Blame - drivers/gpu/drm/amd/amdgpu/amdgpu_vm.c - kernel/msm-4.19

blob: 5638c16887d87c8ec632fd7faf2836436d804b55 [file] [log] [blame]

Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1	/*
				2	* Copyright 2008 Advanced Micro Devices, Inc.
				3	* Copyright 2008 Red Hat Inc.
				4	* Copyright 2009 Jerome Glisse.
				5	*
				6	* Permission is hereby granted, free of charge, to any person obtaining a
				7	* copy of this software and associated documentation files (the "Software"),
				8	* to deal in the Software without restriction, including without limitation
				9	* the rights to use, copy, modify, merge, publish, distribute, sublicense,
				10	* and/or sell copies of the Software, and to permit persons to whom the
				11	* Software is furnished to do so, subject to the following conditions:
				12	*
				13	* The above copyright notice and this permission notice shall be included in
				14	* all copies or substantial portions of the Software.
				15	*
				16	* THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
				17	* IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
				18	* FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL
				19	* THE COPYRIGHT HOLDER(S) OR AUTHOR(S) BE LIABLE FOR ANY CLAIM, DAMAGES OR
				20	* OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE,
				21	* ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR
				22	* OTHER DEALINGS IN THE SOFTWARE.
				23	*
				24	* Authors: Dave Airlie
				25	* Alex Deucher
				26	* Jerome Glisse
				27	*/
Chris Wilson	f54d186	2016-10-25 13:00:45 +0100	[diff] [blame]	28	#include <linux/dma-fence-array.h>
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	29	#include <linux/interval_tree_generic.h>
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	30	#include <drm/drmP.h>
				31	#include <drm/amdgpu_drm.h>
				32	#include "amdgpu.h"
				33	#include "amdgpu_trace.h"
				34
				35	/*
				36	* GPUVM
				37	* GPUVM is similar to the legacy gart on older asics, however
				38	* rather than there being a single global gart table
				39	* for the entire GPU, there are multiple VM page tables active
				40	* at any given time. The VM page tables can contain a mix
				41	* vram pages and system memory pages and system memory pages
				42	* can be mapped as snooped (cached system pages) or unsnooped
				43	* (uncached system pages).
				44	* Each VM has an ID associated with it and there is a page table
				45	* associated with each VMID. When execting a command buffer,
				46	* the kernel tells the the ring what VMID to use for that command
				47	* buffer. VMIDs are allocated dynamically as commands are submitted.
				48	* The userspace drivers maintain their own address space and the kernel
				49	* sets up their pages tables accordingly when they submit their
				50	* command buffers and a VMID is assigned.
				51	* Cayman/Trinity support up to 8 active VMs at any given time;
				52	* SI supports 16.
				53	*/
				54
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	55	#define START(node) ((node)->start)
				56	#define LAST(node) ((node)->last)
				57
				58	INTERVAL_TREE_DEFINE(struct amdgpu_bo_va_mapping, rb, uint64_t, __subtree_last,
				59	START, LAST, static, amdgpu_vm_it)
				60
				61	#undef START
				62	#undef LAST
				63
Harish Kasiviswanathan	f4833c4	2016-04-21 10:40:18 -0400	[diff] [blame]	64	/* Local structure. Encapsulate some VM table update parameters to reduce
				65	* the number of function parameters
				66	*/
Christian König	29efc4f	2016-08-04 14:52:50 +0200	[diff] [blame]	67	struct amdgpu_pte_update_params {
Christian König	27c5f36	2016-08-04 15:02:49 +0200	[diff] [blame]	68	/* amdgpu device we do this update for */
				69	struct amdgpu_device *adev;
Christian König	49ac8a2	2016-10-13 15:09:08 +0200	[diff] [blame]	70	/* optional amdgpu_vm we do this update for */
				71	struct amdgpu_vm *vm;
Harish Kasiviswanathan	f4833c4	2016-04-21 10:40:18 -0400	[diff] [blame]	72	/* address where to copy page table entries from */
				73	uint64_t src;
Harish Kasiviswanathan	f4833c4	2016-04-21 10:40:18 -0400	[diff] [blame]	74	/* indirect buffer to fill with commands */
				75	struct amdgpu_ib *ib;
Christian König	afef8b8	2016-08-12 13:29:18 +0200	[diff] [blame]	76	/* Function which actually does the update */
				77	void (func)(struct amdgpu_pte_update_params params, uint64_t pe,
				78	uint64_t addr, unsigned count, uint32_t incr,
Chunming Zhou	6b77760	2016-09-21 16:19:19 +0800	[diff] [blame]	79	uint64_t flags);
Harish Kasiviswanathan	b4d4251	2017-05-11 19:47:22 -0400	[diff] [blame]	80	/* The next two are used during VM update by CPU
				81	* DMA addresses to use for mapping
				82	* Kernel pointer of PD/PT BO that needs to be updated
				83	*/
				84	dma_addr_t *pages_addr;
				85	void *kptr;
Harish Kasiviswanathan	f4833c4	2016-04-21 10:40:18 -0400	[diff] [blame]	86	};
				87
Christian König	284710f	2017-01-30 11:09:31 +0100	[diff] [blame]	88	/* Helper to disable partial resident texture feature from a fence callback */
				89	struct amdgpu_prt_cb {
				90	struct amdgpu_device *adev;
				91	struct dma_fence_cb cb;
				92	};
				93
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	94	/**
Christian König	72a7ec5	2016-10-19 11:03:57 +0200	[diff] [blame]	95	* amdgpu_vm_num_entries - return the number of entries in a PD/PT
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	96	*
				97	* @adev: amdgpu_device pointer
				98	*
Christian König	72a7ec5	2016-10-19 11:03:57 +0200	[diff] [blame]	99	* Calculate the number of entries in a page directory or page table.
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	100	*/
Christian König	72a7ec5	2016-10-19 11:03:57 +0200	[diff] [blame]	101	static unsigned amdgpu_vm_num_entries(struct amdgpu_device *adev,
				102	unsigned level)
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	103	{
Christian König	72a7ec5	2016-10-19 11:03:57 +0200	[diff] [blame]	104	if (level == 0)
				105	/* For the root directory */
				106	return adev->vm_manager.max_pfn >>
Zhang, Jerry	36b32a6	2017-03-29 16:08:32 +0800	[diff] [blame]	107	(adev->vm_manager.block_size *
				108	adev->vm_manager.num_level);
Christian König	72a7ec5	2016-10-19 11:03:57 +0200	[diff] [blame]	109	else if (level == adev->vm_manager.num_level)
				110	/* For the page tables on the leaves */
Zhang, Jerry	36b32a6	2017-03-29 16:08:32 +0800	[diff] [blame]	111	return AMDGPU_VM_PTE_COUNT(adev);
Christian König	72a7ec5	2016-10-19 11:03:57 +0200	[diff] [blame]	112	else
				113	/* Everything in between */
Zhang, Jerry	36b32a6	2017-03-29 16:08:32 +0800	[diff] [blame]	114	return 1 << adev->vm_manager.block_size;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	115	}
				116
				117	/**
Christian König	72a7ec5	2016-10-19 11:03:57 +0200	[diff] [blame]	118	* amdgpu_vm_bo_size - returns the size of the BOs in bytes
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	119	*
				120	* @adev: amdgpu_device pointer
				121	*
Christian König	72a7ec5	2016-10-19 11:03:57 +0200	[diff] [blame]	122	* Calculate the size of the BO for a page directory or page table in bytes.
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	123	*/
Christian König	72a7ec5	2016-10-19 11:03:57 +0200	[diff] [blame]	124	static unsigned amdgpu_vm_bo_size(struct amdgpu_device *adev, unsigned level)
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	125	{
Christian König	72a7ec5	2016-10-19 11:03:57 +0200	[diff] [blame]	126	return AMDGPU_GPU_PAGE_ALIGN(amdgpu_vm_num_entries(adev, level) * 8);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	127	}
				128
				129	/**
Christian König	56467eb	2015-12-11 15:16:32 +0100	[diff] [blame]	130	* amdgpu_vm_get_pd_bo - add the VM PD to a validation list
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	131	*
				132	* @vm: vm providing the BOs
Christian König	3c0eea6	2015-12-11 14:39:05 +0100	[diff] [blame]	133	* @validated: head of validation list
Christian König	56467eb	2015-12-11 15:16:32 +0100	[diff] [blame]	134	* @entry: entry to add
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	135	*
				136	* Add the page directory to the list of BOs to
Christian König	56467eb	2015-12-11 15:16:32 +0100	[diff] [blame]	137	* validate for command submission.
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	138	*/
Christian König	56467eb	2015-12-11 15:16:32 +0100	[diff] [blame]	139	void amdgpu_vm_get_pd_bo(struct amdgpu_vm *vm,
				140	struct list_head *validated,
				141	struct amdgpu_bo_list_entry *entry)
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	142	{
Christian König	67003a1	2016-10-12 14:46:26 +0200	[diff] [blame]	143	entry->robj = vm->root.bo;
Christian König	56467eb	2015-12-11 15:16:32 +0100	[diff] [blame]	144	entry->priority = 0;
Christian König	67003a1	2016-10-12 14:46:26 +0200	[diff] [blame]	145	entry->tv.bo = &entry->robj->tbo;
Christian König	56467eb	2015-12-11 15:16:32 +0100	[diff] [blame]	146	entry->tv.shared = true;
Christian König	2f568db	2016-02-23 12:36:59 +0100	[diff] [blame]	147	entry->user_pages = NULL;
Christian König	56467eb	2015-12-11 15:16:32 +0100	[diff] [blame]	148	list_add(&entry->tv.head, validated);
				149	}
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	150
Christian König	56467eb	2015-12-11 15:16:32 +0100	[diff] [blame]	151	/**
Christian König	670fecc	2016-10-12 15:36:57 +0200	[diff] [blame]	152	* amdgpu_vm_validate_layer - validate a single page table level
				153	*
				154	* @parent: parent page table level
				155	* @validate: callback to do the validation
				156	* @param: parameter for the validation callback
				157	*
				158	* Validate the page table BOs on command submission if neccessary.
				159	*/
				160	static int amdgpu_vm_validate_level(struct amdgpu_vm_pt *parent,
				161	int (validate)(void , struct amdgpu_bo *),
				162	void *param)
				163	{
				164	unsigned i;
				165	int r;
				166
				167	if (!parent->entries)
				168	return 0;
				169
				170	for (i = 0; i <= parent->last_entry_used; ++i) {
				171	struct amdgpu_vm_pt *entry = &parent->entries[i];
				172
				173	if (!entry->bo)
				174	continue;
				175
				176	r = validate(param, entry->bo);
				177	if (r)
				178	return r;
				179
				180	/*
				181	* Recurse into the sub directory. This is harmless because we
				182	* have only a maximum of 5 layers.
				183	*/
				184	r = amdgpu_vm_validate_level(entry, validate, param);
				185	if (r)
				186	return r;
				187	}
				188
				189	return r;
				190	}
				191
				192	/**
Christian König	f7da30d	2016-09-28 12:03:04 +0200	[diff] [blame]	193	* amdgpu_vm_validate_pt_bos - validate the page table BOs
Christian König	56467eb	2015-12-11 15:16:32 +0100	[diff] [blame]	194	*
Christian König	5a712a8	2016-06-21 16:28:15 +0200	[diff] [blame]	195	* @adev: amdgpu device pointer
Christian König	56467eb	2015-12-11 15:16:32 +0100	[diff] [blame]	196	* @vm: vm providing the BOs
Christian König	f7da30d	2016-09-28 12:03:04 +0200	[diff] [blame]	197	* @validate: callback to do the validation
				198	* @param: parameter for the validation callback
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	199	*
Christian König	f7da30d	2016-09-28 12:03:04 +0200	[diff] [blame]	200	* Validate the page table BOs on command submission if neccessary.
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	201	*/
Christian König	f7da30d	2016-09-28 12:03:04 +0200	[diff] [blame]	202	int amdgpu_vm_validate_pt_bos(struct amdgpu_device adev, struct amdgpu_vm vm,
				203	int (validate)(void p, struct amdgpu_bo *bo),
				204	void *param)
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	205	{
Christian König	5a712a8	2016-06-21 16:28:15 +0200	[diff] [blame]	206	uint64_t num_evictions;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	207
Christian König	5a712a8	2016-06-21 16:28:15 +0200	[diff] [blame]	208	/* We only need to validate the page tables
				209	* if they aren't already valid.
				210	*/
				211	num_evictions = atomic64_read(&adev->num_evictions);
				212	if (num_evictions == vm->last_eviction_counter)
Christian König	f7da30d	2016-09-28 12:03:04 +0200	[diff] [blame]	213	return 0;
Christian König	5a712a8	2016-06-21 16:28:15 +0200	[diff] [blame]	214
Christian König	670fecc	2016-10-12 15:36:57 +0200	[diff] [blame]	215	return amdgpu_vm_validate_level(&vm->root, validate, param);
Christian König	eceb8a1	2016-01-11 15:35:21 +0100	[diff] [blame]	216	}
				217
				218	/**
Christian König	d711e13	2016-10-13 10:20:53 +0200	[diff] [blame]	219	* amdgpu_vm_move_level_in_lru - move one level of PT BOs to the LRU tail
				220	*
				221	* @adev: amdgpu device instance
				222	* @vm: vm providing the BOs
				223	*
				224	* Move the PT BOs to the tail of the LRU.
				225	*/
				226	static void amdgpu_vm_move_level_in_lru(struct amdgpu_vm_pt *parent)
				227	{
				228	unsigned i;
				229
				230	if (!parent->entries)
				231	return;
				232
				233	for (i = 0; i <= parent->last_entry_used; ++i) {
				234	struct amdgpu_vm_pt *entry = &parent->entries[i];
				235
				236	if (!entry->bo)
				237	continue;
				238
				239	ttm_bo_move_to_lru_tail(&entry->bo->tbo);
				240	amdgpu_vm_move_level_in_lru(entry);
				241	}
				242	}
				243
				244	/**
Christian König	eceb8a1	2016-01-11 15:35:21 +0100	[diff] [blame]	245	* amdgpu_vm_move_pt_bos_in_lru - move the PT BOs to the LRU tail
				246	*
				247	* @adev: amdgpu device instance
				248	* @vm: vm providing the BOs
				249	*
				250	* Move the PT BOs to the tail of the LRU.
				251	*/
				252	void amdgpu_vm_move_pt_bos_in_lru(struct amdgpu_device *adev,
				253	struct amdgpu_vm *vm)
				254	{
				255	struct ttm_bo_global *glob = adev->mman.bdev.glob;
Christian König	eceb8a1	2016-01-11 15:35:21 +0100	[diff] [blame]	256
				257	spin_lock(&glob->lru_lock);
Christian König	d711e13	2016-10-13 10:20:53 +0200	[diff] [blame]	258	amdgpu_vm_move_level_in_lru(&vm->root);
Christian König	eceb8a1	2016-01-11 15:35:21 +0100	[diff] [blame]	259	spin_unlock(&glob->lru_lock);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	260	}
				261
Christian König	f566ceb	2016-10-27 20:04:38 +0200	[diff] [blame]	262	/**
				263	* amdgpu_vm_alloc_levels - allocate the PD/PT levels
				264	*
				265	* @adev: amdgpu_device pointer
				266	* @vm: requested vm
				267	* @saddr: start of the address range
				268	* @eaddr: end of the address range
				269	*
				270	* Make sure the page directories and page tables are allocated
				271	*/
				272	static int amdgpu_vm_alloc_levels(struct amdgpu_device *adev,
				273	struct amdgpu_vm *vm,
				274	struct amdgpu_vm_pt *parent,
				275	uint64_t saddr, uint64_t eaddr,
				276	unsigned level)
				277	{
				278	unsigned shift = (adev->vm_manager.num_level - level) *
Zhang, Jerry	36b32a6	2017-03-29 16:08:32 +0800	[diff] [blame]	279	adev->vm_manager.block_size;
Christian König	f566ceb	2016-10-27 20:04:38 +0200	[diff] [blame]	280	unsigned pt_idx, from, to;
				281	int r;
Harish Kasiviswanathan	3c82417	2017-05-11 15:50:08 -0400	[diff] [blame]	282	u64 flags;
Christian König	f566ceb	2016-10-27 20:04:38 +0200	[diff] [blame]	283
				284	if (!parent->entries) {
				285	unsigned num_entries = amdgpu_vm_num_entries(adev, level);
				286
Michal Hocko	2098105	2017-05-17 14:23:12 +0200	[diff] [blame]	287	parent->entries = kvmalloc_array(num_entries,
				288	sizeof(struct amdgpu_vm_pt),
				289	GFP_KERNEL \| __GFP_ZERO);
Christian König	f566ceb	2016-10-27 20:04:38 +0200	[diff] [blame]	290	if (!parent->entries)
				291	return -ENOMEM;
				292	memset(parent->entries, 0 , sizeof(struct amdgpu_vm_pt));
				293	}
				294
Felix Kuehling	1866bac	2017-03-28 20:36:12 -0400	[diff] [blame]	295	from = saddr >> shift;
				296	to = eaddr >> shift;
				297	if (from >= amdgpu_vm_num_entries(adev, level) \|\|
				298	to >= amdgpu_vm_num_entries(adev, level))
				299	return -EINVAL;
Christian König	f566ceb	2016-10-27 20:04:38 +0200	[diff] [blame]	300
				301	if (to > parent->last_entry_used)
				302	parent->last_entry_used = to;
				303
				304	++level;
Felix Kuehling	1866bac	2017-03-28 20:36:12 -0400	[diff] [blame]	305	saddr = saddr & ((1 << shift) - 1);
				306	eaddr = eaddr & ((1 << shift) - 1);
Christian König	f566ceb	2016-10-27 20:04:38 +0200	[diff] [blame]	307
Harish Kasiviswanathan	3c82417	2017-05-11 15:50:08 -0400	[diff] [blame]	308	flags = AMDGPU_GEM_CREATE_VRAM_CONTIGUOUS \|
				309	AMDGPU_GEM_CREATE_VRAM_CLEARED;
				310	if (vm->use_cpu_for_update)
				311	flags \|= AMDGPU_GEM_CREATE_CPU_ACCESS_REQUIRED;
				312	else
				313	flags \|= (AMDGPU_GEM_CREATE_NO_CPU_ACCESS \|
				314	AMDGPU_GEM_CREATE_SHADOW);
				315
Christian König	f566ceb	2016-10-27 20:04:38 +0200	[diff] [blame]	316	/* walk over the address space and allocate the page tables */
				317	for (pt_idx = from; pt_idx <= to; ++pt_idx) {
				318	struct reservation_object *resv = vm->root.bo->tbo.resv;
				319	struct amdgpu_vm_pt *entry = &parent->entries[pt_idx];
				320	struct amdgpu_bo *pt;
				321
				322	if (!entry->bo) {
				323	r = amdgpu_bo_create(adev,
				324	amdgpu_vm_bo_size(adev, level),
				325	AMDGPU_GPU_PAGE_SIZE, true,
				326	AMDGPU_GEM_DOMAIN_VRAM,
Harish Kasiviswanathan	3c82417	2017-05-11 15:50:08 -0400	[diff] [blame]	327	flags,
Christian König	f566ceb	2016-10-27 20:04:38 +0200	[diff] [blame]	328	NULL, resv, &pt);
				329	if (r)
				330	return r;
				331
				332	/* Keep a reference to the root directory to avoid
				333	* freeing them up in the wrong order.
				334	*/
				335	pt->parent = amdgpu_bo_ref(vm->root.bo);
				336
				337	entry->bo = pt;
				338	entry->addr = 0;
				339	}
				340
				341	if (level < adev->vm_manager.num_level) {
Felix Kuehling	1866bac	2017-03-28 20:36:12 -0400	[diff] [blame]	342	uint64_t sub_saddr = (pt_idx == from) ? saddr : 0;
				343	uint64_t sub_eaddr = (pt_idx == to) ? eaddr :
				344	((1 << shift) - 1);
				345	r = amdgpu_vm_alloc_levels(adev, vm, entry, sub_saddr,
				346	sub_eaddr, level);
Christian König	f566ceb	2016-10-27 20:04:38 +0200	[diff] [blame]	347	if (r)
				348	return r;
				349	}
				350	}
				351
				352	return 0;
				353	}
				354
Christian König	663e457	2017-03-13 10:13:37 +0100	[diff] [blame]	355	/**
				356	* amdgpu_vm_alloc_pts - Allocate page tables.
				357	*
				358	* @adev: amdgpu_device pointer
				359	* @vm: VM to allocate page tables for
				360	* @saddr: Start address which needs to be allocated
				361	* @size: Size from start address we need.
				362	*
				363	* Make sure the page tables are allocated.
				364	*/
				365	int amdgpu_vm_alloc_pts(struct amdgpu_device *adev,
				366	struct amdgpu_vm *vm,
				367	uint64_t saddr, uint64_t size)
				368	{
Felix Kuehling	22770e5	2017-03-28 20:24:53 -0400	[diff] [blame]	369	uint64_t last_pfn;
Christian König	663e457	2017-03-13 10:13:37 +0100	[diff] [blame]	370	uint64_t eaddr;
Christian König	663e457	2017-03-13 10:13:37 +0100	[diff] [blame]	371
				372	/* validate the parameters */
				373	if (saddr & AMDGPU_GPU_PAGE_MASK \|\| size & AMDGPU_GPU_PAGE_MASK)
				374	return -EINVAL;
				375
				376	eaddr = saddr + size - 1;
				377	last_pfn = eaddr / AMDGPU_GPU_PAGE_SIZE;
				378	if (last_pfn >= adev->vm_manager.max_pfn) {
Felix Kuehling	22770e5	2017-03-28 20:24:53 -0400	[diff] [blame]	379	dev_err(adev->dev, "va above limit (0x%08llX >= 0x%08llX)\n",
Christian König	663e457	2017-03-13 10:13:37 +0100	[diff] [blame]	380	last_pfn, adev->vm_manager.max_pfn);
				381	return -EINVAL;
				382	}
				383
				384	saddr /= AMDGPU_GPU_PAGE_SIZE;
				385	eaddr /= AMDGPU_GPU_PAGE_SIZE;
				386
Christian König	f566ceb	2016-10-27 20:04:38 +0200	[diff] [blame]	387	return amdgpu_vm_alloc_levels(adev, vm, &vm->root, saddr, eaddr, 0);
Christian König	663e457	2017-03-13 10:13:37 +0100	[diff] [blame]	388	}
				389
Christian König	641e940	2017-04-03 13:59:25 +0200	[diff] [blame]	390	/**
				391	* amdgpu_vm_had_gpu_reset - check if reset occured since last use
				392	*
				393	* @adev: amdgpu_device pointer
				394	* @id: VMID structure
				395	*
				396	* Check if GPU reset occured since last use of the VMID.
				397	*/
				398	static bool amdgpu_vm_had_gpu_reset(struct amdgpu_device *adev,
				399	struct amdgpu_vm_id *id)
Chunming Zhou	192b7dc	2016-06-29 14:01:15 +0800	[diff] [blame]	400	{
				401	return id->current_gpu_reset_count !=
Christian König	641e940	2017-04-03 13:59:25 +0200	[diff] [blame]	402	atomic_read(&adev->gpu_reset_counter);
Chunming Zhou	192b7dc	2016-06-29 14:01:15 +0800	[diff] [blame]	403	}
				404
Chunming Zhou	7a63eb2	2017-04-21 11:13:56 +0800	[diff] [blame]	405	static bool amdgpu_vm_reserved_vmid_ready(struct amdgpu_vm *vm, unsigned vmhub)
				406	{
				407	return !!vm->reserved_vmid[vmhub];
				408	}
				409
				410	/* idr_mgr->lock must be held */
				411	static int amdgpu_vm_grab_reserved_vmid_locked(struct amdgpu_vm *vm,
				412	struct amdgpu_ring *ring,
				413	struct amdgpu_sync *sync,
				414	struct dma_fence *fence,
				415	struct amdgpu_job *job)
				416	{
				417	struct amdgpu_device *adev = ring->adev;
				418	unsigned vmhub = ring->funcs->vmhub;
				419	uint64_t fence_context = adev->fence_context + ring->idx;
				420	struct amdgpu_vm_id *id = vm->reserved_vmid[vmhub];
				421	struct amdgpu_vm_id_manager *id_mgr = &adev->vm_manager.id_mgr[vmhub];
				422	struct dma_fence *updates = sync->last_vm_update;
				423	int r = 0;
				424	struct dma_fence flushed, tmp;
Christian König	6f1ceab	2017-07-11 16:59:21 +0200	[diff] [blame]	425	bool needs_flush = vm->use_cpu_for_update;
Chunming Zhou	7a63eb2	2017-04-21 11:13:56 +0800	[diff] [blame]	426
				427	flushed = id->flushed_updates;
				428	if ((amdgpu_vm_had_gpu_reset(adev, id)) \|\|
				429	(atomic64_read(&id->owner) != vm->client_id) \|\|
				430	(job->vm_pd_addr != id->pd_gpu_addr) \|\|
				431	(updates && (!flushed \|\| updates->context != flushed->context \|\|
				432	dma_fence_is_later(updates, flushed))) \|\|
				433	(!id->last_flush \|\| (id->last_flush->context != fence_context &&
				434	!dma_fence_is_signaled(id->last_flush)))) {
				435	needs_flush = true;
				436	/* to prevent one context starved by another context */
				437	id->pd_gpu_addr = 0;
				438	tmp = amdgpu_sync_peek_fence(&id->active, ring);
				439	if (tmp) {
				440	r = amdgpu_sync_fence(adev, sync, tmp);
				441	return r;
				442	}
				443	}
				444
				445	/* Good we can use this VMID. Remember this submission as
				446	* user of the VMID.
				447	*/
				448	r = amdgpu_sync_fence(ring->adev, &id->active, fence);
				449	if (r)
				450	goto out;
				451
				452	if (updates && (!flushed \|\| updates->context != flushed->context \|\|
				453	dma_fence_is_later(updates, flushed))) {
				454	dma_fence_put(id->flushed_updates);
				455	id->flushed_updates = dma_fence_get(updates);
				456	}
				457	id->pd_gpu_addr = job->vm_pd_addr;
Chunming Zhou	7a63eb2	2017-04-21 11:13:56 +0800	[diff] [blame]	458	atomic64_set(&id->owner, vm->client_id);
				459	job->vm_needs_flush = needs_flush;
				460	if (needs_flush) {
				461	dma_fence_put(id->last_flush);
				462	id->last_flush = NULL;
				463	}
				464	job->vm_id = id - id_mgr->ids;
				465	trace_amdgpu_vm_grab_id(vm, ring, job);
				466	out:
				467	return r;
				468	}
				469
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	470	/**
				471	* amdgpu_vm_grab_id - allocate the next free VMID
				472	*
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	473	* @vm: vm to allocate id for
Christian König	7f8a529	2015-07-20 16:09:40 +0200	[diff] [blame]	474	* @ring: ring we want to submit job to
				475	* @sync: sync object where we add dependencies
Christian König	94dd0a4	2016-01-18 17:01:42 +0100	[diff] [blame]	476	* @fence: fence protecting ID from reuse
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	477	*
Christian König	7f8a529	2015-07-20 16:09:40 +0200	[diff] [blame]	478	* Allocate an id for the vm, adding fences to the sync obj as necessary.
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	479	*/
Christian König	7f8a529	2015-07-20 16:09:40 +0200	[diff] [blame]	480	int amdgpu_vm_grab_id(struct amdgpu_vm vm, struct amdgpu_ring ring,
Chris Wilson	f54d186	2016-10-25 13:00:45 +0100	[diff] [blame]	481	struct amdgpu_sync sync, struct dma_fence fence,
Chunming Zhou	fd53be3	2016-07-01 17:59:01 +0800	[diff] [blame]	482	struct amdgpu_job *job)
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	483	{
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	484	struct amdgpu_device *adev = ring->adev;
Christian König	2e81984	2017-03-30 16:50:47 +0200	[diff] [blame]	485	unsigned vmhub = ring->funcs->vmhub;
Christian König	7645670	2017-04-06 17:52:39 +0200	[diff] [blame]	486	struct amdgpu_vm_id_manager *id_mgr = &adev->vm_manager.id_mgr[vmhub];
Christian König	090b767	2016-07-08 10:21:02 +0200	[diff] [blame]	487	uint64_t fence_context = adev->fence_context + ring->idx;
Chris Wilson	f54d186	2016-10-25 13:00:45 +0100	[diff] [blame]	488	struct dma_fence *updates = sync->last_vm_update;
Christian König	8d76001e	2016-05-23 16:00:32 +0200	[diff] [blame]	489	struct amdgpu_vm_id id, idle;
Chris Wilson	f54d186	2016-10-25 13:00:45 +0100	[diff] [blame]	490	struct dma_fence **fences;
Christian König	1fbb2e9	2016-06-01 10:47:36 +0200	[diff] [blame]	491	unsigned i;
				492	int r = 0;
				493
Christian König	7645670	2017-04-06 17:52:39 +0200	[diff] [blame]	494	mutex_lock(&id_mgr->lock);
Chunming Zhou	7a63eb2	2017-04-21 11:13:56 +0800	[diff] [blame]	495	if (amdgpu_vm_reserved_vmid_ready(vm, vmhub)) {
				496	r = amdgpu_vm_grab_reserved_vmid_locked(vm, ring, sync, fence, job);
				497	mutex_unlock(&id_mgr->lock);
				498	return r;
				499	}
				500	fences = kmalloc_array(sizeof(void *), id_mgr->num_ids, GFP_KERNEL);
				501	if (!fences) {
				502	mutex_unlock(&id_mgr->lock);
				503	return -ENOMEM;
				504	}
Christian König	36fd7c5	2016-05-23 15:30:08 +0200	[diff] [blame]	505	/* Check if we have an idle VMID */
Christian König	1fbb2e9	2016-06-01 10:47:36 +0200	[diff] [blame]	506	i = 0;
Christian König	7645670	2017-04-06 17:52:39 +0200	[diff] [blame]	507	list_for_each_entry(idle, &id_mgr->ids_lru, list) {
Christian König	1fbb2e9	2016-06-01 10:47:36 +0200	[diff] [blame]	508	fences[i] = amdgpu_sync_peek_fence(&idle->active, ring);
				509	if (!fences[i])
Christian König	36fd7c5	2016-05-23 15:30:08 +0200	[diff] [blame]	510	break;
Christian König	1fbb2e9	2016-06-01 10:47:36 +0200	[diff] [blame]	511	++i;
Christian König	36fd7c5	2016-05-23 15:30:08 +0200	[diff] [blame]	512	}
Christian König	bcb1ba3	2016-03-08 15:40:11 +0100	[diff] [blame]	513
Christian König	1fbb2e9	2016-06-01 10:47:36 +0200	[diff] [blame]	514	/* If we can't find a idle VMID to use, wait till one becomes available */
Christian König	7645670	2017-04-06 17:52:39 +0200	[diff] [blame]	515	if (&idle->list == &id_mgr->ids_lru) {
Christian König	1fbb2e9	2016-06-01 10:47:36 +0200	[diff] [blame]	516	u64 fence_context = adev->vm_manager.fence_context + ring->idx;
				517	unsigned seqno = ++adev->vm_manager.seqno[ring->idx];
Chris Wilson	f54d186	2016-10-25 13:00:45 +0100	[diff] [blame]	518	struct dma_fence_array *array;
Christian König	1fbb2e9	2016-06-01 10:47:36 +0200	[diff] [blame]	519	unsigned j;
Christian König	8d76001e	2016-05-23 16:00:32 +0200	[diff] [blame]	520
Christian König	1fbb2e9	2016-06-01 10:47:36 +0200	[diff] [blame]	521	for (j = 0; j < i; ++j)
Chris Wilson	f54d186	2016-10-25 13:00:45 +0100	[diff] [blame]	522	dma_fence_get(fences[j]);
Christian König	8d76001e	2016-05-23 16:00:32 +0200	[diff] [blame]	523
Chris Wilson	f54d186	2016-10-25 13:00:45 +0100	[diff] [blame]	524	array = dma_fence_array_create(i, fences, fence_context,
Christian König	1fbb2e9	2016-06-01 10:47:36 +0200	[diff] [blame]	525	seqno, true);
				526	if (!array) {
				527	for (j = 0; j < i; ++j)
Chris Wilson	f54d186	2016-10-25 13:00:45 +0100	[diff] [blame]	528	dma_fence_put(fences[j]);
Christian König	1fbb2e9	2016-06-01 10:47:36 +0200	[diff] [blame]	529	kfree(fences);
				530	r = -ENOMEM;
				531	goto error;
				532	}
Christian König	8d76001e	2016-05-23 16:00:32 +0200	[diff] [blame]	533
Christian König	8d76001e	2016-05-23 16:00:32 +0200	[diff] [blame]	534
Christian König	1fbb2e9	2016-06-01 10:47:36 +0200	[diff] [blame]	535	r = amdgpu_sync_fence(ring->adev, sync, &array->base);
Chris Wilson	f54d186	2016-10-25 13:00:45 +0100	[diff] [blame]	536	dma_fence_put(&array->base);
Christian König	1fbb2e9	2016-06-01 10:47:36 +0200	[diff] [blame]	537	if (r)
				538	goto error;
Christian König	8d76001e	2016-05-23 16:00:32 +0200	[diff] [blame]	539
Christian König	7645670	2017-04-06 17:52:39 +0200	[diff] [blame]	540	mutex_unlock(&id_mgr->lock);
Christian König	1fbb2e9	2016-06-01 10:47:36 +0200	[diff] [blame]	541	return 0;
Christian König	8d76001e	2016-05-23 16:00:32 +0200	[diff] [blame]	542
Christian König	1fbb2e9	2016-06-01 10:47:36 +0200	[diff] [blame]	543	}
				544	kfree(fences);
Christian König	8d76001e	2016-05-23 16:00:32 +0200	[diff] [blame]	545
Christian König	6f1ceab	2017-07-11 16:59:21 +0200	[diff] [blame]	546	job->vm_needs_flush = vm->use_cpu_for_update;
Christian König	1fbb2e9	2016-06-01 10:47:36 +0200	[diff] [blame]	547	/* Check if we can use a VMID already assigned to this VM */
Christian König	7645670	2017-04-06 17:52:39 +0200	[diff] [blame]	548	list_for_each_entry_reverse(id, &id_mgr->ids_lru, list) {
Chris Wilson	f54d186	2016-10-25 13:00:45 +0100	[diff] [blame]	549	struct dma_fence *flushed;
Christian König	6f1ceab	2017-07-11 16:59:21 +0200	[diff] [blame]	550	bool needs_flush = vm->use_cpu_for_update;
Christian König	8d76001e	2016-05-23 16:00:32 +0200	[diff] [blame]	551
Christian König	1fbb2e9	2016-06-01 10:47:36 +0200	[diff] [blame]	552	/* Check all the prerequisites to using this VMID */
Christian König	641e940	2017-04-03 13:59:25 +0200	[diff] [blame]	553	if (amdgpu_vm_had_gpu_reset(adev, id))
Chunming Zhou	6adb051	2016-06-27 17:06:01 +0800	[diff] [blame]	554	continue;
Christian König	1fbb2e9	2016-06-01 10:47:36 +0200	[diff] [blame]	555
				556	if (atomic64_read(&id->owner) != vm->client_id)
				557	continue;
				558
Chunming Zhou	fd53be3	2016-07-01 17:59:01 +0800	[diff] [blame]	559	if (job->vm_pd_addr != id->pd_gpu_addr)
Christian König	1fbb2e9	2016-06-01 10:47:36 +0200	[diff] [blame]	560	continue;
				561
Christian König	87c910d	2017-03-30 16:56:20 +0200	[diff] [blame]	562	if (!id->last_flush \|\|
				563	(id->last_flush->context != fence_context &&
				564	!dma_fence_is_signaled(id->last_flush)))
				565	needs_flush = true;
Christian König	1fbb2e9	2016-06-01 10:47:36 +0200	[diff] [blame]	566
				567	flushed = id->flushed_updates;
Christian König	87c910d	2017-03-30 16:56:20 +0200	[diff] [blame]	568	if (updates && (!flushed \|\| dma_fence_is_later(updates, flushed)))
				569	needs_flush = true;
				570
				571	/* Concurrent flushes are only possible starting with Vega10 */
				572	if (adev->asic_type < CHIP_VEGA10 && needs_flush)
Christian König	1fbb2e9	2016-06-01 10:47:36 +0200	[diff] [blame]	573	continue;
				574
Christian König	3dab83b	2016-06-01 13:31:17 +0200	[diff] [blame]	575	/* Good we can use this VMID. Remember this submission as
				576	* user of the VMID.
				577	*/
Christian König	1fbb2e9	2016-06-01 10:47:36 +0200	[diff] [blame]	578	r = amdgpu_sync_fence(ring->adev, &id->active, fence);
				579	if (r)
				580	goto error;
Christian König	8d76001e	2016-05-23 16:00:32 +0200	[diff] [blame]	581
Christian König	87c910d	2017-03-30 16:56:20 +0200	[diff] [blame]	582	if (updates && (!flushed \|\| dma_fence_is_later(updates, flushed))) {
				583	dma_fence_put(id->flushed_updates);
				584	id->flushed_updates = dma_fence_get(updates);
				585	}
Christian König	8d76001e	2016-05-23 16:00:32 +0200	[diff] [blame]	586
Christian König	87c910d	2017-03-30 16:56:20 +0200	[diff] [blame]	587	if (needs_flush)
				588	goto needs_flush;
				589	else
				590	goto no_flush_needed;
Christian König	8d76001e	2016-05-23 16:00:32 +0200	[diff] [blame]	591
Christian König	4f618e7	2017-04-06 15:18:21 +0200	[diff] [blame]	592	};
Chunming Zhou	8e9fbeb	2016-03-17 11:41:37 +0800	[diff] [blame]	593
Christian König	1fbb2e9	2016-06-01 10:47:36 +0200	[diff] [blame]	594	/* Still no ID to use? Then use the idle one found earlier */
				595	id = idle;
				596
				597	/* Remember this submission as user of the VMID */
				598	r = amdgpu_sync_fence(ring->adev, &id->active, fence);
Christian König	832a902	2016-02-15 12:33:02 +0100	[diff] [blame]	599	if (r)
				600	goto error;
Christian König	4ff37a8	2016-02-26 16:18:26 +0100	[diff] [blame]	601
Christian König	87c910d	2017-03-30 16:56:20 +0200	[diff] [blame]	602	id->pd_gpu_addr = job->vm_pd_addr;
				603	dma_fence_put(id->flushed_updates);
				604	id->flushed_updates = dma_fence_get(updates);
Christian König	87c910d	2017-03-30 16:56:20 +0200	[diff] [blame]	605	atomic64_set(&id->owner, vm->client_id);
				606
				607	needs_flush:
				608	job->vm_needs_flush = true;
Chris Wilson	f54d186	2016-10-25 13:00:45 +0100	[diff] [blame]	609	dma_fence_put(id->last_flush);
Christian König	41d9eb2	2016-03-01 16:46:18 +0100	[diff] [blame]	610	id->last_flush = NULL;
				611
Christian König	87c910d	2017-03-30 16:56:20 +0200	[diff] [blame]	612	no_flush_needed:
Christian König	7645670	2017-04-06 17:52:39 +0200	[diff] [blame]	613	list_move_tail(&id->list, &id_mgr->ids_lru);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	614
Christian König	7645670	2017-04-06 17:52:39 +0200	[diff] [blame]	615	job->vm_id = id - id_mgr->ids;
Christian König	c5296d1	2017-04-07 15:31:13 +0200	[diff] [blame]	616	trace_amdgpu_vm_grab_id(vm, ring, job);
Christian König	832a902	2016-02-15 12:33:02 +0100	[diff] [blame]	617
				618	error:
Christian König	7645670	2017-04-06 17:52:39 +0200	[diff] [blame]	619	mutex_unlock(&id_mgr->lock);
Christian König	a9a78b3	2016-01-21 10:19:11 +0100	[diff] [blame]	620	return r;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	621	}
				622
Chunming Zhou	1e9ef26	2017-04-20 16:18:48 +0800	[diff] [blame]	623	static void amdgpu_vm_free_reserved_vmid(struct amdgpu_device *adev,
				624	struct amdgpu_vm *vm,
				625	unsigned vmhub)
Alex Deucher	93dcc37	2016-06-17 17:05:15 -0400	[diff] [blame]	626	{
Chunming Zhou	1e9ef26	2017-04-20 16:18:48 +0800	[diff] [blame]	627	struct amdgpu_vm_id_manager *id_mgr = &adev->vm_manager.id_mgr[vmhub];
Alex Deucher	93dcc37	2016-06-17 17:05:15 -0400	[diff] [blame]	628
Chunming Zhou	1e9ef26	2017-04-20 16:18:48 +0800	[diff] [blame]	629	mutex_lock(&id_mgr->lock);
				630	if (vm->reserved_vmid[vmhub]) {
				631	list_add(&vm->reserved_vmid[vmhub]->list,
				632	&id_mgr->ids_lru);
				633	vm->reserved_vmid[vmhub] = NULL;
Chunming Zhou	c350577	2017-04-21 15:51:04 +0800	[diff] [blame]	634	atomic_dec(&id_mgr->reserved_vmid_num);
Alex Deucher	93dcc37	2016-06-17 17:05:15 -0400	[diff] [blame]	635	}
Chunming Zhou	1e9ef26	2017-04-20 16:18:48 +0800	[diff] [blame]	636	mutex_unlock(&id_mgr->lock);
Alex Deucher	93dcc37	2016-06-17 17:05:15 -0400	[diff] [blame]	637	}
				638
Chunming Zhou	1e9ef26	2017-04-20 16:18:48 +0800	[diff] [blame]	639	static int amdgpu_vm_alloc_reserved_vmid(struct amdgpu_device *adev,
				640	struct amdgpu_vm *vm,
				641	unsigned vmhub)
Alex Xie	e60f8db	2017-03-09 11:36:26 -0500	[diff] [blame]	642	{
Chunming Zhou	1e9ef26	2017-04-20 16:18:48 +0800	[diff] [blame]	643	struct amdgpu_vm_id_manager *id_mgr;
				644	struct amdgpu_vm_id *idle;
				645	int r = 0;
Alex Xie	e60f8db	2017-03-09 11:36:26 -0500	[diff] [blame]	646
Chunming Zhou	1e9ef26	2017-04-20 16:18:48 +0800	[diff] [blame]	647	id_mgr = &adev->vm_manager.id_mgr[vmhub];
				648	mutex_lock(&id_mgr->lock);
				649	if (vm->reserved_vmid[vmhub])
				650	goto unlock;
Chunming Zhou	c350577	2017-04-21 15:51:04 +0800	[diff] [blame]	651	if (atomic_inc_return(&id_mgr->reserved_vmid_num) >
				652	AMDGPU_VM_MAX_RESERVED_VMID) {
				653	DRM_ERROR("Over limitation of reserved vmid\n");
				654	atomic_dec(&id_mgr->reserved_vmid_num);
				655	r = -EINVAL;
				656	goto unlock;
				657	}
Chunming Zhou	1e9ef26	2017-04-20 16:18:48 +0800	[diff] [blame]	658	/* Select the first entry VMID */
				659	idle = list_first_entry(&id_mgr->ids_lru, struct amdgpu_vm_id, list);
				660	list_del_init(&idle->list);
				661	vm->reserved_vmid[vmhub] = idle;
				662	mutex_unlock(&id_mgr->lock);
Alex Xie	e60f8db	2017-03-09 11:36:26 -0500	[diff] [blame]	663
Chunming Zhou	1e9ef26	2017-04-20 16:18:48 +0800	[diff] [blame]	664	return 0;
				665	unlock:
				666	mutex_unlock(&id_mgr->lock);
				667	return r;
				668	}
				669
Alex Xie	e59c020	2017-06-01 09:42:59 -0400	[diff] [blame]	670	/**
				671	* amdgpu_vm_check_compute_bug - check whether asic has compute vm bug
				672	*
				673	* @adev: amdgpu_device pointer
				674	*/
				675	void amdgpu_vm_check_compute_bug(struct amdgpu_device *adev)
				676	{
				677	const struct amdgpu_ip_block *ip_block;
				678	bool has_compute_vm_bug;
				679	struct amdgpu_ring *ring;
				680	int i;
				681
				682	has_compute_vm_bug = false;
				683
				684	ip_block = amdgpu_get_ip_block(adev, AMD_IP_BLOCK_TYPE_GFX);
				685	if (ip_block) {
				686	/* Compute has a VM bug for GFX version < 7.
				687	Compute has a VM bug for GFX 8 MEC firmware version < 673.*/
				688	if (ip_block->version->major <= 7)
				689	has_compute_vm_bug = true;
				690	else if (ip_block->version->major == 8)
				691	if (adev->gfx.mec_fw_version < 673)
				692	has_compute_vm_bug = true;
				693	}
				694
				695	for (i = 0; i < adev->num_rings; i++) {
				696	ring = adev->rings[i];
				697	if (ring->funcs->type == AMDGPU_RING_TYPE_COMPUTE)
				698	/* only compute rings */
				699	ring->has_compute_vm_bug = has_compute_vm_bug;
				700	else
				701	ring->has_compute_vm_bug = false;
				702	}
				703	}
				704
Chunming Zhou	b9bf33d	2017-05-11 14:52:48 -0400	[diff] [blame]	705	bool amdgpu_vm_need_pipeline_sync(struct amdgpu_ring *ring,
				706	struct amdgpu_job *job)
				707	{
				708	struct amdgpu_device *adev = ring->adev;
				709	unsigned vmhub = ring->funcs->vmhub;
				710	struct amdgpu_vm_id_manager *id_mgr = &adev->vm_manager.id_mgr[vmhub];
				711	struct amdgpu_vm_id *id;
				712	bool gds_switch_needed;
Alex Xie	e59c020	2017-06-01 09:42:59 -0400	[diff] [blame]	713	bool vm_flush_needed = job->vm_needs_flush \|\| ring->has_compute_vm_bug;
Chunming Zhou	b9bf33d	2017-05-11 14:52:48 -0400	[diff] [blame]	714
				715	if (job->vm_id == 0)
				716	return false;
				717	id = &id_mgr->ids[job->vm_id];
				718	gds_switch_needed = ring->funcs->emit_gds_switch && (
				719	id->gds_base != job->gds_base \|\|
				720	id->gds_size != job->gds_size \|\|
				721	id->gws_base != job->gws_base \|\|
				722	id->gws_size != job->gws_size \|\|
				723	id->oa_base != job->oa_base \|\|
				724	id->oa_size != job->oa_size);
				725
				726	if (amdgpu_vm_had_gpu_reset(adev, id))
				727	return true;
Alex Xie	bb37b67	2017-05-30 23:50:10 -0400	[diff] [blame]	728
				729	return vm_flush_needed \|\| gds_switch_needed;
Chunming Zhou	b9bf33d	2017-05-11 14:52:48 -0400	[diff] [blame]	730	}
				731
Harish Kasiviswanathan	9a4b7d4	2017-06-09 11:26:57 -0400	[diff] [blame]	732	static bool amdgpu_vm_is_large_bar(struct amdgpu_device *adev)
				733	{
				734	return (adev->mc.real_vram_size == adev->mc.visible_vram_size);
Alex Xie	e60f8db	2017-03-09 11:36:26 -0500	[diff] [blame]	735	}
				736
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	737	/**
				738	* amdgpu_vm_flush - hardware flush the vm
				739	*
				740	* @ring: ring to use for flush
Christian König	cffadc8	2016-03-01 13:34:49 +0100	[diff] [blame]	741	* @vm_id: vmid number to use
Christian König	4ff37a8	2016-02-26 16:18:26 +0100	[diff] [blame]	742	* @pd_addr: address of the page directory
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	743	*
Christian König	4ff37a8	2016-02-26 16:18:26 +0100	[diff] [blame]	744	* Emit a VM flush when it is necessary.
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	745	*/
Monk Liu	8fdf074	2017-06-06 17:25:13 +0800	[diff] [blame]	746	int amdgpu_vm_flush(struct amdgpu_ring ring, struct amdgpu_job job, bool need_pipe_sync)
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	747	{
Christian König	971fe9a9	2016-03-01 15:09:25 +0100	[diff] [blame]	748	struct amdgpu_device *adev = ring->adev;
Christian König	7645670	2017-04-06 17:52:39 +0200	[diff] [blame]	749	unsigned vmhub = ring->funcs->vmhub;
				750	struct amdgpu_vm_id_manager *id_mgr = &adev->vm_manager.id_mgr[vmhub];
				751	struct amdgpu_vm_id *id = &id_mgr->ids[job->vm_id];
Christian König	d564a06	2016-03-01 15:51:53 +0100	[diff] [blame]	752	bool gds_switch_needed = ring->funcs->emit_gds_switch && (
Chunming Zhou	fd53be3	2016-07-01 17:59:01 +0800	[diff] [blame]	753	id->gds_base != job->gds_base \|\|
				754	id->gds_size != job->gds_size \|\|
				755	id->gws_base != job->gws_base \|\|
				756	id->gws_size != job->gws_size \|\|
				757	id->oa_base != job->oa_base \|\|
				758	id->oa_size != job->oa_size);
Flora Cui	de37e68	2017-05-18 13:56:22 +0800	[diff] [blame]	759	bool vm_flush_needed = job->vm_needs_flush;
Christian König	c0e5193	2017-04-03 14:16:07 +0200	[diff] [blame]	760	unsigned patch_offset = 0;
Christian König	41d9eb2	2016-03-01 16:46:18 +0100	[diff] [blame]	761	int r;
Christian König	d564a06	2016-03-01 15:51:53 +0100	[diff] [blame]	762
Christian König	f7d015b	2017-04-03 14:28:26 +0200	[diff] [blame]	763	if (amdgpu_vm_had_gpu_reset(adev, id)) {
				764	gds_switch_needed = true;
				765	vm_flush_needed = true;
				766	}
Christian König	971fe9a9	2016-03-01 15:09:25 +0100	[diff] [blame]	767
Monk Liu	8fdf074	2017-06-06 17:25:13 +0800	[diff] [blame]	768	if (!vm_flush_needed && !gds_switch_needed && !need_pipe_sync)
Christian König	f7d015b	2017-04-03 14:28:26 +0200	[diff] [blame]	769	return 0;
Christian König	41d9eb2	2016-03-01 16:46:18 +0100	[diff] [blame]	770
Christian König	c0e5193	2017-04-03 14:16:07 +0200	[diff] [blame]	771	if (ring->funcs->init_cond_exec)
				772	patch_offset = amdgpu_ring_init_cond_exec(ring);
Christian König	41d9eb2	2016-03-01 16:46:18 +0100	[diff] [blame]	773
Monk Liu	8fdf074	2017-06-06 17:25:13 +0800	[diff] [blame]	774	if (need_pipe_sync)
				775	amdgpu_ring_emit_pipeline_sync(ring);
				776
Christian König	f7d015b	2017-04-03 14:28:26 +0200	[diff] [blame]	777	if (ring->funcs->emit_vm_flush && vm_flush_needed) {
Christian König	c0e5193	2017-04-03 14:16:07 +0200	[diff] [blame]	778	struct dma_fence *fence;
Monk Liu	e9d672b	2017-03-15 12:18:57 +0800	[diff] [blame]	779
Christian König	9a94f5a	2017-05-12 14:46:23 +0200	[diff] [blame]	780	trace_amdgpu_vm_flush(ring, job->vm_id, job->vm_pd_addr);
				781	amdgpu_ring_emit_vm_flush(ring, job->vm_id, job->vm_pd_addr);
Monk Liu	e9d672b	2017-03-15 12:18:57 +0800	[diff] [blame]	782
Christian König	c0e5193	2017-04-03 14:16:07 +0200	[diff] [blame]	783	r = amdgpu_fence_emit(ring, &fence);
				784	if (r)
				785	return r;
Monk Liu	e9d672b	2017-03-15 12:18:57 +0800	[diff] [blame]	786
Christian König	7645670	2017-04-06 17:52:39 +0200	[diff] [blame]	787	mutex_lock(&id_mgr->lock);
Christian König	c0e5193	2017-04-03 14:16:07 +0200	[diff] [blame]	788	dma_fence_put(id->last_flush);
				789	id->last_flush = fence;
Chunming Zhou	bea39672	2017-05-10 13:02:39 +0800	[diff] [blame]	790	id->current_gpu_reset_count = atomic_read(&adev->gpu_reset_counter);
Christian König	7645670	2017-04-06 17:52:39 +0200	[diff] [blame]	791	mutex_unlock(&id_mgr->lock);
Christian König	c0e5193	2017-04-03 14:16:07 +0200	[diff] [blame]	792	}
Monk Liu	e9d672b	2017-03-15 12:18:57 +0800	[diff] [blame]	793
Chunming Zhou	7c4378f	2017-05-11 18:22:17 +0800	[diff] [blame]	794	if (ring->funcs->emit_gds_switch && gds_switch_needed) {
Christian König	c0e5193	2017-04-03 14:16:07 +0200	[diff] [blame]	795	id->gds_base = job->gds_base;
				796	id->gds_size = job->gds_size;
				797	id->gws_base = job->gws_base;
				798	id->gws_size = job->gws_size;
				799	id->oa_base = job->oa_base;
				800	id->oa_size = job->oa_size;
				801	amdgpu_ring_emit_gds_switch(ring, job->vm_id, job->gds_base,
				802	job->gds_size, job->gws_base,
				803	job->gws_size, job->oa_base,
				804	job->oa_size);
				805	}
				806
				807	if (ring->funcs->patch_cond_exec)
				808	amdgpu_ring_patch_cond_exec(ring, patch_offset);
				809
				810	/* the double SWITCH_BUFFER here cannot be skipped by COND_EXEC */
				811	if (ring->funcs->emit_switch_buffer) {
				812	amdgpu_ring_emit_switch_buffer(ring);
				813	amdgpu_ring_emit_switch_buffer(ring);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	814	}
Christian König	41d9eb2	2016-03-01 16:46:18 +0100	[diff] [blame]	815	return 0;
Christian König	971fe9a9	2016-03-01 15:09:25 +0100	[diff] [blame]	816	}
				817
				818	/**
				819	* amdgpu_vm_reset_id - reset VMID to zero
				820	*
				821	* @adev: amdgpu device structure
				822	* @vm_id: vmid number to use
				823	*
				824	* Reset saved GDW, GWS and OA to force switch on next flush.
				825	*/
Christian König	7645670	2017-04-06 17:52:39 +0200	[diff] [blame]	826	void amdgpu_vm_reset_id(struct amdgpu_device *adev, unsigned vmhub,
				827	unsigned vmid)
Christian König	971fe9a9	2016-03-01 15:09:25 +0100	[diff] [blame]	828	{
Christian König	7645670	2017-04-06 17:52:39 +0200	[diff] [blame]	829	struct amdgpu_vm_id_manager *id_mgr = &adev->vm_manager.id_mgr[vmhub];
				830	struct amdgpu_vm_id *id = &id_mgr->ids[vmid];
Christian König	971fe9a9	2016-03-01 15:09:25 +0100	[diff] [blame]	831
Christian König	b3c85a0	2017-05-10 20:06:58 +0200	[diff] [blame]	832	atomic64_set(&id->owner, 0);
Christian König	bcb1ba3	2016-03-08 15:40:11 +0100	[diff] [blame]	833	id->gds_base = 0;
				834	id->gds_size = 0;
				835	id->gws_base = 0;
				836	id->gws_size = 0;
				837	id->oa_base = 0;
				838	id->oa_size = 0;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	839	}
				840
				841	/**
Christian König	b3c85a0	2017-05-10 20:06:58 +0200	[diff] [blame]	842	* amdgpu_vm_reset_all_id - reset VMID to zero
				843	*
				844	* @adev: amdgpu device structure
				845	*
				846	* Reset VMID to force flush on next use
				847	*/
				848	void amdgpu_vm_reset_all_ids(struct amdgpu_device *adev)
				849	{
				850	unsigned i, j;
				851
				852	for (i = 0; i < AMDGPU_MAX_VMHUBS; ++i) {
				853	struct amdgpu_vm_id_manager *id_mgr =
				854	&adev->vm_manager.id_mgr[i];
				855
				856	for (j = 1; j < id_mgr->num_ids; ++j)
				857	amdgpu_vm_reset_id(adev, i, j);
				858	}
				859	}
				860
				861	/**
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	862	* amdgpu_vm_bo_find - find the bo_va for a specific vm & bo
				863	*
				864	* @vm: requested vm
				865	* @bo: requested buffer object
				866	*
Christian König	8843dbb	2016-01-26 12:17:11 +0100	[diff] [blame]	867	* Find @bo inside the requested vm.
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	868	* Search inside the @bos vm list for the requested vm
				869	* Returns the found bo_va or NULL if none is found
				870	*
				871	* Object has to be reserved!
				872	*/
				873	struct amdgpu_bo_va amdgpu_vm_bo_find(struct amdgpu_vm vm,
				874	struct amdgpu_bo *bo)
				875	{
				876	struct amdgpu_bo_va *bo_va;
				877
				878	list_for_each_entry(bo_va, &bo->va, bo_list) {
				879	if (bo_va->vm == vm) {
				880	return bo_va;
				881	}
				882	}
				883	return NULL;
				884	}
				885
				886	/**
Christian König	afef8b8	2016-08-12 13:29:18 +0200	[diff] [blame]	887	* amdgpu_vm_do_set_ptes - helper to call the right asic function
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	888	*
Christian König	29efc4f	2016-08-04 14:52:50 +0200	[diff] [blame]	889	* @params: see amdgpu_pte_update_params definition
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	890	* @pe: addr of the page entry
				891	* @addr: dst addr to write into pe
				892	* @count: number of page entries to update
				893	* @incr: increase next addr by incr bytes
				894	* @flags: hw access flags
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	895	*
				896	* Traces the parameters and calls the right asic functions
				897	* to setup the page table using the DMA.
				898	*/
Christian König	afef8b8	2016-08-12 13:29:18 +0200	[diff] [blame]	899	static void amdgpu_vm_do_set_ptes(struct amdgpu_pte_update_params *params,
				900	uint64_t pe, uint64_t addr,
				901	unsigned count, uint32_t incr,
Chunming Zhou	6b77760	2016-09-21 16:19:19 +0800	[diff] [blame]	902	uint64_t flags)
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	903	{
Christian König	ec2f05f	2016-09-25 16:11:52 +0200	[diff] [blame]	904	trace_amdgpu_vm_set_ptes(pe, addr, count, incr, flags);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	905
Christian König	afef8b8	2016-08-12 13:29:18 +0200	[diff] [blame]	906	if (count < 3) {
Christian König	de9ea7b	2016-08-12 11:33:30 +0200	[diff] [blame]	907	amdgpu_vm_write_pte(params->adev, params->ib, pe,
				908	addr \| flags, count, incr);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	909
				910	} else {
Christian König	27c5f36	2016-08-04 15:02:49 +0200	[diff] [blame]	911	amdgpu_vm_set_pte_pde(params->adev, params->ib, pe, addr,
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	912	count, incr, flags);
				913	}
				914	}
				915
				916	/**
Christian König	afef8b8	2016-08-12 13:29:18 +0200	[diff] [blame]	917	* amdgpu_vm_do_copy_ptes - copy the PTEs from the GART
				918	*
				919	* @params: see amdgpu_pte_update_params definition
				920	* @pe: addr of the page entry
				921	* @addr: dst addr to write into pe
				922	* @count: number of page entries to update
				923	* @incr: increase next addr by incr bytes
				924	* @flags: hw access flags
				925	*
				926	* Traces the parameters and calls the DMA function to copy the PTEs.
				927	*/
				928	static void amdgpu_vm_do_copy_ptes(struct amdgpu_pte_update_params *params,
				929	uint64_t pe, uint64_t addr,
				930	unsigned count, uint32_t incr,
Chunming Zhou	6b77760	2016-09-21 16:19:19 +0800	[diff] [blame]	931	uint64_t flags)
Christian König	afef8b8	2016-08-12 13:29:18 +0200	[diff] [blame]	932	{
Christian König	ec2f05f	2016-09-25 16:11:52 +0200	[diff] [blame]	933	uint64_t src = (params->src + (addr >> 12) * 8);
Christian König	afef8b8	2016-08-12 13:29:18 +0200	[diff] [blame]	934
Christian König	ec2f05f	2016-09-25 16:11:52 +0200	[diff] [blame]	935
				936	trace_amdgpu_vm_copy_ptes(pe, src, count);
				937
				938	amdgpu_vm_copy_pte(params->adev, params->ib, pe, src, count);
Christian König	afef8b8	2016-08-12 13:29:18 +0200	[diff] [blame]	939	}
				940
				941	/**
Christian König	b07c9d2	2015-11-30 13:26:07 +0100	[diff] [blame]	942	* amdgpu_vm_map_gart - Resolve gart mapping of addr
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	943	*
Christian König	b07c9d2	2015-11-30 13:26:07 +0100	[diff] [blame]	944	* @pages_addr: optional DMA address to use for lookup
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	945	* @addr: the unmapped addr
				946	*
				947	* Look up the physical address of the page that the pte resolves
Christian König	b07c9d2	2015-11-30 13:26:07 +0100	[diff] [blame]	948	* to and return the pointer for the page table entry.
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	949	*/
Christian König	de9ea7b	2016-08-12 11:33:30 +0200	[diff] [blame]	950	static uint64_t amdgpu_vm_map_gart(const dma_addr_t *pages_addr, uint64_t addr)
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	951	{
				952	uint64_t result;
				953
Christian König	de9ea7b	2016-08-12 11:33:30 +0200	[diff] [blame]	954	/* page table offset */
				955	result = pages_addr[addr >> PAGE_SHIFT];
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	956
Christian König	de9ea7b	2016-08-12 11:33:30 +0200	[diff] [blame]	957	/* in case cpu page size != gpu page size*/
				958	result \|= addr & (~PAGE_MASK);
Christian König	b07c9d2	2015-11-30 13:26:07 +0100	[diff] [blame]	959
				960	result &= 0xFFFFFFFFFFFFF000ULL;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	961
				962	return result;
				963	}
				964
Harish Kasiviswanathan	3c82417	2017-05-11 15:50:08 -0400	[diff] [blame]	965	/**
				966	* amdgpu_vm_cpu_set_ptes - helper to update page tables via CPU
				967	*
				968	* @params: see amdgpu_pte_update_params definition
				969	* @pe: kmap addr of the page entry
				970	* @addr: dst addr to write into pe
				971	* @count: number of page entries to update
				972	* @incr: increase next addr by incr bytes
				973	* @flags: hw access flags
				974	*
				975	* Write count number of PT/PD entries directly.
				976	*/
				977	static void amdgpu_vm_cpu_set_ptes(struct amdgpu_pte_update_params *params,
				978	uint64_t pe, uint64_t addr,
				979	unsigned count, uint32_t incr,
				980	uint64_t flags)
				981	{
				982	unsigned int i;
Harish Kasiviswanathan	b4d4251	2017-05-11 19:47:22 -0400	[diff] [blame]	983	uint64_t value;
Harish Kasiviswanathan	3c82417	2017-05-11 15:50:08 -0400	[diff] [blame]	984
Christian König	03918b3	2017-07-11 17:15:37 +0200	[diff] [blame^]	985	trace_amdgpu_vm_set_ptes(pe, addr, count, incr, flags);
				986
Harish Kasiviswanathan	3c82417	2017-05-11 15:50:08 -0400	[diff] [blame]	987	for (i = 0; i < count; i++) {
Harish Kasiviswanathan	b4d4251	2017-05-11 19:47:22 -0400	[diff] [blame]	988	value = params->pages_addr ?
				989	amdgpu_vm_map_gart(params->pages_addr, addr) :
				990	addr;
Harish Kasiviswanathan	a1924005	2017-06-09 17:47:28 -0400	[diff] [blame]	991	amdgpu_gart_set_pte_pde(params->adev, (void *)(uintptr_t)pe,
Harish Kasiviswanathan	b4d4251	2017-05-11 19:47:22 -0400	[diff] [blame]	992	i, value, flags);
Harish Kasiviswanathan	3c82417	2017-05-11 15:50:08 -0400	[diff] [blame]	993	addr += incr;
				994	}
				995
				996	/* Flush HDP */
				997	mb();
				998	amdgpu_gart_flush_gpu_tlb(params->adev, 0);
				999	}
				1000
Christian König	a33cab7	2017-07-11 17:13:00 +0200	[diff] [blame]	1001	static int amdgpu_vm_wait_pd(struct amdgpu_device adev, struct amdgpu_vm vm,
				1002	void *owner)
Harish Kasiviswanathan	3c82417	2017-05-11 15:50:08 -0400	[diff] [blame]	1003	{
				1004	struct amdgpu_sync sync;
				1005	int r;
				1006
				1007	amdgpu_sync_create(&sync);
Christian König	a33cab7	2017-07-11 17:13:00 +0200	[diff] [blame]	1008	amdgpu_sync_resv(adev, &sync, vm->root.bo->tbo.resv, owner);
Harish Kasiviswanathan	3c82417	2017-05-11 15:50:08 -0400	[diff] [blame]	1009	r = amdgpu_sync_wait(&sync, true);
				1010	amdgpu_sync_free(&sync);
				1011
				1012	return r;
				1013	}
				1014
Christian König	f8991ba	2016-09-16 15:36:49 +0200	[diff] [blame]	1015	/*
Christian König	194d216	2016-10-12 15:13:52 +0200	[diff] [blame]	1016	* amdgpu_vm_update_level - update a single level in the hierarchy
Christian König	f8991ba	2016-09-16 15:36:49 +0200	[diff] [blame]	1017	*
				1018	* @adev: amdgpu_device pointer
				1019	* @vm: requested vm
Christian König	194d216	2016-10-12 15:13:52 +0200	[diff] [blame]	1020	* @parent: parent directory
Christian König	f8991ba	2016-09-16 15:36:49 +0200	[diff] [blame]	1021	*
Christian König	194d216	2016-10-12 15:13:52 +0200	[diff] [blame]	1022	* Makes sure all entries in @parent are up to date.
Christian König	f8991ba	2016-09-16 15:36:49 +0200	[diff] [blame]	1023	* Returns 0 for success, error for failure.
				1024	*/
Christian König	194d216	2016-10-12 15:13:52 +0200	[diff] [blame]	1025	static int amdgpu_vm_update_level(struct amdgpu_device *adev,
				1026	struct amdgpu_vm *vm,
				1027	struct amdgpu_vm_pt *parent,
				1028	unsigned level)
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1029	{
Christian König	f8991ba	2016-09-16 15:36:49 +0200	[diff] [blame]	1030	struct amdgpu_bo *shadow;
Harish Kasiviswanathan	a1924005	2017-06-09 17:47:28 -0400	[diff] [blame]	1031	struct amdgpu_ring *ring = NULL;
				1032	uint64_t pd_addr, shadow_addr = 0;
Christian König	194d216	2016-10-12 15:13:52 +0200	[diff] [blame]	1033	uint32_t incr = amdgpu_vm_bo_size(adev, level + 1);
Christian König	f8991ba	2016-09-16 15:36:49 +0200	[diff] [blame]	1034	uint64_t last_pde = ~0, last_pt = ~0, last_shadow = ~0;
Harish Kasiviswanathan	a1924005	2017-06-09 17:47:28 -0400	[diff] [blame]	1035	unsigned count = 0, pt_idx, ndw = 0;
Christian König	d71518b	2016-02-01 12:20:25 +0100	[diff] [blame]	1036	struct amdgpu_job *job;
Christian König	29efc4f	2016-08-04 14:52:50 +0200	[diff] [blame]	1037	struct amdgpu_pte_update_params params;
Dave Airlie	220196b	2016-10-28 11:33:52 +1000	[diff] [blame]	1038	struct dma_fence *fence = NULL;
Chunming Zhou	d5fc5e8	2015-07-21 16:52:10 +0800	[diff] [blame]	1039
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1040	int r;
				1041
Christian König	194d216	2016-10-12 15:13:52 +0200	[diff] [blame]	1042	if (!parent->entries)
				1043	return 0;
Christian König	d71518b	2016-02-01 12:20:25 +0100	[diff] [blame]	1044
Christian König	27c5f36	2016-08-04 15:02:49 +0200	[diff] [blame]	1045	memset(&params, 0, sizeof(params));
				1046	params.adev = adev;
Harish Kasiviswanathan	3c82417	2017-05-11 15:50:08 -0400	[diff] [blame]	1047	shadow = parent->bo->shadow;
				1048
Alex Deucher	6927798	2017-07-13 15:37:11 -0400	[diff] [blame]	1049	if (vm->use_cpu_for_update) {
Harish Kasiviswanathan	3c82417	2017-05-11 15:50:08 -0400	[diff] [blame]	1050	r = amdgpu_bo_kmap(parent->bo, (void **)&pd_addr);
				1051	if (r)
				1052	return r;
Christian König	a33cab7	2017-07-11 17:13:00 +0200	[diff] [blame]	1053	r = amdgpu_vm_wait_pd(adev, vm, AMDGPU_FENCE_OWNER_VM);
Harish Kasiviswanathan	3c82417	2017-05-11 15:50:08 -0400	[diff] [blame]	1054	if (unlikely(r)) {
				1055	amdgpu_bo_kunmap(parent->bo);
				1056	return r;
				1057	}
				1058	params.func = amdgpu_vm_cpu_set_ptes;
				1059	} else {
				1060	if (shadow) {
				1061	r = amdgpu_ttm_bind(&shadow->tbo, &shadow->tbo.mem);
				1062	if (r)
				1063	return r;
				1064	}
				1065	ring = container_of(vm->entity.sched, struct amdgpu_ring,
				1066	sched);
				1067
				1068	/* padding, etc. */
				1069	ndw = 64;
				1070
				1071	/* assume the worst case */
				1072	ndw += parent->last_entry_used * 6;
				1073
				1074	pd_addr = amdgpu_bo_gpu_offset(parent->bo);
				1075
				1076	if (shadow) {
				1077	shadow_addr = amdgpu_bo_gpu_offset(shadow);
				1078	ndw *= 2;
				1079	} else {
				1080	shadow_addr = 0;
				1081	}
				1082
				1083	r = amdgpu_job_alloc_with_ib(adev, ndw * 4, &job);
				1084	if (r)
				1085	return r;
				1086
				1087	params.ib = &job->ibs[0];
				1088	params.func = amdgpu_vm_do_set_ptes;
				1089	}
				1090
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1091
Christian König	194d216	2016-10-12 15:13:52 +0200	[diff] [blame]	1092	/* walk over the address space and update the directory */
				1093	for (pt_idx = 0; pt_idx <= parent->last_entry_used; ++pt_idx) {
				1094	struct amdgpu_bo *bo = parent->entries[pt_idx].bo;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1095	uint64_t pde, pt;
				1096
				1097	if (bo == NULL)
				1098	continue;
				1099
Christian König	0fc8683	2016-09-16 11:46:23 +0200	[diff] [blame]	1100	if (bo->shadow) {
Christian König	f8991ba	2016-09-16 15:36:49 +0200	[diff] [blame]	1101	struct amdgpu_bo *pt_shadow = bo->shadow;
Christian König	0fc8683	2016-09-16 11:46:23 +0200	[diff] [blame]	1102
Christian König	f8991ba	2016-09-16 15:36:49 +0200	[diff] [blame]	1103	r = amdgpu_ttm_bind(&pt_shadow->tbo,
				1104	&pt_shadow->tbo.mem);
Christian König	0fc8683	2016-09-16 11:46:23 +0200	[diff] [blame]	1105	if (r)
				1106	return r;
				1107	}
				1108
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1109	pt = amdgpu_bo_gpu_offset(bo);
Christian König	53e2e91	2017-05-15 15:19:10 +0200	[diff] [blame]	1110	pt = amdgpu_gart_get_vm_pde(adev, pt);
Christian König	194d216	2016-10-12 15:13:52 +0200	[diff] [blame]	1111	if (parent->entries[pt_idx].addr == pt)
Christian König	f8991ba	2016-09-16 15:36:49 +0200	[diff] [blame]	1112	continue;
				1113
Christian König	194d216	2016-10-12 15:13:52 +0200	[diff] [blame]	1114	parent->entries[pt_idx].addr = pt;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1115
				1116	pde = pd_addr + pt_idx * 8;
				1117	if (((last_pde + 8 * count) != pde) \|\|
Christian König	96105e5	2016-08-12 12:59:59 +0200	[diff] [blame]	1118	((last_pt + incr * count) != pt) \|\|
				1119	(count == AMDGPU_VM_MAX_UPDATE_SIZE)) {
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1120
				1121	if (count) {
Christian König	f8991ba	2016-09-16 15:36:49 +0200	[diff] [blame]	1122	if (shadow)
Harish Kasiviswanathan	3c82417	2017-05-11 15:50:08 -0400	[diff] [blame]	1123	params.func(&params,
				1124	last_shadow,
				1125	last_pt, count,
				1126	incr,
				1127	AMDGPU_PTE_VALID);
Christian König	f8991ba	2016-09-16 15:36:49 +0200	[diff] [blame]	1128
Harish Kasiviswanathan	3c82417	2017-05-11 15:50:08 -0400	[diff] [blame]	1129	params.func(&params, last_pde,
				1130	last_pt, count, incr,
				1131	AMDGPU_PTE_VALID);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1132	}
				1133
				1134	count = 1;
				1135	last_pde = pde;
Christian König	f8991ba	2016-09-16 15:36:49 +0200	[diff] [blame]	1136	last_shadow = shadow_addr + pt_idx * 8;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1137	last_pt = pt;
				1138	} else {
				1139	++count;
				1140	}
				1141	}
				1142
Christian König	f8991ba	2016-09-16 15:36:49 +0200	[diff] [blame]	1143	if (count) {
Christian König	67003a1	2016-10-12 14:46:26 +0200	[diff] [blame]	1144	if (vm->root.bo->shadow)
Harish Kasiviswanathan	3c82417	2017-05-11 15:50:08 -0400	[diff] [blame]	1145	params.func(&params, last_shadow, last_pt,
				1146	count, incr, AMDGPU_PTE_VALID);
Christian König	f8991ba	2016-09-16 15:36:49 +0200	[diff] [blame]	1147
Harish Kasiviswanathan	3c82417	2017-05-11 15:50:08 -0400	[diff] [blame]	1148	params.func(&params, last_pde, last_pt,
				1149	count, incr, AMDGPU_PTE_VALID);
Chunming Zhou	d5fc5e8	2015-07-21 16:52:10 +0800	[diff] [blame]	1150	}
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1151
Harish Kasiviswanathan	3c82417	2017-05-11 15:50:08 -0400	[diff] [blame]	1152	if (params.func == amdgpu_vm_cpu_set_ptes)
				1153	amdgpu_bo_kunmap(parent->bo);
				1154	else if (params.ib->length_dw == 0) {
Christian König	f8991ba	2016-09-16 15:36:49 +0200	[diff] [blame]	1155	amdgpu_job_free(job);
Christian König	194d216	2016-10-12 15:13:52 +0200	[diff] [blame]	1156	} else {
				1157	amdgpu_ring_pad_ib(ring, params.ib);
				1158	amdgpu_sync_resv(adev, &job->sync, parent->bo->tbo.resv,
Christian König	f8991ba	2016-09-16 15:36:49 +0200	[diff] [blame]	1159	AMDGPU_FENCE_OWNER_VM);
Christian König	194d216	2016-10-12 15:13:52 +0200	[diff] [blame]	1160	if (shadow)
				1161	amdgpu_sync_resv(adev, &job->sync, shadow->tbo.resv,
				1162	AMDGPU_FENCE_OWNER_VM);
Christian König	f8991ba	2016-09-16 15:36:49 +0200	[diff] [blame]	1163
Christian König	194d216	2016-10-12 15:13:52 +0200	[diff] [blame]	1164	WARN_ON(params.ib->length_dw > ndw);
				1165	r = amdgpu_job_submit(job, ring, &vm->entity,
				1166	AMDGPU_FENCE_OWNER_VM, &fence);
				1167	if (r)
				1168	goto error_free;
Christian König	f8991ba	2016-09-16 15:36:49 +0200	[diff] [blame]	1169
Christian König	194d216	2016-10-12 15:13:52 +0200	[diff] [blame]	1170	amdgpu_bo_fence(parent->bo, fence, true);
				1171	dma_fence_put(vm->last_dir_update);
				1172	vm->last_dir_update = dma_fence_get(fence);
				1173	dma_fence_put(fence);
				1174	}
				1175	/*
				1176	* Recurse into the subdirectories. This recursion is harmless because
				1177	* we only have a maximum of 5 layers.
				1178	*/
				1179	for (pt_idx = 0; pt_idx <= parent->last_entry_used; ++pt_idx) {
				1180	struct amdgpu_vm_pt *entry = &parent->entries[pt_idx];
				1181
				1182	if (!entry->bo)
				1183	continue;
				1184
				1185	r = amdgpu_vm_update_level(adev, vm, entry, level + 1);
				1186	if (r)
				1187	return r;
				1188	}
Christian König	f8991ba	2016-09-16 15:36:49 +0200	[diff] [blame]	1189
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1190	return 0;
Chunming Zhou	d5fc5e8	2015-07-21 16:52:10 +0800	[diff] [blame]	1191
				1192	error_free:
Christian König	d71518b	2016-02-01 12:20:25 +0100	[diff] [blame]	1193	amdgpu_job_free(job);
Chunming Zhou	4af9f07	2015-08-03 12:57:31 +0800	[diff] [blame]	1194	return r;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1195	}
				1196
Christian König	194d216	2016-10-12 15:13:52 +0200	[diff] [blame]	1197	/*
Christian König	92456b9	2017-05-12 16:09:26 +0200	[diff] [blame]	1198	* amdgpu_vm_invalidate_level - mark all PD levels as invalid
				1199	*
				1200	* @parent: parent PD
				1201	*
				1202	* Mark all PD level as invalid after an error.
				1203	*/
				1204	static void amdgpu_vm_invalidate_level(struct amdgpu_vm_pt *parent)
				1205	{
				1206	unsigned pt_idx;
				1207
				1208	/*
				1209	* Recurse into the subdirectories. This recursion is harmless because
				1210	* we only have a maximum of 5 layers.
				1211	*/
				1212	for (pt_idx = 0; pt_idx <= parent->last_entry_used; ++pt_idx) {
				1213	struct amdgpu_vm_pt *entry = &parent->entries[pt_idx];
				1214
				1215	if (!entry->bo)
				1216	continue;
				1217
				1218	entry->addr = ~0ULL;
				1219	amdgpu_vm_invalidate_level(entry);
				1220	}
				1221	}
				1222
				1223	/*
Christian König	194d216	2016-10-12 15:13:52 +0200	[diff] [blame]	1224	* amdgpu_vm_update_directories - make sure that all directories are valid
				1225	*
				1226	* @adev: amdgpu_device pointer
				1227	* @vm: requested vm
				1228	*
				1229	* Makes sure all directories are up to date.
				1230	* Returns 0 for success, error for failure.
				1231	*/
				1232	int amdgpu_vm_update_directories(struct amdgpu_device *adev,
				1233	struct amdgpu_vm *vm)
				1234	{
Christian König	92456b9	2017-05-12 16:09:26 +0200	[diff] [blame]	1235	int r;
				1236
				1237	r = amdgpu_vm_update_level(adev, vm, &vm->root, 0);
				1238	if (r)
				1239	amdgpu_vm_invalidate_level(&vm->root);
				1240
				1241	return r;
Christian König	194d216	2016-10-12 15:13:52 +0200	[diff] [blame]	1242	}
				1243
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1244	/**
Christian König	4e2cb64	2016-10-25 15:52:28 +0200	[diff] [blame]	1245	* amdgpu_vm_find_pt - find the page table for an address
				1246	*
				1247	* @p: see amdgpu_pte_update_params definition
				1248	* @addr: virtual address in question
				1249	*
				1250	* Find the page table BO for a virtual address, return NULL when none found.
				1251	*/
				1252	static struct amdgpu_bo amdgpu_vm_get_pt(struct amdgpu_pte_update_params p,
				1253	uint64_t addr)
				1254	{
				1255	struct amdgpu_vm_pt *entry = &p->vm->root;
				1256	unsigned idx, level = p->adev->vm_manager.num_level;
				1257
				1258	while (entry->entries) {
Zhang, Jerry	36b32a6	2017-03-29 16:08:32 +0800	[diff] [blame]	1259	idx = addr >> (p->adev->vm_manager.block_size * level--);
Christian König	4e2cb64	2016-10-25 15:52:28 +0200	[diff] [blame]	1260	idx %= amdgpu_bo_size(entry->bo) / 8;
				1261	entry = &entry->entries[idx];
				1262	}
				1263
				1264	if (level)
				1265	return NULL;
				1266
				1267	return entry->bo;
				1268	}
				1269
				1270	/**
Christian König	92696dd	2016-08-05 13:56:35 +0200	[diff] [blame]	1271	* amdgpu_vm_update_ptes - make sure that page tables are valid
				1272	*
				1273	* @params: see amdgpu_pte_update_params definition
				1274	* @vm: requested vm
				1275	* @start: start of GPU address range
				1276	* @end: end of GPU address range
				1277	* @dst: destination address to map to, the next dst inside the function
				1278	* @flags: mapping flags
				1279	*
				1280	* Update the page tables in the range @start - @end.
Harish Kasiviswanathan	cc28c4e	2017-05-11 22:39:31 -0400	[diff] [blame]	1281	* Returns 0 for success, -EINVAL for failure.
Christian König	92696dd	2016-08-05 13:56:35 +0200	[diff] [blame]	1282	*/
Harish Kasiviswanathan	cc28c4e	2017-05-11 22:39:31 -0400	[diff] [blame]	1283	static int amdgpu_vm_update_ptes(struct amdgpu_pte_update_params *params,
Christian König	92696dd	2016-08-05 13:56:35 +0200	[diff] [blame]	1284	uint64_t start, uint64_t end,
Chunming Zhou	6b77760	2016-09-21 16:19:19 +0800	[diff] [blame]	1285	uint64_t dst, uint64_t flags)
Christian König	92696dd	2016-08-05 13:56:35 +0200	[diff] [blame]	1286	{
Zhang, Jerry	36b32a6	2017-03-29 16:08:32 +0800	[diff] [blame]	1287	struct amdgpu_device *adev = params->adev;
				1288	const uint64_t mask = AMDGPU_VM_PTE_COUNT(adev) - 1;
Christian König	92696dd	2016-08-05 13:56:35 +0200	[diff] [blame]	1289
Christian König	301654a	2017-05-16 14:30:27 +0200	[diff] [blame]	1290	uint64_t addr, pe_start;
Christian König	92696dd	2016-08-05 13:56:35 +0200	[diff] [blame]	1291	struct amdgpu_bo *pt;
Christian König	301654a	2017-05-16 14:30:27 +0200	[diff] [blame]	1292	unsigned nptes;
Harish Kasiviswanathan	370f092	2017-06-09 17:47:27 -0400	[diff] [blame]	1293	int r;
				1294	bool use_cpu_update = (params->func == amdgpu_vm_cpu_set_ptes);
Christian König	92696dd	2016-08-05 13:56:35 +0200	[diff] [blame]	1295
Christian König	92696dd	2016-08-05 13:56:35 +0200	[diff] [blame]	1296
				1297	/* walk over the address space and update the page tables */
Christian König	301654a	2017-05-16 14:30:27 +0200	[diff] [blame]	1298	for (addr = start; addr < end; addr += nptes) {
Christian König	4e2cb64	2016-10-25 15:52:28 +0200	[diff] [blame]	1299	pt = amdgpu_vm_get_pt(params, addr);
Felix Kuehling	1866bac	2017-03-28 20:36:12 -0400	[diff] [blame]	1300	if (!pt) {
				1301	pr_err("PT not found, aborting update_ptes\n");
Harish Kasiviswanathan	cc28c4e	2017-05-11 22:39:31 -0400	[diff] [blame]	1302	return -EINVAL;
Felix Kuehling	1866bac	2017-03-28 20:36:12 -0400	[diff] [blame]	1303	}
Christian König	4e2cb64	2016-10-25 15:52:28 +0200	[diff] [blame]	1304
Christian König	92696dd	2016-08-05 13:56:35 +0200	[diff] [blame]	1305	if ((addr & ~mask) == (end & ~mask))
				1306	nptes = end - addr;
				1307	else
Zhang, Jerry	36b32a6	2017-03-29 16:08:32 +0800	[diff] [blame]	1308	nptes = AMDGPU_VM_PTE_COUNT(adev) - (addr & mask);
Christian König	92696dd	2016-08-05 13:56:35 +0200	[diff] [blame]	1309
Harish Kasiviswanathan	370f092	2017-06-09 17:47:27 -0400	[diff] [blame]	1310	if (use_cpu_update) {
				1311	r = amdgpu_bo_kmap(pt, (void *)&pe_start);
				1312	if (r)
				1313	return r;
Christian König	dd0792c	2017-06-27 14:48:15 -0400	[diff] [blame]	1314	} else {
				1315	if (pt->shadow) {
				1316	pe_start = amdgpu_bo_gpu_offset(pt->shadow);
				1317	pe_start += (addr & mask) * 8;
				1318	params->func(params, pe_start, dst, nptes,
				1319	AMDGPU_GPU_PAGE_SIZE, flags);
				1320	}
Harish Kasiviswanathan	370f092	2017-06-09 17:47:27 -0400	[diff] [blame]	1321	pe_start = amdgpu_bo_gpu_offset(pt);
Christian König	dd0792c	2017-06-27 14:48:15 -0400	[diff] [blame]	1322	}
Christian König	92696dd	2016-08-05 13:56:35 +0200	[diff] [blame]	1323
Christian König	301654a	2017-05-16 14:30:27 +0200	[diff] [blame]	1324	pe_start += (addr & mask) * 8;
Christian König	301654a	2017-05-16 14:30:27 +0200	[diff] [blame]	1325	params->func(params, pe_start, dst, nptes,
				1326	AMDGPU_GPU_PAGE_SIZE, flags);
Christian König	92696dd	2016-08-05 13:56:35 +0200	[diff] [blame]	1327
Christian König	92696dd	2016-08-05 13:56:35 +0200	[diff] [blame]	1328	dst += nptes * AMDGPU_GPU_PAGE_SIZE;
Harish Kasiviswanathan	370f092	2017-06-09 17:47:27 -0400	[diff] [blame]	1329
				1330	if (use_cpu_update)
				1331	amdgpu_bo_kunmap(pt);
Christian König	92696dd	2016-08-05 13:56:35 +0200	[diff] [blame]	1332	}
				1333
Harish Kasiviswanathan	cc28c4e	2017-05-11 22:39:31 -0400	[diff] [blame]	1334	return 0;
Christian König	92696dd	2016-08-05 13:56:35 +0200	[diff] [blame]	1335	}
				1336
				1337	/*
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1338	* amdgpu_vm_frag_ptes - add fragment information to PTEs
				1339	*
Christian König	29efc4f	2016-08-04 14:52:50 +0200	[diff] [blame]	1340	* @params: see amdgpu_pte_update_params definition
Christian König	92696dd	2016-08-05 13:56:35 +0200	[diff] [blame]	1341	* @vm: requested vm
				1342	* @start: first PTE to handle
				1343	* @end: last PTE to handle
				1344	* @dst: addr those PTEs should point to
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1345	* @flags: hw mapping flags
Harish Kasiviswanathan	cc28c4e	2017-05-11 22:39:31 -0400	[diff] [blame]	1346	* Returns 0 for success, -EINVAL for failure.
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1347	*/
Harish Kasiviswanathan	cc28c4e	2017-05-11 22:39:31 -0400	[diff] [blame]	1348	static int amdgpu_vm_frag_ptes(struct amdgpu_pte_update_params *params,
Christian König	92696dd	2016-08-05 13:56:35 +0200	[diff] [blame]	1349	uint64_t start, uint64_t end,
Chunming Zhou	6b77760	2016-09-21 16:19:19 +0800	[diff] [blame]	1350	uint64_t dst, uint64_t flags)
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1351	{
Harish Kasiviswanathan	cc28c4e	2017-05-11 22:39:31 -0400	[diff] [blame]	1352	int r;
				1353
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1354	/**
				1355	* The MC L1 TLB supports variable sized pages, based on a fragment
				1356	* field in the PTE. When this field is set to a non-zero value, page
				1357	* granularity is increased from 4KB to (1 << (12 + frag)). The PTE
				1358	* flags are considered valid for all PTEs within the fragment range
				1359	* and corresponding mappings are assumed to be physically contiguous.
				1360	*
				1361	* The L1 TLB can store a single PTE for the whole fragment,
				1362	* significantly increasing the space available for translation
				1363	* caching. This leads to large improvements in throughput when the
				1364	* TLB is under pressure.
				1365	*
				1366	* The L2 TLB distributes small and large fragments into two
				1367	* asymmetric partitions. The large fragment cache is significantly
				1368	* larger. Thus, we try to use large fragments wherever possible.
				1369	* Userspace can support this by aligning virtual base address and
				1370	* allocation size to the fragment size.
				1371	*/
				1372
Christian König	8036617	2016-10-04 13:39:43 +0200	[diff] [blame]	1373	/* SI and newer are optimized for 64KB */
				1374	uint64_t frag_flags = AMDGPU_PTE_FRAG(AMDGPU_LOG2_PAGES_PER_FRAG);
				1375	uint64_t frag_align = 1 << AMDGPU_LOG2_PAGES_PER_FRAG;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1376
Christian König	92696dd	2016-08-05 13:56:35 +0200	[diff] [blame]	1377	uint64_t frag_start = ALIGN(start, frag_align);
				1378	uint64_t frag_end = end & ~(frag_align - 1);
Christian König	31f6c1f	2016-01-26 12:37:49 +0100	[diff] [blame]	1379
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1380	/* system pages are non continuously */
Christian König	b7fc2cb	2016-08-11 16:44:15 +0200	[diff] [blame]	1381	if (params->src \|\| !(flags & AMDGPU_PTE_VALID) \|\|
Harish Kasiviswanathan	cc28c4e	2017-05-11 22:39:31 -0400	[diff] [blame]	1382	(frag_start >= frag_end))
				1383	return amdgpu_vm_update_ptes(params, start, end, dst, flags);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1384
				1385	/* handle the 4K area at the beginning */
Christian König	92696dd	2016-08-05 13:56:35 +0200	[diff] [blame]	1386	if (start != frag_start) {
Harish Kasiviswanathan	cc28c4e	2017-05-11 22:39:31 -0400	[diff] [blame]	1387	r = amdgpu_vm_update_ptes(params, start, frag_start,
				1388	dst, flags);
				1389	if (r)
				1390	return r;
Christian König	92696dd	2016-08-05 13:56:35 +0200	[diff] [blame]	1391	dst += (frag_start - start) * AMDGPU_GPU_PAGE_SIZE;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1392	}
				1393
				1394	/* handle the area in the middle */
Harish Kasiviswanathan	cc28c4e	2017-05-11 22:39:31 -0400	[diff] [blame]	1395	r = amdgpu_vm_update_ptes(params, frag_start, frag_end, dst,
				1396	flags \| frag_flags);
				1397	if (r)
				1398	return r;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1399
				1400	/* handle the 4K area at the end */
Christian König	92696dd	2016-08-05 13:56:35 +0200	[diff] [blame]	1401	if (frag_end != end) {
				1402	dst += (frag_end - frag_start) * AMDGPU_GPU_PAGE_SIZE;
Harish Kasiviswanathan	cc28c4e	2017-05-11 22:39:31 -0400	[diff] [blame]	1403	r = amdgpu_vm_update_ptes(params, frag_end, end, dst, flags);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1404	}
Harish Kasiviswanathan	cc28c4e	2017-05-11 22:39:31 -0400	[diff] [blame]	1405	return r;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1406	}
				1407
				1408	/**
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1409	* amdgpu_vm_bo_update_mapping - update a mapping in the vm page table
				1410	*
				1411	* @adev: amdgpu_device pointer
Christian König	3cabaa5	2016-06-06 10:17:58 +0200	[diff] [blame]	1412	* @exclusive: fence we need to sync to
Christian König	fa3ab3c	2016-03-18 21:00:35 +0100	[diff] [blame]	1413	* @src: address where to copy page table entries from
				1414	* @pages_addr: DMA addresses to use for mapping
Christian König	a14faa6	2016-01-25 14:27:31 +0100	[diff] [blame]	1415	* @vm: requested vm
				1416	* @start: start of mapped range
				1417	* @last: last mapped entry
				1418	* @flags: flags for the entries
				1419	* @addr: addr to set the area to
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1420	* @fence: optional resulting fence
				1421	*
Christian König	a14faa6	2016-01-25 14:27:31 +0100	[diff] [blame]	1422	* Fill in the page table entries between @start and @last.
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1423	* Returns 0 for success, -EINVAL for failure.
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1424	*/
				1425	static int amdgpu_vm_bo_update_mapping(struct amdgpu_device *adev,
Chris Wilson	f54d186	2016-10-25 13:00:45 +0100	[diff] [blame]	1426	struct dma_fence *exclusive,
Christian König	fa3ab3c	2016-03-18 21:00:35 +0100	[diff] [blame]	1427	uint64_t src,
				1428	dma_addr_t *pages_addr,
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1429	struct amdgpu_vm *vm,
Christian König	a14faa6	2016-01-25 14:27:31 +0100	[diff] [blame]	1430	uint64_t start, uint64_t last,
Chunming Zhou	6b77760	2016-09-21 16:19:19 +0800	[diff] [blame]	1431	uint64_t flags, uint64_t addr,
Chris Wilson	f54d186	2016-10-25 13:00:45 +0100	[diff] [blame]	1432	struct dma_fence **fence)
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1433	{
Christian König	2d55e45	2016-02-08 17:37:38 +0100	[diff] [blame]	1434	struct amdgpu_ring *ring;
Christian König	a1e08d3	2016-01-26 11:40:46 +0100	[diff] [blame]	1435	void *owner = AMDGPU_FENCE_OWNER_VM;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1436	unsigned nptes, ncmds, ndw;
Christian König	d71518b	2016-02-01 12:20:25 +0100	[diff] [blame]	1437	struct amdgpu_job *job;
Christian König	29efc4f	2016-08-04 14:52:50 +0200	[diff] [blame]	1438	struct amdgpu_pte_update_params params;
Chris Wilson	f54d186	2016-10-25 13:00:45 +0100	[diff] [blame]	1439	struct dma_fence *f = NULL;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1440	int r;
				1441
Christian König	afef8b8	2016-08-12 13:29:18 +0200	[diff] [blame]	1442	memset(&params, 0, sizeof(params));
				1443	params.adev = adev;
Christian König	49ac8a2	2016-10-13 15:09:08 +0200	[diff] [blame]	1444	params.vm = vm;
Christian König	afef8b8	2016-08-12 13:29:18 +0200	[diff] [blame]	1445	params.src = src;
				1446
Christian König	a33cab7	2017-07-11 17:13:00 +0200	[diff] [blame]	1447	/* sync to everything on unmapping */
				1448	if (!(flags & AMDGPU_PTE_VALID))
				1449	owner = AMDGPU_FENCE_OWNER_UNDEFINED;
				1450
Harish Kasiviswanathan	b4d4251	2017-05-11 19:47:22 -0400	[diff] [blame]	1451	if (vm->use_cpu_for_update) {
				1452	/* params.src is used as flag to indicate system Memory */
				1453	if (pages_addr)
				1454	params.src = ~0;
				1455
				1456	/* Wait for PT BOs to be free. PTs share the same resv. object
				1457	* as the root PD BO
				1458	*/
Christian König	a33cab7	2017-07-11 17:13:00 +0200	[diff] [blame]	1459	r = amdgpu_vm_wait_pd(adev, vm, owner);
Harish Kasiviswanathan	b4d4251	2017-05-11 19:47:22 -0400	[diff] [blame]	1460	if (unlikely(r))
				1461	return r;
				1462
				1463	params.func = amdgpu_vm_cpu_set_ptes;
				1464	params.pages_addr = pages_addr;
Harish Kasiviswanathan	b4d4251	2017-05-11 19:47:22 -0400	[diff] [blame]	1465	return amdgpu_vm_frag_ptes(&params, start, last + 1,
				1466	addr, flags);
				1467	}
				1468
Christian König	2d55e45	2016-02-08 17:37:38 +0100	[diff] [blame]	1469	ring = container_of(vm->entity.sched, struct amdgpu_ring, sched);
Christian König	27c5f36	2016-08-04 15:02:49 +0200	[diff] [blame]	1470
Christian König	a14faa6	2016-01-25 14:27:31 +0100	[diff] [blame]	1471	nptes = last - start + 1;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1472
				1473	/*
				1474	* reserve space for one command every (1 << BLOCK_SIZE)
				1475	* entries or 2k dwords (whatever is smaller)
				1476	*/
Zhang, Jerry	36b32a6	2017-03-29 16:08:32 +0800	[diff] [blame]	1477	ncmds = (nptes >> min(adev->vm_manager.block_size, 11u)) + 1;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1478
				1479	/* padding, etc. */
				1480	ndw = 64;
				1481
Christian König	b0456f9	2016-08-11 14:06:54 +0200	[diff] [blame]	1482	if (src) {
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1483	/* only copy commands needed */
				1484	ndw += ncmds * 7;
				1485
Christian König	afef8b8	2016-08-12 13:29:18 +0200	[diff] [blame]	1486	params.func = amdgpu_vm_do_copy_ptes;
				1487
Christian König	b0456f9	2016-08-11 14:06:54 +0200	[diff] [blame]	1488	} else if (pages_addr) {
				1489	/* copy commands needed */
				1490	ndw += ncmds * 7;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1491
Christian König	b0456f9	2016-08-11 14:06:54 +0200	[diff] [blame]	1492	/* and also PTEs */
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1493	ndw += nptes * 2;
				1494
Christian König	afef8b8	2016-08-12 13:29:18 +0200	[diff] [blame]	1495	params.func = amdgpu_vm_do_copy_ptes;
				1496
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1497	} else {
				1498	/* set page commands needed */
				1499	ndw += ncmds * 10;
				1500
				1501	/* two extra commands for begin/end of fragment */
				1502	ndw += 2 * 10;
Christian König	afef8b8	2016-08-12 13:29:18 +0200	[diff] [blame]	1503
				1504	params.func = amdgpu_vm_do_set_ptes;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1505	}
				1506
Christian König	d71518b	2016-02-01 12:20:25 +0100	[diff] [blame]	1507	r = amdgpu_job_alloc_with_ib(adev, ndw * 4, &job);
				1508	if (r)
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1509	return r;
Christian König	d71518b	2016-02-01 12:20:25 +0100	[diff] [blame]	1510
Christian König	29efc4f	2016-08-04 14:52:50 +0200	[diff] [blame]	1511	params.ib = &job->ibs[0];
Chunming Zhou	d5fc5e8	2015-07-21 16:52:10 +0800	[diff] [blame]	1512
Christian König	b0456f9	2016-08-11 14:06:54 +0200	[diff] [blame]	1513	if (!src && pages_addr) {
				1514	uint64_t *pte;
				1515	unsigned i;
				1516
				1517	/* Put the PTEs at the end of the IB. */
				1518	i = ndw - nptes * 2;
				1519	pte= (uint64_t *)&(job->ibs->ptr[i]);
				1520	params.src = job->ibs->gpu_addr + i * 4;
				1521
				1522	for (i = 0; i < nptes; ++i) {
				1523	pte[i] = amdgpu_vm_map_gart(pages_addr, addr + i *
				1524	AMDGPU_GPU_PAGE_SIZE);
				1525	pte[i] \|= flags;
				1526	}
Christian König	d7a4ac6	2016-09-25 11:54:00 +0200	[diff] [blame]	1527	addr = 0;
Christian König	b0456f9	2016-08-11 14:06:54 +0200	[diff] [blame]	1528	}
				1529
Christian König	3cabaa5	2016-06-06 10:17:58 +0200	[diff] [blame]	1530	r = amdgpu_sync_fence(adev, &job->sync, exclusive);
				1531	if (r)
				1532	goto error_free;
				1533
Christian König	67003a1	2016-10-12 14:46:26 +0200	[diff] [blame]	1534	r = amdgpu_sync_resv(adev, &job->sync, vm->root.bo->tbo.resv,
Christian König	a1e08d3	2016-01-26 11:40:46 +0100	[diff] [blame]	1535	owner);
				1536	if (r)
				1537	goto error_free;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1538
Christian König	67003a1	2016-10-12 14:46:26 +0200	[diff] [blame]	1539	r = reservation_object_reserve_shared(vm->root.bo->tbo.resv);
Christian König	a1e08d3	2016-01-26 11:40:46 +0100	[diff] [blame]	1540	if (r)
				1541	goto error_free;
				1542
Harish Kasiviswanathan	cc28c4e	2017-05-11 22:39:31 -0400	[diff] [blame]	1543	r = amdgpu_vm_frag_ptes(&params, start, last + 1, addr, flags);
				1544	if (r)
				1545	goto error_free;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1546
Christian König	29efc4f	2016-08-04 14:52:50 +0200	[diff] [blame]	1547	amdgpu_ring_pad_ib(ring, params.ib);
				1548	WARN_ON(params.ib->length_dw > ndw);
Christian König	2bd9ccf	2016-02-01 12:53:58 +0100	[diff] [blame]	1549	r = amdgpu_job_submit(job, ring, &vm->entity,
				1550	AMDGPU_FENCE_OWNER_VM, &f);
Chunming Zhou	4af9f07	2015-08-03 12:57:31 +0800	[diff] [blame]	1551	if (r)
				1552	goto error_free;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1553
Christian König	67003a1	2016-10-12 14:46:26 +0200	[diff] [blame]	1554	amdgpu_bo_fence(vm->root.bo, f, true);
Christian König	284710f	2017-01-30 11:09:31 +0100	[diff] [blame]	1555	dma_fence_put(*fence);
				1556	*fence = f;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1557	return 0;
Chunming Zhou	d5fc5e8	2015-07-21 16:52:10 +0800	[diff] [blame]	1558
				1559	error_free:
Christian König	d71518b	2016-02-01 12:20:25 +0100	[diff] [blame]	1560	amdgpu_job_free(job);
Chunming Zhou	4af9f07	2015-08-03 12:57:31 +0800	[diff] [blame]	1561	return r;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1562	}
				1563
				1564	/**
Christian König	a14faa6	2016-01-25 14:27:31 +0100	[diff] [blame]	1565	* amdgpu_vm_bo_split_mapping - split a mapping into smaller chunks
				1566	*
				1567	* @adev: amdgpu_device pointer
Christian König	3cabaa5	2016-06-06 10:17:58 +0200	[diff] [blame]	1568	* @exclusive: fence we need to sync to
Christian König	8358dce	2016-03-30 10:50:25 +0200	[diff] [blame]	1569	* @gtt_flags: flags as they are used for GTT
				1570	* @pages_addr: DMA addresses to use for mapping
Christian König	a14faa6	2016-01-25 14:27:31 +0100	[diff] [blame]	1571	* @vm: requested vm
				1572	* @mapping: mapped range and flags to use for the update
Christian König	8358dce	2016-03-30 10:50:25 +0200	[diff] [blame]	1573	* @flags: HW flags for the mapping
Christian König	63e0ba4	2016-08-16 17:38:37 +0200	[diff] [blame]	1574	* @nodes: array of drm_mm_nodes with the MC addresses
Christian König	a14faa6	2016-01-25 14:27:31 +0100	[diff] [blame]	1575	* @fence: optional resulting fence
				1576	*
				1577	* Split the mapping into smaller chunks so that each update fits
				1578	* into a SDMA IB.
				1579	* Returns 0 for success, -EINVAL for failure.
				1580	*/
				1581	static int amdgpu_vm_bo_split_mapping(struct amdgpu_device *adev,
Chris Wilson	f54d186	2016-10-25 13:00:45 +0100	[diff] [blame]	1582	struct dma_fence *exclusive,
Chunming Zhou	6b77760	2016-09-21 16:19:19 +0800	[diff] [blame]	1583	uint64_t gtt_flags,
Christian König	8358dce	2016-03-30 10:50:25 +0200	[diff] [blame]	1584	dma_addr_t *pages_addr,
Christian König	a14faa6	2016-01-25 14:27:31 +0100	[diff] [blame]	1585	struct amdgpu_vm *vm,
				1586	struct amdgpu_bo_va_mapping *mapping,
Chunming Zhou	6b77760	2016-09-21 16:19:19 +0800	[diff] [blame]	1587	uint64_t flags,
Christian König	63e0ba4	2016-08-16 17:38:37 +0200	[diff] [blame]	1588	struct drm_mm_node *nodes,
Chris Wilson	f54d186	2016-10-25 13:00:45 +0100	[diff] [blame]	1589	struct dma_fence **fence)
Christian König	a14faa6	2016-01-25 14:27:31 +0100	[diff] [blame]	1590	{
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	1591	uint64_t pfn, src = 0, start = mapping->start;
Christian König	a14faa6	2016-01-25 14:27:31 +0100	[diff] [blame]	1592	int r;
				1593
				1594	/* normally,bo_va->flags only contians READABLE and WIRTEABLE bit go here
				1595	* but in case of something, we filter the flags in first place
				1596	*/
				1597	if (!(mapping->flags & AMDGPU_PTE_READABLE))
				1598	flags &= ~AMDGPU_PTE_READABLE;
				1599	if (!(mapping->flags & AMDGPU_PTE_WRITEABLE))
				1600	flags &= ~AMDGPU_PTE_WRITEABLE;
				1601
Alex Xie	15b31c5	2017-03-03 16:47:11 -0500	[diff] [blame]	1602	flags &= ~AMDGPU_PTE_EXECUTABLE;
				1603	flags \|= mapping->flags & AMDGPU_PTE_EXECUTABLE;
				1604
Alex Xie	b0fd18b	2017-03-03 16:49:39 -0500	[diff] [blame]	1605	flags &= ~AMDGPU_PTE_MTYPE_MASK;
				1606	flags \|= (mapping->flags & AMDGPU_PTE_MTYPE_MASK);
				1607
Zhang, Jerry	d0766e9	2017-04-19 09:53:29 +0800	[diff] [blame]	1608	if ((mapping->flags & AMDGPU_PTE_PRT) &&
				1609	(adev->asic_type >= CHIP_VEGA10)) {
				1610	flags \|= AMDGPU_PTE_PRT;
				1611	flags &= ~AMDGPU_PTE_VALID;
				1612	}
				1613
Christian König	a14faa6	2016-01-25 14:27:31 +0100	[diff] [blame]	1614	trace_amdgpu_vm_bo_update(mapping);
				1615
Christian König	63e0ba4	2016-08-16 17:38:37 +0200	[diff] [blame]	1616	pfn = mapping->offset >> PAGE_SHIFT;
				1617	if (nodes) {
				1618	while (pfn >= nodes->size) {
				1619	pfn -= nodes->size;
				1620	++nodes;
				1621	}
Christian König	fa3ab3c	2016-03-18 21:00:35 +0100	[diff] [blame]	1622	}
Christian König	a14faa6	2016-01-25 14:27:31 +0100	[diff] [blame]	1623
Christian König	63e0ba4	2016-08-16 17:38:37 +0200	[diff] [blame]	1624	do {
				1625	uint64_t max_entries;
				1626	uint64_t addr, last;
Christian König	a14faa6	2016-01-25 14:27:31 +0100	[diff] [blame]	1627
Christian König	63e0ba4	2016-08-16 17:38:37 +0200	[diff] [blame]	1628	if (nodes) {
				1629	addr = nodes->start << PAGE_SHIFT;
				1630	max_entries = (nodes->size - pfn) *
				1631	(PAGE_SIZE / AMDGPU_GPU_PAGE_SIZE);
				1632	} else {
				1633	addr = 0;
				1634	max_entries = S64_MAX;
				1635	}
Christian König	a14faa6	2016-01-25 14:27:31 +0100	[diff] [blame]	1636
Christian König	63e0ba4	2016-08-16 17:38:37 +0200	[diff] [blame]	1637	if (pages_addr) {
				1638	if (flags == gtt_flags)
				1639	src = adev->gart.table_addr +
				1640	(addr >> AMDGPU_GPU_PAGE_SHIFT) * 8;
				1641	else
				1642	max_entries = min(max_entries, 16ull * 1024ull);
				1643	addr = 0;
				1644	} else if (flags & AMDGPU_PTE_VALID) {
				1645	addr += adev->vm_manager.vram_base_offset;
				1646	}
				1647	addr += pfn << PAGE_SHIFT;
				1648
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	1649	last = min((uint64_t)mapping->last, start + max_entries - 1);
Christian König	3cabaa5	2016-06-06 10:17:58 +0200	[diff] [blame]	1650	r = amdgpu_vm_bo_update_mapping(adev, exclusive,
				1651	src, pages_addr, vm,
Christian König	a14faa6	2016-01-25 14:27:31 +0100	[diff] [blame]	1652	start, last, flags, addr,
				1653	fence);
				1654	if (r)
				1655	return r;
				1656
Christian König	63e0ba4	2016-08-16 17:38:37 +0200	[diff] [blame]	1657	pfn += last - start + 1;
				1658	if (nodes && nodes->size == pfn) {
				1659	pfn = 0;
				1660	++nodes;
				1661	}
Christian König	a14faa6	2016-01-25 14:27:31 +0100	[diff] [blame]	1662	start = last + 1;
Christian König	63e0ba4	2016-08-16 17:38:37 +0200	[diff] [blame]	1663
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	1664	} while (unlikely(start != mapping->last + 1));
Christian König	a14faa6	2016-01-25 14:27:31 +0100	[diff] [blame]	1665
				1666	return 0;
				1667	}
				1668
				1669	/**
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1670	* amdgpu_vm_bo_update - update all BO mappings in the vm page table
				1671	*
				1672	* @adev: amdgpu_device pointer
				1673	* @bo_va: requested BO and VM object
Christian König	99e124f	2016-08-16 14:43:17 +0200	[diff] [blame]	1674	* @clear: if true clear the entries
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1675	*
				1676	* Fill in the page table entries for @bo_va.
				1677	* Returns 0 for success, -EINVAL for failure.
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1678	*/
				1679	int amdgpu_vm_bo_update(struct amdgpu_device *adev,
				1680	struct amdgpu_bo_va *bo_va,
Christian König	99e124f	2016-08-16 14:43:17 +0200	[diff] [blame]	1681	bool clear)
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1682	{
				1683	struct amdgpu_vm *vm = bo_va->vm;
				1684	struct amdgpu_bo_va_mapping *mapping;
Christian König	8358dce	2016-03-30 10:50:25 +0200	[diff] [blame]	1685	dma_addr_t *pages_addr = NULL;
Chunming Zhou	6b77760	2016-09-21 16:19:19 +0800	[diff] [blame]	1686	uint64_t gtt_flags, flags;
Christian König	99e124f	2016-08-16 14:43:17 +0200	[diff] [blame]	1687	struct ttm_mem_reg *mem;
Christian König	63e0ba4	2016-08-16 17:38:37 +0200	[diff] [blame]	1688	struct drm_mm_node *nodes;
Chris Wilson	f54d186	2016-10-25 13:00:45 +0100	[diff] [blame]	1689	struct dma_fence *exclusive;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1690	int r;
				1691
Christian König	a5f6b5b	2017-01-30 11:01:38 +0100	[diff] [blame]	1692	if (clear \|\| !bo_va->bo) {
Christian König	99e124f	2016-08-16 14:43:17 +0200	[diff] [blame]	1693	mem = NULL;
Christian König	63e0ba4	2016-08-16 17:38:37 +0200	[diff] [blame]	1694	nodes = NULL;
Christian König	99e124f	2016-08-16 14:43:17 +0200	[diff] [blame]	1695	exclusive = NULL;
				1696	} else {
Christian König	8358dce	2016-03-30 10:50:25 +0200	[diff] [blame]	1697	struct ttm_dma_tt *ttm;
				1698
Christian König	99e124f	2016-08-16 14:43:17 +0200	[diff] [blame]	1699	mem = &bo_va->bo->tbo.mem;
Christian König	63e0ba4	2016-08-16 17:38:37 +0200	[diff] [blame]	1700	nodes = mem->mm_node;
				1701	if (mem->mem_type == TTM_PL_TT) {
Christian König	8358dce	2016-03-30 10:50:25 +0200	[diff] [blame]	1702	ttm = container_of(bo_va->bo->tbo.ttm, struct
				1703	ttm_dma_tt, ttm);
				1704	pages_addr = ttm->dma_address;
Christian König	9ab2146	2015-11-30 14:19:26 +0100	[diff] [blame]	1705	}
Christian König	3cabaa5	2016-06-06 10:17:58 +0200	[diff] [blame]	1706	exclusive = reservation_object_get_excl(bo_va->bo->tbo.resv);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1707	}
				1708
Christian König	a5f6b5b	2017-01-30 11:01:38 +0100	[diff] [blame]	1709	if (bo_va->bo) {
				1710	flags = amdgpu_ttm_tt_pte_flags(adev, bo_va->bo->tbo.ttm, mem);
				1711	gtt_flags = (amdgpu_ttm_is_bound(bo_va->bo->tbo.ttm) &&
				1712	adev == amdgpu_ttm_adev(bo_va->bo->tbo.bdev)) ?
				1713	flags : 0;
				1714	} else {
				1715	flags = 0x0;
				1716	gtt_flags = ~0x0;
				1717	}
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1718
Christian König	7fc1195	2015-07-30 11:53:42 +0200	[diff] [blame]	1719	spin_lock(&vm->status_lock);
				1720	if (!list_empty(&bo_va->vm_status))
				1721	list_splice_init(&bo_va->valids, &bo_va->invalids);
				1722	spin_unlock(&vm->status_lock);
				1723
				1724	list_for_each_entry(mapping, &bo_va->invalids, list) {
Christian König	3cabaa5	2016-06-06 10:17:58 +0200	[diff] [blame]	1725	r = amdgpu_vm_bo_split_mapping(adev, exclusive,
				1726	gtt_flags, pages_addr, vm,
Christian König	63e0ba4	2016-08-16 17:38:37 +0200	[diff] [blame]	1727	mapping, flags, nodes,
Christian König	8358dce	2016-03-30 10:50:25 +0200	[diff] [blame]	1728	&bo_va->last_pt_update);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1729	if (r)
				1730	return r;
				1731	}
				1732
Christian König	d6c10f6	2015-09-28 12:00:23 +0200	[diff] [blame]	1733	if (trace_amdgpu_vm_bo_mapping_enabled()) {
				1734	list_for_each_entry(mapping, &bo_va->valids, list)
				1735	trace_amdgpu_vm_bo_mapping(mapping);
				1736
				1737	list_for_each_entry(mapping, &bo_va->invalids, list)
				1738	trace_amdgpu_vm_bo_mapping(mapping);
				1739	}
				1740
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1741	spin_lock(&vm->status_lock);
monk.liu	6d1d0ef	2015-08-14 13:36:41 +0800	[diff] [blame]	1742	list_splice_init(&bo_va->invalids, &bo_va->valids);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1743	list_del_init(&bo_va->vm_status);
Christian König	99e124f	2016-08-16 14:43:17 +0200	[diff] [blame]	1744	if (clear)
Christian König	7fc1195	2015-07-30 11:53:42 +0200	[diff] [blame]	1745	list_add(&bo_va->vm_status, &vm->cleared);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1746	spin_unlock(&vm->status_lock);
				1747
				1748	return 0;
				1749	}
				1750
				1751	/**
Christian König	284710f	2017-01-30 11:09:31 +0100	[diff] [blame]	1752	* amdgpu_vm_update_prt_state - update the global PRT state
				1753	*/
				1754	static void amdgpu_vm_update_prt_state(struct amdgpu_device *adev)
				1755	{
				1756	unsigned long flags;
				1757	bool enable;
				1758
				1759	spin_lock_irqsave(&adev->vm_manager.prt_lock, flags);
Christian König	451bc8e	2017-02-14 16:02:52 +0100	[diff] [blame]	1760	enable = !!atomic_read(&adev->vm_manager.num_prt_users);
Christian König	284710f	2017-01-30 11:09:31 +0100	[diff] [blame]	1761	adev->gart.gart_funcs->set_prt(adev, enable);
				1762	spin_unlock_irqrestore(&adev->vm_manager.prt_lock, flags);
				1763	}
				1764
				1765	/**
Christian König	4388fc2	2017-03-13 10:13:36 +0100	[diff] [blame]	1766	* amdgpu_vm_prt_get - add a PRT user
Christian König	451bc8e	2017-02-14 16:02:52 +0100	[diff] [blame]	1767	*/
				1768	static void amdgpu_vm_prt_get(struct amdgpu_device *adev)
				1769	{
Christian König	4388fc2	2017-03-13 10:13:36 +0100	[diff] [blame]	1770	if (!adev->gart.gart_funcs->set_prt)
				1771	return;
				1772
Christian König	451bc8e	2017-02-14 16:02:52 +0100	[diff] [blame]	1773	if (atomic_inc_return(&adev->vm_manager.num_prt_users) == 1)
				1774	amdgpu_vm_update_prt_state(adev);
				1775	}
				1776
				1777	/**
Christian König	0b15f2f	2017-02-14 15:47:03 +0100	[diff] [blame]	1778	* amdgpu_vm_prt_put - drop a PRT user
				1779	*/
				1780	static void amdgpu_vm_prt_put(struct amdgpu_device *adev)
				1781	{
Christian König	451bc8e	2017-02-14 16:02:52 +0100	[diff] [blame]	1782	if (atomic_dec_return(&adev->vm_manager.num_prt_users) == 0)
Christian König	0b15f2f	2017-02-14 15:47:03 +0100	[diff] [blame]	1783	amdgpu_vm_update_prt_state(adev);
				1784	}
				1785
				1786	/**
Christian König	451bc8e	2017-02-14 16:02:52 +0100	[diff] [blame]	1787	* amdgpu_vm_prt_cb - callback for updating the PRT status
Christian König	284710f	2017-01-30 11:09:31 +0100	[diff] [blame]	1788	*/
				1789	static void amdgpu_vm_prt_cb(struct dma_fence fence, struct dma_fence_cb _cb)
				1790	{
				1791	struct amdgpu_prt_cb *cb = container_of(_cb, struct amdgpu_prt_cb, cb);
				1792
Christian König	0b15f2f	2017-02-14 15:47:03 +0100	[diff] [blame]	1793	amdgpu_vm_prt_put(cb->adev);
Christian König	284710f	2017-01-30 11:09:31 +0100	[diff] [blame]	1794	kfree(cb);
				1795	}
				1796
				1797	/**
Christian König	451bc8e	2017-02-14 16:02:52 +0100	[diff] [blame]	1798	* amdgpu_vm_add_prt_cb - add callback for updating the PRT status
				1799	*/
				1800	static void amdgpu_vm_add_prt_cb(struct amdgpu_device *adev,
				1801	struct dma_fence *fence)
				1802	{
Christian König	4388fc2	2017-03-13 10:13:36 +0100	[diff] [blame]	1803	struct amdgpu_prt_cb *cb;
Christian König	451bc8e	2017-02-14 16:02:52 +0100	[diff] [blame]	1804
Christian König	4388fc2	2017-03-13 10:13:36 +0100	[diff] [blame]	1805	if (!adev->gart.gart_funcs->set_prt)
				1806	return;
				1807
				1808	cb = kmalloc(sizeof(struct amdgpu_prt_cb), GFP_KERNEL);
Christian König	451bc8e	2017-02-14 16:02:52 +0100	[diff] [blame]	1809	if (!cb) {
				1810	/* Last resort when we are OOM */
				1811	if (fence)
				1812	dma_fence_wait(fence, false);
				1813
Dan Carpenter	486a68f	2017-04-03 21:41:39 +0300	[diff] [blame]	1814	amdgpu_vm_prt_put(adev);
Christian König	451bc8e	2017-02-14 16:02:52 +0100	[diff] [blame]	1815	} else {
				1816	cb->adev = adev;
				1817	if (!fence \|\| dma_fence_add_callback(fence, &cb->cb,
				1818	amdgpu_vm_prt_cb))
				1819	amdgpu_vm_prt_cb(fence, &cb->cb);
				1820	}
				1821	}
				1822
				1823	/**
Christian König	284710f	2017-01-30 11:09:31 +0100	[diff] [blame]	1824	* amdgpu_vm_free_mapping - free a mapping
				1825	*
				1826	* @adev: amdgpu_device pointer
				1827	* @vm: requested vm
				1828	* @mapping: mapping to be freed
				1829	* @fence: fence of the unmap operation
				1830	*
				1831	* Free a mapping and make sure we decrease the PRT usage count if applicable.
				1832	*/
				1833	static void amdgpu_vm_free_mapping(struct amdgpu_device *adev,
				1834	struct amdgpu_vm *vm,
				1835	struct amdgpu_bo_va_mapping *mapping,
				1836	struct dma_fence *fence)
				1837	{
Christian König	451bc8e	2017-02-14 16:02:52 +0100	[diff] [blame]	1838	if (mapping->flags & AMDGPU_PTE_PRT)
				1839	amdgpu_vm_add_prt_cb(adev, fence);
Christian König	284710f	2017-01-30 11:09:31 +0100	[diff] [blame]	1840	kfree(mapping);
				1841	}
				1842
				1843	/**
Christian König	451bc8e	2017-02-14 16:02:52 +0100	[diff] [blame]	1844	* amdgpu_vm_prt_fini - finish all prt mappings
				1845	*
				1846	* @adev: amdgpu_device pointer
				1847	* @vm: requested vm
				1848	*
				1849	* Register a cleanup callback to disable PRT support after VM dies.
				1850	*/
				1851	static void amdgpu_vm_prt_fini(struct amdgpu_device adev, struct amdgpu_vm vm)
				1852	{
Christian König	67003a1	2016-10-12 14:46:26 +0200	[diff] [blame]	1853	struct reservation_object *resv = vm->root.bo->tbo.resv;
Christian König	451bc8e	2017-02-14 16:02:52 +0100	[diff] [blame]	1854	struct dma_fence excl, *shared;
				1855	unsigned i, shared_count;
				1856	int r;
				1857
				1858	r = reservation_object_get_fences_rcu(resv, &excl,
				1859	&shared_count, &shared);
				1860	if (r) {
				1861	/* Not enough memory to grab the fence list, as last resort
				1862	* block for all the fences to complete.
				1863	*/
				1864	reservation_object_wait_timeout_rcu(resv, true, false,
				1865	MAX_SCHEDULE_TIMEOUT);
				1866	return;
				1867	}
				1868
				1869	/* Add a callback for each fence in the reservation object */
				1870	amdgpu_vm_prt_get(adev);
				1871	amdgpu_vm_add_prt_cb(adev, excl);
				1872
				1873	for (i = 0; i < shared_count; ++i) {
				1874	amdgpu_vm_prt_get(adev);
				1875	amdgpu_vm_add_prt_cb(adev, shared[i]);
				1876	}
				1877
				1878	kfree(shared);
				1879	}
				1880
				1881	/**
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1882	* amdgpu_vm_clear_freed - clear freed BOs in the PT
				1883	*
				1884	* @adev: amdgpu_device pointer
				1885	* @vm: requested vm
Nicolai Hähnle	f346781	2017-03-23 19:36:31 +0100	[diff] [blame]	1886	* @fence: optional resulting fence (unchanged if no work needed to be done
				1887	* or if an error occurred)
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1888	*
				1889	* Make sure all freed BOs are cleared in the PT.
				1890	* Returns 0 for success.
				1891	*
				1892	* PTs have to be reserved and mutex must be locked!
				1893	*/
				1894	int amdgpu_vm_clear_freed(struct amdgpu_device *adev,
Nicolai Hähnle	f346781	2017-03-23 19:36:31 +0100	[diff] [blame]	1895	struct amdgpu_vm *vm,
				1896	struct dma_fence **fence)
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1897	{
				1898	struct amdgpu_bo_va_mapping *mapping;
Nicolai Hähnle	f346781	2017-03-23 19:36:31 +0100	[diff] [blame]	1899	struct dma_fence *f = NULL;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1900	int r;
				1901
				1902	while (!list_empty(&vm->freed)) {
				1903	mapping = list_first_entry(&vm->freed,
				1904	struct amdgpu_bo_va_mapping, list);
				1905	list_del(&mapping->list);
Christian König	e17841b	2016-03-08 17:52:01 +0100	[diff] [blame]	1906
Christian König	fc6aa33	2017-04-19 14:41:19 +0200	[diff] [blame]	1907	r = amdgpu_vm_bo_update_mapping(adev, NULL, 0, NULL, vm,
				1908	mapping->start, mapping->last,
				1909	0, 0, &f);
Nicolai Hähnle	f346781	2017-03-23 19:36:31 +0100	[diff] [blame]	1910	amdgpu_vm_free_mapping(adev, vm, mapping, f);
Christian König	284710f	2017-01-30 11:09:31 +0100	[diff] [blame]	1911	if (r) {
Nicolai Hähnle	f346781	2017-03-23 19:36:31 +0100	[diff] [blame]	1912	dma_fence_put(f);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1913	return r;
Christian König	284710f	2017-01-30 11:09:31 +0100	[diff] [blame]	1914	}
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1915	}
Nicolai Hähnle	f346781	2017-03-23 19:36:31 +0100	[diff] [blame]	1916
				1917	if (fence && f) {
				1918	dma_fence_put(*fence);
				1919	*fence = f;
				1920	} else {
				1921	dma_fence_put(f);
				1922	}
				1923
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1924	return 0;
				1925
				1926	}
				1927
				1928	/**
				1929	* amdgpu_vm_clear_invalids - clear invalidated BOs in the PT
				1930	*
				1931	* @adev: amdgpu_device pointer
				1932	* @vm: requested vm
				1933	*
				1934	* Make sure all invalidated BOs are cleared in the PT.
				1935	* Returns 0 for success.
				1936	*
				1937	* PTs have to be reserved and mutex must be locked!
				1938	*/
				1939	int amdgpu_vm_clear_invalids(struct amdgpu_device *adev,
monk.liu	cfe2c97	2015-05-26 15:01:54 +0800	[diff] [blame]	1940	struct amdgpu_vm vm, struct amdgpu_sync sync)
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1941	{
monk.liu	cfe2c97	2015-05-26 15:01:54 +0800	[diff] [blame]	1942	struct amdgpu_bo_va *bo_va = NULL;
Christian König	91e1a52	2015-07-06 22:06:40 +0200	[diff] [blame]	1943	int r = 0;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1944
				1945	spin_lock(&vm->status_lock);
				1946	while (!list_empty(&vm->invalidated)) {
				1947	bo_va = list_first_entry(&vm->invalidated,
				1948	struct amdgpu_bo_va, vm_status);
				1949	spin_unlock(&vm->status_lock);
Christian König	32b41ac	2016-03-08 18:03:27 +0100	[diff] [blame]	1950
Christian König	99e124f	2016-08-16 14:43:17 +0200	[diff] [blame]	1951	r = amdgpu_vm_bo_update(adev, bo_va, true);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1952	if (r)
				1953	return r;
				1954
				1955	spin_lock(&vm->status_lock);
				1956	}
				1957	spin_unlock(&vm->status_lock);
				1958
monk.liu	cfe2c97	2015-05-26 15:01:54 +0800	[diff] [blame]	1959	if (bo_va)
Chunming Zhou	bb1e38a4	2015-08-03 18:19:38 +0800	[diff] [blame]	1960	r = amdgpu_sync_fence(adev, sync, bo_va->last_pt_update);
Christian König	91e1a52	2015-07-06 22:06:40 +0200	[diff] [blame]	1961
				1962	return r;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1963	}
				1964
				1965	/**
				1966	* amdgpu_vm_bo_add - add a bo to a specific vm
				1967	*
				1968	* @adev: amdgpu_device pointer
				1969	* @vm: requested vm
				1970	* @bo: amdgpu buffer object
				1971	*
Christian König	8843dbb	2016-01-26 12:17:11 +0100	[diff] [blame]	1972	* Add @bo into the requested vm.
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1973	* Add @bo to the list of bos associated with the vm
				1974	* Returns newly added bo_va or NULL for failure
				1975	*
				1976	* Object has to be reserved!
				1977	*/
				1978	struct amdgpu_bo_va amdgpu_vm_bo_add(struct amdgpu_device adev,
				1979	struct amdgpu_vm *vm,
				1980	struct amdgpu_bo *bo)
				1981	{
				1982	struct amdgpu_bo_va *bo_va;
				1983
				1984	bo_va = kzalloc(sizeof(struct amdgpu_bo_va), GFP_KERNEL);
				1985	if (bo_va == NULL) {
				1986	return NULL;
				1987	}
				1988	bo_va->vm = vm;
				1989	bo_va->bo = bo;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1990	bo_va->ref_count = 1;
				1991	INIT_LIST_HEAD(&bo_va->bo_list);
Christian König	7fc1195	2015-07-30 11:53:42 +0200	[diff] [blame]	1992	INIT_LIST_HEAD(&bo_va->valids);
				1993	INIT_LIST_HEAD(&bo_va->invalids);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1994	INIT_LIST_HEAD(&bo_va->vm_status);
Christian König	32b41ac	2016-03-08 18:03:27 +0100	[diff] [blame]	1995
Christian König	a5f6b5b	2017-01-30 11:01:38 +0100	[diff] [blame]	1996	if (bo)
				1997	list_add_tail(&bo_va->bo_list, &bo->va);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	1998
				1999	return bo_va;
				2000	}
				2001
				2002	/**
				2003	* amdgpu_vm_bo_map - map bo inside a vm
				2004	*
				2005	* @adev: amdgpu_device pointer
				2006	* @bo_va: bo_va to store the address
				2007	* @saddr: where to map the BO
				2008	* @offset: requested offset in the BO
				2009	* @flags: attributes of pages (read/write/valid/etc.)
				2010	*
				2011	* Add a mapping of the BO at the specefied addr into the VM.
				2012	* Returns 0 for success, error for failure.
				2013	*
Chunming Zhou	49b02b1	2015-11-13 14:18:38 +0800	[diff] [blame]	2014	* Object has to be reserved and unreserved outside!
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2015	*/
				2016	int amdgpu_vm_bo_map(struct amdgpu_device *adev,
				2017	struct amdgpu_bo_va *bo_va,
				2018	uint64_t saddr, uint64_t offset,
Christian König	268c300	2017-01-18 14:49:43 +0100	[diff] [blame]	2019	uint64_t size, uint64_t flags)
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2020	{
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	2021	struct amdgpu_bo_va_mapping mapping, tmp;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2022	struct amdgpu_vm *vm = bo_va->vm;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2023	uint64_t eaddr;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2024
Christian König	0be52de	2015-05-18 14:37:27 +0200	[diff] [blame]	2025	/* validate the parameters */
				2026	if (saddr & AMDGPU_GPU_PAGE_MASK \|\| offset & AMDGPU_GPU_PAGE_MASK \|\|
Chunming Zhou	49b02b1	2015-11-13 14:18:38 +0800	[diff] [blame]	2027	size == 0 \|\| size & AMDGPU_GPU_PAGE_MASK)
Christian König	0be52de	2015-05-18 14:37:27 +0200	[diff] [blame]	2028	return -EINVAL;
Christian König	0be52de	2015-05-18 14:37:27 +0200	[diff] [blame]	2029
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2030	/* make sure object fit at this offset */
Felix Kuehling	005ae95	2015-11-23 17:43:48 -0500	[diff] [blame]	2031	eaddr = saddr + size - 1;
Christian König	a5f6b5b	2017-01-30 11:01:38 +0100	[diff] [blame]	2032	if (saddr >= eaddr \|\|
				2033	(bo_va->bo && offset + size > amdgpu_bo_size(bo_va->bo)))
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2034	return -EINVAL;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2035
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2036	saddr /= AMDGPU_GPU_PAGE_SIZE;
				2037	eaddr /= AMDGPU_GPU_PAGE_SIZE;
				2038
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	2039	tmp = amdgpu_vm_it_iter_first(&vm->va, saddr, eaddr);
				2040	if (tmp) {
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2041	/* bo and tmp overlap, invalid addr */
				2042	dev_err(adev->dev, "bo %p va 0x%010Lx-0x%010Lx conflict with "
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	2043	"0x%010Lx-0x%010Lx\n", bo_va->bo, saddr, eaddr,
				2044	tmp->start, tmp->last + 1);
Christian König	663e457	2017-03-13 10:13:37 +0100	[diff] [blame]	2045	return -EINVAL;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2046	}
				2047
				2048	mapping = kmalloc(sizeof(*mapping), GFP_KERNEL);
Christian König	663e457	2017-03-13 10:13:37 +0100	[diff] [blame]	2049	if (!mapping)
				2050	return -ENOMEM;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2051
				2052	INIT_LIST_HEAD(&mapping->list);
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	2053	mapping->start = saddr;
				2054	mapping->last = eaddr;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2055	mapping->offset = offset;
				2056	mapping->flags = flags;
				2057
Christian König	7fc1195	2015-07-30 11:53:42 +0200	[diff] [blame]	2058	list_add(&mapping->list, &bo_va->invalids);
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	2059	amdgpu_vm_it_insert(mapping, &vm->va);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2060
Christian König	4388fc2	2017-03-13 10:13:36 +0100	[diff] [blame]	2061	if (flags & AMDGPU_PTE_PRT)
				2062	amdgpu_vm_prt_get(adev);
				2063
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2064	return 0;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2065	}
				2066
				2067	/**
Christian König	80f95c5	2017-03-13 10:13:39 +0100	[diff] [blame]	2068	* amdgpu_vm_bo_replace_map - map bo inside a vm, replacing existing mappings
				2069	*
				2070	* @adev: amdgpu_device pointer
				2071	* @bo_va: bo_va to store the address
				2072	* @saddr: where to map the BO
				2073	* @offset: requested offset in the BO
				2074	* @flags: attributes of pages (read/write/valid/etc.)
				2075	*
				2076	* Add a mapping of the BO at the specefied addr into the VM. Replace existing
				2077	* mappings as we do so.
				2078	* Returns 0 for success, error for failure.
				2079	*
				2080	* Object has to be reserved and unreserved outside!
				2081	*/
				2082	int amdgpu_vm_bo_replace_map(struct amdgpu_device *adev,
				2083	struct amdgpu_bo_va *bo_va,
				2084	uint64_t saddr, uint64_t offset,
				2085	uint64_t size, uint64_t flags)
				2086	{
				2087	struct amdgpu_bo_va_mapping *mapping;
				2088	struct amdgpu_vm *vm = bo_va->vm;
				2089	uint64_t eaddr;
				2090	int r;
				2091
				2092	/* validate the parameters */
				2093	if (saddr & AMDGPU_GPU_PAGE_MASK \|\| offset & AMDGPU_GPU_PAGE_MASK \|\|
				2094	size == 0 \|\| size & AMDGPU_GPU_PAGE_MASK)
				2095	return -EINVAL;
				2096
				2097	/* make sure object fit at this offset */
				2098	eaddr = saddr + size - 1;
				2099	if (saddr >= eaddr \|\|
				2100	(bo_va->bo && offset + size > amdgpu_bo_size(bo_va->bo)))
				2101	return -EINVAL;
				2102
				2103	/* Allocate all the needed memory */
				2104	mapping = kmalloc(sizeof(*mapping), GFP_KERNEL);
				2105	if (!mapping)
				2106	return -ENOMEM;
				2107
				2108	r = amdgpu_vm_bo_clear_mappings(adev, bo_va->vm, saddr, size);
				2109	if (r) {
				2110	kfree(mapping);
				2111	return r;
				2112	}
				2113
				2114	saddr /= AMDGPU_GPU_PAGE_SIZE;
				2115	eaddr /= AMDGPU_GPU_PAGE_SIZE;
				2116
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	2117	mapping->start = saddr;
				2118	mapping->last = eaddr;
Christian König	80f95c5	2017-03-13 10:13:39 +0100	[diff] [blame]	2119	mapping->offset = offset;
				2120	mapping->flags = flags;
				2121
				2122	list_add(&mapping->list, &bo_va->invalids);
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	2123	amdgpu_vm_it_insert(mapping, &vm->va);
Christian König	80f95c5	2017-03-13 10:13:39 +0100	[diff] [blame]	2124
				2125	if (flags & AMDGPU_PTE_PRT)
				2126	amdgpu_vm_prt_get(adev);
				2127
				2128	return 0;
				2129	}
				2130
				2131	/**
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2132	* amdgpu_vm_bo_unmap - remove bo mapping from vm
				2133	*
				2134	* @adev: amdgpu_device pointer
				2135	* @bo_va: bo_va to remove the address from
				2136	* @saddr: where to the BO is mapped
				2137	*
				2138	* Remove a mapping of the BO at the specefied addr from the VM.
				2139	* Returns 0 for success, error for failure.
				2140	*
Chunming Zhou	49b02b1	2015-11-13 14:18:38 +0800	[diff] [blame]	2141	* Object has to be reserved and unreserved outside!
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2142	*/
				2143	int amdgpu_vm_bo_unmap(struct amdgpu_device *adev,
				2144	struct amdgpu_bo_va *bo_va,
				2145	uint64_t saddr)
				2146	{
				2147	struct amdgpu_bo_va_mapping *mapping;
				2148	struct amdgpu_vm *vm = bo_va->vm;
Christian König	7fc1195	2015-07-30 11:53:42 +0200	[diff] [blame]	2149	bool valid = true;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2150
Christian König	6c7fc50	2015-06-05 20:56:17 +0200	[diff] [blame]	2151	saddr /= AMDGPU_GPU_PAGE_SIZE;
Christian König	32b41ac	2016-03-08 18:03:27 +0100	[diff] [blame]	2152
Christian König	7fc1195	2015-07-30 11:53:42 +0200	[diff] [blame]	2153	list_for_each_entry(mapping, &bo_va->valids, list) {
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	2154	if (mapping->start == saddr)
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2155	break;
				2156	}
				2157
Christian König	7fc1195	2015-07-30 11:53:42 +0200	[diff] [blame]	2158	if (&mapping->list == &bo_va->valids) {
				2159	valid = false;
				2160
				2161	list_for_each_entry(mapping, &bo_va->invalids, list) {
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	2162	if (mapping->start == saddr)
Christian König	7fc1195	2015-07-30 11:53:42 +0200	[diff] [blame]	2163	break;
				2164	}
				2165
Christian König	32b41ac	2016-03-08 18:03:27 +0100	[diff] [blame]	2166	if (&mapping->list == &bo_va->invalids)
Christian König	7fc1195	2015-07-30 11:53:42 +0200	[diff] [blame]	2167	return -ENOENT;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2168	}
Christian König	32b41ac	2016-03-08 18:03:27 +0100	[diff] [blame]	2169
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2170	list_del(&mapping->list);
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	2171	amdgpu_vm_it_remove(mapping, &vm->va);
Christian König	93e3e43	2015-06-09 16:58:33 +0200	[diff] [blame]	2172	trace_amdgpu_vm_bo_unmap(bo_va, mapping);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2173
Christian König	e17841b	2016-03-08 17:52:01 +0100	[diff] [blame]	2174	if (valid)
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2175	list_add(&mapping->list, &vm->freed);
Christian König	e17841b	2016-03-08 17:52:01 +0100	[diff] [blame]	2176	else
Christian König	284710f	2017-01-30 11:09:31 +0100	[diff] [blame]	2177	amdgpu_vm_free_mapping(adev, vm, mapping,
				2178	bo_va->last_pt_update);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2179
				2180	return 0;
				2181	}
				2182
				2183	/**
Christian König	dc54d3d	2017-03-13 10:13:38 +0100	[diff] [blame]	2184	* amdgpu_vm_bo_clear_mappings - remove all mappings in a specific range
				2185	*
				2186	* @adev: amdgpu_device pointer
				2187	* @vm: VM structure to use
				2188	* @saddr: start of the range
				2189	* @size: size of the range
				2190	*
				2191	* Remove all mappings in a range, split them as appropriate.
				2192	* Returns 0 for success, error for failure.
				2193	*/
				2194	int amdgpu_vm_bo_clear_mappings(struct amdgpu_device *adev,
				2195	struct amdgpu_vm *vm,
				2196	uint64_t saddr, uint64_t size)
				2197	{
				2198	struct amdgpu_bo_va_mapping before, after, tmp, next;
Christian König	dc54d3d	2017-03-13 10:13:38 +0100	[diff] [blame]	2199	LIST_HEAD(removed);
				2200	uint64_t eaddr;
				2201
				2202	eaddr = saddr + size - 1;
				2203	saddr /= AMDGPU_GPU_PAGE_SIZE;
				2204	eaddr /= AMDGPU_GPU_PAGE_SIZE;
				2205
				2206	/* Allocate all the needed memory */
				2207	before = kzalloc(sizeof(*before), GFP_KERNEL);
				2208	if (!before)
				2209	return -ENOMEM;
Junwei Zhang	27f6d61	2017-03-16 16:09:24 +0800	[diff] [blame]	2210	INIT_LIST_HEAD(&before->list);
Christian König	dc54d3d	2017-03-13 10:13:38 +0100	[diff] [blame]	2211
				2212	after = kzalloc(sizeof(*after), GFP_KERNEL);
				2213	if (!after) {
				2214	kfree(before);
				2215	return -ENOMEM;
				2216	}
Junwei Zhang	27f6d61	2017-03-16 16:09:24 +0800	[diff] [blame]	2217	INIT_LIST_HEAD(&after->list);
Christian König	dc54d3d	2017-03-13 10:13:38 +0100	[diff] [blame]	2218
				2219	/* Now gather all removed mappings */
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	2220	tmp = amdgpu_vm_it_iter_first(&vm->va, saddr, eaddr);
				2221	while (tmp) {
Christian König	dc54d3d	2017-03-13 10:13:38 +0100	[diff] [blame]	2222	/* Remember mapping split at the start */
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	2223	if (tmp->start < saddr) {
				2224	before->start = tmp->start;
				2225	before->last = saddr - 1;
Christian König	dc54d3d	2017-03-13 10:13:38 +0100	[diff] [blame]	2226	before->offset = tmp->offset;
				2227	before->flags = tmp->flags;
				2228	list_add(&before->list, &tmp->list);
				2229	}
				2230
				2231	/* Remember mapping split at the end */
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	2232	if (tmp->last > eaddr) {
				2233	after->start = eaddr + 1;
				2234	after->last = tmp->last;
Christian König	dc54d3d	2017-03-13 10:13:38 +0100	[diff] [blame]	2235	after->offset = tmp->offset;
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	2236	after->offset += after->start - tmp->start;
Christian König	dc54d3d	2017-03-13 10:13:38 +0100	[diff] [blame]	2237	after->flags = tmp->flags;
				2238	list_add(&after->list, &tmp->list);
				2239	}
				2240
				2241	list_del(&tmp->list);
				2242	list_add(&tmp->list, &removed);
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	2243
				2244	tmp = amdgpu_vm_it_iter_next(tmp, saddr, eaddr);
Christian König	dc54d3d	2017-03-13 10:13:38 +0100	[diff] [blame]	2245	}
				2246
				2247	/* And free them up */
				2248	list_for_each_entry_safe(tmp, next, &removed, list) {
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	2249	amdgpu_vm_it_remove(tmp, &vm->va);
Christian König	dc54d3d	2017-03-13 10:13:38 +0100	[diff] [blame]	2250	list_del(&tmp->list);
				2251
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	2252	if (tmp->start < saddr)
				2253	tmp->start = saddr;
				2254	if (tmp->last > eaddr)
				2255	tmp->last = eaddr;
Christian König	dc54d3d	2017-03-13 10:13:38 +0100	[diff] [blame]	2256
				2257	list_add(&tmp->list, &vm->freed);
				2258	trace_amdgpu_vm_bo_unmap(NULL, tmp);
				2259	}
				2260
Junwei Zhang	27f6d61	2017-03-16 16:09:24 +0800	[diff] [blame]	2261	/* Insert partial mapping before the range */
				2262	if (!list_empty(&before->list)) {
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	2263	amdgpu_vm_it_insert(before, &vm->va);
Christian König	dc54d3d	2017-03-13 10:13:38 +0100	[diff] [blame]	2264	if (before->flags & AMDGPU_PTE_PRT)
				2265	amdgpu_vm_prt_get(adev);
				2266	} else {
				2267	kfree(before);
				2268	}
				2269
				2270	/* Insert partial mapping after the range */
Junwei Zhang	27f6d61	2017-03-16 16:09:24 +0800	[diff] [blame]	2271	if (!list_empty(&after->list)) {
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	2272	amdgpu_vm_it_insert(after, &vm->va);
Christian König	dc54d3d	2017-03-13 10:13:38 +0100	[diff] [blame]	2273	if (after->flags & AMDGPU_PTE_PRT)
				2274	amdgpu_vm_prt_get(adev);
				2275	} else {
				2276	kfree(after);
				2277	}
				2278
				2279	return 0;
				2280	}
				2281
				2282	/**
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2283	* amdgpu_vm_bo_rmv - remove a bo to a specific vm
				2284	*
				2285	* @adev: amdgpu_device pointer
				2286	* @bo_va: requested bo_va
				2287	*
Christian König	8843dbb	2016-01-26 12:17:11 +0100	[diff] [blame]	2288	* Remove @bo_va->bo from the requested vm.
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2289	*
				2290	* Object have to be reserved!
				2291	*/
				2292	void amdgpu_vm_bo_rmv(struct amdgpu_device *adev,
				2293	struct amdgpu_bo_va *bo_va)
				2294	{
				2295	struct amdgpu_bo_va_mapping mapping, next;
				2296	struct amdgpu_vm *vm = bo_va->vm;
				2297
				2298	list_del(&bo_va->bo_list);
				2299
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2300	spin_lock(&vm->status_lock);
				2301	list_del(&bo_va->vm_status);
				2302	spin_unlock(&vm->status_lock);
				2303
Christian König	7fc1195	2015-07-30 11:53:42 +0200	[diff] [blame]	2304	list_for_each_entry_safe(mapping, next, &bo_va->valids, list) {
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2305	list_del(&mapping->list);
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	2306	amdgpu_vm_it_remove(mapping, &vm->va);
Christian König	93e3e43	2015-06-09 16:58:33 +0200	[diff] [blame]	2307	trace_amdgpu_vm_bo_unmap(bo_va, mapping);
Christian König	7fc1195	2015-07-30 11:53:42 +0200	[diff] [blame]	2308	list_add(&mapping->list, &vm->freed);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2309	}
Christian König	7fc1195	2015-07-30 11:53:42 +0200	[diff] [blame]	2310	list_for_each_entry_safe(mapping, next, &bo_va->invalids, list) {
				2311	list_del(&mapping->list);
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	2312	amdgpu_vm_it_remove(mapping, &vm->va);
Christian König	284710f	2017-01-30 11:09:31 +0100	[diff] [blame]	2313	amdgpu_vm_free_mapping(adev, vm, mapping,
				2314	bo_va->last_pt_update);
Christian König	7fc1195	2015-07-30 11:53:42 +0200	[diff] [blame]	2315	}
Christian König	32b41ac	2016-03-08 18:03:27 +0100	[diff] [blame]	2316
Chris Wilson	f54d186	2016-10-25 13:00:45 +0100	[diff] [blame]	2317	dma_fence_put(bo_va->last_pt_update);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2318	kfree(bo_va);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2319	}
				2320
				2321	/**
				2322	* amdgpu_vm_bo_invalidate - mark the bo as invalid
				2323	*
				2324	* @adev: amdgpu_device pointer
				2325	* @vm: requested vm
				2326	* @bo: amdgpu buffer object
				2327	*
Christian König	8843dbb	2016-01-26 12:17:11 +0100	[diff] [blame]	2328	* Mark @bo as invalid.
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2329	*/
				2330	void amdgpu_vm_bo_invalidate(struct amdgpu_device *adev,
				2331	struct amdgpu_bo *bo)
				2332	{
				2333	struct amdgpu_bo_va *bo_va;
				2334
				2335	list_for_each_entry(bo_va, &bo->va, bo_list) {
Christian König	7fc1195	2015-07-30 11:53:42 +0200	[diff] [blame]	2336	spin_lock(&bo_va->vm->status_lock);
				2337	if (list_empty(&bo_va->vm_status))
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2338	list_add(&bo_va->vm_status, &bo_va->vm->invalidated);
Christian König	7fc1195	2015-07-30 11:53:42 +0200	[diff] [blame]	2339	spin_unlock(&bo_va->vm->status_lock);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2340	}
				2341	}
				2342
Junwei Zhang	bab4fee	2017-04-05 13:54:56 +0800	[diff] [blame]	2343	static uint32_t amdgpu_vm_get_block_size(uint64_t vm_size)
				2344	{
				2345	/* Total bits covered by PD + PTs */
				2346	unsigned bits = ilog2(vm_size) + 18;
				2347
				2348	/* Make sure the PD is 4K in size up to 8GB address space.
				2349	Above that split equal between PD and PTs */
				2350	if (vm_size <= 8)
				2351	return (bits - 9);
				2352	else
				2353	return ((bits + 3) / 2);
				2354	}
				2355
				2356	/**
				2357	* amdgpu_vm_adjust_size - adjust vm size and block size
				2358	*
				2359	* @adev: amdgpu_device pointer
				2360	* @vm_size: the default vm size if it's set auto
				2361	*/
				2362	void amdgpu_vm_adjust_size(struct amdgpu_device *adev, uint64_t vm_size)
				2363	{
				2364	/* adjust vm size firstly */
				2365	if (amdgpu_vm_size == -1)
				2366	adev->vm_manager.vm_size = vm_size;
				2367	else
				2368	adev->vm_manager.vm_size = amdgpu_vm_size;
				2369
				2370	/* block size depends on vm size */
				2371	if (amdgpu_vm_block_size == -1)
				2372	adev->vm_manager.block_size =
				2373	amdgpu_vm_get_block_size(adev->vm_manager.vm_size);
				2374	else
				2375	adev->vm_manager.block_size = amdgpu_vm_block_size;
				2376
				2377	DRM_INFO("vm size is %llu GB, block size is %u-bit\n",
				2378	adev->vm_manager.vm_size, adev->vm_manager.block_size);
				2379	}
				2380
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2381	/**
				2382	* amdgpu_vm_init - initialize a vm instance
				2383	*
				2384	* @adev: amdgpu_device pointer
				2385	* @vm: requested vm
Harish Kasiviswanathan	9a4b7d4	2017-06-09 11:26:57 -0400	[diff] [blame]	2386	* @vm_context: Indicates if it GFX or Compute context
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2387	*
Christian König	8843dbb	2016-01-26 12:17:11 +0100	[diff] [blame]	2388	* Init @vm fields.
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2389	*/
Harish Kasiviswanathan	9a4b7d4	2017-06-09 11:26:57 -0400	[diff] [blame]	2390	int amdgpu_vm_init(struct amdgpu_device adev, struct amdgpu_vm vm,
				2391	int vm_context)
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2392	{
				2393	const unsigned align = min(AMDGPU_VM_PTB_ALIGN_SIZE,
Zhang, Jerry	36b32a6	2017-03-29 16:08:32 +0800	[diff] [blame]	2394	AMDGPU_VM_PTE_COUNT(adev) * 8);
Christian König	2d55e45	2016-02-08 17:37:38 +0100	[diff] [blame]	2395	unsigned ring_instance;
				2396	struct amdgpu_ring *ring;
Christian König	2bd9ccf	2016-02-01 12:53:58 +0100	[diff] [blame]	2397	struct amd_sched_rq *rq;
Chunming Zhou	36bbf3b	2017-04-20 16:17:34 +0800	[diff] [blame]	2398	int r, i;
Harish Kasiviswanathan	3c82417	2017-05-11 15:50:08 -0400	[diff] [blame]	2399	u64 flags;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2400
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2401	vm->va = RB_ROOT;
Chunming Zhou	031e298	2016-04-25 10:19:13 +0800	[diff] [blame]	2402	vm->client_id = atomic64_inc_return(&adev->vm_manager.client_counter);
Chunming Zhou	36bbf3b	2017-04-20 16:17:34 +0800	[diff] [blame]	2403	for (i = 0; i < AMDGPU_MAX_VMHUBS; i++)
				2404	vm->reserved_vmid[i] = NULL;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2405	spin_lock_init(&vm->status_lock);
				2406	INIT_LIST_HEAD(&vm->invalidated);
Christian König	7fc1195	2015-07-30 11:53:42 +0200	[diff] [blame]	2407	INIT_LIST_HEAD(&vm->cleared);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2408	INIT_LIST_HEAD(&vm->freed);
Christian König	2025021	2016-03-08 17:58:35 +0100	[diff] [blame]	2409
Christian König	2bd9ccf	2016-02-01 12:53:58 +0100	[diff] [blame]	2410	/* create scheduler entity for page table updates */
Christian König	2d55e45	2016-02-08 17:37:38 +0100	[diff] [blame]	2411
				2412	ring_instance = atomic_inc_return(&adev->vm_manager.vm_pte_next_ring);
				2413	ring_instance %= adev->vm_manager.vm_pte_num_rings;
				2414	ring = adev->vm_manager.vm_pte_rings[ring_instance];
Christian König	2bd9ccf	2016-02-01 12:53:58 +0100	[diff] [blame]	2415	rq = &ring->sched.sched_rq[AMD_SCHED_PRIORITY_KERNEL];
				2416	r = amd_sched_entity_init(&ring->sched, &vm->entity,
				2417	rq, amdgpu_sched_jobs);
				2418	if (r)
Christian König	f566ceb	2016-10-27 20:04:38 +0200	[diff] [blame]	2419	return r;
Christian König	2bd9ccf	2016-02-01 12:53:58 +0100	[diff] [blame]	2420
Harish Kasiviswanathan	9a4b7d4	2017-06-09 11:26:57 -0400	[diff] [blame]	2421	if (vm_context == AMDGPU_VM_CONTEXT_COMPUTE)
				2422	vm->use_cpu_for_update = !!(adev->vm_manager.vm_update_mode &
				2423	AMDGPU_VM_USE_CPU_FOR_COMPUTE);
				2424	else
				2425	vm->use_cpu_for_update = !!(adev->vm_manager.vm_update_mode &
				2426	AMDGPU_VM_USE_CPU_FOR_GFX);
				2427	DRM_DEBUG_DRIVER("VM update mode is %s\n",
				2428	vm->use_cpu_for_update ? "CPU" : "SDMA");
				2429	WARN_ONCE((vm->use_cpu_for_update & !amdgpu_vm_is_large_bar(adev)),
				2430	"CPU update of VM recommended only for large BAR system\n");
Christian König	a24960f	2016-10-12 13:20:52 +0200	[diff] [blame]	2431	vm->last_dir_update = NULL;
Bas Nieuwenhuizen	05906de	2015-08-14 20:08:40 +0200	[diff] [blame]	2432
Harish Kasiviswanathan	3c82417	2017-05-11 15:50:08 -0400	[diff] [blame]	2433	flags = AMDGPU_GEM_CREATE_VRAM_CONTIGUOUS \|
				2434	AMDGPU_GEM_CREATE_VRAM_CLEARED;
				2435	if (vm->use_cpu_for_update)
				2436	flags \|= AMDGPU_GEM_CREATE_CPU_ACCESS_REQUIRED;
				2437	else
				2438	flags \|= (AMDGPU_GEM_CREATE_NO_CPU_ACCESS \|
				2439	AMDGPU_GEM_CREATE_SHADOW);
				2440
Christian König	f566ceb	2016-10-27 20:04:38 +0200	[diff] [blame]	2441	r = amdgpu_bo_create(adev, amdgpu_vm_bo_size(adev, 0), align, true,
Alex Deucher	857d913	2015-08-27 00:14:16 -0400	[diff] [blame]	2442	AMDGPU_GEM_DOMAIN_VRAM,
Harish Kasiviswanathan	3c82417	2017-05-11 15:50:08 -0400	[diff] [blame]	2443	flags,
Christian König	67003a1	2016-10-12 14:46:26 +0200	[diff] [blame]	2444	NULL, NULL, &vm->root.bo);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2445	if (r)
Christian König	2bd9ccf	2016-02-01 12:53:58 +0100	[diff] [blame]	2446	goto error_free_sched_entity;
				2447
Christian König	67003a1	2016-10-12 14:46:26 +0200	[diff] [blame]	2448	r = amdgpu_bo_reserve(vm->root.bo, false);
Christian König	2bd9ccf	2016-02-01 12:53:58 +0100	[diff] [blame]	2449	if (r)
Christian König	67003a1	2016-10-12 14:46:26 +0200	[diff] [blame]	2450	goto error_free_root;
Christian König	2bd9ccf	2016-02-01 12:53:58 +0100	[diff] [blame]	2451
Christian König	5a712a8	2016-06-21 16:28:15 +0200	[diff] [blame]	2452	vm->last_eviction_counter = atomic64_read(&adev->num_evictions);
Christian König	67003a1	2016-10-12 14:46:26 +0200	[diff] [blame]	2453	amdgpu_bo_unreserve(vm->root.bo);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2454
				2455	return 0;
Christian König	2bd9ccf	2016-02-01 12:53:58 +0100	[diff] [blame]	2456
Christian König	67003a1	2016-10-12 14:46:26 +0200	[diff] [blame]	2457	error_free_root:
				2458	amdgpu_bo_unref(&vm->root.bo->shadow);
				2459	amdgpu_bo_unref(&vm->root.bo);
				2460	vm->root.bo = NULL;
Christian König	2bd9ccf	2016-02-01 12:53:58 +0100	[diff] [blame]	2461
				2462	error_free_sched_entity:
				2463	amd_sched_entity_fini(&ring->sched, &vm->entity);
				2464
				2465	return r;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2466	}
				2467
				2468	/**
Christian König	f566ceb	2016-10-27 20:04:38 +0200	[diff] [blame]	2469	* amdgpu_vm_free_levels - free PD/PT levels
				2470	*
				2471	* @level: PD/PT starting level to free
				2472	*
				2473	* Free the page directory or page table level and all sub levels.
				2474	*/
				2475	static void amdgpu_vm_free_levels(struct amdgpu_vm_pt *level)
				2476	{
				2477	unsigned i;
				2478
				2479	if (level->bo) {
				2480	amdgpu_bo_unref(&level->bo->shadow);
				2481	amdgpu_bo_unref(&level->bo);
				2482	}
				2483
				2484	if (level->entries)
				2485	for (i = 0; i <= level->last_entry_used; i++)
				2486	amdgpu_vm_free_levels(&level->entries[i]);
				2487
Michal Hocko	2098105	2017-05-17 14:23:12 +0200	[diff] [blame]	2488	kvfree(level->entries);
Christian König	f566ceb	2016-10-27 20:04:38 +0200	[diff] [blame]	2489	}
				2490
				2491	/**
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2492	* amdgpu_vm_fini - tear down a vm instance
				2493	*
				2494	* @adev: amdgpu_device pointer
				2495	* @vm: requested vm
				2496	*
Christian König	8843dbb	2016-01-26 12:17:11 +0100	[diff] [blame]	2497	* Tear down @vm.
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2498	* Unbind the VM and remove all bos from the vm bo list
				2499	*/
				2500	void amdgpu_vm_fini(struct amdgpu_device adev, struct amdgpu_vm vm)
				2501	{
				2502	struct amdgpu_bo_va_mapping mapping, tmp;
Christian König	4388fc2	2017-03-13 10:13:36 +0100	[diff] [blame]	2503	bool prt_fini_needed = !!adev->gart.gart_funcs->set_prt;
Chunming Zhou	36bbf3b	2017-04-20 16:17:34 +0800	[diff] [blame]	2504	int i;
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2505
Christian König	2d55e45	2016-02-08 17:37:38 +0100	[diff] [blame]	2506	amd_sched_entity_fini(vm->entity.sched, &vm->entity);
Christian König	2bd9ccf	2016-02-01 12:53:58 +0100	[diff] [blame]	2507
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2508	if (!RB_EMPTY_ROOT(&vm->va)) {
				2509	dev_err(adev->dev, "still active bo inside vm\n");
				2510	}
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	2511	rbtree_postorder_for_each_entry_safe(mapping, tmp, &vm->va, rb) {
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2512	list_del(&mapping->list);
Christian König	a9f87f6	2017-03-30 14:03:59 +0200	[diff] [blame]	2513	amdgpu_vm_it_remove(mapping, &vm->va);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2514	kfree(mapping);
				2515	}
				2516	list_for_each_entry_safe(mapping, tmp, &vm->freed, list) {
Christian König	4388fc2	2017-03-13 10:13:36 +0100	[diff] [blame]	2517	if (mapping->flags & AMDGPU_PTE_PRT && prt_fini_needed) {
Christian König	451bc8e	2017-02-14 16:02:52 +0100	[diff] [blame]	2518	amdgpu_vm_prt_fini(adev, vm);
Christian König	4388fc2	2017-03-13 10:13:36 +0100	[diff] [blame]	2519	prt_fini_needed = false;
Christian König	451bc8e	2017-02-14 16:02:52 +0100	[diff] [blame]	2520	}
Christian König	284710f	2017-01-30 11:09:31 +0100	[diff] [blame]	2521
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2522	list_del(&mapping->list);
Christian König	451bc8e	2017-02-14 16:02:52 +0100	[diff] [blame]	2523	amdgpu_vm_free_mapping(adev, vm, mapping, NULL);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2524	}
				2525
Christian König	f566ceb	2016-10-27 20:04:38 +0200	[diff] [blame]	2526	amdgpu_vm_free_levels(&vm->root);
Christian König	a24960f	2016-10-12 13:20:52 +0200	[diff] [blame]	2527	dma_fence_put(vm->last_dir_update);
Chunming Zhou	1e9ef26	2017-04-20 16:18:48 +0800	[diff] [blame]	2528	for (i = 0; i < AMDGPU_MAX_VMHUBS; i++)
				2529	amdgpu_vm_free_reserved_vmid(adev, vm, i);
Alex Deucher	d38ceaf	2015-04-20 16:55:21 -0400	[diff] [blame]	2530	}
Christian König	ea89f8c	2015-11-15 20:52:06 +0100	[diff] [blame]	2531
				2532	/**
Christian König	a9a78b3	2016-01-21 10:19:11 +0100	[diff] [blame]	2533	* amdgpu_vm_manager_init - init the VM manager
				2534	*
				2535	* @adev: amdgpu_device pointer
				2536	*
				2537	* Initialize the VM manager structures
				2538	*/
				2539	void amdgpu_vm_manager_init(struct amdgpu_device *adev)
				2540	{
Christian König	7645670	2017-04-06 17:52:39 +0200	[diff] [blame]	2541	unsigned i, j;
Christian König	a9a78b3	2016-01-21 10:19:11 +0100	[diff] [blame]	2542
Christian König	7645670	2017-04-06 17:52:39 +0200	[diff] [blame]	2543	for (i = 0; i < AMDGPU_MAX_VMHUBS; ++i) {
				2544	struct amdgpu_vm_id_manager *id_mgr =
				2545	&adev->vm_manager.id_mgr[i];
Christian König	a9a78b3	2016-01-21 10:19:11 +0100	[diff] [blame]	2546
Christian König	7645670	2017-04-06 17:52:39 +0200	[diff] [blame]	2547	mutex_init(&id_mgr->lock);
				2548	INIT_LIST_HEAD(&id_mgr->ids_lru);
Chunming Zhou	c350577	2017-04-21 15:51:04 +0800	[diff] [blame]	2549	atomic_set(&id_mgr->reserved_vmid_num, 0);
Christian König	7645670	2017-04-06 17:52:39 +0200	[diff] [blame]	2550
				2551	/* skip over VMID 0, since it is the system VM */
				2552	for (j = 1; j < id_mgr->num_ids; ++j) {
				2553	amdgpu_vm_reset_id(adev, i, j);
				2554	amdgpu_sync_create(&id_mgr->ids[i].active);
				2555	list_add_tail(&id_mgr->ids[j].list, &id_mgr->ids_lru);
				2556	}
Christian König	971fe9a9	2016-03-01 15:09:25 +0100	[diff] [blame]	2557	}
Christian König	2d55e45	2016-02-08 17:37:38 +0100	[diff] [blame]	2558
Chris Wilson	f54d186	2016-10-25 13:00:45 +0100	[diff] [blame]	2559	adev->vm_manager.fence_context =
				2560	dma_fence_context_alloc(AMDGPU_MAX_RINGS);
Christian König	1fbb2e9	2016-06-01 10:47:36 +0200	[diff] [blame]	2561	for (i = 0; i < AMDGPU_MAX_RINGS; ++i)
				2562	adev->vm_manager.seqno[i] = 0;
				2563
Christian König	2d55e45	2016-02-08 17:37:38 +0100	[diff] [blame]	2564	atomic_set(&adev->vm_manager.vm_pte_next_ring, 0);
Christian König	b1c8a81	2016-05-04 10:34:03 +0200	[diff] [blame]	2565	atomic64_set(&adev->vm_manager.client_counter, 0);
Christian König	284710f	2017-01-30 11:09:31 +0100	[diff] [blame]	2566	spin_lock_init(&adev->vm_manager.prt_lock);
Christian König	451bc8e	2017-02-14 16:02:52 +0100	[diff] [blame]	2567	atomic_set(&adev->vm_manager.num_prt_users, 0);
Harish Kasiviswanathan	9a4b7d4	2017-06-09 11:26:57 -0400	[diff] [blame]	2568
				2569	/* If not overridden by the user, by default, only in large BAR systems
				2570	* Compute VM tables will be updated by CPU
				2571	*/
				2572	#ifdef CONFIG_X86_64
				2573	if (amdgpu_vm_update_mode == -1) {
				2574	if (amdgpu_vm_is_large_bar(adev))
				2575	adev->vm_manager.vm_update_mode =
				2576	AMDGPU_VM_USE_CPU_FOR_COMPUTE;
				2577	else
				2578	adev->vm_manager.vm_update_mode = 0;
				2579	} else
				2580	adev->vm_manager.vm_update_mode = amdgpu_vm_update_mode;
				2581	#else
				2582	adev->vm_manager.vm_update_mode = 0;
				2583	#endif
				2584
Christian König	a9a78b3	2016-01-21 10:19:11 +0100	[diff] [blame]	2585	}
				2586
				2587	/**
Christian König	ea89f8c	2015-11-15 20:52:06 +0100	[diff] [blame]	2588	* amdgpu_vm_manager_fini - cleanup VM manager
				2589	*
				2590	* @adev: amdgpu_device pointer
				2591	*
				2592	* Cleanup the VM manager and free resources.
				2593	*/
				2594	void amdgpu_vm_manager_fini(struct amdgpu_device *adev)
				2595	{
Christian König	7645670	2017-04-06 17:52:39 +0200	[diff] [blame]	2596	unsigned i, j;
Christian König	ea89f8c	2015-11-15 20:52:06 +0100	[diff] [blame]	2597
Christian König	7645670	2017-04-06 17:52:39 +0200	[diff] [blame]	2598	for (i = 0; i < AMDGPU_MAX_VMHUBS; ++i) {
				2599	struct amdgpu_vm_id_manager *id_mgr =
				2600	&adev->vm_manager.id_mgr[i];
Christian König	bcb1ba3	2016-03-08 15:40:11 +0100	[diff] [blame]	2601
Christian König	7645670	2017-04-06 17:52:39 +0200	[diff] [blame]	2602	mutex_destroy(&id_mgr->lock);
				2603	for (j = 0; j < AMDGPU_NUM_VM; ++j) {
				2604	struct amdgpu_vm_id *id = &id_mgr->ids[j];
				2605
				2606	amdgpu_sync_free(&id->active);
				2607	dma_fence_put(id->flushed_updates);
				2608	dma_fence_put(id->last_flush);
				2609	}
Christian König	bcb1ba3	2016-03-08 15:40:11 +0100	[diff] [blame]	2610	}
Christian König	ea89f8c	2015-11-15 20:52:06 +0100	[diff] [blame]	2611	}
Chunming Zhou	cfbcacf	2017-04-24 11:09:04 +0800	[diff] [blame]	2612
				2613	int amdgpu_vm_ioctl(struct drm_device dev, void data, struct drm_file *filp)
				2614	{
				2615	union drm_amdgpu_vm *args = data;
Chunming Zhou	1e9ef26	2017-04-20 16:18:48 +0800	[diff] [blame]	2616	struct amdgpu_device *adev = dev->dev_private;
				2617	struct amdgpu_fpriv *fpriv = filp->driver_priv;
				2618	int r;
Chunming Zhou	cfbcacf	2017-04-24 11:09:04 +0800	[diff] [blame]	2619
				2620	switch (args->in.op) {
				2621	case AMDGPU_VM_OP_RESERVE_VMID:
Chunming Zhou	1e9ef26	2017-04-20 16:18:48 +0800	[diff] [blame]	2622	/* current, we only have requirement to reserve vmid from gfxhub */
				2623	r = amdgpu_vm_alloc_reserved_vmid(adev, &fpriv->vm,
				2624	AMDGPU_GFXHUB);
				2625	if (r)
				2626	return r;
				2627	break;
Chunming Zhou	cfbcacf	2017-04-24 11:09:04 +0800	[diff] [blame]	2628	case AMDGPU_VM_OP_UNRESERVE_VMID:
Chunming Zhou	1e9ef26	2017-04-20 16:18:48 +0800	[diff] [blame]	2629	amdgpu_vm_free_reserved_vmid(adev, &fpriv->vm, AMDGPU_GFXHUB);
Chunming Zhou	cfbcacf	2017-04-24 11:09:04 +0800	[diff] [blame]	2630	break;
				2631	default:
				2632	return -EINVAL;
				2633	}
				2634
				2635	return 0;
				2636	}