[RFC,049/162] drm/i915: Use a single page table lock for each gtt.

From: Maarten Lankhorst <maarten.lankhorst@linux.intel.com>

DMARC-Filter: OpenDMARC Filter v1.3.2 mail.kernel.org 41D052222C
IronPort-SDR: 
 5QKKMGfH51B2/Fvb+tsCR3pho9/0NUmfdxy5xJh78jqCochsyNNYLXbBYUIp4DBiN5b/VSzba2
 Ik6f7Am8sg0g==
IronPort-SDR: 
 9utxEVC7ik6JNTe+5Rj59OYvvhbTvdJoVqTA/qCkd68mCRTds0S/2YNYpfPMa5zq1qXuo4rlk3
 VFijcOdV/7Lg==
From: Matthew Auld <matthew.auld@intel.com>
To: intel-gfx@lists.freedesktop.org
Subject: [RFC PATCH 049/162] drm/i915: Use a single page table lock for each
 gtt.
Date: Fri, 27 Nov 2020 12:05:25 +0000
Message-Id: <20201127120718.454037-50-matthew.auld@intel.com>
In-Reply-To: <20201127120718.454037-1-matthew.auld@intel.com>
References: <20201127120718.454037-1-matthew.auld@intel.com>
MIME-Version: 1.0
Precedence: list
Cc: dri-devel@lists.freedesktop.org,
 =?utf-8?q?Thomas_Hellstr=C3=B6m?= <thomas.hellstrom@linux.intel.com>
Content-Type: text/plain; charset="utf-8"
Content-Transfer-Encoding: base64
Errors-To: dri-devel-bounces@lists.freedesktop.org
Sender: "dri-devel" <dri-devel-bounces@lists.freedesktop.org>

Message ID	20201127120718.454037-50-matthew.auld@intel.com (mailing list archive)
State	New, archived
Headers	show Return-Path: <SRS0=wCRU=FB=lists.freedesktop.org=dri-devel-bounces@kernel.org> DMARC-Filter: OpenDMARC Filter v1.3.2 mail.kernel.org 41D052222C IronPort-SDR: 5QKKMGfH51B2/Fvb+tsCR3pho9/0NUmfdxy5xJh78jqCochsyNNYLXbBYUIp4DBiN5b/VSzba2 Ik6f7Am8sg0g== IronPort-SDR: 9utxEVC7ik6JNTe+5Rj59OYvvhbTvdJoVqTA/qCkd68mCRTds0S/2YNYpfPMa5zq1qXuo4rlk3 VFijcOdV/7Lg== From: Matthew Auld <matthew.auld@intel.com> To: intel-gfx@lists.freedesktop.org Subject: [RFC PATCH 049/162] drm/i915: Use a single page table lock for each gtt. Date: Fri, 27 Nov 2020 12:05:25 +0000 Message-Id: <20201127120718.454037-50-matthew.auld@intel.com> In-Reply-To: <20201127120718.454037-1-matthew.auld@intel.com> References: <20201127120718.454037-1-matthew.auld@intel.com> MIME-Version: 1.0 Precedence: list Cc: dri-devel@lists.freedesktop.org, =?utf-8?q?Thomas_Hellstr=C3=B6m?= <thomas.hellstrom@linux.intel.com> Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: base64 Errors-To: dri-devel-bounces@lists.freedesktop.org Sender: "dri-devel" <dri-devel-bounces@lists.freedesktop.org>
Series	DG1 + LMEM enabling \| expand [RFC,000/162] DG1 + LMEM enabling [RFC,001/162] drm/i915/selftest: also consider non-contiguous objects [RFC,002/162] drm/i915/selftest: assert we get 2M GTT pages [RFC,003/162] drm/i915/selftest: handle local-memory in perf_memcpy [RFC,004/162] drm/i915/gt: Move move context layout registers and offsets to lrc_reg.h [RFC,005/162] drm/i915/gt: Rename lrc.c to execlists_submission.c [RFC,006/162] drm/i915: split gen8+ flush and bb_start emission functions to their own file [RFC,007/162] drm/i915: split wa_bb code to its own file [RFC,008/162] HAX drm/i915: Work around the selftest timeline lock splat workaround [RFC,009/162] drm/i915: Introduce drm_i915_lock_isolated [RFC,010/162] drm/i915: Lock hwsp objects isolated for pinning at create time [RFC,011/162] drm/i915: Pin timeline map after first timeline pin, v5. [RFC,012/162] drm/i915: Move cmd parser pinning to execbuffer [RFC,013/162] drm/i915: Add missing -EDEADLK handling to execbuf pinning, v2. [RFC,014/162] drm/i915: Ensure we hold the object mutex in pin correctly v2 [RFC,015/162] drm/i915: Add gem object locking to madvise. [RFC,016/162] drm/i915: Move HAS_STRUCT_PAGE to obj->flags [RFC,017/162] drm/i915: Rework struct phys attachment handling [RFC,018/162] drm/i915: Convert i915_gem_object_attach_phys() to ww locking, v2. [RFC,019/162] drm/i915: make lockdep slightly happier about execbuf. [RFC,020/162] drm/i915: Disable userptr pread/pwrite support. [RFC,021/162] drm/i915: No longer allow exporting userptr through dma-buf [RFC,022/162] drm/i915: Reject more ioctls for userptr [RFC,023/162] drm/i915: Reject UNSYNCHRONIZED for userptr, v2. [RFC,024/162] drm/i915: Make compilation of userptr code depend on MMU_NOTIFIER. [RFC,025/162] drm/i915: Fix userptr so we do not have to worry about obj->mm.lock, v5. [RFC,026/162] drm/i915: Flatten obj->mm.lock [RFC,027/162] drm/i915: Populate logical context during first pin. [RFC,028/162] drm/i915: Make ring submission compatible with obj->mm.lock removal, v2. [RFC,029/162] drm/i915: Handle ww locking in init_status_page [RFC,030/162] drm/i915: Rework clflush to work correctly without obj->mm.lock. [RFC,031/162] drm/i915: Pass ww ctx to intel_pin_to_display_plane [RFC,032/162] drm/i915: Add object locking to vm_fault_cpu [RFC,033/162] drm/i915: Move pinning to inside engine_wa_list_verify() [RFC,034/162] drm/i915: Take reservation lock around i915_vma_pin. [RFC,035/162] drm/i915: Make intel_init_workaround_bb more compatible with ww locking. [RFC,036/162] drm/i915: Make __engine_unpark() compatible with ww locking v2 [RFC,037/162] drm/i915: Take obj lock around set_domain ioctl [RFC,038/162] drm/i915: Defer pin calls in buffer pool until first use by caller. [RFC,039/162] drm/i915: Fix pread/pwrite to work with new locking rules. [RFC,040/162] drm/i915: Fix workarounds selftest, part 1 [RFC,041/162] drm/i915: Prepare for obj->mm.lock removal [RFC,042/162] drm/i915: Add igt_spinner_pin() to allow for ww locking around spinner. [RFC,043/162] drm/i915: Add ww locking around vm_access() [RFC,044/162] drm/i915: Increase ww locking for perf. [RFC,045/162] drm/i915: Lock ww in ucode objects correctly [RFC,046/162] drm/i915: Add ww locking to dma-buf ops. [RFC,047/162] drm/i915: Add missing ww lock in intel_dsb_prepare. [RFC,048/162] drm/i915: Fix ww locking in shmem_create_from_object [RFC,049/162] drm/i915: Use a single page table lock for each gtt. [RFC,050/162] drm/i915/selftests: Prepare huge_pages testcases for obj->mm.lock removal. [RFC,051/162] drm/i915/selftests: Prepare client blit for obj->mm.lock removal. [RFC,052/162] drm/i915/selftests: Prepare coherency tests for obj->mm.lock removal. [RFC,053/162] drm/i915/selftests: Prepare context tests for obj->mm.lock removal. [RFC,054/162] drm/i915/selftests: Prepare dma-buf tests for obj->mm.lock removal. [RFC,055/162] drm/i915/selftests: Prepare execbuf tests for obj->mm.lock removal. [RFC,056/162] drm/i915/selftests: Prepare mman testcases for obj->mm.lock removal. [RFC,057/162] drm/i915/selftests: Prepare object tests for obj->mm.lock removal. [RFC,058/162] drm/i915/selftests: Prepare object blit tests for obj->mm.lock removal. [RFC,059/162] drm/i915/selftests: Prepare igt_gem_utils for obj->mm.lock removal [RFC,060/162] drm/i915/selftests: Prepare context selftest for obj->mm.lock removal [RFC,061/162] drm/i915/selftests: Prepare hangcheck for obj->mm.lock removal [RFC,062/162] drm/i915/selftests: Prepare execlists for obj->mm.lock removal [RFC,063/162] drm/i915/selftests: Prepare mocs tests for obj->mm.lock removal [RFC,064/162] drm/i915/selftests: Prepare ring submission for obj->mm.lock removal [RFC,065/162] drm/i915/selftests: Prepare timeline tests for obj->mm.lock removal [RFC,066/162] drm/i915/selftests: Prepare i915_request tests for obj->mm.lock removal [RFC,067/162] drm/i915/selftests: Prepare memory region tests for obj->mm.lock removal [RFC,068/162] drm/i915/selftests: Prepare cs engine tests for obj->mm.lock removal [RFC,069/162] drm/i915/selftests: Prepare gtt tests for obj->mm.lock removal [RFC,070/162] drm/i915: Finally remove obj->mm.lock. [RFC,071/162] drm/i915: Keep userpointer bindings if seqcount is unchanged, v2. [RFC,072/162] drm/i915: Avoid some false positives in assert_object_held() [RFC,073/162] drm/i915: Reference contending lock objects [RFC,074/162] drm/i915: Break out dma_resv ww locking utilities to separate files [RFC,075/162] drm/i915: Introduce a for_i915_gem_ww(){} [RFC,076/162] drm/i915: Untangle the vma pages_mutex [RFC,077/162] drm/i915/fbdev: Use lmem physical addresses for fb_mmap() on discrete [RFC,078/162] drm/i915: Return error value when bo not in LMEM for discrete [RFC,079/162] drm/i915/dmabuf: Disallow LMEM objects from dma-buf [RFC,080/162] drm/i915/lmem: Fail driver init if LMEM training failed [RFC,081/162] HAX drm/i915/lmem: support CPU relocations [RFC,082/162] HAX drm/i915/lmem: support pread and pwrite [RFC,083/162] drm/i915: Update the helper to set correct mapping [RFC,084/162] drm/i915: introduce kernel blitter_context [RFC,085/162] drm/i915/region: support basic eviction [RFC,086/162] drm/i915: Add blit functions that can be called from within a WW transaction [RFC,087/162] drm/i915: Delay publishing objects on the eviction lists [RFC,088/162] drm/i915: support basic object migration [RFC,089/162] drm/i915/dg1: Fix occasional migration error [RFC,090/162] drm/i915/query: Expose memory regions through the query uAPI [RFC,091/162] drm/i915: Store gt in memory region [RFC,092/162] drm/i915/uapi: introduce drm_i915_gem_create_ext [RFC,093/162] drm/i915/lmem: allocate cmd ring in lmem [RFC,094/162] drm/i915/dg1: Do not check r->sgt.pfn for NULL [RFC,095/162] drm/i915/dg1: Introduce dmabuf mmap to LMEM [RFC,096/162] drm/i915: setup the LMEM region [RFC,097/162] drm/i915: Distinction of memory regions [RFC,098/162] drm/i915/gtt: map the PD up front [RFC,099/162] drm/i915/gtt/dgfx: place the PD in LMEM [RFC,100/162] drm/i915/gtt: make flushing conditional [RFC,101/162] drm/i915/gtt/dg1: add PTE_LM plumbing for PPGTT [RFC,102/162] drm/i915/gtt/dg1: add PTE_LM plumbing for GGTT [RFC,103/162] drm/i915: allocate context from LMEM [RFC,104/162] drm/i915: move engine scratch to LMEM [RFC,105/162] drm/i915: Provide a way to disable PCIe relaxed write ordering [RFC,106/162] drm/i915: i915 returns -EBUSY on thread contention [RFC,107/162] drm/i915: setup GPU device lmem region [RFC,108/162] drm/i915: Fix object page offset within a region [RFC,109/162] drm/i915: add i915_gem_object_is_devmem() function [RFC,110/162] drm/i915: finish memory region support for stolen objects. [RFC,111/162] drm/i915/lmem: support optional CPU clearing for special internal use [RFC,112/162] drm/i915/guc: put all guc objects in lmem when available [RFC,113/162] drm/i915: Create stolen memory region from local memory [RFC,114/162] drm/i915/lmem: Bypass aperture when lmem is available [RFC,115/162] drm/i915/lmem: reset the lmem buffer created by fbdev [RFC,116/162] drm/i915/dsb: Enable lmem for dsb [RFC,117/162] drm/i915: Reintroduce mem->reserved [RFC,118/162] drm/i915/dg1: Reserve first 1MB of local memory [RFC,119/162] drm/i915/dg1: Read OPROM via SPI controller [RFC,120/162] drm/i915/oprom: Basic sanitization [RFC,121/162] drm/i915: WA for zero memory channel [RFC,122/162] drm/i915/dg1: Compute MEM Bandwidth using MCHBAR [RFC,123/162] drm/i915/dg1: Double memory bandwidth available [RFC,124/162] drm/i915/lmem: allocate HWSP in lmem [RFC,125/162] drm/i915/lmem: Limit block size to 4G [RFC,126/162] drm/i915/gem: Update shmem available memory [RFC,127/162] drm/i915: Allow non-uniform subslices in gen12+ [RFC,128/162] drm/i915/dg1: intel_memory_region_evict() changes for eviction [RFC,129/162] drm/i915/dg1: i915_gem_object_memcpy(..) infrastructure [RFC,130/162] drm/i915/dg1: Eviction logic [RFC,131/162] drm/i915/dg1: Add enable_eviction modparam [RFC,132/162] drm/i915/dg1: Add lmem_size modparam [RFC,133/162] drm/i915/dg1: Track swap in/out stats via debugfs [RFC,134/162] drm/i915/dg1: Measure swap in/out timing stats [RFC,135/162] drm/i915: define intel_partial_pages_for_sg_table [RFC,136/162] drm/i915: create and destroy dummy vma [RFC,137/162] drm/i915: blt copy between objs using pre-created vma windows [RFC,138/162] drm/i915/dg1: Eliminate eviction mutex [RFC,139/162] drm/i915/dg1: Keep engine awake across whole blit [RFC,140/162] drm/i915: window_blt_copy is used for swapin and swapout [RFC,141/162] drm/i915: Lmem eviction statistics by category [RFC,142/162] drm/i915/gem/selftest: test and measure window based blt cpy [RFC,143/162] drm/i915: suspend/resume eviction [RFC,144/162] drm/i915: Reset blitter context when unpark engine [RFC,145/162] drm/i915/dg1: Add dedicated context for blitter eviction [RFC,146/162] drm/i915/pm: suspend and restore ppgtt mapping [RFC,147/162] drm/i915/gt: Allocate default ctx objects in SMEM [RFC,148/162] drm/i915: suspend/resume enable blitter eviction [RFC,149/162] drm/i915: suspend/resume handling of perma-pinned objects [RFC,150/162] drm/i915: need consider system BO snoop for dgfx [RFC,151/162] drm/i915: move eviction to prepare hook [RFC,152/162] drm/i915: Perform execbuffer object locking as a separate step [RFC,153/162] drm/i915: Implement eviction locking v2 [RFC,154/162] drm/i915: Support ww eviction [RFC,155/162] drm/i915: Use a ww transaction in the fault handler [RFC,156/162] drm/i915: Use a ww transaction in i915_gem_object_pin_map_unlocked() [RFC,157/162] drm/i915: Improve accuracy of eviction stats [RFC,158/162] drm/i915: Support ww locks in suspend/resume [RFC,159/162] drm/i915/dg1: Fix mapping type for default state object [RFC,160/162] drm/i915/dg1: Fix GPU hang due to shmemfs page drop [RFC,161/162] drm/i915/dg1: allow pci to auto probe [RFC,162/162] drm/i915: drop fake lmem

[RFC,049/162] drm/i915: Use a single page table lock for each gtt.

Commit Message

Patch