drm/i915: Use per-engine request pools

Message ID	20200402165542.26844-1-chris@chris-wilson.co.uk (mailing list archive)
State	New, archived
Headers	show Return-Path: <SRS0=iVzO=5S=lists.freedesktop.org=intel-gfx-bounces@kernel.org> DMARC-Filter: OpenDMARC Filter v1.3.2 mail.kernel.org B48A520737 From: Chris Wilson <chris@chris-wilson.co.uk> To: intel-gfx@lists.freedesktop.org Date: Thu, 2 Apr 2020 17:55:42 +0100 Message-Id: <20200402165542.26844-1-chris@chris-wilson.co.uk> In-Reply-To: <20200402152856.25407-1-chris@chris-wilson.co.uk> References: <20200402152856.25407-1-chris@chris-wilson.co.uk> MIME-Version: 1.0 Subject: [Intel-gfx] [PATCH] drm/i915: Use per-engine request pools Precedence: list Content-Type: text/plain; charset="us-ascii" Content-Transfer-Encoding: 7bit Errors-To: intel-gfx-bounces@lists.freedesktop.org Sender: "Intel-gfx" <intel-gfx-bounces@lists.freedesktop.org>
Series	drm/i915: Use per-engine request pools \| expand drm/i915: Use per-engine request pools

diff --git a/drivers/gpu/drm/i915/gt/intel_engine.h b/drivers/gpu/drm/i915/gt/intel_engine.h index b469de0dd9b6..23747996a1ed 100644 --- a/drivers/gpu/drm/i915/gt/intel_engine.h +++ b/drivers/gpu/drm/i915/gt/intel_engine.h @@ -324,6 +324,9 @@ void intel_engine_init_active(struct intel_engine_cs *engine, #define ENGINE_MOCK 1 #define ENGINE_VIRTUAL 2 +int intel_engine_init_request_pool(struct intel_engine_cs *engine); +void intel_engine_fini_request_pool(struct intel_engine_cs *engine); + static inline bool intel_engine_has_preempt_reset(const struct intel_engine_cs *engine) { diff --git a/drivers/gpu/drm/i915/gt/intel_engine_cs.c b/drivers/gpu/drm/i915/gt/intel_engine_cs.c index 843cb6f2f696..301fb33b4cf5 100644 --- a/drivers/gpu/drm/i915/gt/intel_engine_cs.c +++ b/drivers/gpu/drm/i915/gt/intel_engine_cs.c @@ -431,7 +431,14 @@ void intel_engines_free(struct intel_gt *gt) struct intel_engine_cs *engine; enum intel_engine_id id; + /* Free the requests! dma-resv keeps fences around for an eternity */ + i915_gem_drain_freed_objects(engine->i915); + rcu_barrier(); + for_each_engine(engine, gt, id) { + /* Must be kept until after all requests are freed! */ + intel_engine_fini_request_pool(engine); + kfree(engine); gt->engine[id] = NULL; } @@ -602,6 +609,30 @@ static int init_status_page(struct intel_engine_cs *engine) return ret; } +static void *__mempool_alloc_slab(gfp_t gfp, void *data) +{ + return kmem_cache_alloc(data, gfp); +} + +static void __mempool_free_slab(void *element, void *data) +{ + kmem_cache_free(data, element); +} + +int intel_engine_init_request_pool(struct intel_engine_cs *engine) +{ + /* NB mempool_init_slab() does not handle TYPESAFE_BY_RCU */ + return mempool_init(&engine->request_pool, + INTEL_ENGINE_REQUEST_POOL_RESERVED, + __mempool_alloc_slab, __mempool_free_slab, + i915_request_slab_cache()); +} + +void intel_engine_fini_request_pool(struct intel_engine_cs *engine) +{ + mempool_exit(&engine->request_pool); +} + static int engine_setup_common(struct intel_engine_cs *engine) { int err; @@ -612,6 +643,9 @@ static int engine_setup_common(struct intel_engine_cs *engine) if (err) return err; + if (intel_engine_init_request_pool(engine)) + goto err_status_page; + intel_engine_init_active(engine, ENGINE_PHYSICAL); intel_engine_init_breadcrumbs(engine); intel_engine_init_execlists(engine); @@ -630,6 +664,10 @@ static int engine_setup_common(struct intel_engine_cs *engine) intel_engine_init_ctx_wa(engine); return 0; + +err_status_page: + cleanup_status_page(engine); + return -ENOMEM; } struct measure_breadcrumb { diff --git a/drivers/gpu/drm/i915/gt/intel_engine_types.h b/drivers/gpu/drm/i915/gt/intel_engine_types.h index 80cdde712842..0db03215127b 100644 --- a/drivers/gpu/drm/i915/gt/intel_engine_types.h +++ b/drivers/gpu/drm/i915/gt/intel_engine_types.h @@ -13,6 +13,7 @@ #include <linux/kref.h> #include <linux/list.h> #include <linux/llist.h> +#include <linux/mempool.h> #include <linux/rbtree.h> #include <linux/timer.h> #include <linux/types.h> @@ -308,6 +309,9 @@ struct intel_engine_cs { struct list_head hold; /* ready requests, but on hold */ } active; + mempool_t request_pool; /* keep some in reserve for powermanagement */ +#define INTEL_ENGINE_REQUEST_POOL_RESERVED 2 + struct llist_head barrier_tasks; struct intel_context *kernel_context; /* pinned */ diff --git a/drivers/gpu/drm/i915/gt/intel_lrc.c b/drivers/gpu/drm/i915/gt/intel_lrc.c index 3479cda37fdc..26ef528c5485 100644 --- a/drivers/gpu/drm/i915/gt/intel_lrc.c +++ b/drivers/gpu/drm/i915/gt/intel_lrc.c @@ -4892,6 +4892,8 @@ static void virtual_context_destroy(struct kref *kref) __execlists_context_fini(&ve->context); intel_context_fini(&ve->context); + intel_engine_fini_request_pool(&ve->base); + kfree(ve->bonds); kfree(ve); } @@ -5173,6 +5175,9 @@ intel_execlists_create_virtual(struct intel_engine_cs **siblings, if (!ve) return ERR_PTR(-ENOMEM); + if (intel_engine_init_request_pool(&ve->base)) + return ERR_PTR(-ENOMEM); + ve->base.i915 = siblings[0]->i915; ve->base.gt = siblings[0]->gt; ve->base.uncore = siblings[0]->uncore; diff --git a/drivers/gpu/drm/i915/gt/mock_engine.c b/drivers/gpu/drm/i915/gt/mock_engine.c index 4a53ded7c2dd..511efe1bd4c5 100644 --- a/drivers/gpu/drm/i915/gt/mock_engine.c +++ b/drivers/gpu/drm/i915/gt/mock_engine.c @@ -266,6 +266,7 @@ static void mock_engine_release(struct intel_engine_cs *engine) intel_context_put(engine->kernel_context); intel_engine_fini_retire(engine); + intel_engine_fini_request_pool(engine); intel_engine_fini_breadcrumbs(engine); } @@ -323,6 +324,9 @@ int mock_engine_init(struct intel_engine_cs *engine) { struct intel_context *ce; + if (intel_engine_init_request_pool(engine)) + return -ENOMEM; + intel_engine_init_active(engine, ENGINE_MOCK); intel_engine_init_breadcrumbs(engine); intel_engine_init_execlists(engine); @@ -339,6 +343,7 @@ int mock_engine_init(struct intel_engine_cs *engine) err_breadcrumbs: intel_engine_fini_breadcrumbs(engine); + intel_engine_fini_request_pool(engine); return -ENOMEM; } diff --git a/drivers/gpu/drm/i915/i915_request.c b/drivers/gpu/drm/i915/i915_request.c index 3388c5b610c5..0bdc33b4ecdc 100644 --- a/drivers/gpu/drm/i915/i915_request.c +++ b/drivers/gpu/drm/i915/i915_request.c @@ -54,6 +54,11 @@ static struct i915_global_request { struct kmem_cache *slab_execute_cbs; } global; +struct kmem_cache *i915_request_slab_cache(void) +{ + return global.slab_requests; +} + static const char *i915_fence_get_driver_name(struct dma_fence *fence) { return dev_name(to_request(fence)->i915->drm.dev); @@ -115,7 +120,7 @@ static void i915_fence_release(struct dma_fence *fence) i915_sw_fence_fini(&rq->submit); i915_sw_fence_fini(&rq->semaphore); - kmem_cache_free(global.slab_requests, rq); + mempool_free(rq, &rq->engine->request_pool); } const struct dma_fence_ops i915_fence_ops = { @@ -629,14 +634,15 @@ static void retire_requests(struct intel_timeline *tl) } static noinline struct i915_request * -request_alloc_slow(struct intel_timeline *tl, gfp_t gfp) +request_alloc_slow(struct intel_timeline *tl, mempool_t *pool, gfp_t gfp) { struct i915_request *rq; - if (list_empty(&tl->requests)) - goto out; - + /* If we cannot wait, dip into our reserves */ if (!gfpflags_allow_blocking(gfp)) + return mempool_alloc(pool, gfp); + + if (list_empty(&tl->requests)) goto out; /* Move our oldest request to the slab-cache (if not in use!) */ @@ -721,7 +727,7 @@ __i915_request_create(struct intel_context *ce, gfp_t gfp) rq = kmem_cache_alloc(global.slab_requests, gfp | __GFP_RETRY_MAYFAIL | __GFP_NOWARN); if (unlikely(!rq)) { - rq = request_alloc_slow(tl, gfp); + rq = request_alloc_slow(tl, &ce->engine->request_pool, gfp); if (!rq) { ret = -ENOMEM; goto err_unreserve; @@ -807,7 +813,7 @@ __i915_request_create(struct intel_context *ce, gfp_t gfp) GEM_BUG_ON(!list_empty(&rq->sched.waiters_list)); err_free: - kmem_cache_free(global.slab_requests, rq); + mempool_free(rq, &ce->engine->request_pool); err_unreserve: intel_context_unpin(ce); return ERR_PTR(ret); diff --git a/drivers/gpu/drm/i915/i915_request.h b/drivers/gpu/drm/i915/i915_request.h index 3c552bfea67a..d8ce908e1346 100644 --- a/drivers/gpu/drm/i915/i915_request.h +++ b/drivers/gpu/drm/i915/i915_request.h @@ -300,6 +300,8 @@ static inline bool dma_fence_is_i915(const struct dma_fence *fence) return fence->ops == &i915_fence_ops; } +struct kmem_cache *i915_request_slab_cache(void); + struct i915_request * __must_check __i915_request_create(struct intel_context *ce, gfp_t gfp); struct i915_request * __must_check

drm/i915: Use per-engine request pools

Commit Message

Patch