[50/54] drm/i915/gt: Infrastructure for ring scheduling

Message ID	20201228155229.9516-50-chris@chris-wilson.co.uk (mailing list archive)
State	New, archived
Headers	show Return-Path: <SRS0=ePkq=GA=lists.freedesktop.org=intel-gfx-bounces@kernel.org> DMARC-Filter: OpenDMARC Filter v1.3.2 mail.kernel.org 2939C206E5 From: Chris Wilson <chris@chris-wilson.co.uk> To: intel-gfx@lists.freedesktop.org Date: Mon, 28 Dec 2020 15:52:25 +0000 Message-Id: <20201228155229.9516-50-chris@chris-wilson.co.uk> In-Reply-To: <20201228155229.9516-1-chris@chris-wilson.co.uk> References: <20201228155229.9516-1-chris@chris-wilson.co.uk> MIME-Version: 1.0 Subject: [Intel-gfx] [PATCH 50/54] drm/i915/gt: Infrastructure for ring scheduling Precedence: list Cc: Chris Wilson <chris@chris-wilson.co.uk> Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: base64 Errors-To: intel-gfx-bounces@lists.freedesktop.org Sender: "Intel-gfx" <intel-gfx-bounces@lists.freedesktop.org>
Series	[01/54] drm/i915/gt: Cancel submitted requests upon context reset \| expand [01/54] drm/i915/gt: Cancel submitted requests upon context reset [02/54] drm/i915/gt: Pull context closure check from request submit to schedule-in [03/54] drm/i915/gem: Peek at the inflight context [04/54] drm/i915: Mark up protected uses of 'i915_request_completed' [05/54] drm/i915: Drop i915_request.lock serialisation around await_start [06/54] drm/i915: Drop i915_request.lock requirement for intel_rps_boost() [07/54] drm/i915/gem: Reduce ctx->engine_mutex for reading the clone source [08/54] drm/i915/gem: Reduce ctx->engines_mutex for get_engines() [09/54] drm/i915: Reduce test_and_set_bit to set_bit in i915_request_submit() [10/54] drm/i915/gt: Drop atomic for engine->fw_active tracking [11/54] drm/i915/gt: Extract busy-stats for ring-scheduler [12/54] drm/i915/gt: Convert stats.active to plain unsigned int [13/54] drm/i915/gt: Do not suspend bonded requests if one hangs [14/54] drm/i915/gt: Remove timeslice suppression [15/54] drm/i915/gt: Skip over completed active execlists, again [16/54] drm/i915: Strip out internal priorities [17/54] drm/i915: Remove I915_USER_PRIORITY_SHIFT [18/54] drm/i915: Replace engine->schedule() with a known request operation [19/54] drm/i915: Teach the i915_dependency to use a double-lock [20/54] drm/i915: Restructure priority inheritance [21/54] drm/i915/selftests: Measure set-priority duration [22/54] drm/i915/selftests: Exercise priority inheritance around an engine loop [23/54] drm/i915: Improve DFS for priority inheritance [24/54] drm/i915: Extract request submission from execlists [25/54] drm/i915: Extract request rewinding from execlists [26/54] drm/i915: Extract request suspension from the execlists backend [27/54] drm/i915: Extract the ability to defer and rerun a request later [28/54] drm/i915: Fix the iterative dfs for defering requests [29/54] drm/i915: Move common active lists from engine to i915_scheduler [30/54] drm/i915: Move scheduler queue [31/54] drm/i915: Move tasklet from execlists to sched [32/54] drm/i915: Replace priolist rbtree with a skiplist [33/54] drm/i915: Wrap cmpxchg64 with try_cmpxchg64() helper [34/54] drm/i915: Fair low-latency scheduling [35/54] drm/i915/gt: Specify a deadline for the heartbeat [36/54] drm/i915: Extend the priority boosting for the display with a deadline [37/54] drm/i915/gt: Support virtual engine queues [38/54] drm/i915: Move saturated workload detection back to the context [39/54] drm/i915: Bump default timeslicing quantum to 5ms [40/54] drm/i915/gt: Wrap intel_timeline.has_initial_breadcrumb [41/54] drm/i915/gt: Track timeline GGTT offset separately from subpage offset [42/54] drm/i915/gt: Add timeline "mode" [43/54] drm/i915/gt: Use indices for writing into relative timelines [44/54] drm/i915/selftests: Exercise relative timeline modes [45/54] drm/i915/gt: Use ppHWSP for unshared non-semaphore related timelines [46/54] Restore "drm/i915: drop engine_pin/unpin_breadcrumbs_irq" [47/54] drm/i915/gt: Couple tasklet scheduling for all CS interrupts [48/54] drm/i915/gt: Support creation of 'internal' rings [49/54] drm/i915/gt: Use client timeline address for seqno writes [50/54] drm/i915/gt: Infrastructure for ring scheduling [51/54] drm/i915/gt: Enable busy-stats for ring-scheduler [52/54] drm/i915/gt: Implement ring scheduler for gen6/7 [53/54] drm/i915/gt: Enable ring scheduling for gen6/7 [54/54] drm/i915/gt: Limit C-states while waiting for requests

diff --git a/drivers/gpu/drm/i915/Makefile b/drivers/gpu/drm/i915/Makefile index f1c7c3246226..f14a3d9145dc 100644 --- a/drivers/gpu/drm/i915/Makefile +++ b/drivers/gpu/drm/i915/Makefile @@ -112,6 +112,7 @@ gt-y += \ gt/intel_renderstate.o \ gt/intel_reset.o \ gt/intel_ring.o \ + gt/intel_ring_scheduler.o \ gt/intel_ring_submission.o \ gt/intel_rps.o \ gt/intel_sseu.o \ diff --git a/drivers/gpu/drm/i915/gt/intel_engine.h b/drivers/gpu/drm/i915/gt/intel_engine.h index 801ae54cf60d..fa257a305143 100644 --- a/drivers/gpu/drm/i915/gt/intel_engine.h +++ b/drivers/gpu/drm/i915/gt/intel_engine.h @@ -191,6 +191,7 @@ void intel_engine_cleanup_common(struct intel_engine_cs *engine); int intel_engine_resume(struct intel_engine_cs *engine); int intel_ring_submission_setup(struct intel_engine_cs *engine); +int intel_ring_scheduler_setup(struct intel_engine_cs *engine); int intel_engine_stop_cs(struct intel_engine_cs *engine); void intel_engine_cancel_stop_cs(struct intel_engine_cs *engine); diff --git a/drivers/gpu/drm/i915/gt/intel_engine_types.h b/drivers/gpu/drm/i915/gt/intel_engine_types.h index 74e55e0fbc65..a93bef46e455 100644 --- a/drivers/gpu/drm/i915/gt/intel_engine_types.h +++ b/drivers/gpu/drm/i915/gt/intel_engine_types.h @@ -319,6 +319,7 @@ struct intel_engine_cs { struct { struct intel_ring *ring; struct intel_timeline *timeline; + struct intel_context *context; } legacy; /* diff --git a/drivers/gpu/drm/i915/gt/intel_ring_scheduler.c b/drivers/gpu/drm/i915/gt/intel_ring_scheduler.c new file mode 100644 index 000000000000..338d847445ca --- /dev/null +++ b/drivers/gpu/drm/i915/gt/intel_ring_scheduler.c @@ -0,0 +1,768 @@ +// SPDX-License-Identifier: MIT +/* + * Copyright © 2020 Intel Corporation + */ + +#include <linux/log2.h> + +#include <drm/i915_drm.h> + +#include "i915_drv.h" +#include "intel_breadcrumbs.h" +#include "intel_context.h" +#include "intel_engine_pm.h" +#include "intel_gt.h" +#include "intel_gt_pm.h" +#include "intel_gt_requests.h" +#include "intel_reset.h" +#include "intel_ring.h" +#include "intel_ring_submission.h" +#include "shmem_utils.h" + +/* + * Rough estimate of the typical request size, performing a flush, + * set-context and then emitting the batch. + */ +#define LEGACY_REQUEST_SIZE 200 + +static inline int rq_prio(const struct i915_request *rq) +{ + return rq->sched.attr.priority; +} + +static inline u64 rq_deadline(const struct i915_request *rq) +{ + return rq->sched.deadline; +} + +static inline bool reset_in_progress(const struct intel_engine_cs *engine) +{ + return unlikely(!__tasklet_is_enabled(&engine->active.tasklet)); +} + +static void +set_current_context(struct intel_context **ptr, struct intel_context *ce) +{ + if (ce) + intel_context_get(ce); + + ce = xchg(ptr, ce); + + if (ce) + intel_context_put(ce); +} + +static struct intel_engine_cs *__schedule_in(struct i915_request *rq) +{ + struct intel_context *ce = rq->context; + struct intel_engine_cs *engine = rq->engine; + + intel_context_get(ce); + + __intel_gt_pm_get(engine->gt); + if (engine->fw_domain && !engine->fw_active++) + intel_uncore_forcewake_get(engine->uncore, engine->fw_domain); + + CE_TRACE(ce, "schedule-in\n"); + + return engine; +} + +static void schedule_in(struct i915_request *rq) +{ + struct intel_context * const ce = rq->context; + struct intel_engine_cs *old; + + GEM_BUG_ON(!intel_engine_pm_is_awake(rq->engine)); + + old = ce->inflight; + if (!old) + old = __schedule_in(rq); + WRITE_ONCE(ce->inflight, ptr_inc(old)); + + GEM_BUG_ON(intel_context_inflight(ce) != rq->engine); + GEM_BUG_ON(!intel_context_inflight_count(ce)); +} + +static void __schedule_out(struct i915_request *rq) +{ + struct intel_context *ce = rq->context; + struct intel_engine_cs *engine = rq->engine; + + CE_TRACE(ce, "schedule-out\n"); + + if (list_is_last_rcu(&rq->link, &ce->timeline->requests)) + intel_engine_add_retire(engine, ce->timeline); + else + i915_request_update_deadline(list_next_entry(rq, link)); + + if (engine->fw_domain && !--engine->fw_active) + intel_uncore_forcewake_put(engine->uncore, engine->fw_domain); + intel_gt_pm_put_async(engine->gt); +} + +static void schedule_out(struct i915_request *rq) +{ + struct intel_context *ce = rq->context; + + GEM_BUG_ON(!ce->inflight); + ce->inflight = ptr_dec(ce->inflight); + if (!intel_context_inflight_count(ce)) { + GEM_BUG_ON(ce->inflight != rq->engine); + __schedule_out(rq); + WRITE_ONCE(ce->inflight, NULL); + intel_context_put(ce); + } + + i915_request_put(rq); +} + +static u32 *ring_map(struct intel_ring *ring, u32 len) +{ + u32 *va; + + if (unlikely(ring->tail + len > ring->effective_size)) { + memset(ring->vaddr + ring->tail, 0, ring->size - ring->tail); + ring->tail = 0; + } + + va = ring->vaddr + ring->tail; + ring->tail = intel_ring_wrap(ring, ring->tail + len); + + return va; +} + +static inline u32 *ring_map_dw(struct intel_ring *ring, u32 len) +{ + return ring_map(ring, len * sizeof(u32)); +} + +static void ring_copy(struct intel_ring *dst, + const struct intel_ring *src, + u32 start, u32 end) +{ + unsigned int len; + void *out; + + len = end - start; + if (end < start) + len += src->size; + out = ring_map(dst, len); + + if (end < start) { + len = src->size - start; + memcpy(out, src->vaddr + start, len); + out += len; + start = 0; + } + + memcpy(out, src->vaddr + start, end - start); +} + +static void switch_context(struct intel_ring *ring, struct i915_request *rq) +{ +} + +static struct i915_request *ring_submit(struct i915_request *rq) +{ + struct intel_ring *ring = rq->engine->legacy.ring; + + __i915_request_submit(rq); + + if (rq->engine->legacy.context != rq->context) { + switch_context(ring, rq); + set_current_context(&rq->engine->legacy.context, rq->context); + } + + ring_copy(ring, rq->ring, rq->head, rq->tail); + return rq; +} + +static struct i915_request ** +copy_active(struct i915_request **port, struct i915_request * const *active) +{ + while (*active) + *port++ = *active++; + + return port; +} + +static inline void +copy_ports(struct i915_request **dst, struct i915_request **src, int count) +{ + /* A memcpy_p() would be very useful here! */ + while (count--) + WRITE_ONCE(*dst++, *src++); /* avoid write tearing */ +} + +static inline void write_tail(const struct intel_engine_cs *engine) +{ + ENGINE_WRITE(engine, RING_TAIL, engine->legacy.ring->tail); +} + +static void dequeue(struct intel_engine_cs *engine) +{ + struct intel_engine_execlists * const el = &engine->execlists; + struct i915_request ** const last_port = el->pending + el->port_mask; + struct i915_request **port, **first, *last; + struct i915_priolist *p; + + first = copy_active(el->pending, el->active); + if (first > last_port) + return; + + local_irq_disable(); + + last = NULL; + port = first; + spin_lock(&engine->active.lock); + for_each_priolist(p, &engine->active.queue) { + struct i915_request *rq, *rn; + + priolist_for_each_request_safe(rq, rn, p) { + GEM_BUG_ON(rq == last); + if (last && rq->context != last->context) { + if (port == last_port) + goto done; + + *port++ = i915_request_get(last); + } + + last = ring_submit(rq); + } + + i915_priolist_advance(&engine->active.queue, p); + } +done: + spin_unlock(&engine->active.lock); + + if (last) { + *port++ = i915_request_get(last); + *port = NULL; + + WRITE_ONCE(el->active, el->pending); + + copy_ports(el->inflight, el->pending, port - el->pending + 1); + while (port-- != first) + schedule_in(*port); + + wmb(); /* paranoid flush of WCB before RING_TAIL write */ + write_tail(engine); + + WRITE_ONCE(el->active, el->inflight); + GEM_BUG_ON(!*el->active); + } + + local_irq_enable(); /* flush irq_work *after* RING_TAIL write */ +} + +static void post_process_csb(struct i915_request **port, + struct i915_request **last) +{ + while (port != last) + schedule_out(*port++); +} + +static struct i915_request ** +process_csb(struct intel_engine_execlists *el, struct i915_request **inactive) +{ + struct i915_request *rq; + + while ((rq = *el->active)) { + if (!__i915_request_is_complete(rq)) + break; + + *inactive++ = rq; + el->active++; + } + + return inactive; +} + +static void submission_tasklet(unsigned long data) +{ + struct intel_engine_cs * const engine = (struct intel_engine_cs *)data; + struct i915_request *post[2 * EXECLIST_MAX_PORTS]; + struct i915_request **inactive; + + rcu_read_lock(); + inactive = process_csb(&engine->execlists, post); + GEM_BUG_ON(inactive - post > ARRAY_SIZE(post)); + + if (!i915_sched_is_idle(&engine->active)) + dequeue(engine); + + post_process_csb(post, inactive); + rcu_read_unlock(); +} + +static void reset_prepare(struct intel_engine_cs *engine) +{ + GEM_TRACE("%s\n", engine->name); + + __tasklet_disable_sync_once(&engine->active.tasklet); + GEM_BUG_ON(!reset_in_progress(engine)); + + intel_ring_submission_reset_prepare(engine); +} + +static inline void clear_ports(struct i915_request **ports, int count) +{ + memset_p((void **)ports, NULL, count); +} + +static struct i915_request ** +cancel_port_requests(struct intel_engine_execlists * const el, + struct i915_request **inactive) +{ + struct i915_request * const *port; + + clear_ports(el->pending, ARRAY_SIZE(el->pending)); + + /* Mark the end of active before we overwrite *active */ + for (port = xchg(&el->active, el->pending); *port; port++) + *inactive++ = *port; + clear_ports(el->inflight, ARRAY_SIZE(el->inflight)); + + smp_wmb(); /* complete the seqlock for execlists_active() */ + WRITE_ONCE(el->active, el->inflight); + + return inactive; +} + +static void __ring_rewind(struct intel_engine_cs *engine, bool stalled) +{ + struct i915_request *rq; + unsigned long flags; + + rcu_read_lock(); + spin_lock_irqsave(&engine->active.lock, flags); + rq = __intel_engine_rewind_requests(engine); + spin_unlock_irqrestore(&engine->active.lock, flags); + if (rq && __i915_request_has_started(rq)) + __i915_request_reset(rq, stalled); + rcu_read_unlock(); +} + +static void ring_reset_csb(struct intel_engine_cs *engine) +{ + struct intel_engine_execlists * const el = &engine->execlists; + struct i915_request *post[2 * EXECLIST_MAX_PORTS]; + struct i915_request **inactive; + + rcu_read_lock(); + inactive = cancel_port_requests(el, post); + + /* Clear the global submission state, we will submit from scratch */ + intel_ring_reset(engine->legacy.ring, 0); + set_current_context(&engine->legacy.context, NULL); + + post_process_csb(post, inactive); + rcu_read_unlock(); +} + +static void ring_reset_rewind(struct intel_engine_cs *engine, bool stalled) +{ + ring_reset_csb(engine); + __ring_rewind(engine, stalled); +} + +static void nop_submission_tasklet(unsigned long data) +{ +} + +static void mark_eio(struct i915_request *rq) +{ + if (__i915_request_is_complete(rq)) + return; + + GEM_BUG_ON(i915_request_signaled(rq)); + + i915_request_set_error_once(rq, -EIO); + i915_request_mark_complete(rq); +} + +static void ring_reset_cancel(struct intel_engine_cs *engine) +{ + struct i915_request *rq, *rn; + struct i915_priolist *p; + unsigned long flags; + + ring_reset_csb(engine); + + rcu_read_lock(); + spin_lock_irqsave(&engine->active.lock, flags); + + /* Mark all submitted requests as skipped. */ + list_for_each_entry(rq, &engine->active.requests, sched.link) + mark_eio(rq); + intel_engine_signal_breadcrumbs(engine); + + /* Flush the queued requests to the timeline list (for retiring). */ + for_each_priolist(p, &engine->active.queue) { + priolist_for_each_request_safe(rq, rn, p) { + mark_eio(rq); + __i915_request_submit(rq); + } + i915_priolist_advance(&engine->active.queue, p); + } + GEM_BUG_ON(!i915_sched_is_idle(&engine->active)); + + /* Remaining _unready_ requests will be nop'ed when submitted */ + + GEM_BUG_ON(__tasklet_is_enabled(&engine->active.tasklet)); + engine->active.tasklet.func = nop_submission_tasklet; + + spin_unlock_irqrestore(&engine->active.lock, flags); + rcu_read_unlock(); +} + +static void reset_finish(struct intel_engine_cs *engine) +{ + intel_ring_submission_reset_finish(engine); + + if (__tasklet_enable(&engine->active.tasklet)) + i915_sched_kick(&engine->active); +} + +static void submission_park(struct intel_engine_cs *engine) +{ + /* drain the submit queue */ + intel_breadcrumbs_unpin_irq(engine->breadcrumbs); + i915_sched_kick(&engine->active); +} + +static void submission_unpark(struct intel_engine_cs *engine) +{ + intel_breadcrumbs_pin_irq(engine->breadcrumbs); +} + +static void ring_context_destroy(struct kref *ref) +{ + struct intel_context *ce = container_of(ref, typeof(*ce), ref); + + GEM_BUG_ON(intel_context_is_pinned(ce)); + + if (ce->state) + i915_vma_put(ce->state); + if (test_bit(CONTEXT_ALLOC_BIT, &ce->flags)) + intel_ring_put(ce->ring); + + intel_context_fini(ce); + intel_context_free(ce); +} + +static int alloc_context_vma(struct intel_context *ce) + +{ + struct intel_engine_cs *engine = ce->engine; + struct drm_i915_gem_object *obj; + struct i915_vma *vma; + int err; + + obj = i915_gem_object_create_shmem(engine->i915, engine->context_size); + if (IS_ERR(obj)) + return PTR_ERR(obj); + + /* + * Try to make the context utilize L3 as well as LLC. + * + * On VLV we don't have L3 controls in the PTEs so we + * shouldn't touch the cache level, especially as that + * would make the object snooped which might have a + * negative performance impact. + * + * Snooping is required on non-llc platforms in execlist + * mode, but since all GGTT accesses use PAT entry 0 we + * get snooping anyway regardless of cache_level. + * + * This is only applicable for Ivy Bridge devices since + * later platforms don't have L3 control bits in the PTE. + */ + if (IS_IVYBRIDGE(engine->i915)) + i915_gem_object_set_cache_coherency(obj, I915_CACHE_L3_LLC); + + if (engine->default_state) { + void *vaddr; + + vaddr = i915_gem_object_pin_map(obj, I915_MAP_WB); + if (IS_ERR(vaddr)) { + err = PTR_ERR(vaddr); + goto err_obj; + } + + shmem_read(engine->default_state, 0, + vaddr, engine->context_size); + __set_bit(CONTEXT_VALID_BIT, &ce->flags); + + i915_gem_object_flush_map(obj); + i915_gem_object_unpin_map(obj); + } + + vma = i915_vma_instance(obj, &engine->gt->ggtt->vm, NULL); + if (IS_ERR(vma)) { + err = PTR_ERR(vma); + goto err_obj; + } + + ce->state = vma; + return 0; + +err_obj: + i915_gem_object_put(obj); + return err; +} + +static struct intel_timeline *pinned_timeline(struct intel_context *ce) +{ + struct intel_timeline *tl = fetch_and_zero(&ce->timeline); + + return intel_timeline_create_from_engine(ce->engine, + page_unmask_bits(tl)); +} + +static int alloc_timeline(struct intel_context *ce) +{ + struct intel_engine_cs *engine = ce->engine; + struct intel_timeline *tl; + + if (unlikely(ce->timeline)) + tl = pinned_timeline(ce); + else + tl = intel_timeline_create(engine->gt); + if (IS_ERR(tl)) + return PTR_ERR(tl); + + ce->timeline = tl; + return 0; +} + +static int ring_context_alloc(struct intel_context *ce) +{ + struct intel_engine_cs *engine = ce->engine; + struct intel_ring *ring; + int err; + + GEM_BUG_ON(ce->state); + if (engine->context_size) { + err = alloc_context_vma(ce); + if (err) + return err; + } + + if (!page_mask_bits(ce->timeline)) { + err = alloc_timeline(ce); + if (err) + goto err_vma; + } + + ring = intel_engine_create_ring(engine, + (unsigned long)ce->ring | + INTEL_RING_CREATE_INTERNAL); + if (IS_ERR(ring)) { + err = PTR_ERR(ring); + goto err_timeline; + } + ce->ring = ring; + + return 0; + +err_timeline: + intel_timeline_put(ce->timeline); +err_vma: + if (ce->state) { + i915_vma_put(ce->state); + ce->state = NULL; + } + return err; +} + +static int ring_context_pre_pin(struct intel_context *ce, + struct i915_gem_ww_ctx *ww, + void **unused) +{ + return 0; +} + +static int ring_context_pin(struct intel_context *ce, void *unused) +{ + return 0; +} + +static void ring_context_unpin(struct intel_context *ce) +{ +} + +static void ring_context_post_unpin(struct intel_context *ce) +{ +} + +static void ring_context_reset(struct intel_context *ce) +{ + intel_ring_reset(ce->ring, 0); + clear_bit(CONTEXT_VALID_BIT, &ce->flags); +} + +static const struct intel_context_ops ring_context_ops = { + .alloc = ring_context_alloc, + + .pre_pin = ring_context_pre_pin, + .pin = ring_context_pin, + .unpin = ring_context_unpin, + .post_unpin = ring_context_post_unpin, + + .enter = intel_context_enter_engine, + .exit = intel_context_exit_engine, + + .reset = ring_context_reset, + .destroy = ring_context_destroy, +}; + +static int ring_request_alloc(struct i915_request *rq) +{ + int ret; + + GEM_BUG_ON(!intel_context_is_pinned(rq->context)); + + /* + * Flush enough space to reduce the likelihood of waiting after + * we start building the request - in which case we will just + * have to repeat work. + */ + rq->reserved_space += LEGACY_REQUEST_SIZE; + + /* Unconditionally invalidate GPU caches and TLBs. */ + ret = rq->engine->emit_flush(rq, EMIT_INVALIDATE); + if (ret) + return ret; + + rq->reserved_space -= LEGACY_REQUEST_SIZE; + return 0; +} + +static void set_default_submission(struct intel_engine_cs *engine) +{ + engine->submit_request = i915_request_enqueue; + engine->active.tasklet.func = submission_tasklet; +} + +static void ring_release(struct intel_engine_cs *engine) +{ + intel_engine_cleanup_common(engine); + + set_current_context(&engine->legacy.context, NULL); + + intel_ring_unpin(engine->legacy.ring); + intel_ring_put(engine->legacy.ring); +} + +static void setup_irq(struct intel_engine_cs *engine) +{ +} + +static void setup_common(struct intel_engine_cs *engine) +{ + struct drm_i915_private *i915 = engine->i915; + + /* gen8+ are only supported with execlists */ + GEM_BUG_ON(INTEL_GEN(i915) >= 8); + GEM_BUG_ON(INTEL_GEN(i915) < 8); + + setup_irq(engine); + + engine->park = submission_park; + engine->unpark = submission_unpark; + + engine->resume = intel_ring_submission_resume; + engine->sanitize = intel_ring_submission_sanitize; + + engine->reset.prepare = reset_prepare; + engine->reset.rewind = ring_reset_rewind; + engine->reset.cancel = ring_reset_cancel; + engine->reset.finish = reset_finish; + + engine->cops = &ring_context_ops; + engine->request_alloc = ring_request_alloc; + + engine->set_default_submission = set_default_submission; +} + +static void setup_rcs(struct intel_engine_cs *engine) +{ +} + +static void setup_vcs(struct intel_engine_cs *engine) +{ +} + +static void setup_bcs(struct intel_engine_cs *engine) +{ +} + +static void setup_vecs(struct intel_engine_cs *engine) +{ + GEM_BUG_ON(!IS_HASWELL(engine->i915)); +} + +static unsigned int global_ring_size(void) +{ + /* Enough space to hold 2 clients and the context switch */ + return roundup_pow_of_two(EXECLIST_MAX_PORTS * SZ_16K + SZ_4K); +} + +int intel_ring_scheduler_setup(struct intel_engine_cs *engine) +{ + struct intel_ring *ring; + int err; + + GEM_BUG_ON(HAS_EXECLISTS(engine->i915)); + + tasklet_init(&engine->active.tasklet, + submission_tasklet, (unsigned long)engine); + + setup_common(engine); + + switch (engine->class) { + case RENDER_CLASS: + setup_rcs(engine); + break; + case VIDEO_DECODE_CLASS: + setup_vcs(engine); + break; + case COPY_ENGINE_CLASS: + setup_bcs(engine); + break; + case VIDEO_ENHANCEMENT_CLASS: + setup_vecs(engine); + break; + default: + MISSING_CASE(engine->class); + return -ENODEV; + } + + ring = intel_engine_create_ring(engine, global_ring_size()); + if (IS_ERR(ring)) { + err = PTR_ERR(ring); + goto err; + } + + err = intel_ring_pin(ring, NULL); + if (err) + goto err_ring; + + GEM_BUG_ON(engine->legacy.ring); + engine->legacy.ring = ring; + + engine->flags |= I915_ENGINE_HAS_SCHEDULER; + engine->flags |= I915_ENGINE_NEEDS_BREADCRUMB_TASKLET; + + /* Finally, take ownership and responsibility for cleanup! */ + engine->release = ring_release; + return 0; + +err_ring: + intel_ring_put(ring); +err: + intel_engine_cleanup_common(engine); + return err; +} diff --git a/drivers/gpu/drm/i915/gt/intel_ring_submission.c b/drivers/gpu/drm/i915/gt/intel_ring_submission.c index cab775a78912..19d7edda2a48 100644 --- a/drivers/gpu/drm/i915/gt/intel_ring_submission.c +++ b/drivers/gpu/drm/i915/gt/intel_ring_submission.c @@ -37,6 +37,7 @@ #include "intel_gt.h" #include "intel_reset.h" #include "intel_ring.h" +#include "intel_ring_submission.h" #include "shmem_utils.h" /* Rough estimate of the typical request size, performing a flush, @@ -217,7 +218,7 @@ static void set_pp_dir(struct intel_engine_cs *engine) } } -static int xcs_resume(struct intel_engine_cs *engine) +int intel_ring_submission_resume(struct intel_engine_cs *engine) { struct drm_i915_private *dev_priv = engine->i915; struct intel_ring *ring = engine->legacy.ring; @@ -329,7 +330,7 @@ static void sanitize_hwsp(struct intel_engine_cs *engine) intel_timeline_reset_seqno(tl); } -static void xcs_sanitize(struct intel_engine_cs *engine) +void intel_ring_submission_sanitize(struct intel_engine_cs *engine) { /* * Poison residual state on resume, in case the suspend didn't! @@ -354,7 +355,7 @@ static void xcs_sanitize(struct intel_engine_cs *engine) clflush_cache_range(engine->status_page.addr, PAGE_SIZE); } -static void reset_prepare(struct intel_engine_cs *engine) +void intel_ring_submission_reset_prepare(struct intel_engine_cs *engine) { struct intel_uncore *uncore = engine->uncore; const u32 base = engine->mmio_base; @@ -463,7 +464,7 @@ static void reset_rewind(struct intel_engine_cs *engine, bool stalled) spin_unlock_irqrestore(&engine->active.lock, flags); } -static void reset_finish(struct intel_engine_cs *engine) +void intel_ring_submission_reset_finish(struct intel_engine_cs *engine) { } @@ -1104,13 +1105,13 @@ static void setup_common(struct intel_engine_cs *engine) setup_irq(engine); - engine->resume = xcs_resume; - engine->sanitize = xcs_sanitize; + engine->resume = intel_ring_submission_resume; + engine->sanitize = intel_ring_submission_sanitize; - engine->reset.prepare = reset_prepare; + engine->reset.prepare = intel_ring_submission_reset_prepare; engine->reset.rewind = reset_rewind; engine->reset.cancel = reset_cancel; - engine->reset.finish = reset_finish; + engine->reset.finish = intel_ring_submission_reset_finish; engine->cops = &ring_context_ops; engine->request_alloc = ring_request_alloc; diff --git a/drivers/gpu/drm/i915/gt/intel_ring_submission.h b/drivers/gpu/drm/i915/gt/intel_ring_submission.h new file mode 100644 index 000000000000..59a43c221748 --- /dev/null +++ b/drivers/gpu/drm/i915/gt/intel_ring_submission.h @@ -0,0 +1,17 @@ +/* SPDX-License-Identifier: MIT */ +/* + * Copyright © 2020 Intel Corporation + */ + +#ifndef __INTEL_RING_SUBMISSION_H__ +#define __INTEL_RING_SUBMISSION_H__ + +struct intel_engine_cs; + +void intel_ring_submission_reset_prepare(struct intel_engine_cs *engine); +void intel_ring_submission_reset_finish(struct intel_engine_cs *engine); + +int intel_ring_submission_resume(struct intel_engine_cs *engine); +void intel_ring_submission_sanitize(struct intel_engine_cs *engine); + +#endif /* __INTEL_RING_SUBMISSION_H__ */

[50/54] drm/i915/gt: Infrastructure for ring scheduling

Commit Message

Patch