[v9,5/9] drm/i915: vgpu context submission pv optimization

Message ID	1564417962-74325-6-git-send-email-xiaolin.zhang@intel.com (mailing list archive)
State	New, archived
Headers	show Return-Path: <intel-gfx-bounces@lists.freedesktop.org> From: Xiaolin Zhang <xiaolin.zhang@intel.com> To: intel-gvt-dev@lists.freedesktop.org, intel-gfx@lists.freedesktop.org Date: Tue, 30 Jul 2019 00:32:38 +0800 Message-Id: <1564417962-74325-6-git-send-email-xiaolin.zhang@intel.com> In-Reply-To: <1564417962-74325-1-git-send-email-xiaolin.zhang@intel.com> References: <1564417962-74325-1-git-send-email-xiaolin.zhang@intel.com> MIME-Version: 1.0 Subject: [Intel-gfx] [PATCH v9 5/9] drm/i915: vgpu context submission pv optimization Precedence: list Cc: zhenyu.z.wang@intel.com, hang.yuan@intel.com, zhiyuan.lv@intel.com Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: base64 Errors-To: intel-gfx-bounces@lists.freedesktop.org Sender: "Intel-gfx" <intel-gfx-bounces@lists.freedesktop.org>
Series	i915 vgpu PV to improve vgpu performance \| expand [v9,0/9] i915 vgpu PV to improve vgpu performance [v9,1/9] drm/i915: introduced vgpu pv capability [v9,2/9] drm/i915: vgpu shared memory setup for pv optimization [v9,3/9] drm/i915: vgpu pv command buffer support [v9,4/9] drm/i915: vgpu ppgtt update pv optimization [v9,5/9] drm/i915: vgpu context submission pv optimization [v9,6/9] drm/i915/gvt: GVTg handle pv_caps PVINFO register [v9,7/9] drm/i915/gvt: GVTg handle shared_page setup [v9,8/9] drm/i915/gvt: GVTg support ppgtt pv optimization [v9,9/9] drm/i915/gvt: GVTg support context submission pv optimization

diff --git a/drivers/gpu/drm/i915/Makefile b/drivers/gpu/drm/i915/Makefile index 5245162..e1d2bef 100644 --- a/drivers/gpu/drm/i915/Makefile +++ b/drivers/gpu/drm/i915/Makefile @@ -245,7 +245,7 @@ i915-$(CONFIG_DRM_I915_SELFTEST) += \ selftests/igt_spinner.o # virtual gpu code -i915-y += i915_vgpu.o +i915-y += i915_vgpu.o intel_pv_submission.o ifeq ($(CONFIG_DRM_I915_GVT),y) i915-y += intel_gvt.o diff --git a/drivers/gpu/drm/i915/gt/intel_lrc.c b/drivers/gpu/drm/i915/gt/intel_lrc.c index 884dfc1..f400231 100644 --- a/drivers/gpu/drm/i915/gt/intel_lrc.c +++ b/drivers/gpu/drm/i915/gt/intel_lrc.c @@ -2767,10 +2767,14 @@ void intel_execlists_set_default_submission(struct intel_engine_cs *engine) engine->unpark = NULL; engine->flags |= I915_ENGINE_SUPPORTS_STATS; - if (!intel_vgpu_active(engine->i915)) { - engine->flags |= I915_ENGINE_HAS_SEMAPHORES; - if (HAS_LOGICAL_RING_PREEMPTION(engine->i915)) - engine->flags |= I915_ENGINE_HAS_PREEMPTION; + engine->flags |= I915_ENGINE_HAS_SEMAPHORES; + if (HAS_LOGICAL_RING_PREEMPTION(engine->i915)) + engine->flags |= I915_ENGINE_HAS_PREEMPTION; + + if (intel_vgpu_active(engine->i915)) { + engine->flags &= ~I915_ENGINE_HAS_SEMAPHORES; + engine->flags &= ~I915_ENGINE_HAS_PREEMPTION; + intel_vgpu_config_pv_caps(engine->i915, PV_SUBMISSION, engine); } } diff --git a/drivers/gpu/drm/i915/i915_vgpu.c b/drivers/gpu/drm/i915/i915_vgpu.c index 2e3a025..33b41b8 100644 --- a/drivers/gpu/drm/i915/i915_vgpu.c +++ b/drivers/gpu/drm/i915/i915_vgpu.c @@ -97,7 +97,7 @@ void i915_detect_vgpu(struct drm_i915_private *dev_priv) dev_priv->vgpu.active = true; /* guest driver PV capability */ - dev_priv->vgpu.pv_caps = PV_PPGTT_UPDATE; + dev_priv->vgpu.pv_caps = PV_PPGTT_UPDATE | PV_SUBMISSION; if (!intel_vgpu_check_pv_caps(dev_priv, shared_area)) { DRM_INFO("Virtual GPU for Intel GVT-g detected.\n"); @@ -385,6 +385,7 @@ void intel_vgpu_config_pv_caps(struct drm_i915_private *dev_priv, enum pv_caps cap, void *data) { struct i915_ppgtt *ppgtt; + struct intel_engine_cs *engine; if (!intel_vgpu_enabled_pv_caps(dev_priv, cap)) return; @@ -395,6 +396,11 @@ void intel_vgpu_config_pv_caps(struct drm_i915_private *dev_priv, ppgtt->vm.insert_entries = gen8_ppgtt_insert_4lvl_pv; ppgtt->vm.clear_range = gen8_ppgtt_clear_4lvl_pv; } + + if (cap == PV_SUBMISSION) { + engine = (struct intel_engine_cs *)data; + vgpu_set_pv_submission(engine); + } } /** @@ -590,6 +596,8 @@ static int intel_vgpu_setup_shared_page(struct drm_i915_private *dev_priv, u64 gpa; u16 ver_maj, ver_min; int ret = 0; + int i; + u32 size; /* We allocate 1 page shared between guest and GVT for data exchange. * ___________..................... @@ -662,6 +670,14 @@ static int intel_vgpu_setup_shared_page(struct drm_i915_private *dev_priv, pv->notify = intel_vgpu_pv_notify_mmio; mutex_init(&pv->send_mutex); + /* setup PV per engine data exchange structure */ + size = sizeof(struct pv_submission); + for (i = 0; i < PV_MAX_ENGINES_NUM; i++) { + pv->pv_elsp[i] = (void *)base + PV_ELSP_OFF + size * i; + pv->pv_elsp[i]->submitted = false; + spin_lock_init(&pv->pv_elsp[i]->lock); + } + return ret; err: __free_page(virt_to_page(base)); diff --git a/drivers/gpu/drm/i915/i915_vgpu.h b/drivers/gpu/drm/i915/i915_vgpu.h index b0fee5b..9994df90 100644 --- a/drivers/gpu/drm/i915/i915_vgpu.h +++ b/drivers/gpu/drm/i915/i915_vgpu.h @@ -29,6 +29,8 @@ #define PV_MAJOR 1 #define PV_MINOR 0 +#define PV_MAX_ENGINES_NUM (VECS1_HW + 1) +#define PV_ELSP_OFF (PAGE_SIZE/8) #define PV_DESC_OFF (PAGE_SIZE/4) #define PV_CMD_OFF (PAGE_SIZE/2) @@ -37,6 +39,7 @@ */ enum pv_caps { PV_PPGTT_UPDATE = 0x1, + PV_SUBMISSION = 0x2, }; /* PV actions */ @@ -45,6 +48,7 @@ enum intel_vgpu_pv_action { PV_ACTION_PPGTT_L4_ALLOC, PV_ACTION_PPGTT_L4_CLEAR, PV_ACTION_PPGTT_L4_INSERT, + PV_ACTION_ELSP_SUBMISSION, }; /* @@ -56,6 +60,13 @@ struct gvt_shared_page { u16 ver_minor; }; +/* workload submission pv support data structure */ +struct pv_submission { + u64 descs[EXECLIST_MAX_PORTS]; + bool submitted; + spinlock_t lock; +}; + /* * Definition of the command transport message header (DW0) * @@ -100,6 +111,9 @@ struct i915_virtual_gpu_pv { struct gvt_shared_page *shared_page; bool enabled; + /* per engine PV workload submission data */ + struct pv_submission *pv_elsp[PV_MAX_ENGINES_NUM]; + /* PV command buffer support */ struct vgpu_pv_ct_buffer ctb; u32 next_fence; @@ -164,4 +178,6 @@ bool intel_vgpu_check_pv_caps(struct drm_i915_private *dev_priv, void __iomem *shared_area); void intel_vgpu_config_pv_caps(struct drm_i915_private *dev_priv, enum pv_caps cap, void *data); +void vgpu_set_pv_submission(struct intel_engine_cs *engine); + #endif /* _I915_VGPU_H_ */ diff --git a/drivers/gpu/drm/i915/intel_pv_submission.c b/drivers/gpu/drm/i915/intel_pv_submission.c new file mode 100644 index 0000000..a53285b --- /dev/null +++ b/drivers/gpu/drm/i915/intel_pv_submission.c @@ -0,0 +1,187 @@ +// SPDX-License-Identifier: MIT +/* + * Copyright © 2018 Intel Corporation + */ + +#include "intel_drv.h" +#include "i915_vgpu.h" +#include "gt/intel_lrc_reg.h" +#include "gt/intel_engine_pm.h" + +static u64 execlists_update_context(struct i915_request *rq) +{ + struct intel_context *ce = rq->hw_context; + u32 *reg_state = ce->lrc_reg_state; + + reg_state[CTX_RING_TAIL+1] = intel_ring_set_tail(rq->ring, rq->tail); + + return ce->lrc_desc; +} + +static inline struct i915_priolist *to_priolist(struct rb_node *rb) +{ + return rb_entry(rb, struct i915_priolist, node); +} + +static void pv_submit(struct intel_engine_cs *engine, + struct i915_request **out, + struct i915_request **end) +{ + struct intel_engine_execlists * const execlists = &engine->execlists; + struct i915_virtual_gpu_pv *pv = engine->i915->vgpu.pv; + struct pv_submission *pv_elsp = pv->pv_elsp[engine->hw_id]; + struct i915_request *rq; + int n, err; + + memset(pv_elsp->descs, 0, sizeof(pv_elsp->descs)); + n = 0; + + do { + rq = *out++; + pv_elsp->descs[n++] = execlists_update_context(rq); + } while (out != end); + + spin_lock(&pv_elsp->lock); + pv_elsp->submitted = true; + writel(PV_ACTION_ELSP_SUBMISSION, execlists->submit_reg); + +#define done (READ_ONCE(pv_elsp->submitted) == false) + err = wait_for_atomic_us(done, 1000); +#undef done + spin_unlock(&pv_elsp->lock); + + if (unlikely(err)) + DRM_ERROR("PV (%s) workload submission failed\n", engine->name); + +} + +static struct i915_request *schedule_in(struct i915_request *rq, int idx) +{ + trace_i915_request_in(rq, idx); + + if (!rq->hw_context->inflight) + rq->hw_context->inflight = rq->engine; + intel_context_inflight_inc(rq->hw_context); + + return i915_request_get(rq); +} + +static void pv_dequeue(struct intel_engine_cs *engine) +{ + struct intel_engine_execlists * const execlists = &engine->execlists; + struct i915_request **first = execlists->inflight; + struct i915_request *last = first[0]; + struct i915_request **port; + bool submit = false; + struct rb_node *rb; + + lockdep_assert_held(&engine->active.lock); + + if (last) + return; + + port = first; + while ((rb = rb_first_cached(&execlists->queue))) { + struct i915_priolist *p = to_priolist(rb); + struct i915_request *rq, *rn; + int i; + + priolist_for_each_request_consume(rq, rn, p, i) { + if (last && rq->hw_context != last->hw_context) + goto done; + + list_del_init(&rq->sched.link); + __i915_request_submit(rq); + submit = true; + last = rq; + } + + rb_erase_cached(&p->node, &execlists->queue); + i915_priolist_free(p); + } +done: + execlists->queue_priority_hint = + rb ? to_priolist(rb)->priority : INT_MIN; + if (submit) { + *port = schedule_in(last, port - execlists->inflight); + *++port = NULL; + pv_submit(engine, first, port); + } + execlists->active = execlists->inflight; +} + +static void schedule_out(struct i915_request *rq) +{ + trace_i915_request_out(rq); + + intel_context_inflight_dec(rq->hw_context); + if (!intel_context_inflight_count(rq->hw_context)) + rq->hw_context->inflight = NULL; + + i915_request_put(rq); +} + + +static void vgpu_pv_submission_tasklet(unsigned long data) +{ + struct intel_engine_cs * const engine = (struct intel_engine_cs *)data; + struct intel_engine_execlists * const execlists = &engine->execlists; + struct i915_request **port, *rq; + unsigned long flags; + struct i915_virtual_gpu_pv *pv = engine->i915->vgpu.pv; + struct pv_submission *pv_elsp = pv->pv_elsp[engine->hw_id]; + + spin_lock_irqsave(&engine->active.lock, flags); + + for (port = execlists->inflight; (rq = *port); port++) { + if (!i915_request_completed(rq)) + break; + + schedule_out(rq); + } + + if (port != execlists->inflight) { + int idx = port - execlists->inflight; + int rem = ARRAY_SIZE(execlists->inflight) - idx; + + memmove(execlists->inflight, port, rem * sizeof(*port)); + } + + if (!pv_elsp->submitted) + pv_dequeue(engine); + + spin_unlock_irqrestore(&engine->active.lock, flags); +} + +static void vgpu_pv_submission_park(struct intel_engine_cs *engine) +{ + intel_engine_park(engine); + intel_engine_unpin_breadcrumbs_irq(engine); + engine->flags &= ~I915_ENGINE_NEEDS_BREADCRUMB_TASKLET; +} + +static void vgpu_pv_submission_unpark(struct intel_engine_cs *engine) +{ + engine->flags |= I915_ENGINE_NEEDS_BREADCRUMB_TASKLET; + intel_engine_pin_breadcrumbs_irq(engine); +} + +void vgpu_set_pv_submission(struct intel_engine_cs *engine) +{ + /* + * We inherit a bunch of functions from execlists that we'd like + * to keep using: + * + * engine->submit_request = execlists_submit_request; + * engine->cancel_requests = execlists_cancel_requests; + * engine->schedule = execlists_schedule; + * + * But we need to override the actual submission backend in order + * to talk to the GVT with PV notification message. + */ + + engine->execlists.tasklet.func = vgpu_pv_submission_tasklet; + + engine->park = vgpu_pv_submission_park; + engine->unpark = vgpu_pv_submission_unpark; +}

[v9,5/9] drm/i915: vgpu context submission pv optimization

Commit Message

Patch