[v11,09/10] drm/i915/perf: execute OA configuration from command stream

Message ID	20190828143327.7965-10-lionel.g.landwerlin@intel.com (mailing list archive)
State	New, archived
Headers	show Return-Path: <SRS0=SPuI=WY=lists.freedesktop.org=intel-gfx-bounces@kernel.org> DMARC-Filter: OpenDMARC Filter v1.3.2 mail.kernel.org 2C8D02080F From: Lionel Landwerlin <lionel.g.landwerlin@intel.com> To: intel-gfx@lists.freedesktop.org Date: Wed, 28 Aug 2019 17:33:26 +0300 Message-Id: <20190828143327.7965-10-lionel.g.landwerlin@intel.com> In-Reply-To: <20190828143327.7965-1-lionel.g.landwerlin@intel.com> References: <20190828143327.7965-1-lionel.g.landwerlin@intel.com> MIME-Version: 1.0 Subject: [Intel-gfx] [PATCH v11 09/10] drm/i915/perf: execute OA configuration from command stream Precedence: list Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: base64 Errors-To: intel-gfx-bounces@lists.freedesktop.org Sender: "Intel-gfx" <intel-gfx-bounces@lists.freedesktop.org>
Series	drm/i915: Vulkan performance query support \| expand [v11,00/10] drm/i915: Vulkan performance query support [v11,01/10] drm/syncobj: add sideband payload [v11,02/10] drm/i915: introduce a mechanism to extend execbuf2 [v11,03/10] drm/i915: add syncobj timeline support [v11,04/10] drm/i915/perf: introduce a versioning of the i915-perf uapi [v11,05/10] drm/i915/perf: allow for CS OA configs to be created lazily [v11,06/10] drm/i915/perf: implement active wait for noa configurations [v11,07/10] drm/i915: add a new perf configuration execbuf parameter [v11,08/10] drm/i915/perf: allow holding preemption on filtered ctx [v11,09/10] drm/i915/perf: execute OA configuration from command stream [v11,10/10] drm/i915: add support for perf configuration queries

diff --git a/drivers/gpu/drm/i915/i915_drv.h b/drivers/gpu/drm/i915/i915_drv.h index ec609c022e5e..f94de001201d 100644 --- a/drivers/gpu/drm/i915/i915_drv.h +++ b/drivers/gpu/drm/i915/i915_drv.h @@ -1094,6 +1094,18 @@ struct i915_perf_stream { */ intel_wakeref_t wakeref; + /** + * @initial_config_rq: First request run at the opening of the i915 + * perf stream to configure the HW. Should be NULL after the perf + * stream has been opened successfully. + */ + struct i915_request *initial_config_rq; + + /** + * @initial_oa_config_bo: First OA configuration BO to be run. + */ + struct drm_i915_gem_object *initial_oa_config_bo; + /** * @sample_flags: Flags representing the `DRM_I915_PERF_PROP_SAMPLE_*` * properties given when opening a stream, representing the contents diff --git a/drivers/gpu/drm/i915/i915_perf.c b/drivers/gpu/drm/i915/i915_perf.c index 1eeabf0bbafc..29eba8c3c792 100644 --- a/drivers/gpu/drm/i915/i915_perf.c +++ b/drivers/gpu/drm/i915/i915_perf.c @@ -1783,6 +1783,10 @@ static int alloc_noa_wait(struct i915_perf_stream *stream) return PTR_ERR(bo); } + ret = i915_mutex_lock_interruptible(&i915->drm); + if (ret) + goto err_unref; + /* * We pin in GGTT because we jump into this buffer now because * multiple OA config BOs will have a jump to this address and it @@ -1790,10 +1794,13 @@ static int alloc_noa_wait(struct i915_perf_stream *stream) */ vma = i915_gem_object_ggtt_pin(bo, NULL, 0, 4096, 0); if (IS_ERR(vma)) { + mutex_unlock(&i915->drm.struct_mutex); ret = PTR_ERR(vma); goto err_unref; } + mutex_unlock(&i915->drm.struct_mutex); + batch = cs = i915_gem_object_pin_map(bo, I915_MAP_WB); if (IS_ERR(batch)) { ret = PTR_ERR(batch); @@ -1927,7 +1934,9 @@ static int alloc_noa_wait(struct i915_perf_stream *stream) return 0; err_unpin: - __i915_vma_unpin(vma); + mutex_lock(&i915->drm.struct_mutex); + i915_vma_unpin_and_release(&vma, 0); + mutex_unlock(&i915->drm.struct_mutex); err_unref: i915_gem_object_put(bo); @@ -1935,50 +1944,71 @@ static int alloc_noa_wait(struct i915_perf_stream *stream) return ret; } -static void config_oa_regs(struct drm_i915_private *dev_priv, - const struct i915_oa_reg *regs, - u32 n_regs) +static int emit_oa_config(struct drm_i915_private *i915, + struct i915_perf_stream *stream) { - u32 i; + struct i915_request *rq; + struct i915_vma *vma; + u32 *cs; + int err; - for (i = 0; i < n_regs; i++) { - const struct i915_oa_reg *reg = regs + i; + lockdep_assert_held(&i915->drm.struct_mutex); - I915_WRITE(reg->addr, reg->value); + rq = i915_request_create(i915->engine[RCS0]->kernel_context); + if (IS_ERR(rq)) + return PTR_ERR(rq); + + err = i915_active_request_set(&i915->engine[RCS0]->last_oa_config, + rq); + if (err) + goto err_add_request; + + vma = i915_vma_instance(stream->initial_oa_config_bo, + &i915->ggtt.vm, NULL); + if (unlikely(IS_ERR(vma))) { + err = PTR_ERR(vma); + goto err_add_request; } -} -static void delay_after_mux(void) -{ - /* - * It apparently takes a fairly long time for a new MUX - * configuration to be be applied after these register writes. - * This delay duration was derived empirically based on the - * render_basic config but hopefully it covers the maximum - * configuration latency. - * - * As a fallback, the checks in _append_oa_reports() to skip - * invalid OA reports do also seem to work to discard reports - * generated before this config has completed - albeit not - * silently. - * - * Unfortunately this is essentially a magic number, since we - * don't currently know of a reliable mechanism for predicting - * how long the MUX config will take to apply and besides - * seeing invalid reports we don't know of a reliable way to - * explicitly check that the MUX config has landed. - * - * It's even possible we've miss characterized the underlying - * problem - it just seems like the simplest explanation why - * a delay at this location would mitigate any invalid reports. - */ - usleep_range(15000, 20000); + err = i915_vma_pin(vma, 0, 0, PIN_GLOBAL); + if (err) + goto err_add_request; + + err = i915_vma_move_to_active(vma, rq, 0); + if (err) + goto err_vma_unpin; + + cs = intel_ring_begin(rq, INTEL_GEN(i915) >= 8 ? 4 : 2); + if (IS_ERR(cs)) { + err = PTR_ERR(cs); + goto err_vma_unpin; + } + + if (INTEL_GEN(i915) > 8) { + *cs++ = MI_BATCH_BUFFER_START_GEN8; + *cs++ = lower_32_bits(vma->node.start); + *cs++ = upper_32_bits(vma->node.start); + *cs++ = MI_NOOP; + } else { + *cs++ = MI_BATCH_BUFFER_START; + *cs++ = vma->node.start; + } + + intel_ring_advance(rq, cs); + + stream->initial_config_rq = i915_request_get(rq); + +err_vma_unpin: + i915_vma_unpin(vma); +err_add_request: + i915_request_add(rq); + + return err; } static int hsw_enable_metric_set(struct i915_perf_stream *stream) { struct drm_i915_private *dev_priv = stream->dev_priv; - const struct i915_oa_config *oa_config = stream->oa_config; /* * PRM: @@ -1995,13 +2025,7 @@ static int hsw_enable_metric_set(struct i915_perf_stream *stream) I915_WRITE(GEN6_UCGCTL1, (I915_READ(GEN6_UCGCTL1) | GEN6_CSUNIT_CLOCK_GATE_DISABLE)); - config_oa_regs(dev_priv, oa_config->mux_regs, oa_config->mux_regs_len); - delay_after_mux(); - - config_oa_regs(dev_priv, oa_config->b_counter_regs, - oa_config->b_counter_regs_len); - - return 0; + return emit_oa_config(dev_priv, stream); } static void hsw_disable_metric_set(struct i915_perf_stream *stream) @@ -2360,13 +2384,7 @@ static int gen8_enable_metric_set(struct i915_perf_stream *stream) if (ret) return ret; - config_oa_regs(dev_priv, oa_config->mux_regs, oa_config->mux_regs_len); - delay_after_mux(); - - config_oa_regs(dev_priv, oa_config->b_counter_regs, - oa_config->b_counter_regs_len); - - return 0; + return emit_oa_config(dev_priv, stream); } static void gen8_disable_metric_set(struct i915_perf_stream *stream) @@ -2542,6 +2560,7 @@ static int i915_oa_stream_init(struct i915_perf_stream *stream, { struct drm_i915_private *dev_priv = stream->dev_priv; int format_size; + long timeout; int ret; /* If the sysfs metrics/ directory wasn't registered for some @@ -2611,8 +2630,9 @@ static int i915_oa_stream_init(struct i915_perf_stream *stream, goto err_noa_wait_alloc; } - ret = i915_perf_get_oa_config(dev_priv, props->metrics_set, - &stream->oa_config); + ret = i915_perf_get_oa_config_and_bo(stream, props->metrics_set, + &stream->oa_config, + &stream->initial_oa_config_bo); if (ret) { DRM_DEBUG("Invalid OA config id=%i\n", props->metrics_set); goto err_config; @@ -2637,22 +2657,34 @@ static int i915_oa_stream_init(struct i915_perf_stream *stream, if (ret) goto err_oa_buf_alloc; + stream->ops = &i915_oa_stream_ops; + ret = i915_mutex_lock_interruptible(&dev_priv->drm); if (ret) goto err_lock; - stream->ops = &i915_oa_stream_ops; dev_priv->perf.exclusive_stream = stream; ret = dev_priv->perf.ops.enable_metric_set(stream); + mutex_unlock(&dev_priv->drm.struct_mutex); if (ret) { DRM_DEBUG("Unable to enable metric set\n"); goto err_enable; } - DRM_DEBUG("opening stream oa config uuid=%s\n", stream->oa_config->uuid); + timeout = i915_request_wait(stream->initial_config_rq, + I915_WAIT_INTERRUPTIBLE, + MAX_SCHEDULE_TIMEOUT); + i915_request_put(stream->initial_config_rq); + i915_gem_object_put(stream->initial_oa_config_bo); + stream->initial_config_rq = NULL; + stream->initial_oa_config_bo = NULL; - mutex_unlock(&dev_priv->drm.struct_mutex); + ret = timeout < 0 ? timeout : 0; + if (ret) + goto err_enable; + + DRM_DEBUG("opening stream oa config uuid=%s\n", stream->oa_config->uuid); hrtimer_init(&stream->poll_check_timer, CLOCK_MONOTONIC, HRTIMER_MODE_REL); @@ -2663,6 +2695,7 @@ static int i915_oa_stream_init(struct i915_perf_stream *stream, return 0; err_enable: + mutex_lock(&dev_priv->drm.struct_mutex); dev_priv->perf.exclusive_stream = NULL; dev_priv->perf.ops.disable_metric_set(stream); mutex_unlock(&dev_priv->drm.struct_mutex); @@ -2674,6 +2707,11 @@ static int i915_oa_stream_init(struct i915_perf_stream *stream, intel_uncore_forcewake_put(&dev_priv->uncore, FORCEWAKE_ALL); intel_runtime_pm_put(&dev_priv->runtime_pm, stream->wakeref); + free_oa_configs(stream); + + i915_gem_object_put(stream->initial_oa_config_bo); + i915_request_put(stream->initial_config_rq); + err_config: free_noa_wait(stream);

[v11,09/10] drm/i915/perf: execute OA configuration from command stream

Commit Message

Comments

Patch