[23/39] drm/i915/tgl: Register state context definition for Gen12

Message ID	20190816080503.28594-24-lucas.demarchi@intel.com (mailing list archive)
State	New, archived
Headers	show Return-Path: <intel-gfx-bounces@lists.freedesktop.org> From: Lucas De Marchi <lucas.demarchi@intel.com> To: intel-gfx@lists.freedesktop.org Date: Fri, 16 Aug 2019 01:04:47 -0700 Message-Id: <20190816080503.28594-24-lucas.demarchi@intel.com> In-Reply-To: <20190816080503.28594-1-lucas.demarchi@intel.com> References: <20190816080503.28594-1-lucas.demarchi@intel.com> MIME-Version: 1.0 Subject: [Intel-gfx] [PATCH 23/39] drm/i915/tgl: Register state context definition for Gen12 Precedence: list Cc: Michel Thierry <michel.thierry@intel.com> Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: base64 Errors-To: intel-gfx-bounces@lists.freedesktop.org Sender: "Intel-gfx" <intel-gfx-bounces@lists.freedesktop.org>
Series	Tiger Lake batch 3 \| expand [00/39] Tiger Lake batch 3 [01/39] drm/i915/tgl: do not use DDIC [02/39] drm/i915/psr: Make PSR registers relative to transcoders [03/39] drm/i915: Add transcoder restriction to PSR2 [04/39] drm/i915: Do not unmask PSR interruption in IRQ postinstall [05/39] drm/i915/psr: Only handle interruptions of the transcoder in use [06/39] drm/i915/bdw+: Enable PSR in any eDP port [07/39] drm/i915: Guard and warn if more than one eDP panel is present [08/39] drm/i915/tgl: Change PSR2 transcoder restriction [09/39] drm/i915: Do not read PSR2 register in transcoders without PSR2 [10/39] drm/i915/tgl: PSR link standby is not supported anymore [11/39] drm/i915/tgl: Access the right register when handling PSR interruptions [12/39] drm/i915/tgl: Add maximum resolution supported by PSR2 HW [13/39] drm/i915/mst: Do not hardcoded the crtcs that encoder can connect [14/39] drm/i915: Add for_each_new_intel_connector_in_state() [15/39] drm: Add for_each_oldnew_intel_crtc_in_state_reverse() [16/39] drm/i915: Disable pipes in reverse order [17/39] drm/i915/tgl: Select master transcoder in DP MST [18/39] drm/i915/tgl: Introduce initial Tiger Lake workarounds [19/39] drm/i915/tgl: Implement Wa_1406941453 [20/39] drm/i915/tgl: Enable VD HCP/MFX sub-pipe power gating [21/39] drm/i915/tgl: Do not apply WaIncreaseDefaultTLBEntries from GEN12 onwards [22/39] drm/i915/tgl: implement WaProgramMgsrForCorrectSliceSpecificMmioReads [23/39] drm/i915/tgl: Register state context definition for Gen12 [24/39] drm/i915/tgl: move DP_TP_* to transcoder [25/39] drm/i915/tgl: Implement TGL DisplayPort training sequence [26/39] HACK: drm/i915/tgl: Gen12 render context size [27/39] drm/i915/tgl: add Gen12 default indirect ctx offset [28/39] drm/i915/tgl: add GEN12_MAX_CONTEXT_HW_ID [29/39] drm/i915/tgl: Report valid VDBoxes with SFC capability [30/39] drm/i915/tgl: Move GTCR register to cope with GAM MMIO address remap [31/39] drm/i915/tgl: Updated Private PAT programming [32/39] drm/i915/tgl/perf: use the same oa ctx_id format as icl [33/39] drm/i915/perf: add a parameter to control the size of OA buffer [34/39] drm/i915/tgl: Add perf support on TGL [35/39] drm/i915/tgl: Gen-12 display loses Yf tiling and legacy CCS support [36/39] drm/framebuffer/tgl: Format modifier for Intel Gen-12 render compression [37/39] drm/i915/tgl: Gen-12 render decompression [38/39] drm/framebuffer/tgl: Format modifier for Intel Gen-12 media compression [39/39] drm/i915/tgl: Gen-12 media compression

diff --git a/drivers/gpu/drm/i915/gt/intel_lrc.c b/drivers/gpu/drm/i915/gt/intel_lrc.c index fafae7c7af0d..35a5ad575e12 100644 --- a/drivers/gpu/drm/i915/gt/intel_lrc.c +++ b/drivers/gpu/drm/i915/gt/intel_lrc.c @@ -2999,28 +2999,12 @@ static u32 intel_lr_indirect_ctx_offset(struct intel_engine_cs *engine) return indirect_ctx_offset; } -static void execlists_init_reg_state(u32 *regs, - struct intel_context *ce, - struct intel_engine_cs *engine, - struct intel_ring *ring) +static void init_common_reg_state(u32 *regs, + struct intel_engine_cs *engine, + struct intel_ring *ring) { - struct i915_ppgtt *ppgtt = i915_vm_to_ppgtt(ce->vm); - bool rcs = engine->class == RENDER_CLASS; u32 base = engine->mmio_base; - /* - * A context is actually a big batch buffer with several - * MI_LOAD_REGISTER_IMM commands followed by (reg, value) pairs. The - * values we are setting here are only for the first context restore: - * on a subsequent save, the GPU will recreate this batchbuffer with new - * values (including all the missing MI_LOAD_REGISTER_IMM commands that - * we are not initializing here). - * - * Must keep consistent with virtual_update_register_offsets(). - */ - regs[CTX_LRI_HEADER_0] = MI_LOAD_REGISTER_IMM(rcs ? 14 : 11) | - MI_LRI_FORCE_POSTED; - CTX_REG(regs, CTX_CONTEXT_CONTROL, RING_CONTEXT_CONTROL(base), _MASKED_BIT_DISABLE(CTX_CTRL_ENGINE_CTX_RESTORE_INHIBIT) | _MASKED_BIT_ENABLE(CTX_CTRL_INHIBIT_SYN_CTX_SWITCH)); @@ -3037,38 +3021,44 @@ static void execlists_init_reg_state(u32 *regs, CTX_REG(regs, CTX_BB_HEAD_U, RING_BBADDR_UDW(base), 0); CTX_REG(regs, CTX_BB_HEAD_L, RING_BBADDR(base), 0); CTX_REG(regs, CTX_BB_STATE, RING_BBSTATE(base), RING_BB_PPGTT); - CTX_REG(regs, CTX_SECOND_BB_HEAD_U, RING_SBBADDR_UDW(base), 0); - CTX_REG(regs, CTX_SECOND_BB_HEAD_L, RING_SBBADDR(base), 0); - CTX_REG(regs, CTX_SECOND_BB_STATE, RING_SBBSTATE(base), 0); - if (rcs) { - struct i915_ctx_workarounds *wa_ctx = &engine->wa_ctx; - - CTX_REG(regs, CTX_RCS_INDIRECT_CTX, RING_INDIRECT_CTX(base), 0); - CTX_REG(regs, CTX_RCS_INDIRECT_CTX_OFFSET, - RING_INDIRECT_CTX_OFFSET(base), 0); - if (wa_ctx->indirect_ctx.size) { - u32 ggtt_offset = i915_ggtt_offset(wa_ctx->vma); +} - regs[CTX_RCS_INDIRECT_CTX + 1] = - (ggtt_offset + wa_ctx->indirect_ctx.offset) | - (wa_ctx->indirect_ctx.size / CACHELINE_BYTES); +static void init_wa_bb_reg_state(u32 *regs, + struct intel_engine_cs *engine, + u32 pos_bb_per_ctx) +{ + struct i915_ctx_workarounds *wa_ctx = &engine->wa_ctx; + u32 base = engine->mmio_base; + u32 pos_indirect_ctx = pos_bb_per_ctx + 2; + u32 pos_indirect_ctx_offset = pos_indirect_ctx + 2; - regs[CTX_RCS_INDIRECT_CTX_OFFSET + 1] = - intel_lr_indirect_ctx_offset(engine) << 6; - } + GEM_BUG_ON(engine->id != RCS0); + CTX_REG(regs, pos_indirect_ctx, RING_INDIRECT_CTX(base), 0); + CTX_REG(regs, pos_indirect_ctx_offset, + RING_INDIRECT_CTX_OFFSET(base), 0); + if (wa_ctx->indirect_ctx.size) { + u32 ggtt_offset = i915_ggtt_offset(wa_ctx->vma); - CTX_REG(regs, CTX_BB_PER_CTX_PTR, RING_BB_PER_CTX_PTR(base), 0); - if (wa_ctx->per_ctx.size) { - u32 ggtt_offset = i915_ggtt_offset(wa_ctx->vma); + regs[pos_indirect_ctx + 1] = + (ggtt_offset + wa_ctx->indirect_ctx.offset) | + (wa_ctx->indirect_ctx.size / CACHELINE_BYTES); - regs[CTX_BB_PER_CTX_PTR + 1] = - (ggtt_offset + wa_ctx->per_ctx.offset) | 0x01; - } + regs[pos_indirect_ctx_offset + 1] = + intel_lr_indirect_ctx_offset(engine) << 6; } - regs[CTX_LRI_HEADER_1] = MI_LOAD_REGISTER_IMM(9) | MI_LRI_FORCE_POSTED; + CTX_REG(regs, pos_bb_per_ctx, RING_BB_PER_CTX_PTR(base), 0); + if (wa_ctx->per_ctx.size) { + u32 ggtt_offset = i915_ggtt_offset(wa_ctx->vma); - CTX_REG(regs, CTX_CTX_TIMESTAMP, RING_CTX_TIMESTAMP(base), 0); + regs[pos_bb_per_ctx + 1] = + (ggtt_offset + wa_ctx->per_ctx.offset) | 0x01; + } +} + +static void init_ppgtt_reg_state(u32 *regs, u32 base, + struct i915_ppgtt *ppgtt) +{ /* PDP values well be assigned later if needed */ CTX_REG(regs, CTX_PDP3_UDW, GEN8_RING_PDP_UDW(base, 3), 0); CTX_REG(regs, CTX_PDP3_LDW, GEN8_RING_PDP_LDW(base, 3), 0); @@ -3091,6 +3081,32 @@ static void execlists_init_reg_state(u32 *regs, ASSIGN_CTX_PDP(ppgtt, regs, 1); ASSIGN_CTX_PDP(ppgtt, regs, 0); } +} + +static void gen8_init_reg_state(u32 *regs, + struct intel_context *ce, + struct intel_engine_cs *engine, + struct intel_ring *ring) +{ + struct i915_ppgtt *ppgtt = i915_vm_to_ppgtt(ce->vm); + bool rcs = engine->class == RENDER_CLASS; + u32 base = engine->mmio_base; + + regs[CTX_LRI_HEADER_0] = MI_LOAD_REGISTER_IMM(rcs ? 14 : 11) | + MI_LRI_FORCE_POSTED; + + init_common_reg_state(regs, engine, ring); + CTX_REG(regs, CTX_SECOND_BB_HEAD_U, RING_SBBADDR_UDW(base), 0); + CTX_REG(regs, CTX_SECOND_BB_HEAD_L, RING_SBBADDR(base), 0); + CTX_REG(regs, CTX_SECOND_BB_STATE, RING_SBBSTATE(base), 0); + if (rcs) + init_wa_bb_reg_state(regs, engine, CTX_BB_PER_CTX_PTR); + + regs[CTX_LRI_HEADER_1] = MI_LOAD_REGISTER_IMM(9) | MI_LRI_FORCE_POSTED; + + CTX_REG(regs, CTX_CTX_TIMESTAMP, RING_CTX_TIMESTAMP(base), 0); + + init_ppgtt_reg_state(regs, base, ppgtt); if (rcs) { regs[CTX_LRI_HEADER_2] = MI_LOAD_REGISTER_IMM(1); @@ -3102,6 +3118,58 @@ static void execlists_init_reg_state(u32 *regs, regs[CTX_END] |= BIT(0); } +static void gen12_init_reg_state(u32 *regs, + struct intel_context *ce, + struct intel_engine_cs *engine, + struct intel_ring *ring) +{ + struct i915_ppgtt *ppgtt = i915_vm_to_ppgtt(ce->vm); + bool rcs = engine->class == RENDER_CLASS; + u32 base = engine->mmio_base; + + GEM_DEBUG_EXEC(DRM_INFO_ONCE("Using GEN12 Register State Context\n")); + + regs[GEN12_CTX_LRI_HEADER_0] = MI_LOAD_REGISTER_IMM(13) | + MI_LRI_FORCE_POSTED; + + init_common_reg_state(regs, engine, ring); + if (rcs) + init_wa_bb_reg_state(regs, engine, GEN12_CTX_BB_PER_CTX_PTR); + + regs[GEN12_CTX_LRI_HEADER_1] = MI_LOAD_REGISTER_IMM(9) | + MI_LRI_FORCE_POSTED; + + CTX_REG(regs, GEN12_CTX_CTX_TIMESTAMP, RING_CTX_TIMESTAMP(base), 0); + + init_ppgtt_reg_state(regs, base, ppgtt); + + if (rcs) { + regs[GEN12_CTX_LRI_HEADER_3] = MI_LOAD_REGISTER_IMM(1); + CTX_REG(regs, GEN12_CTX_R_PWR_CLK_STATE, GEN8_R_PWR_CLK_STATE, + 0); + + /* TODO: oa_init_reg_state ? */ + } +} + +static void execlists_init_reg_state(u32 *regs, + struct intel_context *ce, + struct intel_engine_cs *engine, + struct intel_ring *ring) +{ + /* A context is actually a big batch buffer with several + * MI_LOAD_REGISTER_IMM commands followed by (reg, value) pairs. The + * values we are setting here are only for the first context restore: + * on a subsequent save, the GPU will recreate this batchbuffer with new + * values (including all the missing MI_LOAD_REGISTER_IMM commands that + * we are not initializing here). + */ + if (INTEL_GEN(engine->i915) >= 12) + gen12_init_reg_state(regs, ce, engine, ring); + else + gen8_init_reg_state(regs, ce, engine, ring); +} + static int populate_lr_context(struct intel_context *ce, struct drm_i915_gem_object *ctx_obj, diff --git a/drivers/gpu/drm/i915/gt/intel_lrc.h b/drivers/gpu/drm/i915/gt/intel_lrc.h index c2bba82bcc16..69285d354d9b 100644 --- a/drivers/gpu/drm/i915/gt/intel_lrc.h +++ b/drivers/gpu/drm/i915/gt/intel_lrc.h @@ -49,6 +49,8 @@ struct intel_engine_cs; #define EL_CTRL_LOAD (1 << 0) +#define GEN12_ENGINE_SEMAPHORE_TOKEN(engine) _MMIO((engine)->mmio_base + 0x2b4) + /* The docs specify that the write pointer wraps around after 5h, "After status * is written out to the last available status QW at offset 5h, this pointer * wraps to 0." diff --git a/drivers/gpu/drm/i915/gt/intel_lrc_reg.h b/drivers/gpu/drm/i915/gt/intel_lrc_reg.h index 6bf34738b4e5..915824ebaf17 100644 --- a/drivers/gpu/drm/i915/gt/intel_lrc_reg.h +++ b/drivers/gpu/drm/i915/gt/intel_lrc_reg.h @@ -9,7 +9,7 @@ #include <linux/types.h> -/* GEN8+ Reg State Context */ +/* GEN8 to GEN11 Reg State Context */ #define CTX_LRI_HEADER_0 0x01 #define CTX_CONTEXT_CONTROL 0x02 #define CTX_RING_HEAD 0x04 @@ -39,6 +39,34 @@ #define CTX_R_PWR_CLK_STATE 0x42 #define CTX_END 0x44 +/* GEN12+ Reg State Context */ +#define GEN12_CTX_LRI_HEADER_0 CTX_LRI_HEADER_0 +#define GEN12_CTX_CONTEXT_CONTROL CTX_CONTEXT_CONTROL +#define GEN12_CTX_RING_HEAD CTX_RING_HEAD +#define GEN12_CTX_RING_TAIL CTX_RING_TAIL +#define GEN12_CTX_RING_BUFFER_START CTX_RING_BUFFER_START +#define GEN12_CTX_RING_BUFFER_CONTROL CTX_RING_BUFFER_CONTROL +#define GEN12_CTX_BB_HEAD_U CTX_BB_HEAD_U +#define GEN12_CTX_BB_HEAD_L CTX_BB_HEAD_L +#define GEN12_CTX_BB_STATE CTX_BB_STATE +#define GEN12_CTX_BB_PER_CTX_PTR 0x12 +#define GEN12_CTX_RCS_INDIRECT_CTX 0x14 +#define GEN12_CTX_RCS_INDIRECT_CTX_OFFSET 0x16 +#define GEN12_CTX_LRI_HEADER_1 CTX_LRI_HEADER_1 +#define GEN12_CTX_CTX_TIMESTAMP CTX_CTX_TIMESTAMP +#define GEN12_CTX_PDP3_UDW CTX_PDP3_UDW +#define GEN12_CTX_PDP3_LDW CTX_PDP3_LDW +#define GEN12_CTX_PDP2_UDW CTX_PDP2_UDW +#define GEN12_CTX_PDP2_LDW CTX_PDP2_LDW +#define GEN12_CTX_PDP1_UDW CTX_PDP1_UDW +#define GEN12_CTX_PDP1_LDW CTX_PDP1_LDW +#define GEN12_CTX_PDP0_UDW CTX_PDP0_UDW +#define GEN12_CTX_PDP0_LDW CTX_PDP0_LDW +#define GEN12_CTX_LRI_HEADER_2 0x34 +#define GEN12_CTX_LRI_HEADER_3 0x41 +#define GEN12_CTX_R_PWR_CLK_STATE 0x42 +#define GEN12_CTX_GPGPU_CSR_BASE_ADDRESS 0x44 + #define CTX_REG(reg_state, pos, reg, val) do { \ u32 *reg_state__ = (reg_state); \ const u32 pos__ = (pos); \

[23/39] drm/i915/tgl: Register state context definition for Gen12

Commit Message

Patch