[v5,15/27] drm/scheduler: Fix hang when sched_entity released

DMARC-Filter: OpenDMARC Filter v1.3.2 mail.kernel.org C494E613F1
From: Andrey Grodzovsky <andrey.grodzovsky@amd.com>
To: dri-devel@lists.freedesktop.org, amd-gfx@lists.freedesktop.org,
 linux-pci@vger.kernel.org, ckoenig.leichtzumerken@gmail.com,
 daniel.vetter@ffwll.ch, Harry.Wentland@amd.com
Subject: [PATCH v5 15/27] drm/scheduler: Fix hang when sched_entity released
Date: Wed, 28 Apr 2021 11:11:55 -0400
Message-Id: <20210428151207.1212258-16-andrey.grodzovsky@amd.com>
In-Reply-To: <20210428151207.1212258-1-andrey.grodzovsky@amd.com>
References: <20210428151207.1212258-1-andrey.grodzovsky@amd.com>
MIME-Version: 1.0
X-MS-Exchange-MessageSentRepresentingType: 1
Received: from agrodzovsky-All-Series.hitronhub.home
 (2607:fea8:3edf:49b0:7212:f93a:73b0:8f23) by
 YT1PR01CA0142.CANPRD01.PROD.OUTLOOK.COM (2603:10b6:b01:2f::21) with Microsoft
 SMTP Server (version=TLS1_2, cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id
 15.20.4065.25 via Frontend Transport; Wed, 28 Apr 2021 15:12:58 +0000
X-MS-PublicTrafficType: Email
X-MS-Office365-Filtering-Correlation-Id: ce484d86-8da4-4163-f65e-08d90a581c30
X-MS-TrafficTypeDiagnostic: SN6PR12MB2749:
X-MS-Exchange-Transport-Forked: True
X-Microsoft-Antispam-PRVS: 
 <SN6PR12MB274954E60AD29DD29BD9F6F4EA409@SN6PR12MB2749.namprd12.prod.outlook.com>
X-MS-Oob-TLC-OOBClassifiers: OLM:663;
X-MS-Exchange-SenderADCheck: 1
X-Microsoft-Antispam: BCL:0;
X-Microsoft-Antispam-Message-Info: 
 Lulc5oekbOtXj1MaqcGN1BTIc6Cp4R8OS7NZVrhvetkmTF2eGi3vjmJg68sjSit8fOIH3NvALxllkZNEjI2sLLwiqlNoGLfGpzKweMHlFQp5JTVn6udkfb2YkSejPNbl3KQnTMKOgHf1MSJdXLncV+lke3L9o4g7ATTmg7b5RsLU92e5uzTi6Qu41qWWF8Q1/t12+OMeySx8+gCKFK+prSnSeE82w643Dt74J8m73mTt7AD+bFntua6xXB1ljDTR0SytT07eLBzOJ5dhg39K7dKRLOG983KMX5E0iqcbfxzDxY7QqIQK/mlO3lBAvWNHTAldG7FxyOK6KbF4DgTrWKqS/MmoSyY8knNnujNPzdQ8bRfo/8mMAB1XvZqi+tUzuvqXxJglKqQv207MrzcDhxazB32AbJZnhAiPJz1YnOF0DpCX9GVFREjkiW1Nc1lbMh4IUa39NOyxeqk+Qz+LclHDn6SRFwow4PQ93Bcg8bYN35FOoxH6Minb/hi5RYMCbFIPSzBSo76ib+Wh/jrGwXotA7BeVoEn99jNB5MsiJ+Ft5/ijvJJTZoYnic2MpOPVyCz5QydCbjYsCAql4LHWy8F+No8z2buxd4W6k46sA8=
X-Forefront-Antispam-Report: CIP:255.255.255.255; CTRY:; LANG:en; SCL:1; SRV:;
 IPV:NLI; SFV:NSPM; H:SN6PR12MB4623.namprd12.prod.outlook.com; PTR:; CAT:NONE;
 SFS:(4636009)(376002)(346002)(39860400002)(136003)(396003)(366004)(16526019)(6666004)(66574015)(6512007)(2616005)(1076003)(2906002)(6636002)(66556008)(186003)(86362001)(5660300002)(8936002)(83380400001)(6486002)(478600001)(44832011)(38100700002)(54906003)(66946007)(52116002)(6506007)(66476007)(8676002)(4326008)(36756003)(316002);
 DIR:OUT; SFP:1101;
X-MS-Exchange-AntiSpam-MessageData: =?utf-8?q?hHXQAZNqngzXO02+lhSBdeMfGMC3ct?=
	=?utf-8?q?VK7y/rVxwogi8PvqCi8pFbfVcfkUdaiGZlvZ2uYyqviyhtODcqtSc5AyEpA4G3cMk?=
	=?utf-8?q?LQuPsixkvvSAQcka5Pjp8aXLCvvyhHSMk6GhJY2EaeMKSzaoO5cZSMc50ETHXxXZV?=
	=?utf-8?q?gxo3yE2h2jTZz5gLpJwXyZHCHQczH24/amYRcBzByc6acjHp/f23EydWILsjqO/Yq?=
	=?utf-8?q?N0QncJshmNx+w90lCC1S3Zarq2yPAnBdHHK+b3OO8ez1owLC1C/68jCUZxDnRlaoU?=
	=?utf-8?q?KMzme0ymxeo6q56Fgba5CUnhO2vD/Chhz8S1rXiX4D9H4iRHCUNGNYsZDIpMvV64N?=
	=?utf-8?q?ZvUeYVdmTGIVpxBOGLxl020K2rC5dy61IZ5/WSD/rLzT5rvSmFGgqJ9pFU9Rvf+1g?=
	=?utf-8?q?4491IeDOq7Ifux4Kc/t4FXE/YlYH/IVjD+q8AZyDsw7vVBIKDbi2a8JSAT6WixbEX?=
	=?utf-8?q?sqxHKD4RrABaBiCom2v7I+0jmz2AFq9Ce0jvu+sMSPDVWVhAij20qTYt94P0/4zAf?=
	=?utf-8?q?cmePw0M8gx65k3KNmbbGnbMEB9Ct+VfaWJ5+Udu0Rg4h4ao9ZmQCCNqZXBOmHZ1yG?=
	=?utf-8?q?AT4iV8KCsxjbcKdIZY/udfGZ81JSnqE/A49yYG6aBlykmBD4DHPtzSIFJXRjJz1jA?=
	=?utf-8?q?8wdV+y6yOwDJA01n5MYdW7SGuaCKERML717uOgTTWkWg3CwptsJ15UTKpccCfTbqO?=
	=?utf-8?q?VdoPD2inEG8ZTnUYhQwR0JOWdU3NWs25KFfiOyG7YATrNDAAUqWYF3pDdMUckoQ5m?=
	=?utf-8?q?7Dxc8NyE+mr55Sf/VysBTOBE9vkcWg57zncnuSXh1CxOpzsjYPB8cAD+TSNtL4DWG?=
	=?utf-8?q?syP7ahWsElZBYAwQwj3kpnr/9Gh5SFzs9K3GT5KHek2qShI4NsIXiFWMEMBxtXMjc?=
	=?utf-8?q?jRZhywl7iERpBz/0XgUdda/9UFiQfDLipTEk5sVCfl9t2evQOouqx7v7baC6tdBVl?=
	=?utf-8?q?//oyyJdPAtnrKp2h6K3vhqATExdY0fkwAoeQMiOBaLu0YrM1mjpGbDyZOJxRXYpHf?=
	=?utf-8?q?RV3icstkw9qLQDaWiNxdMj6ae0CU4Mr0Z/AS1upaf0ipvOfZMpoLQEPJMGnf1+rjL?=
	=?utf-8?q?1qgugeMjFiNhHQsalK9dxZNxy8Da/GrnrFxkujXf4F6PoDXAGgTjUtJnfJEU1hWFL?=
	=?utf-8?q?v3Rg0uP6HX+WWJdOEteGqwtF/H7m52Eocvhu30jKMYHVu+MtUzaVlR2ZvfbgVIet6?=
	=?utf-8?q?jO2t53HIxcsUam2Nw7r+flgxFfXThHUZZz7LGPOEQGy/DWu0iSJ5GhwLlsvCJkiRh?=
	=?utf-8?q?Z0YP+Ae5/8h8aupoRTKOlUHnuL+qkXkkxnpiijiam5I6ZFumnppXmSey1WaEjDZr4?=
	=?utf-8?q?gUg4MOFWqRYRr?=
X-OriginatorOrg: amd.com
X-MS-Exchange-CrossTenant-Network-Message-Id: 
 ce484d86-8da4-4163-f65e-08d90a581c30
X-MS-Exchange-CrossTenant-AuthSource: SN6PR12MB4623.namprd12.prod.outlook.com
X-MS-Exchange-CrossTenant-AuthAs: Internal
X-MS-Exchange-CrossTenant-OriginalArrivalTime: 28 Apr 2021 15:12:59.7125 (UTC)
X-MS-Exchange-CrossTenant-FromEntityHeader: Hosted
X-MS-Exchange-CrossTenant-Id: 3dd8961f-e488-4e60-8e11-a82d994e183d
X-MS-Exchange-CrossTenant-MailboxType: HOSTED
X-MS-Exchange-CrossTenant-UserPrincipalName: 
 tidZahAWe63VbKeEMpdBSQLgXVe1Gr1otsTGygf0HvRQLXgyrWPJ2pI+vIhfyuA3b+uMlbuqO7bunDgzpq3QKQ==
X-MS-Exchange-Transport-CrossTenantHeadersStamped: SN6PR12MB2749
X-BeenThere: dri-devel@lists.freedesktop.org
X-Mailman-Version: 2.1.29
Precedence: list
List-Id: Direct Rendering Infrastructure - Development
 <dri-devel.lists.freedesktop.org>
List-Unsubscribe: <https://lists.freedesktop.org/mailman/options/dri-devel>,
 <mailto:dri-devel-request@lists.freedesktop.org?subject=unsubscribe>
List-Archive: <https://lists.freedesktop.org/archives/dri-devel>
List-Post: <mailto:dri-devel@lists.freedesktop.org>
List-Help: <mailto:dri-devel-request@lists.freedesktop.org?subject=help>
List-Subscribe: <https://lists.freedesktop.org/mailman/listinfo/dri-devel>,
 <mailto:dri-devel-request@lists.freedesktop.org?subject=subscribe>
Cc: gregkh@linuxfoundation.org, Felix.Kuehling@amd.com, helgaas@kernel.org,
 Alexander.Deucher@amd.com,
 =?utf-8?q?Christian_K=C3=B6nig?= <christian.koenig@amd.com>
Content-Type: text/plain; charset="utf-8"
Content-Transfer-Encoding: base64
Errors-To: dri-devel-bounces@lists.freedesktop.org
Sender: "dri-devel" <dri-devel-bounces@lists.freedesktop.org>

Message ID	20210428151207.1212258-16-andrey.grodzovsky@amd.com (mailing list archive)
State	New, archived
Headers	show Return-Path: <SRS0=UY5J=JZ=lists.freedesktop.org=dri-devel-bounces@kernel.org> DMARC-Filter: OpenDMARC Filter v1.3.2 mail.kernel.org C494E613F1 From: Andrey Grodzovsky <andrey.grodzovsky@amd.com> To: dri-devel@lists.freedesktop.org, amd-gfx@lists.freedesktop.org, linux-pci@vger.kernel.org, ckoenig.leichtzumerken@gmail.com, daniel.vetter@ffwll.ch, Harry.Wentland@amd.com Subject: [PATCH v5 15/27] drm/scheduler: Fix hang when sched_entity released Date: Wed, 28 Apr 2021 11:11:55 -0400 Message-Id: <20210428151207.1212258-16-andrey.grodzovsky@amd.com> In-Reply-To: <20210428151207.1212258-1-andrey.grodzovsky@amd.com> References: <20210428151207.1212258-1-andrey.grodzovsky@amd.com> MIME-Version: 1.0 X-MS-Exchange-MessageSentRepresentingType: 1 Precedence: list Cc: gregkh@linuxfoundation.org, Felix.Kuehling@amd.com, helgaas@kernel.org, Alexander.Deucher@amd.com, =?utf-8?q?Christian_K=C3=B6nig?= <christian.koenig@amd.com> Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: base64 Errors-To: dri-devel-bounces@lists.freedesktop.org Sender: "dri-devel" <dri-devel-bounces@lists.freedesktop.org>
Series	RFC Support hot device unplug in amdgpu \| expand [v5,00/27] RFC Support hot device unplug in amdgpu [v5,01/27] drm/ttm: Remap all page faults to per process dummy page. [v5,02/27] drm/ttm: Expose ttm_tt_unpopulate for driver use [v5,03/27] drm/amdgpu: Split amdgpu_device_fini into early and late [v5,04/27] drm/amdkfd: Split kfd suspend from devie exit [v5,05/27] drm/amdgpu: Add early fini callback [v5,06/27] drm/amdgpu: Handle IOMMU enabled case. [v5,07/27] drm/amdgpu: Remap all page faults to per process dummy page. [v5,08/27] PCI: add support for dev_groups to struct pci_device_driver [v5,09/27] dmr/amdgpu: Move some sysfs attrs creation to default_attr [v5,10/27] drm/amdgpu: Guard against write accesses after device removal [v5,11/27] drm/sched: Make timeout timer rearm conditional. [v5,12/27] drm/amdgpu: Prevent any job recoveries after device is unplugged. [v5,13/27] drm/amdgpu: When filizing the fence driver. stop scheduler first. [v5,14/27] drm/amdgpu: Fix hang on device removal. [v5,15/27] drm/scheduler: Fix hang when sched_entity released [v5,16/27] drm/amdgpu: Unmap all MMIO mappings [v5,17/27] drm/amdgpu: Add rw_sem to pushing job into sched queue [v5,18/27] drm/sched: Expose drm_sched_entity_kill_jobs [v5,19/27] drm/amdgpu: Finilise device fences on device remove. [v5,20/27] drm: Scope all DRM IOCTLs with drm_dev_enter/exit [v5,21/27] drm/amdgpu: Add support for hot-unplug feature at DRM level. [v5,22/27] drm/amd/display: Scope all DM queued work with drm_dev_enter/exit [v5,23/27] drm/amd/powerplay: Scope all PM queued work with drm_dev_enter/exit [v5,24/27] drm/amdkfd: Scope all KFD queued work with drm_dev_enter/exit [v5,25/27] drm/amdgpu: Scope all amdgpu queued work with drm_dev_enter/exit [v5,26/27] drm/amd/display: Remove superflous drm_mode_config_cleanup [v5,27/27] drm/amdgpu: Verify DMA opearations from device are done

[v5,15/27] drm/scheduler: Fix hang when sched_entity released

Commit Message

Comments

Patch