From patchwork Wed Nov 24 21:44:19 2021
Content-Type: text/plain; charset="utf-8"
MIME-Version: 1.0
Content-Transfer-Encoding: 7bit
X-Patchwork-Submitter: Mingwei Zhang <mizhang@google.com>
X-Patchwork-Id: 12637943
Return-Path: <kvm-owner@kernel.org>
X-Spam-Checker-Version: SpamAssassin 3.4.0 (2014-02-07) on
	aws-us-west-2-korg-lkml-1.web.codeaurora.org
Received: from vger.kernel.org (vger.kernel.org [23.128.96.18])
	by smtp.lore.kernel.org (Postfix) with ESMTP id 41618C433F5
	for <kvm@archiver.kernel.org>; Wed, 24 Nov 2021 21:44:35 +0000 (UTC)
Received: (majordomo@vger.kernel.org) by vger.kernel.org via listexpand
        id S244474AbhKXVrn (ORCPT <rfc822;kvm@archiver.kernel.org>);
        Wed, 24 Nov 2021 16:47:43 -0500
Received: from lindbergh.monkeyblade.net ([23.128.96.19]:35944 "EHLO
        lindbergh.monkeyblade.net" rhost-flags-OK-OK-OK-OK) by vger.kernel.org
        with ESMTP id S244658AbhKXVrm (ORCPT <rfc822;kvm@vger.kernel.org>);
        Wed, 24 Nov 2021 16:47:42 -0500
Received: from mail-pl1-x64a.google.com (mail-pl1-x64a.google.com
 [IPv6:2607:f8b0:4864:20::64a])
        by lindbergh.monkeyblade.net (Postfix) with ESMTPS id B5372C061746
        for <kvm@vger.kernel.org>; Wed, 24 Nov 2021 13:44:30 -0800 (PST)
Received: by mail-pl1-x64a.google.com with SMTP id
 4-20020a170902c20400b0014381f710d5so1303565pll.11
        for <kvm@vger.kernel.org>; Wed, 24 Nov 2021 13:44:30 -0800 (PST)
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed;
        d=google.com; s=20210112;
        h=reply-to:date:message-id:mime-version:subject:from:to:cc;
        bh=Ok5W2zC2Qy8edZ8sCypy5xZAEqEbZ3krPlmsI3nnu4A=;
        b=kvsHwmtd0Jycx9oNKaqbcp5xS2Du7sltDiaZYx+mtSjX+dbDuvzlnc+6H61LKeKVTp
         AC/IxF58K2YgM8bvhxTo7fcuXlkOoMBykSsUiPiKCiju3c8vj2Y/PQBFdaA01NNWCyvy
         qwSq5s0t+zhoa577H3BMX5Uywh+2FuXY1f9/ZOozeIczcEMLUU4sUDj3pa93nR9iub5T
         qB2ZswTC5ryTBHWm4QyAYYZQLoSjnilsHy1JR2Nm02gfREgZ+7KUyB9hfx2H3WiOX2Vx
         dwW/oG6+PXzyrk/6CHkx/hAkkUxSN+PE7aAoU1RqnRpHrBCCp1tB3KjkFvqsHlxa2Qu1
         oU5Q==
X-Google-DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed;
        d=1e100.net; s=20210112;
        h=x-gm-message-state:reply-to:date:message-id:mime-version:subject
         :from:to:cc;
        bh=Ok5W2zC2Qy8edZ8sCypy5xZAEqEbZ3krPlmsI3nnu4A=;
        b=HD6CmtAvoT0zXnMx5Ix21EFc4UhwC0+rqVt2h4cagFxpaQ/vMOktW1egvkQ3I8OkId
         UVlQ3SB5GnTsLAJsHYMmZ0BvPLQ06ruTuWANkZ/lHKaINbzSYNmhx8TId0q5/BgVsudD
         HRCkrjBFTDcQ9O2aJ6Un1aQO8KhjFwKTYP6cUhsFPOaWI3cWS7NjoC6osjbTOTkPMgBA
         xO4H3kJq2YhIzbbdbETwTYAZJP5WvCB9YznsIaS0bwIXlyonI/JHMTlnDuqqegDdqAn9
         YpEUI31eBWJRQfHdj3UxQhTuQz2dCXQLeAJYiG5kTVm1QyAz/S3bLDOhwZROVGroC8nS
         RcuQ==
X-Gm-Message-State: AOAM531LAN0OCs/U305BxwofIXbifzD1eTAzu4EIEUBTAalTDcYOrc9w
        ApyaYRO1HQUbF59zVA+oW2YJSi727PbO
X-Google-Smtp-Source: 
 ABdhPJwZBYK/p1mHoASj8Iy8hBROOKPmnT3FvwXaf9uY2ps+0CJrCzWtSt8VfyAMA+lNUnqcULTyWupq1slV
X-Received: from mizhang-super.c.googlers.com
 ([fda3:e722:ac3:cc00:7f:e700:c0a8:1071])
 (user=mizhang job=sendgmr) by 2002:a17:90b:3849:: with SMTP id
 nl9mr265300pjb.145.1637790270164; Wed, 24 Nov 2021 13:44:30 -0800 (PST)
Reply-To: Mingwei Zhang <mizhang@google.com>
Date: Wed, 24 Nov 2021 21:44:19 +0000
Message-Id: <20211124214421.458549-1-mizhang@google.com>
Mime-Version: 1.0
X-Mailer: git-send-email 2.34.0.rc2.393.gf8c9666880-goog
Subject: [PATCH 0/2] optimize spte zapping in zap_gfn_range()
From: Mingwei Zhang <mizhang@google.com>
To: Paolo Bonzini <pbonzini@redhat.com>
Cc: Sean Christopherson <seanjc@google.com>,
        Vitaly Kuznetsov <vkuznets@redhat.com>,
        Wanpeng Li <wanpengli@tencent.com>,
        Jim Mattson <jmattson@google.com>,
        Joerg Roedel <joro@8bytes.org>, kvm@vger.kernel.org,
        linux-kernel@vger.kernel.org, Ben Gardon <bgardon@google.com>,
        David Matlack <dmatlack@google.com>,
        Mingwei Zhang <mizhang@google.com>
Precedence: bulk
List-ID: <kvm.vger.kernel.org>
X-Mailing-List: kvm@vger.kernel.org

TDP MMU SPTE zapping process currently uses two levels of iterations. The
first level iteration happens at the for loop within the zap_gfn_range()
with the purpose of calibrating the accurate range for zapping. The second
level itreration start at tdp_mmu_set_spte{,_atomic}() that tears down the
whole paging structures (leaf and non-leaf SPTEs) within the range. The
former iteration is yield safe, while the second one is not.

In many cases, zapping SPTE process could be optimized since the non-leaf
SPTEs could most likely be retained for the next allocation. On the other
hand, for large scale SPTE zapping scenarios, we may end up zapping too
many SPTEs and use excessive CPU time that causes the RCU stall warning.

The follow selftest reproduces the warning:

        (env: kvm.tdp_mmu=Y)
        ./dirty_log_perf_test -v 64 -b 8G

This patch set revert a previous optimization and create a helper
__zap_gfn_range() to help optimize the zapping process.

In particular, it does the following two things:
 - optimize the zapping by retaining some non-leaf SPTEs.
 - avoid RCU stall warning when zapping too many SPTEs.

Mingwei Zhang (2):
  Revert "KVM: x86/mmu: Don't step down in the TDP iterator when zapping
    all SPTEs"
  KVM: mmu/x86: optimize zapping by retaining non-leaf SPTEs and avoid
    rcu stall

 arch/x86/kvm/mmu/tdp_mmu.c | 66 +++++++++++++++++++++++---------------
 1 file changed, 41 insertions(+), 25 deletions(-)
---
2.34.0.rc2.393.gf8c9666880-goog