[net] net: ensure all external references are released in deferred skbuffs

Open vSwitch system test suite is broken due to inability to
load/unload netfilter modules.  kworker thread is getting trapped
in the infinite loop while running a net cleanup inside the
nf_conntrack_cleanup_net_list, because deferred skbuffs are still
holding nfct references and not being freed by their CPU cores.

In general, the idea that we will have an rx interrupt on every
CPU core at some point in a near future doesn't seem correct.
Devices are getting created and destroyed, interrupts are getting
re-scheduled, CPUs are going online and offline dynamically.
Any of these events may leave packets stuck in defer list for a
long time.  It might be OK, if they are just a piece of memory,
but we can't afford them holding references to any other resources.

In case of OVS, nfct reference keeps the kernel thread in busy loop
while holding a 'pernet_ops_rwsem' semaphore.  That blocks the
later modprobe request from user space:

  # ps
   299 root  R  99.3  200:25.89 kworker/u96:4+

  # journalctl
  INFO: task modprobe:11787 blocked for more than 1228 seconds.
        Not tainted 5.19.0-rc2 #8
  task:modprobe     state:D
  Call Trace:
   <TASK>
   __schedule+0x8aa/0x21d0
   schedule+0xcc/0x200
   rwsem_down_write_slowpath+0x8e4/0x1580
   down_write+0xfc/0x140
   register_pernet_subsys+0x15/0x40
   nf_nat_init+0xb6/0x1000 [nf_nat]
   do_one_initcall+0xbb/0x410
   do_init_module+0x1b4/0x640
   load_module+0x4c1b/0x58d0
   __do_sys_init_module+0x1d7/0x220
   do_syscall_64+0x3a/0x80
   entry_SYSCALL_64_after_hwframe+0x46/0xb0

At this point OVS testsuite is unresponsive and never recover,
because these skbuffs are never freed.

Solution is to make sure no external references attached to skb
before pushing it to the defer list.  Using skb_release_head_state()
for that purpose.  The function modified to be re-enterable, as it
will be called again during the defer list flush.

Another approach that can fix the OVS use-case, is to kick all
cores while waiting for references to be released during the net
cleanup.  But that sounds more like a workaround for a current
issue rather than a proper solution and will not cover possible
issues in other parts of the code.

Additionally checking for skb_zcopy() while deferring.  This might
not be necessary, as I'm not sure if we can actually have zero copy
packets on this path, but seems worth having for completeness as we
should never defer such packets regardless.

CC: Eric Dumazet <edumazet@google.com>
Fixes: 68822bdf76f1 ("net: generalize skb freeing deferral to per-cpu lists")
Signed-off-by: Ilya Maximets <i.maximets@ovn.org>
---
 net/core/skbuff.c | 16 +++++++++++-----
 1 file changed, 11 insertions(+), 5 deletions(-)

Message ID	20220619003919.394622-1-i.maximets@ovn.org (mailing list archive)
State	Changes Requested
Delegated to:	Netdev Maintainers
Headers	show Return-Path: <netdev-owner@kernel.org> X-Spam-Checker-Version: SpamAssassin 3.4.0 (2014-02-07) on aws-us-west-2-korg-lkml-1.web.codeaurora.org Received: from vger.kernel.org (vger.kernel.org [23.128.96.18]) by smtp.lore.kernel.org (Postfix) with ESMTP id 655A2C43334 for <netdev@archiver.kernel.org>; Sun, 19 Jun 2022 00:39:43 +0000 (UTC) Received: (majordomo@vger.kernel.org) by vger.kernel.org via listexpand id S230272AbiFSAjl (ORCPT <rfc822;netdev@archiver.kernel.org>); Sat, 18 Jun 2022 20:39:41 -0400 Received: from lindbergh.monkeyblade.net ([23.128.96.19]:42132 "EHLO lindbergh.monkeyblade.net" rhost-flags-OK-OK-OK-OK) by vger.kernel.org with ESMTP id S229446AbiFSAjk (ORCPT <rfc822;netdev@vger.kernel.org>); Sat, 18 Jun 2022 20:39:40 -0400 Received: from relay7-d.mail.gandi.net (relay7-d.mail.gandi.net [IPv6:2001:4b98:dc4:8::227]) by lindbergh.monkeyblade.net (Postfix) with ESMTPS id F05171056D; Sat, 18 Jun 2022 17:39:37 -0700 (PDT) Received: (Authenticated sender: i.maximets@ovn.org) by mail.gandi.net (Postfix) with ESMTPSA id 01BD420003; Sun, 19 Jun 2022 00:39:33 +0000 (UTC) From: Ilya Maximets <i.maximets@ovn.org> To: netdev@vger.kernel.org Cc: "David S. Miller" <davem@davemloft.net>, dev@openvswitch.org, linux-kernel@vger.kernel.org, Eric Dumazet <edumazet@google.com>, Jakub Kicinski <kuba@kernel.org>, Paolo Abeni <pabeni@redhat.com>, Florian Westphal <fw@strlen.de>, Ilya Maximets <i.maximets@ovn.org> Subject: [PATCH net] net: ensure all external references are released in deferred skbuffs Date: Sun, 19 Jun 2022 02:39:19 +0200 Message-Id: <20220619003919.394622-1-i.maximets@ovn.org> X-Mailer: git-send-email 2.34.3 MIME-Version: 1.0 Content-Transfer-Encoding: 8bit Precedence: bulk List-ID: <netdev.vger.kernel.org> X-Mailing-List: netdev@vger.kernel.org X-Patchwork-Delegate: kuba@kernel.org
Series	[net] net: ensure all external references are released in deferred skbuffs \| expand [net] net: ensure all external references are released in deferred skbuffs

Context	Check	Description
netdev/tree_selection	success	Clearly marked for net
netdev/fixes_present	success	Fixes tag present in non-next series
netdev/subject_prefix	success	Link
netdev/cover_letter	success	Single patches do not need cover letters
netdev/patch_count	success	Link
netdev/header_inline	success	No static functions without inline keyword in header files
netdev/build_32bit	success	Errors and warnings before: 2 this patch: 2
netdev/cc_maintainers	success	CCed 5 of 5 maintainers
netdev/build_clang	success	Errors and warnings before: 6 this patch: 6
netdev/module_param	success	Was 0 now: 0
netdev/verify_signedoff	success	Signed-off-by tag matches author and committer
netdev/check_selftest	success	No net selftest shell script
netdev/verify_fixes	success	Fixes tag looks correct
netdev/build_allmodconfig_warn	success	Errors and warnings before: 2 this patch: 2
netdev/checkpatch	success	total: 0 errors, 0 warnings, 0 checks, 35 lines checked
netdev/kdoc	success	Errors and warnings before: 0 this patch: 0
netdev/source_inline	success	Was 0 now: 0

[net] net: ensure all external references are released in deferred skbuffs

Checks

Commit Message

Comments

Patch