[v2,1/1] net: fec: handle page_pool_dev_alloc_pages error

Message ID	20250113154846.1765414-1-kgroeneveld@lenbrook.com (mailing list archive)
State	New
Delegated to:	Netdev Maintainers
Headers	show Received: from YT3PR01CU008.outbound.protection.outlook.com (mail-canadacentralazon11020073.outbound.protection.outlook.com [52.101.189.73]) (using TLSv1.2 with cipher ECDHE-RSA-AES256-GCM-SHA384 (256/256 bits)) (No client certificate requested) by smtp.subspace.kernel.org (Postfix) with ESMTPS id E56FF1C5D6F; Mon, 13 Jan 2025 15:48:56 +0000 (UTC) From: Kevin Groeneveld <kgroeneveld@lenbrook.com> To: Wei Fang <wei.fang@nxp.com>, Shenwei Wang <shenwei.wang@nxp.com>, Clark Wang <xiaoning.wang@nxp.com>, Andrew Lunn <andrew+netdev@lunn.ch>, "David S. Miller" <davem@davemloft.net>, Eric Dumazet <edumazet@google.com>, Jakub Kicinski <kuba@kernel.org>, Paolo Abeni <pabeni@redhat.com>, imx@lists.linux.dev, netdev@vger.kernel.org, linux-kernel@vger.kernel.org Cc: Kevin Groeneveld <kgroeneveld@lenbrook.com> Subject: [PATCH v2 1/1] net: fec: handle page_pool_dev_alloc_pages error Date: Mon, 13 Jan 2025 10:48:45 -0500 Message-ID: <20250113154846.1765414-1-kgroeneveld@lenbrook.com> Content-Transfer-Encoding: 8bit Content-Type: text/plain Precedence: bulk MIME-Version: 1.0
Series	[v2,1/1] net: fec: handle page_pool_dev_alloc_pages error \| expand [v2,1/1] net: fec: handle page_pool_dev_alloc_pages error

Message ID

20250113154846.1765414-1-kgroeneveld@lenbrook.com (mailing list archive)

State

New

Delegated to:

Netdev Maintainers

Headers

From: Kevin Groeneveld <kgroeneveld@lenbrook.com>
To: Wei Fang <wei.fang@nxp.com>,
	Shenwei Wang <shenwei.wang@nxp.com>,
	Clark Wang <xiaoning.wang@nxp.com>,
	Andrew Lunn <andrew+netdev@lunn.ch>,
	"David S. Miller" <davem@davemloft.net>,
	Eric Dumazet <edumazet@google.com>,
	Jakub Kicinski <kuba@kernel.org>,
	Paolo Abeni <pabeni@redhat.com>,
	imx@lists.linux.dev,
	netdev@vger.kernel.org,
	linux-kernel@vger.kernel.org
Cc: Kevin Groeneveld <kgroeneveld@lenbrook.com>
Subject: [PATCH v2 1/1] net: fec: handle page_pool_dev_alloc_pages error
Date: Mon, 13 Jan 2025 10:48:45 -0500
Message-ID: <20250113154846.1765414-1-kgroeneveld@lenbrook.com>
Content-Transfer-Encoding: 8bit
Content-Type: text/plain
Precedence: bulk
MIME-Version: 1.0
X-MS-Exchange-AntiSpam-MessageData-ChunkCount: 1
X-MS-Exchange-AntiSpam-MessageData-0: 
 gcHdV9Bxom/iIvquuOGEyAEI78xXqv9dXH7gL/8yEKLSFwyoMxnahwLYer5pEuHt3GZ7Hdnr+fxG8QxEh1FjR3l9QE265uvM/OLQ9g5VmUZxHxGJPFRennJzIKS9HFyN1TGUe3YWZpgFlm7G4xW+gINImCulXbiquRTxTMf5Afz0F0m7XXGp0ivUCx3Ez4GyId+ZuzCtwiZlW6lG06g1YNBDEDQ62gCh2WZGYmZMB4iQlsTO5C1IChIFix6KztSOojaVu77cdbVCRVsNYnkO6yE7+9/CS0E2lolEXZ5gF9qZmFHHNLo7gggxFmgM39u7sRPV3pDyPtMTp6JUssf0WNgZkaDdIc8N6z9JW/mm0sJgiMDgoW2dXeQiuho/dq2LLj6/8X3Oj0ZS2HThewPE7s497Hv3HY6Xx9MdlXijTQPlWqn0Kgil0JSjPgCxbMEZnjBMOoMDsb/goyJhrX0+jjKVzPTmw0zlqSAAsUXnZLr87w37aiBy3yj+Ea0ubOf4SEFAz7xVH51KrKBJV1GNgInKoT6jpKPXZ0ZwWky8tHfD5rHiu/8xrJsnqStlMkIYPB3pme/k6gtBfHwPyLX/yQI8Dh7GjYKSh3ffkrEwfKwn67N0qTts7+RLJ9TTPv9lZIq5OISJ/x06DB/bo8R5GCdzgs0t7VKBlT/Gys9cWdd0hSoKHWrC1q2mFSwfAwrrCKiQZAzzMJAvCJaoEh4cLi0MvvxwPprUIj5mkqP7vSZWGxbCpq4rsVFidwWHBAHKxWCqwFB3sSCTdgvPP7QoHcz3iooMLurVtP8+SVIxnesDMcKjpjdw4MJLQoeupVqcTUTXgC7b5TzUzhjbH/8augvJGUwN0vqsvYVBFiajyIoXUdVdyEVrNpZgFusgG+dT0KZSpVkiWJfZcAtSz2uaMzfjoyw/q4Zk80qP5VwVVH4MV5f9+6cL6DixKwRkkv9lnMaSiP7sMUWScGSYX/xu+wXu27Clpnbm5Xe0r0fmndmBXje70wRXcfOKMj0EAqCWf/wa3Qyh8zMbLgDUbsC8fdfVW8NWxtEViZvuhcwBLhXWZAcskVjk3Ef5OjJJaNU/WTyMyNTAXaFZJGH/grkmDyrtRNzNzMGWZmFCpSk1jh7e+V3NCYOTYKp0k/i6tQaZm5bNJ5tjre6gMUbn7qDWj/Rle9X2mjX808JBSs6+qiUIQ+KjI9oIGPV7cqIdBNv0wapGCepEzsW1ZCLKjsmVHKVPDcmBJqfAIpR+cEoW0aD9KMvg3fLnyqeEef/AOZHWrotc9k3L18RtAegRxgRkP+TmzXSTFp6lQ5/R4MbdPPaY0g8vPIILx7D1OS40ZHBHM7nfHY3ejYozxRPjAMjMRnlLhkabXSUrLsXO22JCgJuBvvXpAQTni/NQy++Q9g5yyWx5I29PZHAwRG4BnktM1gFQQvQPxx9Kq98imT0OvDcdAC6/ba5nLdDMnkoCRLCZ2wzlgiRlSgbjyJYkOU+ZDXTwhZ9jrvkqW+oeQBI9UGw3+eVgcyZyKrSAr+cpnqvsK/NWA2Wgl4q13eXTyvTApH7XZOEqMaYvDln4QCSWgRVKH/EBOrhnTGOYNrqhjk2sjMCBG1unTWv5qC37ZyPc3Q==
X-OriginatorOrg: lenbrook.com
X-MS-Exchange-CrossTenant-Network-Message-Id: 
 8798f192-ce25-4a36-826e-08dd33e9c895
X-MS-Exchange-CrossTenant-AuthSource: YT2PR01MB5632.CANPRD01.PROD.OUTLOOK.COM
X-MS-Exchange-CrossTenant-AuthAs: Internal
X-MS-Exchange-CrossTenant-OriginalArrivalTime: 13 Jan 2025 15:48:54.4926
 (UTC)
X-MS-Exchange-CrossTenant-FromEntityHeader: Hosted
X-MS-Exchange-CrossTenant-Id: 3089fb55-f9f3-4ac8-ba44-52ac0e467cb6
X-MS-Exchange-CrossTenant-MailboxType: HOSTED
X-MS-Exchange-CrossTenant-UserPrincipalName: 
 V4AOcKo9zNIozC60dOAza9gWHh762gULI10046sw6SF7p8MUeZny0NVoj8O0wMHVuARAGILMTcyz+7JoaJjRnesCLQc+5nyhpLBD2evM45Y=
X-MS-Exchange-Transport-CrossTenantHeadersStamped: YT3PR01MB10701
X-Patchwork-Delegate: kuba@kernel.org

Series

[v2,1/1] net: fec: handle page_pool_dev_alloc_pages error | expand

Context	Check	Description
netdev/series_format	warning	Single patches do not need cover letters; Target tree name not specified in the subject
netdev/tree_selection	success	Guessed tree name to be net-next
netdev/ynl	success	Generated files up to date; no warnings/errors; no diff in generated;
netdev/fixes_present	success	Fixes tag not required for -next series
netdev/header_inline	success	No static functions without inline keyword in header files
netdev/build_32bit	success	Errors and warnings before: 1 this patch: 1
netdev/build_tools	success	No tools touched, skip
netdev/cc_maintainers	success	CCed 9 of 9 maintainers
netdev/build_clang	success	Errors and warnings before: 2 this patch: 2
netdev/verify_signedoff	success	Signed-off-by tag matches author and committer
netdev/deprecated_api	success	None detected
netdev/check_selftest	success	No net selftest shell script
netdev/verify_fixes	success	Fixes tag looks correct
netdev/build_allmodconfig_warn	success	Errors and warnings before: 1 this patch: 1
netdev/checkpatch	warning	CHECK: Alignment should match open parenthesis WARNING: Please use correct Fixes: style 'Fixes: <12 chars of sha1> ("<title line>")' - ie: 'Fixes: 95698ff6177b ("net: fec: using page pool to manage RX buffers")'
netdev/build_clang_rust	success	No Rust files in patch. Skipping build
netdev/kdoc	success	Errors and warnings before: 0 this patch: 0
netdev/source_inline	success	Was 0 now: 0
netdev/contest	success	net-next-2025-01-14--03-00 (tests: 885)

Context

Check

Description

netdev/series_format

warning

Single patches do not need cover letters; Target tree name not specified in the subject

netdev/tree_selection

success

Guessed tree name to be net-next

netdev/ynl

success

Generated files up to date; no warnings/errors; no diff in generated;

netdev/fixes_present

success

Fixes tag not required for -next series

netdev/header_inline

success

No static functions without inline keyword in header files

netdev/build_32bit

success

Errors and warnings before: 1 this patch: 1

netdev/build_tools

success

No tools touched, skip

netdev/cc_maintainers

success

CCed 9 of 9 maintainers

netdev/build_clang

success

Errors and warnings before: 2 this patch: 2

netdev/verify_signedoff

success

Signed-off-by tag matches author and committer

netdev/deprecated_api

success

None detected

netdev/check_selftest

success

No net selftest shell script

netdev/verify_fixes

success

Fixes tag looks correct

netdev/build_allmodconfig_warn

success

Errors and warnings before: 1 this patch: 1

netdev/checkpatch

warning

CHECK: Alignment should match open parenthesis WARNING: Please use correct Fixes: style 'Fixes: <12 chars of sha1> ("<title line>")' - ie: 'Fixes: 95698ff6177b ("net: fec: using page pool to manage RX buffers")'

netdev/build_clang_rust

success

No Rust files in patch. Skipping build

netdev/kdoc

success

Errors and warnings before: 0 this patch: 0

netdev/source_inline

success

Was 0 now: 0

netdev/contest

success

net-next-2025-01-14--03-00 (tests: 885)

Commit Message

Kevin Groeneveld Jan. 13, 2025, 3:48 p.m. UTC

The fec_enet_update_cbd function calls page_pool_dev_alloc_pages but did
not handle the case when it returned NULL. There was a WARN_ON(!new_page)
but it would still proceed to use the NULL pointer and then crash.

This case does seem somewhat rare but when the system is under memory
pressure it can happen. One case where I can duplicate this with some
frequency is when writing over a smbd share to a SATA HDD attached to an
imx6q.

Setting /proc/sys/vm/min_free_kbytes to higher values also seems to solve
the problem for my test case. But it still seems wrong that the fec driver
ignores the memory allocation error and can crash.

This commit handles the allocation error by dropping the current packet.

Fixes: 95698ff6177b5 ("net: fec: using page pool to manage RX buffers")
Signed-off-by: Kevin Groeneveld <kgroeneveld@lenbrook.com>
---
v1 -> v2:
- Simplify commit message.
- As suggested by and based on partial patch from Wei Fang, re-write to
  drop packet instead of trying to return from fec_enet_rx_napi early.

 drivers/net/ethernet/freescale/fec_main.c | 19 ++++++++++++++-----
 1 file changed, 14 insertions(+), 5 deletions(-)

Comments

Jacob Keller Jan. 13, 2025, 6:55 p.m. UTC | #1

On 1/13/2025 7:48 AM, Kevin Groeneveld wrote:
> The fec_enet_update_cbd function calls page_pool_dev_alloc_pages but did
> not handle the case when it returned NULL. There was a WARN_ON(!new_page)
> but it would still proceed to use the NULL pointer and then crash.
> 
> This case does seem somewhat rare but when the system is under memory
> pressure it can happen. One case where I can duplicate this with some
> frequency is when writing over a smbd share to a SATA HDD attached to an
> imx6q.
> 
> Setting /proc/sys/vm/min_free_kbytes to higher values also seems to solve
> the problem for my test case. But it still seems wrong that the fec driver
> ignores the memory allocation error and can crash.
> 
> This commit handles the allocation error by dropping the current packet.
> 
> Fixes: 95698ff6177b5 ("net: fec: using page pool to manage RX buffers")
> Signed-off-by: Kevin Groeneveld <kgroeneveld@lenbrook.com>
> ---

Reviewed-by: Jacob Keller <jacob.e.keller@intel.com>

Wei Fang Jan. 14, 2025, 1:19 a.m. UTC | #2

> The fec_enet_update_cbd function calls page_pool_dev_alloc_pages but did
> not handle the case when it returned NULL. There was a
> WARN_ON(!new_page)
> but it would still proceed to use the NULL pointer and then crash.
> 
> This case does seem somewhat rare but when the system is under memory
> pressure it can happen. One case where I can duplicate this with some
> frequency is when writing over a smbd share to a SATA HDD attached to an
> imx6q.
> 
> Setting /proc/sys/vm/min_free_kbytes to higher values also seems to solve
> the problem for my test case. But it still seems wrong that the fec driver
> ignores the memory allocation error and can crash.
> 
> This commit handles the allocation error by dropping the current packet.
> 
> Fixes: 95698ff6177b5 ("net: fec: using page pool to manage RX buffers")
> Signed-off-by: Kevin Groeneveld <kgroeneveld@lenbrook.com>
> ---
> v1 -> v2:
> - Simplify commit message.
> - As suggested by and based on partial patch from Wei Fang, re-write to
>   drop packet instead of trying to return from fec_enet_rx_napi early.
> 
>  drivers/net/ethernet/freescale/fec_main.c | 19 ++++++++++++++-----
>  1 file changed, 14 insertions(+), 5 deletions(-)
> 
> diff --git a/drivers/net/ethernet/freescale/fec_main.c
> b/drivers/net/ethernet/freescale/fec_main.c
> index 1b55047c0237..4566848e1d7c 100644
> --- a/drivers/net/ethernet/freescale/fec_main.c
> +++ b/drivers/net/ethernet/freescale/fec_main.c
> @@ -1591,19 +1591,22 @@ static void fec_enet_tx(struct net_device *ndev,
> int budget)
>  		fec_enet_tx_queue(ndev, i, budget);
>  }
> 
> -static void fec_enet_update_cbd(struct fec_enet_priv_rx_q *rxq,
> +static int fec_enet_update_cbd(struct fec_enet_priv_rx_q *rxq,
>  				struct bufdesc *bdp, int index)
>  {
>  	struct page *new_page;
>  	dma_addr_t phys_addr;
> 
>  	new_page = page_pool_dev_alloc_pages(rxq->page_pool);
> -	WARN_ON(!new_page);
> -	rxq->rx_skb_info[index].page = new_page;
> +	if (unlikely(!new_page))
> +		return -ENOMEM;
> 
> +	rxq->rx_skb_info[index].page = new_page;
>  	rxq->rx_skb_info[index].offset = FEC_ENET_XDP_HEADROOM;
>  	phys_addr = page_pool_get_dma_addr(new_page) +
> FEC_ENET_XDP_HEADROOM;
>  	bdp->cbd_bufaddr = cpu_to_fec32(phys_addr);
> +
> +	return 0;
>  }
> 
>  static u32
> @@ -1698,6 +1701,7 @@ fec_enet_rx_queue(struct net_device *ndev, int
> budget, u16 queue_id)
>  	int cpu = smp_processor_id();
>  	struct xdp_buff xdp;
>  	struct page *page;
> +	__fec32 cbd_bufaddr;
>  	u32 sub_len = 4;
> 
>  #if !defined(CONFIG_M5272)
> @@ -1766,12 +1770,17 @@ fec_enet_rx_queue(struct net_device *ndev, int
> budget, u16 queue_id)
> 
>  		index = fec_enet_get_bd_index(bdp, &rxq->bd);
>  		page = rxq->rx_skb_info[index].page;
> +		cbd_bufaddr = bdp->cbd_bufaddr;
> +		if (fec_enet_update_cbd(rxq, bdp, index)) {
> +			ndev->stats.rx_dropped++;
> +			goto rx_processing_done;
> +		}
> +
>  		dma_sync_single_for_cpu(&fep->pdev->dev,
> -					fec32_to_cpu(bdp->cbd_bufaddr),
> +					fec32_to_cpu(cbd_bufaddr),
>  					pkt_len,
>  					DMA_FROM_DEVICE);
>  		prefetch(page_address(page));
> -		fec_enet_update_cbd(rxq, bdp, index);
> 
>  		if (xdp_prog) {
>  			xdp_buff_clear_frags_flag(&xdp);
> --
> 2.43.0

Thanks.

Reviewed-by: Wei Fang <wei.fang@nxp.com>

diff --git a/drivers/net/ethernet/freescale/fec_main.c b/drivers/net/ethernet/freescale/fec_main.c
index 1b55047c0237..4566848e1d7c 100644
--- a/drivers/net/ethernet/freescale/fec_main.c
+++ b/drivers/net/ethernet/freescale/fec_main.c
@@ -1591,19 +1591,22 @@  static void fec_enet_tx(struct net_device *ndev, int budget)
 		fec_enet_tx_queue(ndev, i, budget);
 }
 
-static void fec_enet_update_cbd(struct fec_enet_priv_rx_q *rxq,
+static int fec_enet_update_cbd(struct fec_enet_priv_rx_q *rxq,
 				struct bufdesc *bdp, int index)
 {
 	struct page *new_page;
 	dma_addr_t phys_addr;
 
 	new_page = page_pool_dev_alloc_pages(rxq->page_pool);
-	WARN_ON(!new_page);
-	rxq->rx_skb_info[index].page = new_page;
+	if (unlikely(!new_page))
+		return -ENOMEM;
 
+	rxq->rx_skb_info[index].page = new_page;
 	rxq->rx_skb_info[index].offset = FEC_ENET_XDP_HEADROOM;
 	phys_addr = page_pool_get_dma_addr(new_page) + FEC_ENET_XDP_HEADROOM;
 	bdp->cbd_bufaddr = cpu_to_fec32(phys_addr);
+
+	return 0;
 }
 
 static u32
@@ -1698,6 +1701,7 @@  fec_enet_rx_queue(struct net_device *ndev, int budget, u16 queue_id)
 	int cpu = smp_processor_id();
 	struct xdp_buff xdp;
 	struct page *page;
+	__fec32 cbd_bufaddr;
 	u32 sub_len = 4;
 
 #if !defined(CONFIG_M5272)
@@ -1766,12 +1770,17 @@  fec_enet_rx_queue(struct net_device *ndev, int budget, u16 queue_id)
 
 		index = fec_enet_get_bd_index(bdp, &rxq->bd);
 		page = rxq->rx_skb_info[index].page;
+		cbd_bufaddr = bdp->cbd_bufaddr;
+		if (fec_enet_update_cbd(rxq, bdp, index)) {
+			ndev->stats.rx_dropped++;
+			goto rx_processing_done;
+		}
+
 		dma_sync_single_for_cpu(&fep->pdev->dev,
-					fec32_to_cpu(bdp->cbd_bufaddr),
+					fec32_to_cpu(cbd_bufaddr),
 					pkt_len,
 					DMA_FROM_DEVICE);
 		prefetch(page_address(page));
-		fec_enet_update_cbd(rxq, bdp, index);
 
 		if (xdp_prog) {
 			xdp_buff_clear_frags_flag(&xdp);

[v2,1/1] net: fec: handle page_pool_dev_alloc_pages error

Checks

Commit Message

Comments

Patch