[RFC] mm: control mthp per process/cgroup

Message ID	20240816091327.54183-1-sunnanyong@huawei.com (mailing list archive)
State	New
Headers	show Return-Path: <owner-linux-mm@kvack.org> From: Nanyong Sun <sunnanyong@huawei.com> To: <hughd@google.com>, <akpm@linux-foundation.org>, <david@redhat.com>, <willy@infradead.org>, <ryan.roberts@arm.com> CC: <baohua@kernel.org>, <baolin.wang@linux.alibaba.com>, <ioworker0@gmail.com>, <peterx@redhat.com>, <ziy@nvidia.com>, <sunnanyong@huawei.com>, <wangkefeng.wang@huawei.com>, <linux-mm@kvack.org>, <linux-kernel@vger.kernel.org> Subject: [RFC PATCH] mm: control mthp per process/cgroup Date: Fri, 16 Aug 2024 17:13:27 +0800 Message-ID: <20240816091327.54183-1-sunnanyong@huawei.com> MIME-Version: 1.0 Content-Transfer-Encoding: 8bit Content-Type: text/plain Sender: owner-linux-mm@kvack.org Precedence: bulk
Series	[RFC] mm: control mthp per process/cgroup \| expand [RFC] mm: control mthp per process/cgroup

diff --git a/include/linux/huge_mm.h b/include/linux/huge_mm.h index e25d9ebfdf89..8c0b62b732b7 100644 --- a/include/linux/huge_mm.h +++ b/include/linux/huge_mm.h @@ -247,6 +247,9 @@ unsigned long thp_vma_allowable_orders(struct vm_area_struct *vma, if ((tva_flags & TVA_ENFORCE_SYSFS) && vma_is_anonymous(vma)) { unsigned long mask = READ_ONCE(huge_anon_orders_always); + if (test_bit(MMF_DISABLE_ANON_MTHP, &vma->vm_mm->flags)) + return 0; + if (vm_flags & VM_HUGEPAGE) mask |= READ_ONCE(huge_anon_orders_madvise); if (hugepage_global_always() || diff --git a/include/linux/sched/coredump.h b/include/linux/sched/coredump.h index e62ff805cfc9..0935b4790e6f 100644 --- a/include/linux/sched/coredump.h +++ b/include/linux/sched/coredump.h @@ -56,6 +56,10 @@ static inline int get_dumpable(struct mm_struct *mm) # define MMF_DUMP_MASK_DEFAULT_ELF 0 #endif /* leave room for more dump flags */ +#define MMF_DISABLE_ANON_MTHP 13 +#define MMF_DISABLE_SHMEM_MTHP 14 +#define MMF_DISABLE_FILE_MTHP 15 +#define MMF_DISABLE_MTHP_MASK (7 << MMF_DISABLE_ANON_MTHP) #define MMF_VM_MERGEABLE 16 /* KSM may merge identical pages */ #define MMF_VM_HUGEPAGE 17 /* set when mm is available for khugepaged */ @@ -96,8 +100,9 @@ static inline int get_dumpable(struct mm_struct *mm) #define MMF_TOPDOWN_MASK (1 << MMF_TOPDOWN) #define MMF_INIT_MASK (MMF_DUMPABLE_MASK | MMF_DUMP_FILTER_MASK |\ - MMF_DISABLE_THP_MASK | MMF_HAS_MDWE_MASK |\ - MMF_VM_MERGE_ANY_MASK | MMF_TOPDOWN_MASK) + MMF_DISABLE_THP_MASK | MMF_DISABLE_MTHP_MASK |\ + MMF_HAS_MDWE_MASK | MMF_VM_MERGE_ANY_MASK |\ + MMF_TOPDOWN_MASK) static inline unsigned long mmf_init_flags(unsigned long flags) { diff --git a/include/uapi/linux/prctl.h b/include/uapi/linux/prctl.h index 35791791a879..584ac45f4ec8 100644 --- a/include/uapi/linux/prctl.h +++ b/include/uapi/linux/prctl.h @@ -178,6 +178,11 @@ struct prctl_mm_map { #define PR_GET_TID_ADDRESS 40 #define PR_SET_THP_DISABLE 41 +# define PR_DISABLE_ANON_MTHP (1UL << 1) +# define PR_DISABLE_SHMEM_MTHP (1UL << 2) +# define PR_DISABLE_FILE_MTHP (1UL << 3) +# define DISABLE_MTHP_ALL_MASK (PR_DISABLE_ANON_MTHP | PR_DISABLE_SHMEM_MTHP |\ + PR_DISABLE_FILE_MTHP) #define PR_GET_THP_DISABLE 42 /* diff --git a/kernel/sys.c b/kernel/sys.c index 3a2df1bd9f64..06f2b1de46a7 100644 --- a/kernel/sys.c +++ b/kernel/sys.c @@ -2627,17 +2627,41 @@ SYSCALL_DEFINE5(prctl, int, option, unsigned long, arg2, unsigned long, arg3, case PR_GET_THP_DISABLE: if (arg2 || arg3 || arg4 || arg5) return -EINVAL; - error = !!test_bit(MMF_DISABLE_THP, &me->mm->flags); + if (test_bit(MMF_DISABLE_THP, &me->mm->flags)) + error = 1; + if (test_bit(MMF_DISABLE_ANON_MTHP, &me->mm->flags)) + error |= PR_DISABLE_ANON_MTHP; + if (test_bit(MMF_DISABLE_SHMEM_MTHP, &me->mm->flags)) + error |= PR_DISABLE_SHMEM_MTHP; + if (test_bit(MMF_DISABLE_FILE_MTHP, &me->mm->flags)) + error |= PR_DISABLE_FILE_MTHP; break; case PR_SET_THP_DISABLE: - if (arg3 || arg4 || arg5) + if (arg4 || arg5) + return -EINVAL; + if (arg3 && (arg3 & ~DISABLE_MTHP_ALL_MASK)) return -EINVAL; if (mmap_write_lock_killable(me->mm)) return -EINTR; - if (arg2) - set_bit(MMF_DISABLE_THP, &me->mm->flags); - else - clear_bit(MMF_DISABLE_THP, &me->mm->flags); + if (arg2) { + if (!arg3) + set_bit(MMF_DISABLE_THP, &me->mm->flags); + if (arg3 & PR_DISABLE_ANON_MTHP) + set_bit(MMF_DISABLE_ANON_MTHP, &me->mm->flags); + if (arg3 & PR_DISABLE_SHMEM_MTHP) + set_bit(MMF_DISABLE_SHMEM_MTHP, &me->mm->flags); + if (arg3 & PR_DISABLE_FILE_MTHP) + set_bit(MMF_DISABLE_FILE_MTHP, &me->mm->flags); + } else { + if (!arg3) + clear_bit(MMF_DISABLE_THP, &me->mm->flags); + if (arg3 & PR_DISABLE_ANON_MTHP) + clear_bit(MMF_DISABLE_ANON_MTHP, &me->mm->flags); + if (arg3 & PR_DISABLE_SHMEM_MTHP) + clear_bit(MMF_DISABLE_SHMEM_MTHP, &me->mm->flags); + if (arg3 & PR_DISABLE_FILE_MTHP) + clear_bit(MMF_DISABLE_FILE_MTHP, &me->mm->flags); + } mmap_write_unlock(me->mm); break; case PR_MPX_ENABLE_MANAGEMENT: diff --git a/mm/shmem.c b/mm/shmem.c index 5a77acf6ac6a..f4272883df77 100644 --- a/mm/shmem.c +++ b/mm/shmem.c @@ -556,7 +556,9 @@ static bool __shmem_is_huge(struct inode *inode, pgoff_t index, if (!S_ISREG(inode->i_mode)) return false; - if (mm && ((vm_flags & VM_NOHUGEPAGE) || test_bit(MMF_DISABLE_THP, &mm->flags))) + if (mm && ((vm_flags & VM_NOHUGEPAGE) || + test_bit(MMF_DISABLE_THP, &mm->flags) || + test_bit(MMF_DISABLE_SHMEM_MTHP, &mm->flags))) return false; if (shmem_huge == SHMEM_HUGE_DENY) return false; @@ -1633,7 +1635,8 @@ unsigned long shmem_allowable_huge_orders(struct inode *inode, int order; if ((vm_flags & VM_NOHUGEPAGE) || - test_bit(MMF_DISABLE_THP, &vma->vm_mm->flags)) + test_bit(MMF_DISABLE_THP, &vma->vm_mm->flags) || + test_bit(MMF_DISABLE_SHMEM_MTHP, &vma->vm_mm->flags)) return 0; /* If the hardware/firmware marked hugepage support disabled. */

[RFC] mm: control mthp per process/cgroup

Commit Message

Comments

Patch