[07/21] btrfs: lock extents while truncating

Message ID	831366e1026ea504f319f600cef7e0e835aacdb2.1677793433.git.rgoldwyn@suse.com (mailing list archive)
State	New, archived
Headers	show Return-Path: <linux-btrfs-owner@vger.kernel.org> From: Goldwyn Rodrigues <rgoldwyn@suse.de> To: linux-btrfs@vger.kernel.org Cc: Goldwyn Rodrigues <rgoldwyn@suse.com> Subject: [PATCH 07/21] btrfs: lock extents while truncating Date: Thu, 2 Mar 2023 16:24:52 -0600 Message-Id: <831366e1026ea504f319f600cef7e0e835aacdb2.1677793433.git.rgoldwyn@suse.com> In-Reply-To: <cover.1677793433.git.rgoldwyn@suse.com> References: <cover.1677793433.git.rgoldwyn@suse.com> MIME-Version: 1.0 Content-Transfer-Encoding: 8bit Precedence: bulk
Series	Lock extents before pages \| expand [00/21] Lock extents before pages [01/21] fs: readahead_begin() to call before locking folio [02/21] btrfs: add WARN_ON() on incorrect lock range [03/21] btrfs: Add start < end check in btrfs_debug_check_extent_io_range() [04/21] btrfs: make btrfs_qgroup_flush() non-static [05/21] btrfs: Lock extents before pages for buffered write() [06/21] btrfs: wait ordered range before locking during truncate [07/21] btrfs: lock extents while truncating [08/21] btrfs: no need to lock extent while performing invalidate_folio() [09/21] btrfs: lock extents before folio for read()s [10/21] btrfs: lock extents before pages in writepages [11/21] btrfs: locking extents for async writeback [12/21] btrfs: lock extents before pages - defrag [13/21] btrfs: Perform memory faults under locked extent [14/21] btrfs: writepage fixup lock rearrangement [15/21] btrfs: lock extent before pages for encoded read ioctls [16/21] btrfs: lock extent before pages in encoded write [17/21] btrfs: btree_writepages lock extents before pages [18/21] btrfs: check if writeback pages exist before starting writeback [19/21] btrfs: lock extents before pages in relocation [20/21] btrfs: Add inode->i_count instead of calling ihold() [21/21] btrfs: debug extent locking

diff --git a/fs/btrfs/file.c b/fs/btrfs/file.c index a2f8f566cfbf..2e835096e3ce 100644 --- a/fs/btrfs/file.c +++ b/fs/btrfs/file.c @@ -2165,10 +2165,10 @@ static void btrfs_punch_hole_lock_range(struct inode *inode, const u64 page_lockend = round_down(lockend + 1, PAGE_SIZE) - 1; while (1) { - truncate_pagecache_range(inode, lockstart, lockend); - lock_extent(&BTRFS_I(inode)->io_tree, lockstart, lockend, cached_state); + + truncate_pagecache_range(inode, lockstart, lockend); /* * We can't have ordered extents in the range, nor dirty/writeback * pages, because we have locked the inode's VFS lock in exclusive diff --git a/fs/btrfs/inode.c b/fs/btrfs/inode.c index 02307789b0a8..2816629fafe4 100644 --- a/fs/btrfs/inode.c +++ b/fs/btrfs/inode.c @@ -4757,7 +4757,6 @@ int btrfs_truncate_block(struct btrfs_inode *inode, loff_t from, loff_t len, { struct btrfs_fs_info *fs_info = inode->root->fs_info; struct address_space *mapping = inode->vfs_inode.i_mapping; - struct extent_io_tree *io_tree = &inode->io_tree; struct btrfs_ordered_extent *ordered; struct extent_state *cached_state = NULL; struct extent_changeset *data_reserved = NULL; @@ -4789,7 +4788,7 @@ int btrfs_truncate_block(struct btrfs_inode *inode, loff_t from, loff_t len, goto out; } } - ret = btrfs_delalloc_reserve_metadata(inode, blocksize, blocksize, false); + ret = btrfs_delalloc_reserve_metadata(inode, blocksize, blocksize, true); if (ret < 0) { if (!only_release_metadata) btrfs_free_reserved_data_space(inode, data_reserved, @@ -4824,11 +4823,8 @@ int btrfs_truncate_block(struct btrfs_inode *inode, loff_t from, loff_t len, } wait_on_page_writeback(page); - lock_extent(io_tree, block_start, block_end, &cached_state); - ordered = btrfs_lookup_ordered_extent(inode, block_start); if (ordered) { - unlock_extent(io_tree, block_start, block_end, &cached_state); unlock_page(page); put_page(page); btrfs_start_ordered_extent(ordered); @@ -4842,10 +4838,8 @@ int btrfs_truncate_block(struct btrfs_inode *inode, loff_t from, loff_t len, ret = btrfs_set_extent_delalloc(inode, block_start, block_end, 0, &cached_state); - if (ret) { - unlock_extent(io_tree, block_start, block_end, &cached_state); + if (ret) goto out_unlock; - } if (offset != blocksize) { if (!len) @@ -4860,7 +4854,6 @@ int btrfs_truncate_block(struct btrfs_inode *inode, loff_t from, loff_t len, btrfs_page_clear_checked(fs_info, page, block_start, block_end + 1 - block_start); btrfs_page_set_dirty(fs_info, page, block_start, block_end + 1 - block_start); - unlock_extent(io_tree, block_start, block_end, &cached_state); if (only_release_metadata) set_extent_bit(&inode->io_tree, block_start, block_end, @@ -4952,6 +4945,13 @@ int btrfs_cont_expand(struct btrfs_inode *inode, loff_t oldsize, loff_t size) u64 hole_size; int err = 0; + /* + * Check so that no erroneous nodes are created in locking trees + * when hole_start and block_end are equal. + */ + if (hole_start != block_end) + btrfs_lock_and_flush_ordered_range(inode, hole_start, block_end - 1, &cached_state); + /* * If our size started in the middle of a block we need to zero out the * rest of the block before we expand the i_size, otherwise we could @@ -4959,13 +4959,11 @@ int btrfs_cont_expand(struct btrfs_inode *inode, loff_t oldsize, loff_t size) */ err = btrfs_truncate_block(inode, oldsize, 0, 0); if (err) - return err; + goto out; if (size <= hole_start) - return 0; + goto out; - btrfs_lock_and_flush_ordered_range(inode, hole_start, block_end - 1, - &cached_state); cur_offset = hole_start; while (1) { em = btrfs_get_extent(inode, NULL, 0, cur_offset, @@ -5027,7 +5025,9 @@ int btrfs_cont_expand(struct btrfs_inode *inode, loff_t oldsize, loff_t size) break; } free_extent_map(em); - unlock_extent(io_tree, hole_start, block_end - 1, &cached_state); +out: + if (hole_start != block_end) + unlock_extent(io_tree, hole_start, block_end - 1, &cached_state); return err; } @@ -5039,6 +5039,7 @@ static int btrfs_setsize(struct inode *inode, struct iattr *attr) loff_t newsize = attr->ia_size; int mask = attr->ia_valid; int ret; + bool flushed = false; /* * The regular truncate() case without ATTR_CTIME and ATTR_MTIME is a @@ -5083,6 +5084,9 @@ static int btrfs_setsize(struct inode *inode, struct iattr *attr) btrfs_end_transaction(trans); } else { struct btrfs_fs_info *fs_info = btrfs_sb(inode->i_sb); + u64 start = round_down(newsize, fs_info->sectorsize); + u64 end = round_up(oldsize, fs_info->sectorsize) - 1; + struct extent_state **cached = NULL; if (btrfs_is_zoned(fs_info) || (newsize < oldsize)) { ret = btrfs_wait_ordered_range(inode, @@ -5100,12 +5104,22 @@ static int btrfs_setsize(struct inode *inode, struct iattr *attr) if (newsize == 0) set_bit(BTRFS_INODE_FLUSH_ON_CLOSE, &BTRFS_I(inode)->runtime_flags); - +again: + if (start < end) + lock_extent(&BTRFS_I(inode)->io_tree, start, end, cached); truncate_setsize(inode, newsize); inode_dio_wait(inode); ret = btrfs_truncate(BTRFS_I(inode)); + if (start < end) + unlock_extent(&BTRFS_I(inode)->io_tree, start, end, cached); + + if (ret == -EDQUOT && !flushed) { + flushed = true; + btrfs_qgroup_flush(BTRFS_I(inode)->root); + goto again; + } if (ret && inode->i_nlink) { int err; @@ -7956,9 +7970,6 @@ static void btrfs_invalidate_folio(struct folio *folio, size_t offset, return; } - if (!inode_evicting) - lock_extent(tree, page_start, page_end, &cached_state); - cur = page_start; while (cur < page_end) { struct btrfs_ordered_extent *ordered; @@ -8059,7 +8070,7 @@ static void btrfs_invalidate_folio(struct folio *folio, size_t offset, */ btrfs_qgroup_free_data(inode, NULL, cur, range_end + 1 - cur); if (!inode_evicting) { - clear_extent_bit(tree, cur, range_end, EXTENT_LOCKED | + clear_extent_bit(tree, cur, range_end, EXTENT_DELALLOC | EXTENT_UPTODATE | EXTENT_DO_ACCOUNTING | EXTENT_DEFRAG | extra_flags, &cached_state); @@ -8309,12 +8320,9 @@ static int btrfs_truncate(struct btrfs_inode *inode) trans->block_rsv = rsv; while (1) { - struct extent_state *cached_state = NULL; const u64 new_size = inode->vfs_inode.i_size; - const u64 lock_start = ALIGN_DOWN(new_size, fs_info->sectorsize); control.new_size = new_size; - lock_extent(&inode->io_tree, lock_start, (u64)-1, &cached_state); /* * We want to drop from the next block forward in case this new * size is not block aligned since we will be keeping the last @@ -8329,8 +8337,6 @@ static int btrfs_truncate(struct btrfs_inode *inode) inode_sub_bytes(&inode->vfs_inode, control.sub_bytes); btrfs_inode_safe_disk_i_size_write(inode, control.last_size); - unlock_extent(&inode->io_tree, lock_start, (u64)-1, &cached_state); - trans->block_rsv = &fs_info->trans_block_rsv; if (ret != -ENOSPC && ret != -EAGAIN) break;

[07/21] btrfs: lock extents while truncating

Commit Message

Patch