[GFS2] Add sync_page to metadata address space operations
[safe/jmp/linux-2.6] / fs / gfs2 / meta_io.c
1 /*
2  * Copyright (C) Sistina Software, Inc.  1997-2003 All rights reserved.
3  * Copyright (C) 2004-2006 Red Hat, Inc.  All rights reserved.
4  *
5  * This copyrighted material is made available to anyone wishing to use,
6  * modify, copy, or redistribute it subject to the terms and conditions
7  * of the GNU General Public License version 2.
8  */
9
10 #include <linux/sched.h>
11 #include <linux/slab.h>
12 #include <linux/spinlock.h>
13 #include <linux/completion.h>
14 #include <linux/buffer_head.h>
15 #include <linux/mm.h>
16 #include <linux/pagemap.h>
17 #include <linux/writeback.h>
18 #include <linux/swap.h>
19 #include <linux/delay.h>
20 #include <linux/bio.h>
21 #include <linux/gfs2_ondisk.h>
22 #include <linux/lm_interface.h>
23
24 #include "gfs2.h"
25 #include "incore.h"
26 #include "glock.h"
27 #include "glops.h"
28 #include "inode.h"
29 #include "log.h"
30 #include "lops.h"
31 #include "meta_io.h"
32 #include "rgrp.h"
33 #include "trans.h"
34 #include "util.h"
35 #include "ops_address.h"
36
37 static int aspace_get_block(struct inode *inode, sector_t lblock,
38                             struct buffer_head *bh_result, int create)
39 {
40         gfs2_assert_warn(inode->i_sb->s_fs_info, 0);
41         return -EOPNOTSUPP;
42 }
43
44 static int gfs2_aspace_writepage(struct page *page,
45                                  struct writeback_control *wbc)
46 {
47         return block_write_full_page(page, aspace_get_block, wbc);
48 }
49
50 static const struct address_space_operations aspace_aops = {
51         .writepage = gfs2_aspace_writepage,
52         .releasepage = gfs2_releasepage,
53         .sync_page = block_sync_page,
54 };
55
56 /**
57  * gfs2_aspace_get - Create and initialize a struct inode structure
58  * @sdp: the filesystem the aspace is in
59  *
60  * Right now a struct inode is just a struct inode.  Maybe Linux
61  * will supply a more lightweight address space construct (that works)
62  * in the future.
63  *
64  * Make sure pages/buffers in this aspace aren't in high memory.
65  *
66  * Returns: the aspace
67  */
68
69 struct inode *gfs2_aspace_get(struct gfs2_sbd *sdp)
70 {
71         struct inode *aspace;
72
73         aspace = new_inode(sdp->sd_vfs);
74         if (aspace) {
75                 mapping_set_gfp_mask(aspace->i_mapping, GFP_NOFS);
76                 aspace->i_mapping->a_ops = &aspace_aops;
77                 aspace->i_size = ~0ULL;
78                 aspace->i_private = NULL;
79                 insert_inode_hash(aspace);
80         }
81         return aspace;
82 }
83
84 void gfs2_aspace_put(struct inode *aspace)
85 {
86         remove_inode_hash(aspace);
87         iput(aspace);
88 }
89
90 /**
91  * gfs2_meta_inval - Invalidate all buffers associated with a glock
92  * @gl: the glock
93  *
94  */
95
96 void gfs2_meta_inval(struct gfs2_glock *gl)
97 {
98         struct gfs2_sbd *sdp = gl->gl_sbd;
99         struct inode *aspace = gl->gl_aspace;
100         struct address_space *mapping = gl->gl_aspace->i_mapping;
101
102         gfs2_assert_withdraw(sdp, !atomic_read(&gl->gl_ail_count));
103
104         atomic_inc(&aspace->i_writecount);
105         truncate_inode_pages(mapping, 0);
106         atomic_dec(&aspace->i_writecount);
107
108         gfs2_assert_withdraw(sdp, !mapping->nrpages);
109 }
110
111 /**
112  * gfs2_meta_sync - Sync all buffers associated with a glock
113  * @gl: The glock
114  *
115  */
116
117 void gfs2_meta_sync(struct gfs2_glock *gl)
118 {
119         struct address_space *mapping = gl->gl_aspace->i_mapping;
120         int error;
121
122         filemap_fdatawrite(mapping);
123         error = filemap_fdatawait(mapping);
124
125         if (error)
126                 gfs2_io_error(gl->gl_sbd);
127 }
128
129 /**
130  * getbuf - Get a buffer with a given address space
131  * @gl: the glock
132  * @blkno: the block number (filesystem scope)
133  * @create: 1 if the buffer should be created
134  *
135  * Returns: the buffer
136  */
137
138 static struct buffer_head *getbuf(struct gfs2_glock *gl, u64 blkno, int create)
139 {
140         struct address_space *mapping = gl->gl_aspace->i_mapping;
141         struct gfs2_sbd *sdp = gl->gl_sbd;
142         struct page *page;
143         struct buffer_head *bh;
144         unsigned int shift;
145         unsigned long index;
146         unsigned int bufnum;
147
148         shift = PAGE_CACHE_SHIFT - sdp->sd_sb.sb_bsize_shift;
149         index = blkno >> shift;             /* convert block to page */
150         bufnum = blkno - (index << shift);  /* block buf index within page */
151
152         if (create) {
153                 for (;;) {
154                         page = grab_cache_page(mapping, index);
155                         if (page)
156                                 break;
157                         yield();
158                 }
159         } else {
160                 page = find_lock_page(mapping, index);
161                 if (!page)
162                         return NULL;
163         }
164
165         if (!page_has_buffers(page))
166                 create_empty_buffers(page, sdp->sd_sb.sb_bsize, 0);
167
168         /* Locate header for our buffer within our page */
169         for (bh = page_buffers(page); bufnum--; bh = bh->b_this_page)
170                 /* Do nothing */;
171         get_bh(bh);
172
173         if (!buffer_mapped(bh))
174                 map_bh(bh, sdp->sd_vfs, blkno);
175
176         unlock_page(page);
177         mark_page_accessed(page);
178         page_cache_release(page);
179
180         return bh;
181 }
182
183 static void meta_prep_new(struct buffer_head *bh)
184 {
185         struct gfs2_meta_header *mh = (struct gfs2_meta_header *)bh->b_data;
186
187         lock_buffer(bh);
188         clear_buffer_dirty(bh);
189         set_buffer_uptodate(bh);
190         unlock_buffer(bh);
191
192         mh->mh_magic = cpu_to_be32(GFS2_MAGIC);
193 }
194
195 /**
196  * gfs2_meta_new - Get a block
197  * @gl: The glock associated with this block
198  * @blkno: The block number
199  *
200  * Returns: The buffer
201  */
202
203 struct buffer_head *gfs2_meta_new(struct gfs2_glock *gl, u64 blkno)
204 {
205         struct buffer_head *bh;
206         bh = getbuf(gl, blkno, CREATE);
207         meta_prep_new(bh);
208         return bh;
209 }
210
211 /**
212  * gfs2_meta_read - Read a block from disk
213  * @gl: The glock covering the block
214  * @blkno: The block number
215  * @flags: flags
216  * @bhp: the place where the buffer is returned (NULL on failure)
217  *
218  * Returns: errno
219  */
220
221 int gfs2_meta_read(struct gfs2_glock *gl, u64 blkno, int flags,
222                    struct buffer_head **bhp)
223 {
224         *bhp = getbuf(gl, blkno, CREATE);
225         if (!buffer_uptodate(*bhp))
226                 ll_rw_block(READ_META, 1, bhp);
227         if (flags & DIO_WAIT) {
228                 int error = gfs2_meta_wait(gl->gl_sbd, *bhp);
229                 if (error) {
230                         brelse(*bhp);
231                         return error;
232                 }
233         }
234
235         return 0;
236 }
237
238 /**
239  * gfs2_meta_wait - Reread a block from disk
240  * @sdp: the filesystem
241  * @bh: The block to wait for
242  *
243  * Returns: errno
244  */
245
246 int gfs2_meta_wait(struct gfs2_sbd *sdp, struct buffer_head *bh)
247 {
248         if (unlikely(test_bit(SDF_SHUTDOWN, &sdp->sd_flags)))
249                 return -EIO;
250
251         wait_on_buffer(bh);
252
253         if (!buffer_uptodate(bh)) {
254                 struct gfs2_trans *tr = current->journal_info;
255                 if (tr && tr->tr_touched)
256                         gfs2_io_error_bh(sdp, bh);
257                 return -EIO;
258         }
259         if (unlikely(test_bit(SDF_SHUTDOWN, &sdp->sd_flags)))
260                 return -EIO;
261
262         return 0;
263 }
264
265 /**
266  * gfs2_attach_bufdata - attach a struct gfs2_bufdata structure to a buffer
267  * @gl: the glock the buffer belongs to
268  * @bh: The buffer to be attached to
269  * @meta: Flag to indicate whether its metadata or not
270  */
271
272 void gfs2_attach_bufdata(struct gfs2_glock *gl, struct buffer_head *bh,
273                          int meta)
274 {
275         struct gfs2_bufdata *bd;
276
277         if (meta)
278                 lock_page(bh->b_page);
279
280         if (bh->b_private) {
281                 if (meta)
282                         unlock_page(bh->b_page);
283                 return;
284         }
285
286         bd = kmem_cache_zalloc(gfs2_bufdata_cachep, GFP_NOFS | __GFP_NOFAIL),
287         bd->bd_bh = bh;
288         bd->bd_gl = gl;
289
290         INIT_LIST_HEAD(&bd->bd_list_tr);
291         if (meta)
292                 lops_init_le(&bd->bd_le, &gfs2_buf_lops);
293         else
294                 lops_init_le(&bd->bd_le, &gfs2_databuf_lops);
295         bh->b_private = bd;
296
297         if (meta)
298                 unlock_page(bh->b_page);
299 }
300
301 void gfs2_remove_from_journal(struct buffer_head *bh, struct gfs2_trans *tr, int meta)
302 {
303         struct gfs2_sbd *sdp = GFS2_SB(bh->b_page->mapping->host);
304         struct gfs2_bufdata *bd = bh->b_private;
305         if (test_clear_buffer_pinned(bh)) {
306                 list_del_init(&bd->bd_le.le_list);
307                 if (meta) {
308                         gfs2_assert_warn(sdp, sdp->sd_log_num_buf);
309                         sdp->sd_log_num_buf--;
310                         tr->tr_num_buf_rm++;
311                 } else {
312                         gfs2_assert_warn(sdp, sdp->sd_log_num_databuf);
313                         sdp->sd_log_num_databuf--;
314                         tr->tr_num_databuf_rm++;
315                 }
316                 tr->tr_touched = 1;
317                 brelse(bh);
318         }
319         if (bd) {
320                 if (bd->bd_ail) {
321                         gfs2_remove_from_ail(bd);
322                         bh->b_private = NULL;
323                         bd->bd_bh = NULL;
324                         bd->bd_blkno = bh->b_blocknr;
325                         gfs2_trans_add_revoke(sdp, bd);
326                 }
327         }
328         clear_buffer_dirty(bh);
329         clear_buffer_uptodate(bh);
330 }
331
332 /**
333  * gfs2_meta_wipe - make inode's buffers so they aren't dirty/pinned anymore
334  * @ip: the inode who owns the buffers
335  * @bstart: the first buffer in the run
336  * @blen: the number of buffers in the run
337  *
338  */
339
340 void gfs2_meta_wipe(struct gfs2_inode *ip, u64 bstart, u32 blen)
341 {
342         struct gfs2_sbd *sdp = GFS2_SB(&ip->i_inode);
343         struct buffer_head *bh;
344
345         while (blen) {
346                 bh = getbuf(ip->i_gl, bstart, NO_CREATE);
347                 if (bh) {
348                         lock_buffer(bh);
349                         gfs2_log_lock(sdp);
350                         gfs2_remove_from_journal(bh, current->journal_info, 1);
351                         gfs2_log_unlock(sdp);
352                         unlock_buffer(bh);
353                         brelse(bh);
354                 }
355
356                 bstart++;
357                 blen--;
358         }
359 }
360
361 /**
362  * gfs2_meta_indirect_buffer - Get a metadata buffer
363  * @ip: The GFS2 inode
364  * @height: The level of this buf in the metadata (indir addr) tree (if any)
365  * @num: The block number (device relative) of the buffer
366  * @new: Non-zero if we may create a new buffer
367  * @bhp: the buffer is returned here
368  *
369  * Returns: errno
370  */
371
372 int gfs2_meta_indirect_buffer(struct gfs2_inode *ip, int height, u64 num,
373                               int new, struct buffer_head **bhp)
374 {
375         struct gfs2_sbd *sdp = GFS2_SB(&ip->i_inode);
376         struct gfs2_glock *gl = ip->i_gl;
377         struct buffer_head *bh;
378         int ret = 0;
379
380         if (new) {
381                 BUG_ON(height == 0);
382                 bh = gfs2_meta_new(gl, num);
383                 gfs2_trans_add_bh(ip->i_gl, bh, 1);
384                 gfs2_metatype_set(bh, GFS2_METATYPE_IN, GFS2_FORMAT_IN);
385                 gfs2_buffer_clear_tail(bh, sizeof(struct gfs2_meta_header));
386         } else {
387                 u32 mtype = height ? GFS2_METATYPE_IN : GFS2_METATYPE_DI;
388                 ret = gfs2_meta_read(gl, num, DIO_WAIT, &bh);
389                 if (ret == 0 && gfs2_metatype_check(sdp, bh, mtype)) {
390                         brelse(bh);
391                         ret = -EIO;
392                 }
393         }
394         *bhp = bh;
395         return ret;
396 }
397
398 /**
399  * gfs2_meta_ra - start readahead on an extent of a file
400  * @gl: the glock the blocks belong to
401  * @dblock: the starting disk block
402  * @extlen: the number of blocks in the extent
403  *
404  * returns: the first buffer in the extent
405  */
406
407 struct buffer_head *gfs2_meta_ra(struct gfs2_glock *gl, u64 dblock, u32 extlen)
408 {
409         struct gfs2_sbd *sdp = gl->gl_sbd;
410         struct buffer_head *first_bh, *bh;
411         u32 max_ra = gfs2_tune_get(sdp, gt_max_readahead) >>
412                           sdp->sd_sb.sb_bsize_shift;
413
414         BUG_ON(!extlen);
415
416         if (max_ra < 1)
417                 max_ra = 1;
418         if (extlen > max_ra)
419                 extlen = max_ra;
420
421         first_bh = getbuf(gl, dblock, CREATE);
422
423         if (buffer_uptodate(first_bh))
424                 goto out;
425         if (!buffer_locked(first_bh))
426                 ll_rw_block(READ_META, 1, &first_bh);
427
428         dblock++;
429         extlen--;
430
431         while (extlen) {
432                 bh = getbuf(gl, dblock, CREATE);
433
434                 if (!buffer_uptodate(bh) && !buffer_locked(bh))
435                         ll_rw_block(READA, 1, &bh);
436                 brelse(bh);
437                 dblock++;
438                 extlen--;
439                 if (!buffer_locked(first_bh) && buffer_uptodate(first_bh))
440                         goto out;
441         }
442
443         wait_on_buffer(first_bh);
444 out:
445         return first_bh;
446 }
447