dd93fd39c56a0e6e838f11d57484c2b2acc89443
[safe/jmp/linux-2.6] / fs / xfs / xfs_btree.h
1 /*
2  * Copyright (c) 2000-2001,2005 Silicon Graphics, Inc.
3  * All Rights Reserved.
4  *
5  * This program is free software; you can redistribute it and/or
6  * modify it under the terms of the GNU General Public License as
7  * published by the Free Software Foundation.
8  *
9  * This program is distributed in the hope that it would be useful,
10  * but WITHOUT ANY WARRANTY; without even the implied warranty of
11  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12  * GNU General Public License for more details.
13  *
14  * You should have received a copy of the GNU General Public License
15  * along with this program; if not, write the Free Software Foundation,
16  * Inc.,  51 Franklin St, Fifth Floor, Boston, MA  02110-1301  USA
17  */
18 #ifndef __XFS_BTREE_H__
19 #define __XFS_BTREE_H__
20
21 struct xfs_buf;
22 struct xfs_bmap_free;
23 struct xfs_inode;
24 struct xfs_mount;
25 struct xfs_trans;
26
27 extern kmem_zone_t      *xfs_btree_cur_zone;
28
29 /*
30  * This nonsense is to make -wlint happy.
31  */
32 #define XFS_LOOKUP_EQ   ((xfs_lookup_t)XFS_LOOKUP_EQi)
33 #define XFS_LOOKUP_LE   ((xfs_lookup_t)XFS_LOOKUP_LEi)
34 #define XFS_LOOKUP_GE   ((xfs_lookup_t)XFS_LOOKUP_GEi)
35
36 #define XFS_BTNUM_BNO   ((xfs_btnum_t)XFS_BTNUM_BNOi)
37 #define XFS_BTNUM_CNT   ((xfs_btnum_t)XFS_BTNUM_CNTi)
38 #define XFS_BTNUM_BMAP  ((xfs_btnum_t)XFS_BTNUM_BMAPi)
39 #define XFS_BTNUM_INO   ((xfs_btnum_t)XFS_BTNUM_INOi)
40
41 /*
42  * Short form header: space allocation btrees.
43  */
44 typedef struct xfs_btree_sblock {
45         __be32          bb_magic;       /* magic number for block type */
46         __be16          bb_level;       /* 0 is a leaf */
47         __be16          bb_numrecs;     /* current # of data records */
48         __be32          bb_leftsib;     /* left sibling block or NULLAGBLOCK */
49         __be32          bb_rightsib;    /* right sibling block or NULLAGBLOCK */
50 } xfs_btree_sblock_t;
51
52 /*
53  * Long form header: bmap btrees.
54  */
55 typedef struct xfs_btree_lblock {
56         __be32          bb_magic;       /* magic number for block type */
57         __be16          bb_level;       /* 0 is a leaf */
58         __be16          bb_numrecs;     /* current # of data records */
59         __be64          bb_leftsib;     /* left sibling block or NULLDFSBNO */
60         __be64          bb_rightsib;    /* right sibling block or NULLDFSBNO */
61 } xfs_btree_lblock_t;
62
63 /*
64  * Combined header and structure, used by common code.
65  */
66 typedef struct xfs_btree_block {
67         __be32          bb_magic;       /* magic number for block type */
68         __be16          bb_level;       /* 0 is a leaf */
69         __be16          bb_numrecs;     /* current # of data records */
70         union {
71                 struct {
72                         __be32          bb_leftsib;
73                         __be32          bb_rightsib;
74                 } s;                    /* short form pointers */
75                 struct  {
76                         __be64          bb_leftsib;
77                         __be64          bb_rightsib;
78                 } l;                    /* long form pointers */
79         } bb_u;                         /* rest */
80 } xfs_btree_block_t;
81
82 /*
83  * Generic key, ptr and record wrapper structures.
84  *
85  * These are disk format structures, and are converted where necessary
86  * by the btree specific code that needs to interpret them.
87  */
88 union xfs_btree_ptr {
89         __be32                  s;      /* short form ptr */
90         __be64                  l;      /* long form ptr */
91 };
92
93 union xfs_btree_key {
94         xfs_bmbt_key_t          bmbt;
95         xfs_bmdr_key_t          bmbr;   /* bmbt root block */
96         xfs_alloc_key_t         alloc;
97         xfs_inobt_key_t         inobt;
98 };
99
100 union xfs_btree_rec {
101         xfs_bmbt_rec_t          bmbt;
102         xfs_bmdr_rec_t          bmbr;   /* bmbt root block */
103         xfs_alloc_rec_t         alloc;
104         xfs_inobt_rec_t         inobt;
105 };
106
107 /*
108  * For logging record fields.
109  */
110 #define XFS_BB_MAGIC            0x01
111 #define XFS_BB_LEVEL            0x02
112 #define XFS_BB_NUMRECS          0x04
113 #define XFS_BB_LEFTSIB          0x08
114 #define XFS_BB_RIGHTSIB         0x10
115 #define XFS_BB_NUM_BITS         5
116 #define XFS_BB_ALL_BITS         ((1 << XFS_BB_NUM_BITS) - 1)
117
118 /*
119  * Magic numbers for btree blocks.
120  */
121 extern const __uint32_t xfs_magics[];
122
123 /*
124  * Maximum and minimum records in a btree block.
125  * Given block size, type prefix, and leaf flag (0 or 1).
126  * The divisor below is equivalent to lf ? (e1) : (e2) but that produces
127  * compiler warnings.
128  */
129 #define XFS_BTREE_BLOCK_MAXRECS(bsz,t,lf)       \
130         ((int)(((bsz) - (uint)sizeof(t ## _block_t)) / \
131          (((lf) * (uint)sizeof(t ## _rec_t)) + \
132           ((1 - (lf)) * \
133            ((uint)sizeof(t ## _key_t) + (uint)sizeof(t ## _ptr_t))))))
134 #define XFS_BTREE_BLOCK_MINRECS(bsz,t,lf)       \
135         (XFS_BTREE_BLOCK_MAXRECS(bsz,t,lf) / 2)
136
137 /*
138  * Record, key, and pointer address calculation macros.
139  * Given block size, type prefix, block pointer, and index of requested entry
140  * (first entry numbered 1).
141  */
142 #define XFS_BTREE_REC_ADDR(t,bb,i)      \
143         ((t ## _rec_t *)((char *)(bb) + sizeof(t ## _block_t) + \
144          ((i) - 1) * sizeof(t ## _rec_t)))
145 #define XFS_BTREE_KEY_ADDR(t,bb,i)      \
146         ((t ## _key_t *)((char *)(bb) + sizeof(t ## _block_t) + \
147          ((i) - 1) * sizeof(t ## _key_t)))
148 #define XFS_BTREE_PTR_ADDR(t,bb,i,mxr)  \
149         ((t ## _ptr_t *)((char *)(bb) + sizeof(t ## _block_t) + \
150          (mxr) * sizeof(t ## _key_t) + ((i) - 1) * sizeof(t ## _ptr_t)))
151
152 #define XFS_BTREE_MAXLEVELS     8       /* max of all btrees */
153
154 struct xfs_btree_ops {
155         /* cursor operations */
156         struct xfs_btree_cur *(*dup_cursor)(struct xfs_btree_cur *);
157 };
158
159 /*
160  * Btree cursor structure.
161  * This collects all information needed by the btree code in one place.
162  */
163 typedef struct xfs_btree_cur
164 {
165         struct xfs_trans        *bc_tp; /* transaction we're in, if any */
166         struct xfs_mount        *bc_mp; /* file system mount struct */
167         const struct xfs_btree_ops *bc_ops;
168         uint                    bc_flags; /* btree features - below */
169         union {
170                 xfs_alloc_rec_incore_t  a;
171                 xfs_bmbt_irec_t         b;
172                 xfs_inobt_rec_incore_t  i;
173         }               bc_rec;         /* current insert/search record value */
174         struct xfs_buf  *bc_bufs[XFS_BTREE_MAXLEVELS];  /* buf ptr per level */
175         int             bc_ptrs[XFS_BTREE_MAXLEVELS];   /* key/record # */
176         __uint8_t       bc_ra[XFS_BTREE_MAXLEVELS];     /* readahead bits */
177 #define XFS_BTCUR_LEFTRA        1       /* left sibling has been read-ahead */
178 #define XFS_BTCUR_RIGHTRA       2       /* right sibling has been read-ahead */
179         __uint8_t       bc_nlevels;     /* number of levels in the tree */
180         __uint8_t       bc_blocklog;    /* log2(blocksize) of btree blocks */
181         xfs_btnum_t     bc_btnum;       /* identifies which btree type */
182         union {
183                 struct {                        /* needed for BNO, CNT, INO */
184                         struct xfs_buf  *agbp;  /* agf/agi buffer pointer */
185                         xfs_agnumber_t  agno;   /* ag number */
186                 } a;
187                 struct {                        /* needed for BMAP */
188                         struct xfs_inode *ip;   /* pointer to our inode */
189                         struct xfs_bmap_free *flist;    /* list to free after */
190                         xfs_fsblock_t   firstblock;     /* 1st blk allocated */
191                         int             allocated;      /* count of alloced */
192                         short           forksize;       /* fork's inode space */
193                         char            whichfork;      /* data or attr fork */
194                         char            flags;          /* flags */
195 #define XFS_BTCUR_BPRV_WASDEL   1                       /* was delayed */
196                 } b;
197         }               bc_private;     /* per-btree type data */
198 } xfs_btree_cur_t;
199
200 /* cursor flags */
201 #define XFS_BTREE_LONG_PTRS             (1<<0)  /* pointers are 64bits long */
202 #define XFS_BTREE_ROOT_IN_INODE         (1<<1)  /* root may be variable size */
203
204
205 #define XFS_BTREE_NOERROR       0
206 #define XFS_BTREE_ERROR         1
207
208 /*
209  * Convert from buffer to btree block header.
210  */
211 #define XFS_BUF_TO_BLOCK(bp)    ((xfs_btree_block_t *)XFS_BUF_PTR(bp))
212 #define XFS_BUF_TO_LBLOCK(bp)   ((xfs_btree_lblock_t *)XFS_BUF_PTR(bp))
213 #define XFS_BUF_TO_SBLOCK(bp)   ((xfs_btree_sblock_t *)XFS_BUF_PTR(bp))
214
215
216 #ifdef __KERNEL__
217
218 #ifdef DEBUG
219 /*
220  * Debug routine: check that block header is ok.
221  */
222 void
223 xfs_btree_check_block(
224         xfs_btree_cur_t         *cur,   /* btree cursor */
225         xfs_btree_block_t       *block, /* generic btree block pointer */
226         int                     level,  /* level of the btree block */
227         struct xfs_buf          *bp);   /* buffer containing block, if any */
228
229 /*
230  * Debug routine: check that keys are in the right order.
231  */
232 void
233 xfs_btree_check_key(
234         xfs_btnum_t             btnum,  /* btree identifier */
235         void                    *ak1,   /* pointer to left (lower) key */
236         void                    *ak2);  /* pointer to right (higher) key */
237
238 /*
239  * Debug routine: check that records are in the right order.
240  */
241 void
242 xfs_btree_check_rec(
243         xfs_btnum_t             btnum,  /* btree identifier */
244         void                    *ar1,   /* pointer to left (lower) record */
245         void                    *ar2);  /* pointer to right (higher) record */
246 #else
247 #define xfs_btree_check_block(a,b,c,d)
248 #define xfs_btree_check_key(a,b,c)
249 #define xfs_btree_check_rec(a,b,c)
250 #endif  /* DEBUG */
251
252 /*
253  * Checking routine: check that long form block header is ok.
254  */
255 int                                     /* error (0 or EFSCORRUPTED) */
256 xfs_btree_check_lblock(
257         xfs_btree_cur_t         *cur,   /* btree cursor */
258         xfs_btree_lblock_t      *block, /* btree long form block pointer */
259         int                     level,  /* level of the btree block */
260         struct xfs_buf          *bp);   /* buffer containing block, if any */
261
262 /*
263  * Checking routine: check that (long) pointer is ok.
264  */
265 int                                     /* error (0 or EFSCORRUPTED) */
266 xfs_btree_check_lptr(
267         xfs_btree_cur_t         *cur,   /* btree cursor */
268         xfs_dfsbno_t            ptr,    /* btree block disk address */
269         int                     level); /* btree block level */
270
271 #define xfs_btree_check_lptr_disk(cur, ptr, level) \
272         xfs_btree_check_lptr(cur, be64_to_cpu(ptr), level)
273
274 /*
275  * Checking routine: check that short form block header is ok.
276  */
277 int                                     /* error (0 or EFSCORRUPTED) */
278 xfs_btree_check_sblock(
279         xfs_btree_cur_t         *cur,   /* btree cursor */
280         xfs_btree_sblock_t      *block, /* btree short form block pointer */
281         int                     level,  /* level of the btree block */
282         struct xfs_buf          *bp);   /* buffer containing block */
283
284 /*
285  * Checking routine: check that (short) pointer is ok.
286  */
287 int                                     /* error (0 or EFSCORRUPTED) */
288 xfs_btree_check_sptr(
289         xfs_btree_cur_t         *cur,   /* btree cursor */
290         xfs_agblock_t           ptr,    /* btree block disk address */
291         int                     level); /* btree block level */
292
293 /*
294  * Delete the btree cursor.
295  */
296 void
297 xfs_btree_del_cursor(
298         xfs_btree_cur_t         *cur,   /* btree cursor */
299         int                     error); /* del because of error */
300
301 /*
302  * Duplicate the btree cursor.
303  * Allocate a new one, copy the record, re-get the buffers.
304  */
305 int                                     /* error */
306 xfs_btree_dup_cursor(
307         xfs_btree_cur_t         *cur,   /* input cursor */
308         xfs_btree_cur_t         **ncur);/* output cursor */
309
310 /*
311  * Change the cursor to point to the first record in the current block
312  * at the given level.  Other levels are unaffected.
313  */
314 int                                     /* success=1, failure=0 */
315 xfs_btree_firstrec(
316         xfs_btree_cur_t         *cur,   /* btree cursor */
317         int                     level); /* level to change */
318
319 /*
320  * Get a buffer for the block, return it with no data read.
321  * Long-form addressing.
322  */
323 struct xfs_buf *                                /* buffer for fsbno */
324 xfs_btree_get_bufl(
325         struct xfs_mount        *mp,    /* file system mount point */
326         struct xfs_trans        *tp,    /* transaction pointer */
327         xfs_fsblock_t           fsbno,  /* file system block number */
328         uint                    lock);  /* lock flags for get_buf */
329
330 /*
331  * Get a buffer for the block, return it with no data read.
332  * Short-form addressing.
333  */
334 struct xfs_buf *                                /* buffer for agno/agbno */
335 xfs_btree_get_bufs(
336         struct xfs_mount        *mp,    /* file system mount point */
337         struct xfs_trans        *tp,    /* transaction pointer */
338         xfs_agnumber_t          agno,   /* allocation group number */
339         xfs_agblock_t           agbno,  /* allocation group block number */
340         uint                    lock);  /* lock flags for get_buf */
341
342 /*
343  * Check for the cursor referring to the last block at the given level.
344  */
345 int                                     /* 1=is last block, 0=not last block */
346 xfs_btree_islastblock(
347         xfs_btree_cur_t         *cur,   /* btree cursor */
348         int                     level); /* level to check */
349
350 /*
351  * Change the cursor to point to the last record in the current block
352  * at the given level.  Other levels are unaffected.
353  */
354 int                                     /* success=1, failure=0 */
355 xfs_btree_lastrec(
356         xfs_btree_cur_t         *cur,   /* btree cursor */
357         int                     level); /* level to change */
358
359 /*
360  * Compute first and last byte offsets for the fields given.
361  * Interprets the offsets table, which contains struct field offsets.
362  */
363 void
364 xfs_btree_offsets(
365         __int64_t               fields, /* bitmask of fields */
366         const short             *offsets,/* table of field offsets */
367         int                     nbits,  /* number of bits to inspect */
368         int                     *first, /* output: first byte offset */
369         int                     *last); /* output: last byte offset */
370
371 /*
372  * Get a buffer for the block, return it read in.
373  * Long-form addressing.
374  */
375 int                                     /* error */
376 xfs_btree_read_bufl(
377         struct xfs_mount        *mp,    /* file system mount point */
378         struct xfs_trans        *tp,    /* transaction pointer */
379         xfs_fsblock_t           fsbno,  /* file system block number */
380         uint                    lock,   /* lock flags for read_buf */
381         struct xfs_buf          **bpp,  /* buffer for fsbno */
382         int                     refval);/* ref count value for buffer */
383
384 /*
385  * Get a buffer for the block, return it read in.
386  * Short-form addressing.
387  */
388 int                                     /* error */
389 xfs_btree_read_bufs(
390         struct xfs_mount        *mp,    /* file system mount point */
391         struct xfs_trans        *tp,    /* transaction pointer */
392         xfs_agnumber_t          agno,   /* allocation group number */
393         xfs_agblock_t           agbno,  /* allocation group block number */
394         uint                    lock,   /* lock flags for read_buf */
395         struct xfs_buf          **bpp,  /* buffer for agno/agbno */
396         int                     refval);/* ref count value for buffer */
397
398 /*
399  * Read-ahead the block, don't wait for it, don't return a buffer.
400  * Long-form addressing.
401  */
402 void                                    /* error */
403 xfs_btree_reada_bufl(
404         struct xfs_mount        *mp,    /* file system mount point */
405         xfs_fsblock_t           fsbno,  /* file system block number */
406         xfs_extlen_t            count); /* count of filesystem blocks */
407
408 /*
409  * Read-ahead the block, don't wait for it, don't return a buffer.
410  * Short-form addressing.
411  */
412 void                                    /* error */
413 xfs_btree_reada_bufs(
414         struct xfs_mount        *mp,    /* file system mount point */
415         xfs_agnumber_t          agno,   /* allocation group number */
416         xfs_agblock_t           agbno,  /* allocation group block number */
417         xfs_extlen_t            count); /* count of filesystem blocks */
418
419 /*
420  * Read-ahead btree blocks, at the given level.
421  * Bits in lr are set from XFS_BTCUR_{LEFT,RIGHT}RA.
422  */
423 int                                     /* readahead block count */
424 xfs_btree_readahead_core(
425         xfs_btree_cur_t         *cur,   /* btree cursor */
426         int                     lev,    /* level in btree */
427         int                     lr);    /* left/right bits */
428
429 static inline int                       /* readahead block count */
430 xfs_btree_readahead(
431         xfs_btree_cur_t         *cur,   /* btree cursor */
432         int                     lev,    /* level in btree */
433         int                     lr)     /* left/right bits */
434 {
435         if ((cur->bc_ra[lev] | lr) == cur->bc_ra[lev])
436                 return 0;
437
438         return xfs_btree_readahead_core(cur, lev, lr);
439 }
440
441
442 /*
443  * Set the buffer for level "lev" in the cursor to bp, releasing
444  * any previous buffer.
445  */
446 void
447 xfs_btree_setbuf(
448         xfs_btree_cur_t         *cur,   /* btree cursor */
449         int                     lev,    /* level in btree */
450         struct xfs_buf          *bp);   /* new buffer to set */
451
452 #endif  /* __KERNEL__ */
453
454
455 /*
456  * Min and max functions for extlen, agblock, fileoff, and filblks types.
457  */
458 #define XFS_EXTLEN_MIN(a,b)     min_t(xfs_extlen_t, (a), (b))
459 #define XFS_EXTLEN_MAX(a,b)     max_t(xfs_extlen_t, (a), (b))
460 #define XFS_AGBLOCK_MIN(a,b)    min_t(xfs_agblock_t, (a), (b))
461 #define XFS_AGBLOCK_MAX(a,b)    max_t(xfs_agblock_t, (a), (b))
462 #define XFS_FILEOFF_MIN(a,b)    min_t(xfs_fileoff_t, (a), (b))
463 #define XFS_FILEOFF_MAX(a,b)    max_t(xfs_fileoff_t, (a), (b))
464 #define XFS_FILBLKS_MIN(a,b)    min_t(xfs_filblks_t, (a), (b))
465 #define XFS_FILBLKS_MAX(a,b)    max_t(xfs_filblks_t, (a), (b))
466
467 #define XFS_FSB_SANITY_CHECK(mp,fsb)    \
468         (XFS_FSB_TO_AGNO(mp, fsb) < mp->m_sb.sb_agcount && \
469                 XFS_FSB_TO_AGBNO(mp, fsb) < mp->m_sb.sb_agblocks)
470
471 #endif  /* __XFS_BTREE_H__ */