[GFS2] Journal extent mapping
[safe/jmp/linux-2.6] / fs / gfs2 / incore.h
1 /*
2  * Copyright (C) Sistina Software, Inc.  1997-2003 All rights reserved.
3  * Copyright (C) 2004-2007 Red Hat, Inc.  All rights reserved.
4  *
5  * This copyrighted material is made available to anyone wishing to use,
6  * modify, copy, or redistribute it subject to the terms and conditions
7  * of the GNU General Public License version 2.
8  */
9
10 #ifndef __INCORE_DOT_H__
11 #define __INCORE_DOT_H__
12
13 #include <linux/fs.h>
14 #include <linux/workqueue.h>
15
16 #define DIO_WAIT        0x00000010
17 #define DIO_METADATA    0x00000020
18 #define DIO_ALL         0x00000100
19
20 struct gfs2_log_operations;
21 struct gfs2_log_element;
22 struct gfs2_holder;
23 struct gfs2_glock;
24 struct gfs2_quota_data;
25 struct gfs2_trans;
26 struct gfs2_ail;
27 struct gfs2_jdesc;
28 struct gfs2_sbd;
29
30 typedef void (*gfs2_glop_bh_t) (struct gfs2_glock *gl, unsigned int ret);
31
32 struct gfs2_log_header_host {
33         u64 lh_sequence;        /* Sequence number of this transaction */
34         u32 lh_flags;           /* GFS2_LOG_HEAD_... */
35         u32 lh_tail;            /* Block number of log tail */
36         u32 lh_blkno;
37         u32 lh_hash;
38 };
39
40 /*
41  * Structure of operations that are associated with each
42  * type of element in the log.
43  */
44
45 struct gfs2_log_operations {
46         void (*lo_add) (struct gfs2_sbd *sdp, struct gfs2_log_element *le);
47         void (*lo_incore_commit) (struct gfs2_sbd *sdp, struct gfs2_trans *tr);
48         void (*lo_before_commit) (struct gfs2_sbd *sdp);
49         void (*lo_after_commit) (struct gfs2_sbd *sdp, struct gfs2_ail *ai);
50         void (*lo_before_scan) (struct gfs2_jdesc *jd,
51                                 struct gfs2_log_header_host *head, int pass);
52         int (*lo_scan_elements) (struct gfs2_jdesc *jd, unsigned int start,
53                                  struct gfs2_log_descriptor *ld, __be64 *ptr,
54                                  int pass);
55         void (*lo_after_scan) (struct gfs2_jdesc *jd, int error, int pass);
56         const char *lo_name;
57 };
58
59 struct gfs2_log_element {
60         struct list_head le_list;
61         const struct gfs2_log_operations *le_ops;
62 };
63
64 struct gfs2_bitmap {
65         struct buffer_head *bi_bh;
66         char *bi_clone;
67         u32 bi_offset;
68         u32 bi_start;
69         u32 bi_len;
70 };
71
72 struct gfs2_rgrp_host {
73         u32 rg_flags;
74         u32 rg_free;
75         u32 rg_dinodes;
76         u64 rg_igeneration;
77 };
78
79 struct gfs2_rgrpd {
80         struct list_head rd_list;       /* Link with superblock */
81         struct list_head rd_list_mru;
82         struct list_head rd_recent;     /* Recently used rgrps */
83         struct gfs2_glock *rd_gl;       /* Glock for this rgrp */
84         u64 rd_addr;                    /* grp block disk address */
85         u64 rd_data0;                   /* first data location */
86         u32 rd_length;                  /* length of rgrp header in fs blocks */
87         u32 rd_data;                    /* num of data blocks in rgrp */
88         u32 rd_bitbytes;                /* number of bytes in data bitmaps */
89         struct gfs2_rgrp_host rd_rg;
90         u64 rd_rg_vn;
91         struct gfs2_bitmap *rd_bits;
92         unsigned int rd_bh_count;
93         struct mutex rd_mutex;
94         u32 rd_free_clone;
95         struct gfs2_log_element rd_le;
96         u32 rd_last_alloc_data;
97         u32 rd_last_alloc_meta;
98         struct gfs2_sbd *rd_sbd;
99         unsigned long rd_flags;
100 #define GFS2_RDF_CHECK        0x0001          /* Need to check for unlinked inodes */
101 };
102
103 enum gfs2_state_bits {
104         BH_Pinned = BH_PrivateStart,
105         BH_Escaped = BH_PrivateStart + 1,
106 };
107
108 BUFFER_FNS(Pinned, pinned)
109 TAS_BUFFER_FNS(Pinned, pinned)
110 BUFFER_FNS(Escaped, escaped)
111 TAS_BUFFER_FNS(Escaped, escaped)
112
113 struct gfs2_bufdata {
114         struct buffer_head *bd_bh;
115         struct gfs2_glock *bd_gl;
116
117         union {
118                 struct list_head list_tr;
119                 u64 blkno;
120         } u;
121 #define bd_list_tr u.list_tr
122 #define bd_blkno u.blkno
123
124         struct gfs2_log_element bd_le;
125
126         struct gfs2_ail *bd_ail;
127         struct list_head bd_ail_st_list;
128         struct list_head bd_ail_gl_list;
129 };
130
131 struct gfs2_glock_operations {
132         void (*go_xmote_th) (struct gfs2_glock *gl);
133         void (*go_xmote_bh) (struct gfs2_glock *gl);
134         void (*go_drop_th) (struct gfs2_glock *gl);
135         void (*go_inval) (struct gfs2_glock *gl, int flags);
136         int (*go_demote_ok) (struct gfs2_glock *gl);
137         int (*go_lock) (struct gfs2_holder *gh);
138         void (*go_unlock) (struct gfs2_holder *gh);
139         const int go_type;
140         const unsigned long go_min_hold_time;
141 };
142
143 enum {
144         /* States */
145         HIF_HOLDER              = 6,
146         HIF_FIRST               = 7,
147         HIF_ABORTED             = 9,
148         HIF_WAIT                = 10,
149 };
150
151 struct gfs2_holder {
152         struct list_head gh_list;
153
154         struct gfs2_glock *gh_gl;
155         pid_t gh_owner_pid;
156         unsigned int gh_state;
157         unsigned gh_flags;
158
159         int gh_error;
160         unsigned long gh_iflags;
161         unsigned long gh_ip;
162 };
163
164 enum {
165         GLF_LOCK                = 1,
166         GLF_STICKY              = 2,
167         GLF_DEMOTE              = 3,
168         GLF_PENDING_DEMOTE      = 4,
169         GLF_DIRTY               = 5,
170         GLF_DEMOTE_IN_PROGRESS  = 6,
171         GLF_LFLUSH              = 7,
172 };
173
174 struct gfs2_glock {
175         struct hlist_node gl_list;
176         unsigned long gl_flags;         /* GLF_... */
177         struct lm_lockname gl_name;
178         atomic_t gl_ref;
179
180         spinlock_t gl_spin;
181
182         unsigned int gl_state;
183         unsigned int gl_hash;
184         unsigned int gl_demote_state; /* state requested by remote node */
185         unsigned long gl_demote_time; /* time of first demote request */
186         pid_t gl_owner_pid;
187         unsigned long gl_ip;
188         struct list_head gl_holders;
189         struct list_head gl_waiters1;   /* HIF_MUTEX */
190         struct list_head gl_waiters3;   /* HIF_PROMOTE */
191         int gl_waiters2;                /* GIF_DEMOTE */
192
193         const struct gfs2_glock_operations *gl_ops;
194
195         struct gfs2_holder *gl_req_gh;
196         gfs2_glop_bh_t gl_req_bh;
197
198         void *gl_lock;
199         char *gl_lvb;
200         atomic_t gl_lvb_count;
201
202         u64 gl_vn;
203         unsigned long gl_stamp;
204         unsigned long gl_tchange;
205         void *gl_object;
206
207         struct list_head gl_reclaim;
208
209         struct gfs2_sbd *gl_sbd;
210
211         struct inode *gl_aspace;
212         struct list_head gl_ail_list;
213         atomic_t gl_ail_count;
214         struct delayed_work gl_work;
215 };
216
217 struct gfs2_alloc {
218         /* Quota stuff */
219
220         struct gfs2_quota_data *al_qd[2*MAXQUOTAS];
221         struct gfs2_holder al_qd_ghs[2*MAXQUOTAS];
222         unsigned int al_qd_num;
223
224         u32 al_requested; /* Filled in by caller of gfs2_inplace_reserve() */
225         u32 al_alloced; /* Filled in by gfs2_alloc_*() */
226
227         /* Filled in by gfs2_inplace_reserve() */
228
229         unsigned int al_line;
230         char *al_file;
231         struct gfs2_holder al_ri_gh;
232         struct gfs2_holder al_rgd_gh;
233         struct gfs2_rgrpd *al_rgd;
234
235 };
236
237 enum {
238         GIF_INVALID             = 0,
239         GIF_QD_LOCKED           = 1,
240         GIF_SW_PAGED            = 3,
241 };
242
243 struct gfs2_dinode_host {
244         u64 di_size;            /* number of bytes in file */
245         u64 di_blocks;          /* number of blocks in file */
246         u64 di_goal_meta;       /* rgrp to alloc from next */
247         u64 di_goal_data;       /* data block goal */
248         u64 di_generation;      /* generation number for NFS */
249         u32 di_flags;           /* GFS2_DIF_... */
250         u16 di_height;          /* height of metadata */
251         /* These only apply to directories  */
252         u16 di_depth;           /* Number of bits in the table */
253         u32 di_entries;         /* The number of entries in the directory */
254         u64 di_eattr;           /* extended attribute block number */
255 };
256
257 struct gfs2_inode {
258         struct inode i_inode;
259         u64 i_no_addr;
260         u64 i_no_formal_ino;
261         unsigned long i_flags;          /* GIF_... */
262
263         struct gfs2_dinode_host i_di; /* To be replaced by ref to block */
264
265         struct gfs2_glock *i_gl; /* Move into i_gh? */
266         struct gfs2_holder i_iopen_gh;
267         struct gfs2_holder i_gh; /* for prepare/commit_write only */
268         struct gfs2_alloc i_alloc;
269         u64 i_last_rg_alloc;
270
271         spinlock_t i_spin;
272         struct rw_semaphore i_rw_mutex;
273 };
274
275 /*
276  * Since i_inode is the first element of struct gfs2_inode,
277  * this is effectively a cast.
278  */
279 static inline struct gfs2_inode *GFS2_I(struct inode *inode)
280 {
281         return container_of(inode, struct gfs2_inode, i_inode);
282 }
283
284 static inline struct gfs2_sbd *GFS2_SB(const struct inode *inode)
285 {
286         return inode->i_sb->s_fs_info;
287 }
288
289 struct gfs2_file {
290         struct mutex f_fl_mutex;
291         struct gfs2_holder f_fl_gh;
292 };
293
294 struct gfs2_revoke_replay {
295         struct list_head rr_list;
296         u64 rr_blkno;
297         unsigned int rr_where;
298 };
299
300 enum {
301         QDF_USER                = 0,
302         QDF_CHANGE              = 1,
303         QDF_LOCKED              = 2,
304 };
305
306 struct gfs2_quota_data {
307         struct list_head qd_list;
308         unsigned int qd_count;
309
310         u32 qd_id;
311         unsigned long qd_flags;         /* QDF_... */
312
313         s64 qd_change;
314         s64 qd_change_sync;
315
316         unsigned int qd_slot;
317         unsigned int qd_slot_count;
318
319         struct buffer_head *qd_bh;
320         struct gfs2_quota_change *qd_bh_qc;
321         unsigned int qd_bh_count;
322
323         struct gfs2_glock *qd_gl;
324         struct gfs2_quota_lvb qd_qb;
325
326         u64 qd_sync_gen;
327         unsigned long qd_last_warn;
328         unsigned long qd_last_touched;
329 };
330
331 struct gfs2_trans {
332         unsigned long tr_ip;
333
334         unsigned int tr_blocks;
335         unsigned int tr_revokes;
336         unsigned int tr_reserved;
337
338         struct gfs2_holder tr_t_gh;
339
340         int tr_touched;
341
342         unsigned int tr_num_buf;
343         unsigned int tr_num_buf_new;
344         unsigned int tr_num_databuf_new;
345         unsigned int tr_num_buf_rm;
346         unsigned int tr_num_databuf_rm;
347         struct list_head tr_list_buf;
348
349         unsigned int tr_num_revoke;
350         unsigned int tr_num_revoke_rm;
351 };
352
353 struct gfs2_ail {
354         struct list_head ai_list;
355
356         unsigned int ai_first;
357         struct list_head ai_ail1_list;
358         struct list_head ai_ail2_list;
359
360         u64 ai_sync_gen;
361 };
362
363 struct gfs2_journal_extent {
364         struct list_head extent_list;
365
366         unsigned int lblock; /* First logical block */
367         u64 dblock; /* First disk block */
368         u64 blocks;
369 };
370
371 struct gfs2_jdesc {
372         struct list_head jd_list;
373         struct list_head extent_list;
374
375         struct inode *jd_inode;
376         unsigned int jd_jid;
377         int jd_dirty;
378
379         unsigned int jd_blocks;
380 };
381
382 struct gfs2_statfs_change_host {
383         s64 sc_total;
384         s64 sc_free;
385         s64 sc_dinodes;
386 };
387
388 #define GFS2_GLOCKD_DEFAULT     1
389 #define GFS2_GLOCKD_MAX         16
390
391 #define GFS2_QUOTA_DEFAULT      GFS2_QUOTA_OFF
392 #define GFS2_QUOTA_OFF          0
393 #define GFS2_QUOTA_ACCOUNT      1
394 #define GFS2_QUOTA_ON           2
395
396 #define GFS2_DATA_DEFAULT       GFS2_DATA_ORDERED
397 #define GFS2_DATA_WRITEBACK     1
398 #define GFS2_DATA_ORDERED       2
399
400 struct gfs2_args {
401         char ar_lockproto[GFS2_LOCKNAME_LEN]; /* Name of the Lock Protocol */
402         char ar_locktable[GFS2_LOCKNAME_LEN]; /* Name of the Lock Table */
403         char ar_hostdata[GFS2_LOCKNAME_LEN]; /* Host specific data */
404         int ar_spectator; /* Don't get a journal because we're always RO */
405         int ar_ignore_local_fs; /* Don't optimize even if local_fs is 1 */
406         int ar_localflocks; /* Let the VFS do flock|fcntl locks for us */
407         int ar_localcaching; /* Local-style caching (dangerous on multihost) */
408         int ar_debug; /* Oops on errors instead of trying to be graceful */
409         int ar_upgrade; /* Upgrade ondisk/multihost format */
410         unsigned int ar_num_glockd; /* Number of glockd threads */
411         int ar_posix_acl; /* Enable posix acls */
412         int ar_quota; /* off/account/on */
413         int ar_suiddir; /* suiddir support */
414         int ar_data; /* ordered/writeback */
415 };
416
417 struct gfs2_tune {
418         spinlock_t gt_spin;
419
420         unsigned int gt_demote_secs; /* Cache retention for unheld glock */
421         unsigned int gt_incore_log_blocks;
422         unsigned int gt_log_flush_secs;
423
424         unsigned int gt_recoverd_secs;
425         unsigned int gt_logd_secs;
426         unsigned int gt_quotad_secs;
427
428         unsigned int gt_quota_simul_sync; /* Max quotavals to sync at once */
429         unsigned int gt_quota_warn_period; /* Secs between quota warn msgs */
430         unsigned int gt_quota_scale_num; /* Numerator */
431         unsigned int gt_quota_scale_den; /* Denominator */
432         unsigned int gt_quota_cache_secs;
433         unsigned int gt_quota_quantum; /* Secs between syncs to quota file */
434         unsigned int gt_atime_quantum; /* Min secs between atime updates */
435         unsigned int gt_new_files_jdata;
436         unsigned int gt_new_files_directio;
437         unsigned int gt_max_readahead; /* Max bytes to read-ahead from disk */
438         unsigned int gt_stall_secs; /* Detects trouble! */
439         unsigned int gt_complain_secs;
440         unsigned int gt_statfs_quantum;
441         unsigned int gt_statfs_slow;
442 };
443
444 enum {
445         SDF_JOURNAL_CHECKED     = 0,
446         SDF_JOURNAL_LIVE        = 1,
447         SDF_SHUTDOWN            = 2,
448         SDF_NOATIME             = 3,
449 };
450
451 #define GFS2_FSNAME_LEN         256
452
453 struct gfs2_inum_host {
454         u64 no_formal_ino;
455         u64 no_addr;
456 };
457
458 struct gfs2_sb_host {
459         u32 sb_magic;
460         u32 sb_type;
461         u32 sb_format;
462
463         u32 sb_fs_format;
464         u32 sb_multihost_format;
465         u32 sb_bsize;
466         u32 sb_bsize_shift;
467
468         struct gfs2_inum_host sb_master_dir;
469         struct gfs2_inum_host sb_root_dir;
470
471         char sb_lockproto[GFS2_LOCKNAME_LEN];
472         char sb_locktable[GFS2_LOCKNAME_LEN];
473 };
474
475 struct gfs2_sbd {
476         struct super_block *sd_vfs;
477         struct super_block *sd_vfs_meta;
478         struct kobject sd_kobj;
479         unsigned long sd_flags; /* SDF_... */
480         struct gfs2_sb_host sd_sb;
481
482         /* Constants computed on mount */
483
484         u32 sd_fsb2bb;
485         u32 sd_fsb2bb_shift;
486         u32 sd_diptrs;  /* Number of pointers in a dinode */
487         u32 sd_inptrs;  /* Number of pointers in a indirect block */
488         u32 sd_jbsize;  /* Size of a journaled data block */
489         u32 sd_hash_bsize;      /* sizeof(exhash block) */
490         u32 sd_hash_bsize_shift;
491         u32 sd_hash_ptrs;       /* Number of pointers in a hash block */
492         u32 sd_qc_per_block;
493         u32 sd_max_dirres;      /* Max blocks needed to add a directory entry */
494         u32 sd_max_height;      /* Max height of a file's metadata tree */
495         u64 sd_heightsize[GFS2_MAX_META_HEIGHT];
496         u32 sd_max_jheight; /* Max height of journaled file's meta tree */
497         u64 sd_jheightsize[GFS2_MAX_META_HEIGHT];
498
499         struct gfs2_args sd_args;       /* Mount arguments */
500         struct gfs2_tune sd_tune;       /* Filesystem tuning structure */
501
502         /* Lock Stuff */
503
504         struct lm_lockstruct sd_lockstruct;
505         struct list_head sd_reclaim_list;
506         spinlock_t sd_reclaim_lock;
507         wait_queue_head_t sd_reclaim_wq;
508         atomic_t sd_reclaim_count;
509         struct gfs2_holder sd_live_gh;
510         struct gfs2_glock *sd_rename_gl;
511         struct gfs2_glock *sd_trans_gl;
512
513         /* Inode Stuff */
514
515         struct inode *sd_master_dir;
516         struct inode *sd_jindex;
517         struct inode *sd_inum_inode;
518         struct inode *sd_statfs_inode;
519         struct inode *sd_ir_inode;
520         struct inode *sd_sc_inode;
521         struct inode *sd_qc_inode;
522         struct inode *sd_rindex;
523         struct inode *sd_quota_inode;
524
525         /* Inum stuff */
526
527         struct mutex sd_inum_mutex;
528
529         /* StatFS stuff */
530
531         spinlock_t sd_statfs_spin;
532         struct mutex sd_statfs_mutex;
533         struct gfs2_statfs_change_host sd_statfs_master;
534         struct gfs2_statfs_change_host sd_statfs_local;
535         unsigned long sd_statfs_sync_time;
536
537         /* Resource group stuff */
538
539         u64 sd_rindex_vn;
540         spinlock_t sd_rindex_spin;
541         struct mutex sd_rindex_mutex;
542         struct list_head sd_rindex_list;
543         struct list_head sd_rindex_mru_list;
544         struct list_head sd_rindex_recent_list;
545         struct gfs2_rgrpd *sd_rindex_forward;
546         unsigned int sd_rgrps;
547
548         /* Journal index stuff */
549
550         struct list_head sd_jindex_list;
551         spinlock_t sd_jindex_spin;
552         struct mutex sd_jindex_mutex;
553         unsigned int sd_journals;
554         unsigned long sd_jindex_refresh_time;
555
556         struct gfs2_jdesc *sd_jdesc;
557         struct gfs2_holder sd_journal_gh;
558         struct gfs2_holder sd_jinode_gh;
559
560         struct gfs2_holder sd_ir_gh;
561         struct gfs2_holder sd_sc_gh;
562         struct gfs2_holder sd_qc_gh;
563
564         /* Daemon stuff */
565
566         struct task_struct *sd_recoverd_process;
567         struct task_struct *sd_logd_process;
568         struct task_struct *sd_quotad_process;
569         struct task_struct *sd_glockd_process[GFS2_GLOCKD_MAX];
570         unsigned int sd_glockd_num;
571
572         /* Quota stuff */
573
574         struct list_head sd_quota_list;
575         atomic_t sd_quota_count;
576         spinlock_t sd_quota_spin;
577         struct mutex sd_quota_mutex;
578
579         unsigned int sd_quota_slots;
580         unsigned int sd_quota_chunks;
581         unsigned char **sd_quota_bitmap;
582
583         u64 sd_quota_sync_gen;
584         unsigned long sd_quota_sync_time;
585
586         /* Log stuff */
587
588         spinlock_t sd_log_lock;
589
590         unsigned int sd_log_blks_reserved;
591         unsigned int sd_log_commited_buf;
592         unsigned int sd_log_commited_databuf;
593         unsigned int sd_log_commited_revoke;
594
595         unsigned int sd_log_num_buf;
596         unsigned int sd_log_num_revoke;
597         unsigned int sd_log_num_rg;
598         unsigned int sd_log_num_databuf;
599
600         struct list_head sd_log_le_buf;
601         struct list_head sd_log_le_revoke;
602         struct list_head sd_log_le_rg;
603         struct list_head sd_log_le_databuf;
604         struct list_head sd_log_le_ordered;
605
606         atomic_t sd_log_blks_free;
607         struct mutex sd_log_reserve_mutex;
608
609         u64 sd_log_sequence;
610         unsigned int sd_log_head;
611         unsigned int sd_log_tail;
612         int sd_log_idle;
613
614         unsigned long sd_log_flush_time;
615         struct rw_semaphore sd_log_flush_lock;
616         atomic_t sd_log_in_flight;
617         wait_queue_head_t sd_log_flush_wait;
618
619         unsigned int sd_log_flush_head;
620         u64 sd_log_flush_wrapped;
621
622         struct list_head sd_ail1_list;
623         struct list_head sd_ail2_list;
624         u64 sd_ail_sync_gen;
625
626         /* Replay stuff */
627
628         struct list_head sd_revoke_list;
629         unsigned int sd_replay_tail;
630
631         unsigned int sd_found_blocks;
632         unsigned int sd_found_revokes;
633         unsigned int sd_replayed_blocks;
634
635         /* For quiescing the filesystem */
636
637         struct gfs2_holder sd_freeze_gh;
638         struct mutex sd_freeze_lock;
639         unsigned int sd_freeze_count;
640
641         /* Counters */
642
643         atomic_t sd_glock_count;
644         atomic_t sd_glock_held_count;
645         atomic_t sd_inode_count;
646         atomic_t sd_reclaimed;
647
648         char sd_fsname[GFS2_FSNAME_LEN];
649         char sd_table_name[GFS2_FSNAME_LEN];
650         char sd_proto_name[GFS2_FSNAME_LEN];
651
652         /* Debugging crud */
653
654         unsigned long sd_last_warning;
655         struct vfsmount *sd_gfs2mnt;
656         struct dentry *debugfs_dir;    /* debugfs directory */
657         struct dentry *debugfs_dentry_glocks; /* for debugfs */
658 };
659
660 #endif /* __INCORE_DOT_H__ */
661