fuse: add reference counting to fuse_file
[safe/jmp/linux-2.6] / fs / fuse / dir.c
1 /*
2   FUSE: Filesystem in Userspace
3   Copyright (C) 2001-2006  Miklos Szeredi <miklos@szeredi.hu>
4
5   This program can be distributed under the terms of the GNU GPL.
6   See the file COPYING.
7 */
8
9 #include "fuse_i.h"
10
11 #include <linux/pagemap.h>
12 #include <linux/file.h>
13 #include <linux/gfp.h>
14 #include <linux/sched.h>
15 #include <linux/namei.h>
16
17 #if BITS_PER_LONG >= 64
18 static inline void fuse_dentry_settime(struct dentry *entry, u64 time)
19 {
20         entry->d_time = time;
21 }
22
23 static inline u64 fuse_dentry_time(struct dentry *entry)
24 {
25         return entry->d_time;
26 }
27 #else
28 /*
29  * On 32 bit archs store the high 32 bits of time in d_fsdata
30  */
31 static void fuse_dentry_settime(struct dentry *entry, u64 time)
32 {
33         entry->d_time = time;
34         entry->d_fsdata = (void *) (unsigned long) (time >> 32);
35 }
36
37 static u64 fuse_dentry_time(struct dentry *entry)
38 {
39         return (u64) entry->d_time +
40                 ((u64) (unsigned long) entry->d_fsdata << 32);
41 }
42 #endif
43
44 /*
45  * FUSE caches dentries and attributes with separate timeout.  The
46  * time in jiffies until the dentry/attributes are valid is stored in
47  * dentry->d_time and fuse_inode->i_time respectively.
48  */
49
50 /*
51  * Calculate the time in jiffies until a dentry/attributes are valid
52  */
53 static u64 time_to_jiffies(unsigned long sec, unsigned long nsec)
54 {
55         if (sec || nsec) {
56                 struct timespec ts = {sec, nsec};
57                 return get_jiffies_64() + timespec_to_jiffies(&ts);
58         } else
59                 return 0;
60 }
61
62 /*
63  * Set dentry and possibly attribute timeouts from the lookup/mk*
64  * replies
65  */
66 static void fuse_change_timeout(struct dentry *entry, struct fuse_entry_out *o)
67 {
68         fuse_dentry_settime(entry,
69                 time_to_jiffies(o->entry_valid, o->entry_valid_nsec));
70         if (entry->d_inode)
71                 get_fuse_inode(entry->d_inode)->i_time =
72                         time_to_jiffies(o->attr_valid, o->attr_valid_nsec);
73 }
74
75 /*
76  * Mark the attributes as stale, so that at the next call to
77  * ->getattr() they will be fetched from userspace
78  */
79 void fuse_invalidate_attr(struct inode *inode)
80 {
81         get_fuse_inode(inode)->i_time = 0;
82 }
83
84 /*
85  * Just mark the entry as stale, so that a next attempt to look it up
86  * will result in a new lookup call to userspace
87  *
88  * This is called when a dentry is about to become negative and the
89  * timeout is unknown (unlink, rmdir, rename and in some cases
90  * lookup)
91  */
92 static void fuse_invalidate_entry_cache(struct dentry *entry)
93 {
94         fuse_dentry_settime(entry, 0);
95 }
96
97 /*
98  * Same as fuse_invalidate_entry_cache(), but also try to remove the
99  * dentry from the hash
100  */
101 static void fuse_invalidate_entry(struct dentry *entry)
102 {
103         d_invalidate(entry);
104         fuse_invalidate_entry_cache(entry);
105 }
106
107 static void fuse_lookup_init(struct fuse_req *req, struct inode *dir,
108                              struct dentry *entry,
109                              struct fuse_entry_out *outarg)
110 {
111         req->in.h.opcode = FUSE_LOOKUP;
112         req->in.h.nodeid = get_node_id(dir);
113         req->in.numargs = 1;
114         req->in.args[0].size = entry->d_name.len + 1;
115         req->in.args[0].value = entry->d_name.name;
116         req->out.numargs = 1;
117         req->out.args[0].size = sizeof(struct fuse_entry_out);
118         req->out.args[0].value = outarg;
119 }
120
121 /*
122  * Check whether the dentry is still valid
123  *
124  * If the entry validity timeout has expired and the dentry is
125  * positive, try to redo the lookup.  If the lookup results in a
126  * different inode, then let the VFS invalidate the dentry and redo
127  * the lookup once more.  If the lookup results in the same inode,
128  * then refresh the attributes, timeouts and mark the dentry valid.
129  */
130 static int fuse_dentry_revalidate(struct dentry *entry, struct nameidata *nd)
131 {
132         struct inode *inode = entry->d_inode;
133
134         if (inode && is_bad_inode(inode))
135                 return 0;
136         else if (fuse_dentry_time(entry) < get_jiffies_64()) {
137                 int err;
138                 struct fuse_entry_out outarg;
139                 struct fuse_conn *fc;
140                 struct fuse_req *req;
141                 struct fuse_req *forget_req;
142                 struct dentry *parent;
143
144                 /* For negative dentries, always do a fresh lookup */
145                 if (!inode)
146                         return 0;
147
148                 fc = get_fuse_conn(inode);
149                 req = fuse_get_req(fc);
150                 if (IS_ERR(req))
151                         return 0;
152
153                 forget_req = fuse_get_req(fc);
154                 if (IS_ERR(forget_req)) {
155                         fuse_put_request(fc, req);
156                         return 0;
157                 }
158
159                 parent = dget_parent(entry);
160                 fuse_lookup_init(req, parent->d_inode, entry, &outarg);
161                 request_send(fc, req);
162                 dput(parent);
163                 err = req->out.h.error;
164                 fuse_put_request(fc, req);
165                 /* Zero nodeid is same as -ENOENT */
166                 if (!err && !outarg.nodeid)
167                         err = -ENOENT;
168                 if (!err) {
169                         struct fuse_inode *fi = get_fuse_inode(inode);
170                         if (outarg.nodeid != get_node_id(inode)) {
171                                 fuse_send_forget(fc, forget_req,
172                                                  outarg.nodeid, 1);
173                                 return 0;
174                         }
175                         spin_lock(&fc->lock);
176                         fi->nlookup ++;
177                         spin_unlock(&fc->lock);
178                 }
179                 fuse_put_request(fc, forget_req);
180                 if (err || (outarg.attr.mode ^ inode->i_mode) & S_IFMT)
181                         return 0;
182
183                 fuse_change_attributes(inode, &outarg.attr);
184                 fuse_change_timeout(entry, &outarg);
185         }
186         return 1;
187 }
188
189 static int invalid_nodeid(u64 nodeid)
190 {
191         return !nodeid || nodeid == FUSE_ROOT_ID;
192 }
193
194 static struct dentry_operations fuse_dentry_operations = {
195         .d_revalidate   = fuse_dentry_revalidate,
196 };
197
198 int fuse_valid_type(int m)
199 {
200         return S_ISREG(m) || S_ISDIR(m) || S_ISLNK(m) || S_ISCHR(m) ||
201                 S_ISBLK(m) || S_ISFIFO(m) || S_ISSOCK(m);
202 }
203
204 /*
205  * Add a directory inode to a dentry, ensuring that no other dentry
206  * refers to this inode.  Called with fc->inst_mutex.
207  */
208 static int fuse_d_add_directory(struct dentry *entry, struct inode *inode)
209 {
210         struct dentry *alias = d_find_alias(inode);
211         if (alias) {
212                 /* This tries to shrink the subtree below alias */
213                 fuse_invalidate_entry(alias);
214                 dput(alias);
215                 if (!list_empty(&inode->i_dentry))
216                         return -EBUSY;
217         }
218         d_add(entry, inode);
219         return 0;
220 }
221
222 static struct dentry *fuse_lookup(struct inode *dir, struct dentry *entry,
223                                   struct nameidata *nd)
224 {
225         int err;
226         struct fuse_entry_out outarg;
227         struct inode *inode = NULL;
228         struct fuse_conn *fc = get_fuse_conn(dir);
229         struct fuse_req *req;
230         struct fuse_req *forget_req;
231
232         if (entry->d_name.len > FUSE_NAME_MAX)
233                 return ERR_PTR(-ENAMETOOLONG);
234
235         req = fuse_get_req(fc);
236         if (IS_ERR(req))
237                 return ERR_PTR(PTR_ERR(req));
238
239         forget_req = fuse_get_req(fc);
240         if (IS_ERR(forget_req)) {
241                 fuse_put_request(fc, req);
242                 return ERR_PTR(PTR_ERR(forget_req));
243         }
244
245         fuse_lookup_init(req, dir, entry, &outarg);
246         request_send(fc, req);
247         err = req->out.h.error;
248         fuse_put_request(fc, req);
249         /* Zero nodeid is same as -ENOENT, but with valid timeout */
250         if (!err && outarg.nodeid &&
251             (invalid_nodeid(outarg.nodeid) ||
252              !fuse_valid_type(outarg.attr.mode)))
253                 err = -EIO;
254         if (!err && outarg.nodeid) {
255                 inode = fuse_iget(dir->i_sb, outarg.nodeid, outarg.generation,
256                                   &outarg.attr);
257                 if (!inode) {
258                         fuse_send_forget(fc, forget_req, outarg.nodeid, 1);
259                         return ERR_PTR(-ENOMEM);
260                 }
261         }
262         fuse_put_request(fc, forget_req);
263         if (err && err != -ENOENT)
264                 return ERR_PTR(err);
265
266         if (inode && S_ISDIR(inode->i_mode)) {
267                 mutex_lock(&fc->inst_mutex);
268                 err = fuse_d_add_directory(entry, inode);
269                 mutex_unlock(&fc->inst_mutex);
270                 if (err) {
271                         iput(inode);
272                         return ERR_PTR(err);
273                 }
274         } else
275                 d_add(entry, inode);
276
277         entry->d_op = &fuse_dentry_operations;
278         if (!err)
279                 fuse_change_timeout(entry, &outarg);
280         else
281                 fuse_invalidate_entry_cache(entry);
282         return NULL;
283 }
284
285 /*
286  * Synchronous release for the case when something goes wrong in CREATE_OPEN
287  */
288 static void fuse_sync_release(struct fuse_conn *fc, struct fuse_file *ff,
289                               u64 nodeid, int flags)
290 {
291         fuse_release_fill(ff, nodeid, flags, FUSE_RELEASE);
292         ff->reserved_req->force = 1;
293         request_send(fc, ff->reserved_req);
294         fuse_put_request(fc, ff->reserved_req);
295         kfree(ff);
296 }
297
298 /*
299  * Atomic create+open operation
300  *
301  * If the filesystem doesn't support this, then fall back to separate
302  * 'mknod' + 'open' requests.
303  */
304 static int fuse_create_open(struct inode *dir, struct dentry *entry, int mode,
305                             struct nameidata *nd)
306 {
307         int err;
308         struct inode *inode;
309         struct fuse_conn *fc = get_fuse_conn(dir);
310         struct fuse_req *req;
311         struct fuse_req *forget_req;
312         struct fuse_open_in inarg;
313         struct fuse_open_out outopen;
314         struct fuse_entry_out outentry;
315         struct fuse_file *ff;
316         struct file *file;
317         int flags = nd->intent.open.flags - 1;
318
319         if (fc->no_create)
320                 return -ENOSYS;
321
322         forget_req = fuse_get_req(fc);
323         if (IS_ERR(forget_req))
324                 return PTR_ERR(forget_req);
325
326         req = fuse_get_req(fc);
327         err = PTR_ERR(req);
328         if (IS_ERR(req))
329                 goto out_put_forget_req;
330
331         err = -ENOMEM;
332         ff = fuse_file_alloc();
333         if (!ff)
334                 goto out_put_request;
335
336         flags &= ~O_NOCTTY;
337         memset(&inarg, 0, sizeof(inarg));
338         inarg.flags = flags;
339         inarg.mode = mode;
340         req->in.h.opcode = FUSE_CREATE;
341         req->in.h.nodeid = get_node_id(dir);
342         req->in.numargs = 2;
343         req->in.args[0].size = sizeof(inarg);
344         req->in.args[0].value = &inarg;
345         req->in.args[1].size = entry->d_name.len + 1;
346         req->in.args[1].value = entry->d_name.name;
347         req->out.numargs = 2;
348         req->out.args[0].size = sizeof(outentry);
349         req->out.args[0].value = &outentry;
350         req->out.args[1].size = sizeof(outopen);
351         req->out.args[1].value = &outopen;
352         request_send(fc, req);
353         err = req->out.h.error;
354         if (err) {
355                 if (err == -ENOSYS)
356                         fc->no_create = 1;
357                 goto out_free_ff;
358         }
359
360         err = -EIO;
361         if (!S_ISREG(outentry.attr.mode) || invalid_nodeid(outentry.nodeid))
362                 goto out_free_ff;
363
364         fuse_put_request(fc, req);
365         inode = fuse_iget(dir->i_sb, outentry.nodeid, outentry.generation,
366                           &outentry.attr);
367         if (!inode) {
368                 flags &= ~(O_CREAT | O_EXCL | O_TRUNC);
369                 ff->fh = outopen.fh;
370                 fuse_sync_release(fc, ff, outentry.nodeid, flags);
371                 fuse_send_forget(fc, forget_req, outentry.nodeid, 1);
372                 return -ENOMEM;
373         }
374         fuse_put_request(fc, forget_req);
375         d_instantiate(entry, inode);
376         fuse_change_timeout(entry, &outentry);
377         file = lookup_instantiate_filp(nd, entry, generic_file_open);
378         if (IS_ERR(file)) {
379                 ff->fh = outopen.fh;
380                 fuse_sync_release(fc, ff, outentry.nodeid, flags);
381                 return PTR_ERR(file);
382         }
383         fuse_finish_open(inode, file, ff, &outopen);
384         return 0;
385
386  out_free_ff:
387         fuse_file_free(ff);
388  out_put_request:
389         fuse_put_request(fc, req);
390  out_put_forget_req:
391         fuse_put_request(fc, forget_req);
392         return err;
393 }
394
395 /*
396  * Code shared between mknod, mkdir, symlink and link
397  */
398 static int create_new_entry(struct fuse_conn *fc, struct fuse_req *req,
399                             struct inode *dir, struct dentry *entry,
400                             int mode)
401 {
402         struct fuse_entry_out outarg;
403         struct inode *inode;
404         int err;
405         struct fuse_req *forget_req;
406
407         forget_req = fuse_get_req(fc);
408         if (IS_ERR(forget_req)) {
409                 fuse_put_request(fc, req);
410                 return PTR_ERR(forget_req);
411         }
412
413         req->in.h.nodeid = get_node_id(dir);
414         req->out.numargs = 1;
415         req->out.args[0].size = sizeof(outarg);
416         req->out.args[0].value = &outarg;
417         request_send(fc, req);
418         err = req->out.h.error;
419         fuse_put_request(fc, req);
420         if (err)
421                 goto out_put_forget_req;
422
423         err = -EIO;
424         if (invalid_nodeid(outarg.nodeid))
425                 goto out_put_forget_req;
426
427         if ((outarg.attr.mode ^ mode) & S_IFMT)
428                 goto out_put_forget_req;
429
430         inode = fuse_iget(dir->i_sb, outarg.nodeid, outarg.generation,
431                           &outarg.attr);
432         if (!inode) {
433                 fuse_send_forget(fc, forget_req, outarg.nodeid, 1);
434                 return -ENOMEM;
435         }
436         fuse_put_request(fc, forget_req);
437
438         if (S_ISDIR(inode->i_mode)) {
439                 struct dentry *alias;
440                 mutex_lock(&fc->inst_mutex);
441                 alias = d_find_alias(inode);
442                 if (alias) {
443                         /* New directory must have moved since mkdir */
444                         mutex_unlock(&fc->inst_mutex);
445                         dput(alias);
446                         iput(inode);
447                         return -EBUSY;
448                 }
449                 d_instantiate(entry, inode);
450                 mutex_unlock(&fc->inst_mutex);
451         } else
452                 d_instantiate(entry, inode);
453
454         fuse_change_timeout(entry, &outarg);
455         fuse_invalidate_attr(dir);
456         return 0;
457
458  out_put_forget_req:
459         fuse_put_request(fc, forget_req);
460         return err;
461 }
462
463 static int fuse_mknod(struct inode *dir, struct dentry *entry, int mode,
464                       dev_t rdev)
465 {
466         struct fuse_mknod_in inarg;
467         struct fuse_conn *fc = get_fuse_conn(dir);
468         struct fuse_req *req = fuse_get_req(fc);
469         if (IS_ERR(req))
470                 return PTR_ERR(req);
471
472         memset(&inarg, 0, sizeof(inarg));
473         inarg.mode = mode;
474         inarg.rdev = new_encode_dev(rdev);
475         req->in.h.opcode = FUSE_MKNOD;
476         req->in.numargs = 2;
477         req->in.args[0].size = sizeof(inarg);
478         req->in.args[0].value = &inarg;
479         req->in.args[1].size = entry->d_name.len + 1;
480         req->in.args[1].value = entry->d_name.name;
481         return create_new_entry(fc, req, dir, entry, mode);
482 }
483
484 static int fuse_create(struct inode *dir, struct dentry *entry, int mode,
485                        struct nameidata *nd)
486 {
487         if (nd && (nd->flags & LOOKUP_OPEN)) {
488                 int err = fuse_create_open(dir, entry, mode, nd);
489                 if (err != -ENOSYS)
490                         return err;
491                 /* Fall back on mknod */
492         }
493         return fuse_mknod(dir, entry, mode, 0);
494 }
495
496 static int fuse_mkdir(struct inode *dir, struct dentry *entry, int mode)
497 {
498         struct fuse_mkdir_in inarg;
499         struct fuse_conn *fc = get_fuse_conn(dir);
500         struct fuse_req *req = fuse_get_req(fc);
501         if (IS_ERR(req))
502                 return PTR_ERR(req);
503
504         memset(&inarg, 0, sizeof(inarg));
505         inarg.mode = mode;
506         req->in.h.opcode = FUSE_MKDIR;
507         req->in.numargs = 2;
508         req->in.args[0].size = sizeof(inarg);
509         req->in.args[0].value = &inarg;
510         req->in.args[1].size = entry->d_name.len + 1;
511         req->in.args[1].value = entry->d_name.name;
512         return create_new_entry(fc, req, dir, entry, S_IFDIR);
513 }
514
515 static int fuse_symlink(struct inode *dir, struct dentry *entry,
516                         const char *link)
517 {
518         struct fuse_conn *fc = get_fuse_conn(dir);
519         unsigned len = strlen(link) + 1;
520         struct fuse_req *req = fuse_get_req(fc);
521         if (IS_ERR(req))
522                 return PTR_ERR(req);
523
524         req->in.h.opcode = FUSE_SYMLINK;
525         req->in.numargs = 2;
526         req->in.args[0].size = entry->d_name.len + 1;
527         req->in.args[0].value = entry->d_name.name;
528         req->in.args[1].size = len;
529         req->in.args[1].value = link;
530         return create_new_entry(fc, req, dir, entry, S_IFLNK);
531 }
532
533 static int fuse_unlink(struct inode *dir, struct dentry *entry)
534 {
535         int err;
536         struct fuse_conn *fc = get_fuse_conn(dir);
537         struct fuse_req *req = fuse_get_req(fc);
538         if (IS_ERR(req))
539                 return PTR_ERR(req);
540
541         req->in.h.opcode = FUSE_UNLINK;
542         req->in.h.nodeid = get_node_id(dir);
543         req->in.numargs = 1;
544         req->in.args[0].size = entry->d_name.len + 1;
545         req->in.args[0].value = entry->d_name.name;
546         request_send(fc, req);
547         err = req->out.h.error;
548         fuse_put_request(fc, req);
549         if (!err) {
550                 struct inode *inode = entry->d_inode;
551
552                 /* Set nlink to zero so the inode can be cleared, if
553                    the inode does have more links this will be
554                    discovered at the next lookup/getattr */
555                 clear_nlink(inode);
556                 fuse_invalidate_attr(inode);
557                 fuse_invalidate_attr(dir);
558                 fuse_invalidate_entry_cache(entry);
559         } else if (err == -EINTR)
560                 fuse_invalidate_entry(entry);
561         return err;
562 }
563
564 static int fuse_rmdir(struct inode *dir, struct dentry *entry)
565 {
566         int err;
567         struct fuse_conn *fc = get_fuse_conn(dir);
568         struct fuse_req *req = fuse_get_req(fc);
569         if (IS_ERR(req))
570                 return PTR_ERR(req);
571
572         req->in.h.opcode = FUSE_RMDIR;
573         req->in.h.nodeid = get_node_id(dir);
574         req->in.numargs = 1;
575         req->in.args[0].size = entry->d_name.len + 1;
576         req->in.args[0].value = entry->d_name.name;
577         request_send(fc, req);
578         err = req->out.h.error;
579         fuse_put_request(fc, req);
580         if (!err) {
581                 clear_nlink(entry->d_inode);
582                 fuse_invalidate_attr(dir);
583                 fuse_invalidate_entry_cache(entry);
584         } else if (err == -EINTR)
585                 fuse_invalidate_entry(entry);
586         return err;
587 }
588
589 static int fuse_rename(struct inode *olddir, struct dentry *oldent,
590                        struct inode *newdir, struct dentry *newent)
591 {
592         int err;
593         struct fuse_rename_in inarg;
594         struct fuse_conn *fc = get_fuse_conn(olddir);
595         struct fuse_req *req = fuse_get_req(fc);
596         if (IS_ERR(req))
597                 return PTR_ERR(req);
598
599         memset(&inarg, 0, sizeof(inarg));
600         inarg.newdir = get_node_id(newdir);
601         req->in.h.opcode = FUSE_RENAME;
602         req->in.h.nodeid = get_node_id(olddir);
603         req->in.numargs = 3;
604         req->in.args[0].size = sizeof(inarg);
605         req->in.args[0].value = &inarg;
606         req->in.args[1].size = oldent->d_name.len + 1;
607         req->in.args[1].value = oldent->d_name.name;
608         req->in.args[2].size = newent->d_name.len + 1;
609         req->in.args[2].value = newent->d_name.name;
610         request_send(fc, req);
611         err = req->out.h.error;
612         fuse_put_request(fc, req);
613         if (!err) {
614                 fuse_invalidate_attr(olddir);
615                 if (olddir != newdir)
616                         fuse_invalidate_attr(newdir);
617
618                 /* newent will end up negative */
619                 if (newent->d_inode)
620                         fuse_invalidate_entry_cache(newent);
621         } else if (err == -EINTR) {
622                 /* If request was interrupted, DEITY only knows if the
623                    rename actually took place.  If the invalidation
624                    fails (e.g. some process has CWD under the renamed
625                    directory), then there can be inconsistency between
626                    the dcache and the real filesystem.  Tough luck. */
627                 fuse_invalidate_entry(oldent);
628                 if (newent->d_inode)
629                         fuse_invalidate_entry(newent);
630         }
631
632         return err;
633 }
634
635 static int fuse_link(struct dentry *entry, struct inode *newdir,
636                      struct dentry *newent)
637 {
638         int err;
639         struct fuse_link_in inarg;
640         struct inode *inode = entry->d_inode;
641         struct fuse_conn *fc = get_fuse_conn(inode);
642         struct fuse_req *req = fuse_get_req(fc);
643         if (IS_ERR(req))
644                 return PTR_ERR(req);
645
646         memset(&inarg, 0, sizeof(inarg));
647         inarg.oldnodeid = get_node_id(inode);
648         req->in.h.opcode = FUSE_LINK;
649         req->in.numargs = 2;
650         req->in.args[0].size = sizeof(inarg);
651         req->in.args[0].value = &inarg;
652         req->in.args[1].size = newent->d_name.len + 1;
653         req->in.args[1].value = newent->d_name.name;
654         err = create_new_entry(fc, req, newdir, newent, inode->i_mode);
655         /* Contrary to "normal" filesystems it can happen that link
656            makes two "logical" inodes point to the same "physical"
657            inode.  We invalidate the attributes of the old one, so it
658            will reflect changes in the backing inode (link count,
659            etc.)
660         */
661         if (!err || err == -EINTR)
662                 fuse_invalidate_attr(inode);
663         return err;
664 }
665
666 int fuse_do_getattr(struct inode *inode)
667 {
668         int err;
669         struct fuse_attr_out arg;
670         struct fuse_conn *fc = get_fuse_conn(inode);
671         struct fuse_req *req = fuse_get_req(fc);
672         if (IS_ERR(req))
673                 return PTR_ERR(req);
674
675         req->in.h.opcode = FUSE_GETATTR;
676         req->in.h.nodeid = get_node_id(inode);
677         req->out.numargs = 1;
678         req->out.args[0].size = sizeof(arg);
679         req->out.args[0].value = &arg;
680         request_send(fc, req);
681         err = req->out.h.error;
682         fuse_put_request(fc, req);
683         if (!err) {
684                 if ((inode->i_mode ^ arg.attr.mode) & S_IFMT) {
685                         make_bad_inode(inode);
686                         err = -EIO;
687                 } else {
688                         struct fuse_inode *fi = get_fuse_inode(inode);
689                         fuse_change_attributes(inode, &arg.attr);
690                         fi->i_time = time_to_jiffies(arg.attr_valid,
691                                                      arg.attr_valid_nsec);
692                 }
693         }
694         return err;
695 }
696
697 /*
698  * Calling into a user-controlled filesystem gives the filesystem
699  * daemon ptrace-like capabilities over the requester process.  This
700  * means, that the filesystem daemon is able to record the exact
701  * filesystem operations performed, and can also control the behavior
702  * of the requester process in otherwise impossible ways.  For example
703  * it can delay the operation for arbitrary length of time allowing
704  * DoS against the requester.
705  *
706  * For this reason only those processes can call into the filesystem,
707  * for which the owner of the mount has ptrace privilege.  This
708  * excludes processes started by other users, suid or sgid processes.
709  */
710 static int fuse_allow_task(struct fuse_conn *fc, struct task_struct *task)
711 {
712         if (fc->flags & FUSE_ALLOW_OTHER)
713                 return 1;
714
715         if (task->euid == fc->user_id &&
716             task->suid == fc->user_id &&
717             task->uid == fc->user_id &&
718             task->egid == fc->group_id &&
719             task->sgid == fc->group_id &&
720             task->gid == fc->group_id)
721                 return 1;
722
723         return 0;
724 }
725
726 /*
727  * Check whether the inode attributes are still valid
728  *
729  * If the attribute validity timeout has expired, then fetch the fresh
730  * attributes with a 'getattr' request
731  *
732  * I'm not sure why cached attributes are never returned for the root
733  * inode, this is probably being too cautious.
734  */
735 static int fuse_revalidate(struct dentry *entry)
736 {
737         struct inode *inode = entry->d_inode;
738         struct fuse_inode *fi = get_fuse_inode(inode);
739         struct fuse_conn *fc = get_fuse_conn(inode);
740
741         if (!fuse_allow_task(fc, current))
742                 return -EACCES;
743         if (get_node_id(inode) != FUSE_ROOT_ID &&
744             fi->i_time >= get_jiffies_64())
745                 return 0;
746
747         return fuse_do_getattr(inode);
748 }
749
750 static int fuse_access(struct inode *inode, int mask)
751 {
752         struct fuse_conn *fc = get_fuse_conn(inode);
753         struct fuse_req *req;
754         struct fuse_access_in inarg;
755         int err;
756
757         if (fc->no_access)
758                 return 0;
759
760         req = fuse_get_req(fc);
761         if (IS_ERR(req))
762                 return PTR_ERR(req);
763
764         memset(&inarg, 0, sizeof(inarg));
765         inarg.mask = mask;
766         req->in.h.opcode = FUSE_ACCESS;
767         req->in.h.nodeid = get_node_id(inode);
768         req->in.numargs = 1;
769         req->in.args[0].size = sizeof(inarg);
770         req->in.args[0].value = &inarg;
771         request_send(fc, req);
772         err = req->out.h.error;
773         fuse_put_request(fc, req);
774         if (err == -ENOSYS) {
775                 fc->no_access = 1;
776                 err = 0;
777         }
778         return err;
779 }
780
781 /*
782  * Check permission.  The two basic access models of FUSE are:
783  *
784  * 1) Local access checking ('default_permissions' mount option) based
785  * on file mode.  This is the plain old disk filesystem permission
786  * modell.
787  *
788  * 2) "Remote" access checking, where server is responsible for
789  * checking permission in each inode operation.  An exception to this
790  * is if ->permission() was invoked from sys_access() in which case an
791  * access request is sent.  Execute permission is still checked
792  * locally based on file mode.
793  */
794 static int fuse_permission(struct inode *inode, int mask, struct nameidata *nd)
795 {
796         struct fuse_conn *fc = get_fuse_conn(inode);
797
798         if (!fuse_allow_task(fc, current))
799                 return -EACCES;
800         else if (fc->flags & FUSE_DEFAULT_PERMISSIONS) {
801                 int err = generic_permission(inode, mask, NULL);
802
803                 /* If permission is denied, try to refresh file
804                    attributes.  This is also needed, because the root
805                    node will at first have no permissions */
806                 if (err == -EACCES) {
807                         err = fuse_do_getattr(inode);
808                         if (!err)
809                                 err = generic_permission(inode, mask, NULL);
810                 }
811
812                 /* Note: the opposite of the above test does not
813                    exist.  So if permissions are revoked this won't be
814                    noticed immediately, only after the attribute
815                    timeout has expired */
816
817                 return err;
818         } else {
819                 int mode = inode->i_mode;
820                 if ((mask & MAY_EXEC) && !S_ISDIR(mode) && !(mode & S_IXUGO))
821                         return -EACCES;
822
823                 if (nd && (nd->flags & (LOOKUP_ACCESS | LOOKUP_CHDIR)))
824                         return fuse_access(inode, mask);
825                 return 0;
826         }
827 }
828
829 static int parse_dirfile(char *buf, size_t nbytes, struct file *file,
830                          void *dstbuf, filldir_t filldir)
831 {
832         while (nbytes >= FUSE_NAME_OFFSET) {
833                 struct fuse_dirent *dirent = (struct fuse_dirent *) buf;
834                 size_t reclen = FUSE_DIRENT_SIZE(dirent);
835                 int over;
836                 if (!dirent->namelen || dirent->namelen > FUSE_NAME_MAX)
837                         return -EIO;
838                 if (reclen > nbytes)
839                         break;
840
841                 over = filldir(dstbuf, dirent->name, dirent->namelen,
842                                file->f_pos, dirent->ino, dirent->type);
843                 if (over)
844                         break;
845
846                 buf += reclen;
847                 nbytes -= reclen;
848                 file->f_pos = dirent->off;
849         }
850
851         return 0;
852 }
853
854 static int fuse_readdir(struct file *file, void *dstbuf, filldir_t filldir)
855 {
856         int err;
857         size_t nbytes;
858         struct page *page;
859         struct inode *inode = file->f_path.dentry->d_inode;
860         struct fuse_conn *fc = get_fuse_conn(inode);
861         struct fuse_file *ff = file->private_data;
862         struct fuse_req *req;
863
864         if (is_bad_inode(inode))
865                 return -EIO;
866
867         req = fuse_get_req(fc);
868         if (IS_ERR(req))
869                 return PTR_ERR(req);
870
871         page = alloc_page(GFP_KERNEL);
872         if (!page) {
873                 fuse_put_request(fc, req);
874                 return -ENOMEM;
875         }
876         req->num_pages = 1;
877         req->pages[0] = page;
878         fuse_read_fill(req, ff, inode, file->f_pos, PAGE_SIZE, FUSE_READDIR);
879         request_send(fc, req);
880         nbytes = req->out.args[0].size;
881         err = req->out.h.error;
882         fuse_put_request(fc, req);
883         if (!err)
884                 err = parse_dirfile(page_address(page), nbytes, file, dstbuf,
885                                     filldir);
886
887         __free_page(page);
888         fuse_invalidate_attr(inode); /* atime changed */
889         return err;
890 }
891
892 static char *read_link(struct dentry *dentry)
893 {
894         struct inode *inode = dentry->d_inode;
895         struct fuse_conn *fc = get_fuse_conn(inode);
896         struct fuse_req *req = fuse_get_req(fc);
897         char *link;
898
899         if (IS_ERR(req))
900                 return ERR_PTR(PTR_ERR(req));
901
902         link = (char *) __get_free_page(GFP_KERNEL);
903         if (!link) {
904                 link = ERR_PTR(-ENOMEM);
905                 goto out;
906         }
907         req->in.h.opcode = FUSE_READLINK;
908         req->in.h.nodeid = get_node_id(inode);
909         req->out.argvar = 1;
910         req->out.numargs = 1;
911         req->out.args[0].size = PAGE_SIZE - 1;
912         req->out.args[0].value = link;
913         request_send(fc, req);
914         if (req->out.h.error) {
915                 free_page((unsigned long) link);
916                 link = ERR_PTR(req->out.h.error);
917         } else
918                 link[req->out.args[0].size] = '\0';
919  out:
920         fuse_put_request(fc, req);
921         fuse_invalidate_attr(inode); /* atime changed */
922         return link;
923 }
924
925 static void free_link(char *link)
926 {
927         if (!IS_ERR(link))
928                 free_page((unsigned long) link);
929 }
930
931 static void *fuse_follow_link(struct dentry *dentry, struct nameidata *nd)
932 {
933         nd_set_link(nd, read_link(dentry));
934         return NULL;
935 }
936
937 static void fuse_put_link(struct dentry *dentry, struct nameidata *nd, void *c)
938 {
939         free_link(nd_get_link(nd));
940 }
941
942 static int fuse_dir_open(struct inode *inode, struct file *file)
943 {
944         return fuse_open_common(inode, file, 1);
945 }
946
947 static int fuse_dir_release(struct inode *inode, struct file *file)
948 {
949         return fuse_release_common(inode, file, 1);
950 }
951
952 static int fuse_dir_fsync(struct file *file, struct dentry *de, int datasync)
953 {
954         /* nfsd can call this with no file */
955         return file ? fuse_fsync_common(file, de, datasync, 1) : 0;
956 }
957
958 static void iattr_to_fattr(struct iattr *iattr, struct fuse_setattr_in *arg)
959 {
960         unsigned ivalid = iattr->ia_valid;
961
962         if (ivalid & ATTR_MODE)
963                 arg->valid |= FATTR_MODE,   arg->mode = iattr->ia_mode;
964         if (ivalid & ATTR_UID)
965                 arg->valid |= FATTR_UID,    arg->uid = iattr->ia_uid;
966         if (ivalid & ATTR_GID)
967                 arg->valid |= FATTR_GID,    arg->gid = iattr->ia_gid;
968         if (ivalid & ATTR_SIZE)
969                 arg->valid |= FATTR_SIZE,   arg->size = iattr->ia_size;
970         /* You can only _set_ these together (they may change by themselves) */
971         if ((ivalid & (ATTR_ATIME | ATTR_MTIME)) == (ATTR_ATIME | ATTR_MTIME)) {
972                 arg->valid |= FATTR_ATIME | FATTR_MTIME;
973                 arg->atime = iattr->ia_atime.tv_sec;
974                 arg->mtime = iattr->ia_mtime.tv_sec;
975         }
976         if (ivalid & ATTR_FILE) {
977                 struct fuse_file *ff = iattr->ia_file->private_data;
978                 arg->valid |= FATTR_FH;
979                 arg->fh = ff->fh;
980         }
981 }
982
983 static void fuse_vmtruncate(struct inode *inode, loff_t offset)
984 {
985         struct fuse_conn *fc = get_fuse_conn(inode);
986         int need_trunc;
987
988         spin_lock(&fc->lock);
989         need_trunc = inode->i_size > offset;
990         i_size_write(inode, offset);
991         spin_unlock(&fc->lock);
992
993         if (need_trunc) {
994                 struct address_space *mapping = inode->i_mapping;
995                 unmap_mapping_range(mapping, offset + PAGE_SIZE - 1, 0, 1);
996                 truncate_inode_pages(mapping, offset);
997         }
998 }
999
1000 /*
1001  * Set attributes, and at the same time refresh them.
1002  *
1003  * Truncation is slightly complicated, because the 'truncate' request
1004  * may fail, in which case we don't want to touch the mapping.
1005  * vmtruncate() doesn't allow for this case, so do the rlimit checking
1006  * and the actual truncation by hand.
1007  */
1008 static int fuse_setattr(struct dentry *entry, struct iattr *attr)
1009 {
1010         struct inode *inode = entry->d_inode;
1011         struct fuse_conn *fc = get_fuse_conn(inode);
1012         struct fuse_inode *fi = get_fuse_inode(inode);
1013         struct fuse_req *req;
1014         struct fuse_setattr_in inarg;
1015         struct fuse_attr_out outarg;
1016         int err;
1017         int is_truncate = 0;
1018
1019         if (fc->flags & FUSE_DEFAULT_PERMISSIONS) {
1020                 err = inode_change_ok(inode, attr);
1021                 if (err)
1022                         return err;
1023         }
1024
1025         if (attr->ia_valid & ATTR_SIZE) {
1026                 unsigned long limit;
1027                 is_truncate = 1;
1028                 if (IS_SWAPFILE(inode))
1029                         return -ETXTBSY;
1030                 limit = current->signal->rlim[RLIMIT_FSIZE].rlim_cur;
1031                 if (limit != RLIM_INFINITY && attr->ia_size > (loff_t) limit) {
1032                         send_sig(SIGXFSZ, current, 0);
1033                         return -EFBIG;
1034                 }
1035         }
1036
1037         req = fuse_get_req(fc);
1038         if (IS_ERR(req))
1039                 return PTR_ERR(req);
1040
1041         memset(&inarg, 0, sizeof(inarg));
1042         iattr_to_fattr(attr, &inarg);
1043         req->in.h.opcode = FUSE_SETATTR;
1044         req->in.h.nodeid = get_node_id(inode);
1045         req->in.numargs = 1;
1046         req->in.args[0].size = sizeof(inarg);
1047         req->in.args[0].value = &inarg;
1048         req->out.numargs = 1;
1049         req->out.args[0].size = sizeof(outarg);
1050         req->out.args[0].value = &outarg;
1051         request_send(fc, req);
1052         err = req->out.h.error;
1053         fuse_put_request(fc, req);
1054         if (!err) {
1055                 if ((inode->i_mode ^ outarg.attr.mode) & S_IFMT) {
1056                         make_bad_inode(inode);
1057                         err = -EIO;
1058                 } else {
1059                         if (is_truncate)
1060                                 fuse_vmtruncate(inode, outarg.attr.size);
1061                         fuse_change_attributes(inode, &outarg.attr);
1062                         fi->i_time = time_to_jiffies(outarg.attr_valid,
1063                                                      outarg.attr_valid_nsec);
1064                 }
1065         } else if (err == -EINTR)
1066                 fuse_invalidate_attr(inode);
1067
1068         return err;
1069 }
1070
1071 static int fuse_getattr(struct vfsmount *mnt, struct dentry *entry,
1072                         struct kstat *stat)
1073 {
1074         struct inode *inode = entry->d_inode;
1075         int err = fuse_revalidate(entry);
1076         if (!err)
1077                 generic_fillattr(inode, stat);
1078
1079         return err;
1080 }
1081
1082 static int fuse_setxattr(struct dentry *entry, const char *name,
1083                          const void *value, size_t size, int flags)
1084 {
1085         struct inode *inode = entry->d_inode;
1086         struct fuse_conn *fc = get_fuse_conn(inode);
1087         struct fuse_req *req;
1088         struct fuse_setxattr_in inarg;
1089         int err;
1090
1091         if (fc->no_setxattr)
1092                 return -EOPNOTSUPP;
1093
1094         req = fuse_get_req(fc);
1095         if (IS_ERR(req))
1096                 return PTR_ERR(req);
1097
1098         memset(&inarg, 0, sizeof(inarg));
1099         inarg.size = size;
1100         inarg.flags = flags;
1101         req->in.h.opcode = FUSE_SETXATTR;
1102         req->in.h.nodeid = get_node_id(inode);
1103         req->in.numargs = 3;
1104         req->in.args[0].size = sizeof(inarg);
1105         req->in.args[0].value = &inarg;
1106         req->in.args[1].size = strlen(name) + 1;
1107         req->in.args[1].value = name;
1108         req->in.args[2].size = size;
1109         req->in.args[2].value = value;
1110         request_send(fc, req);
1111         err = req->out.h.error;
1112         fuse_put_request(fc, req);
1113         if (err == -ENOSYS) {
1114                 fc->no_setxattr = 1;
1115                 err = -EOPNOTSUPP;
1116         }
1117         return err;
1118 }
1119
1120 static ssize_t fuse_getxattr(struct dentry *entry, const char *name,
1121                              void *value, size_t size)
1122 {
1123         struct inode *inode = entry->d_inode;
1124         struct fuse_conn *fc = get_fuse_conn(inode);
1125         struct fuse_req *req;
1126         struct fuse_getxattr_in inarg;
1127         struct fuse_getxattr_out outarg;
1128         ssize_t ret;
1129
1130         if (fc->no_getxattr)
1131                 return -EOPNOTSUPP;
1132
1133         req = fuse_get_req(fc);
1134         if (IS_ERR(req))
1135                 return PTR_ERR(req);
1136
1137         memset(&inarg, 0, sizeof(inarg));
1138         inarg.size = size;
1139         req->in.h.opcode = FUSE_GETXATTR;
1140         req->in.h.nodeid = get_node_id(inode);
1141         req->in.numargs = 2;
1142         req->in.args[0].size = sizeof(inarg);
1143         req->in.args[0].value = &inarg;
1144         req->in.args[1].size = strlen(name) + 1;
1145         req->in.args[1].value = name;
1146         /* This is really two different operations rolled into one */
1147         req->out.numargs = 1;
1148         if (size) {
1149                 req->out.argvar = 1;
1150                 req->out.args[0].size = size;
1151                 req->out.args[0].value = value;
1152         } else {
1153                 req->out.args[0].size = sizeof(outarg);
1154                 req->out.args[0].value = &outarg;
1155         }
1156         request_send(fc, req);
1157         ret = req->out.h.error;
1158         if (!ret)
1159                 ret = size ? req->out.args[0].size : outarg.size;
1160         else {
1161                 if (ret == -ENOSYS) {
1162                         fc->no_getxattr = 1;
1163                         ret = -EOPNOTSUPP;
1164                 }
1165         }
1166         fuse_put_request(fc, req);
1167         return ret;
1168 }
1169
1170 static ssize_t fuse_listxattr(struct dentry *entry, char *list, size_t size)
1171 {
1172         struct inode *inode = entry->d_inode;
1173         struct fuse_conn *fc = get_fuse_conn(inode);
1174         struct fuse_req *req;
1175         struct fuse_getxattr_in inarg;
1176         struct fuse_getxattr_out outarg;
1177         ssize_t ret;
1178
1179         if (fc->no_listxattr)
1180                 return -EOPNOTSUPP;
1181
1182         req = fuse_get_req(fc);
1183         if (IS_ERR(req))
1184                 return PTR_ERR(req);
1185
1186         memset(&inarg, 0, sizeof(inarg));
1187         inarg.size = size;
1188         req->in.h.opcode = FUSE_LISTXATTR;
1189         req->in.h.nodeid = get_node_id(inode);
1190         req->in.numargs = 1;
1191         req->in.args[0].size = sizeof(inarg);
1192         req->in.args[0].value = &inarg;
1193         /* This is really two different operations rolled into one */
1194         req->out.numargs = 1;
1195         if (size) {
1196                 req->out.argvar = 1;
1197                 req->out.args[0].size = size;
1198                 req->out.args[0].value = list;
1199         } else {
1200                 req->out.args[0].size = sizeof(outarg);
1201                 req->out.args[0].value = &outarg;
1202         }
1203         request_send(fc, req);
1204         ret = req->out.h.error;
1205         if (!ret)
1206                 ret = size ? req->out.args[0].size : outarg.size;
1207         else {
1208                 if (ret == -ENOSYS) {
1209                         fc->no_listxattr = 1;
1210                         ret = -EOPNOTSUPP;
1211                 }
1212         }
1213         fuse_put_request(fc, req);
1214         return ret;
1215 }
1216
1217 static int fuse_removexattr(struct dentry *entry, const char *name)
1218 {
1219         struct inode *inode = entry->d_inode;
1220         struct fuse_conn *fc = get_fuse_conn(inode);
1221         struct fuse_req *req;
1222         int err;
1223
1224         if (fc->no_removexattr)
1225                 return -EOPNOTSUPP;
1226
1227         req = fuse_get_req(fc);
1228         if (IS_ERR(req))
1229                 return PTR_ERR(req);
1230
1231         req->in.h.opcode = FUSE_REMOVEXATTR;
1232         req->in.h.nodeid = get_node_id(inode);
1233         req->in.numargs = 1;
1234         req->in.args[0].size = strlen(name) + 1;
1235         req->in.args[0].value = name;
1236         request_send(fc, req);
1237         err = req->out.h.error;
1238         fuse_put_request(fc, req);
1239         if (err == -ENOSYS) {
1240                 fc->no_removexattr = 1;
1241                 err = -EOPNOTSUPP;
1242         }
1243         return err;
1244 }
1245
1246 static const struct inode_operations fuse_dir_inode_operations = {
1247         .lookup         = fuse_lookup,
1248         .mkdir          = fuse_mkdir,
1249         .symlink        = fuse_symlink,
1250         .unlink         = fuse_unlink,
1251         .rmdir          = fuse_rmdir,
1252         .rename         = fuse_rename,
1253         .link           = fuse_link,
1254         .setattr        = fuse_setattr,
1255         .create         = fuse_create,
1256         .mknod          = fuse_mknod,
1257         .permission     = fuse_permission,
1258         .getattr        = fuse_getattr,
1259         .setxattr       = fuse_setxattr,
1260         .getxattr       = fuse_getxattr,
1261         .listxattr      = fuse_listxattr,
1262         .removexattr    = fuse_removexattr,
1263 };
1264
1265 static const struct file_operations fuse_dir_operations = {
1266         .llseek         = generic_file_llseek,
1267         .read           = generic_read_dir,
1268         .readdir        = fuse_readdir,
1269         .open           = fuse_dir_open,
1270         .release        = fuse_dir_release,
1271         .fsync          = fuse_dir_fsync,
1272 };
1273
1274 static const struct inode_operations fuse_common_inode_operations = {
1275         .setattr        = fuse_setattr,
1276         .permission     = fuse_permission,
1277         .getattr        = fuse_getattr,
1278         .setxattr       = fuse_setxattr,
1279         .getxattr       = fuse_getxattr,
1280         .listxattr      = fuse_listxattr,
1281         .removexattr    = fuse_removexattr,
1282 };
1283
1284 static const struct inode_operations fuse_symlink_inode_operations = {
1285         .setattr        = fuse_setattr,
1286         .follow_link    = fuse_follow_link,
1287         .put_link       = fuse_put_link,
1288         .readlink       = generic_readlink,
1289         .getattr        = fuse_getattr,
1290         .setxattr       = fuse_setxattr,
1291         .getxattr       = fuse_getxattr,
1292         .listxattr      = fuse_listxattr,
1293         .removexattr    = fuse_removexattr,
1294 };
1295
1296 void fuse_init_common(struct inode *inode)
1297 {
1298         inode->i_op = &fuse_common_inode_operations;
1299 }
1300
1301 void fuse_init_dir(struct inode *inode)
1302 {
1303         inode->i_op = &fuse_dir_inode_operations;
1304         inode->i_fop = &fuse_dir_operations;
1305 }
1306
1307 void fuse_init_symlink(struct inode *inode)
1308 {
1309         inode->i_op = &fuse_symlink_inode_operations;
1310 }