[PATCH] configfs: Lock new directory inodes before removing on cleanup after failure
[safe/jmp/linux-2.6] / fs / configfs / dir.c
1 /* -*- mode: c; c-basic-offset: 8; -*-
2  * vim: noexpandtab sw=8 ts=8 sts=0:
3  *
4  * dir.c - Operations for configfs directories.
5  *
6  * This program is free software; you can redistribute it and/or
7  * modify it under the terms of the GNU General Public
8  * License as published by the Free Software Foundation; either
9  * version 2 of the License, or (at your option) any later version.
10  *
11  * This program is distributed in the hope that it will be useful,
12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14  * General Public License for more details.
15  *
16  * You should have received a copy of the GNU General Public
17  * License along with this program; if not, write to the
18  * Free Software Foundation, Inc., 59 Temple Place - Suite 330,
19  * Boston, MA 021110-1307, USA.
20  *
21  * Based on sysfs:
22  *      sysfs is Copyright (C) 2001, 2002, 2003 Patrick Mochel
23  *
24  * configfs Copyright (C) 2005 Oracle.  All rights reserved.
25  */
26
27 #undef DEBUG
28
29 #include <linux/fs.h>
30 #include <linux/mount.h>
31 #include <linux/module.h>
32 #include <linux/slab.h>
33 #include <linux/err.h>
34
35 #include <linux/configfs.h>
36 #include "configfs_internal.h"
37
38 DECLARE_RWSEM(configfs_rename_sem);
39 /*
40  * Protects mutations of configfs_dirent linkage together with proper i_mutex
41  * Also protects mutations of symlinks linkage to target configfs_dirent
42  * Mutators of configfs_dirent linkage must *both* have the proper inode locked
43  * and configfs_dirent_lock locked, in that order.
44  * This allows one to safely traverse configfs_dirent trees and symlinks without
45  * having to lock inodes.
46  *
47  * Protects setting of CONFIGFS_USET_DROPPING: checking the flag
48  * unlocked is not reliable unless in detach_groups() called from
49  * rmdir()/unregister() and from configfs_attach_group()
50  */
51 DEFINE_SPINLOCK(configfs_dirent_lock);
52
53 static void configfs_d_iput(struct dentry * dentry,
54                             struct inode * inode)
55 {
56         struct configfs_dirent * sd = dentry->d_fsdata;
57
58         if (sd) {
59                 BUG_ON(sd->s_dentry != dentry);
60                 sd->s_dentry = NULL;
61                 configfs_put(sd);
62         }
63         iput(inode);
64 }
65
66 /*
67  * We _must_ delete our dentries on last dput, as the chain-to-parent
68  * behavior is required to clear the parents of default_groups.
69  */
70 static int configfs_d_delete(struct dentry *dentry)
71 {
72         return 1;
73 }
74
75 static struct dentry_operations configfs_dentry_ops = {
76         .d_iput         = configfs_d_iput,
77         /* simple_delete_dentry() isn't exported */
78         .d_delete       = configfs_d_delete,
79 };
80
81 /*
82  * Allocates a new configfs_dirent and links it to the parent configfs_dirent
83  */
84 static struct configfs_dirent *configfs_new_dirent(struct configfs_dirent * parent_sd,
85                                                 void * element)
86 {
87         struct configfs_dirent * sd;
88
89         sd = kmem_cache_zalloc(configfs_dir_cachep, GFP_KERNEL);
90         if (!sd)
91                 return ERR_PTR(-ENOMEM);
92
93         atomic_set(&sd->s_count, 1);
94         INIT_LIST_HEAD(&sd->s_links);
95         INIT_LIST_HEAD(&sd->s_children);
96         sd->s_element = element;
97         spin_lock(&configfs_dirent_lock);
98         if (parent_sd->s_type & CONFIGFS_USET_DROPPING) {
99                 spin_unlock(&configfs_dirent_lock);
100                 kmem_cache_free(configfs_dir_cachep, sd);
101                 return ERR_PTR(-ENOENT);
102         }
103         list_add(&sd->s_sibling, &parent_sd->s_children);
104         spin_unlock(&configfs_dirent_lock);
105
106         return sd;
107 }
108
109 /*
110  *
111  * Return -EEXIST if there is already a configfs element with the same
112  * name for the same parent.
113  *
114  * called with parent inode's i_mutex held
115  */
116 static int configfs_dirent_exists(struct configfs_dirent *parent_sd,
117                                   const unsigned char *new)
118 {
119         struct configfs_dirent * sd;
120
121         list_for_each_entry(sd, &parent_sd->s_children, s_sibling) {
122                 if (sd->s_element) {
123                         const unsigned char *existing = configfs_get_name(sd);
124                         if (strcmp(existing, new))
125                                 continue;
126                         else
127                                 return -EEXIST;
128                 }
129         }
130
131         return 0;
132 }
133
134
135 int configfs_make_dirent(struct configfs_dirent * parent_sd,
136                          struct dentry * dentry, void * element,
137                          umode_t mode, int type)
138 {
139         struct configfs_dirent * sd;
140
141         sd = configfs_new_dirent(parent_sd, element);
142         if (IS_ERR(sd))
143                 return PTR_ERR(sd);
144
145         sd->s_mode = mode;
146         sd->s_type = type;
147         sd->s_dentry = dentry;
148         if (dentry) {
149                 dentry->d_fsdata = configfs_get(sd);
150                 dentry->d_op = &configfs_dentry_ops;
151         }
152
153         return 0;
154 }
155
156 static int init_dir(struct inode * inode)
157 {
158         inode->i_op = &configfs_dir_inode_operations;
159         inode->i_fop = &configfs_dir_operations;
160
161         /* directory inodes start off with i_nlink == 2 (for "." entry) */
162         inc_nlink(inode);
163         return 0;
164 }
165
166 static int configfs_init_file(struct inode * inode)
167 {
168         inode->i_size = PAGE_SIZE;
169         inode->i_fop = &configfs_file_operations;
170         return 0;
171 }
172
173 static int init_symlink(struct inode * inode)
174 {
175         inode->i_op = &configfs_symlink_inode_operations;
176         return 0;
177 }
178
179 static int create_dir(struct config_item * k, struct dentry * p,
180                       struct dentry * d)
181 {
182         int error;
183         umode_t mode = S_IFDIR| S_IRWXU | S_IRUGO | S_IXUGO;
184
185         error = configfs_dirent_exists(p->d_fsdata, d->d_name.name);
186         if (!error)
187                 error = configfs_make_dirent(p->d_fsdata, d, k, mode,
188                                              CONFIGFS_DIR | CONFIGFS_USET_CREATING);
189         if (!error) {
190                 error = configfs_create(d, mode, init_dir);
191                 if (!error) {
192                         inc_nlink(p->d_inode);
193                         (d)->d_op = &configfs_dentry_ops;
194                 } else {
195                         struct configfs_dirent *sd = d->d_fsdata;
196                         if (sd) {
197                                 spin_lock(&configfs_dirent_lock);
198                                 list_del_init(&sd->s_sibling);
199                                 spin_unlock(&configfs_dirent_lock);
200                                 configfs_put(sd);
201                         }
202                 }
203         }
204         return error;
205 }
206
207
208 /**
209  *      configfs_create_dir - create a directory for an config_item.
210  *      @item:          config_itemwe're creating directory for.
211  *      @dentry:        config_item's dentry.
212  *
213  *      Note: user-created entries won't be allowed under this new directory
214  *      until it is validated by configfs_dir_set_ready()
215  */
216
217 static int configfs_create_dir(struct config_item * item, struct dentry *dentry)
218 {
219         struct dentry * parent;
220         int error = 0;
221
222         BUG_ON(!item);
223
224         if (item->ci_parent)
225                 parent = item->ci_parent->ci_dentry;
226         else if (configfs_mount && configfs_mount->mnt_sb)
227                 parent = configfs_mount->mnt_sb->s_root;
228         else
229                 return -EFAULT;
230
231         error = create_dir(item,parent,dentry);
232         if (!error)
233                 item->ci_dentry = dentry;
234         return error;
235 }
236
237 /*
238  * Allow userspace to create new entries under a new directory created with
239  * configfs_create_dir(), and under all of its chidlren directories recursively.
240  * @sd          configfs_dirent of the new directory to validate
241  *
242  * Caller must hold configfs_dirent_lock.
243  */
244 static void configfs_dir_set_ready(struct configfs_dirent *sd)
245 {
246         struct configfs_dirent *child_sd;
247
248         sd->s_type &= ~CONFIGFS_USET_CREATING;
249         list_for_each_entry(child_sd, &sd->s_children, s_sibling)
250                 if (child_sd->s_type & CONFIGFS_USET_CREATING)
251                         configfs_dir_set_ready(child_sd);
252 }
253
254 /*
255  * Check that a directory does not belong to a directory hierarchy being
256  * attached and not validated yet.
257  * @sd          configfs_dirent of the directory to check
258  *
259  * @return      non-zero iff the directory was validated
260  *
261  * Note: takes configfs_dirent_lock, so the result may change from false to true
262  * in two consecutive calls, but never from true to false.
263  */
264 int configfs_dirent_is_ready(struct configfs_dirent *sd)
265 {
266         int ret;
267
268         spin_lock(&configfs_dirent_lock);
269         ret = !(sd->s_type & CONFIGFS_USET_CREATING);
270         spin_unlock(&configfs_dirent_lock);
271
272         return ret;
273 }
274
275 int configfs_create_link(struct configfs_symlink *sl,
276                          struct dentry *parent,
277                          struct dentry *dentry)
278 {
279         int err = 0;
280         umode_t mode = S_IFLNK | S_IRWXUGO;
281
282         err = configfs_make_dirent(parent->d_fsdata, dentry, sl, mode,
283                                    CONFIGFS_ITEM_LINK);
284         if (!err) {
285                 err = configfs_create(dentry, mode, init_symlink);
286                 if (!err)
287                         dentry->d_op = &configfs_dentry_ops;
288                 else {
289                         struct configfs_dirent *sd = dentry->d_fsdata;
290                         if (sd) {
291                                 spin_lock(&configfs_dirent_lock);
292                                 list_del_init(&sd->s_sibling);
293                                 spin_unlock(&configfs_dirent_lock);
294                                 configfs_put(sd);
295                         }
296                 }
297         }
298         return err;
299 }
300
301 static void remove_dir(struct dentry * d)
302 {
303         struct dentry * parent = dget(d->d_parent);
304         struct configfs_dirent * sd;
305
306         sd = d->d_fsdata;
307         spin_lock(&configfs_dirent_lock);
308         list_del_init(&sd->s_sibling);
309         spin_unlock(&configfs_dirent_lock);
310         configfs_put(sd);
311         if (d->d_inode)
312                 simple_rmdir(parent->d_inode,d);
313
314         pr_debug(" o %s removing done (%d)\n",d->d_name.name,
315                  atomic_read(&d->d_count));
316
317         dput(parent);
318 }
319
320 /**
321  * configfs_remove_dir - remove an config_item's directory.
322  * @item:       config_item we're removing.
323  *
324  * The only thing special about this is that we remove any files in
325  * the directory before we remove the directory, and we've inlined
326  * what used to be configfs_rmdir() below, instead of calling separately.
327  *
328  * Caller holds the mutex of the item's inode
329  */
330
331 static void configfs_remove_dir(struct config_item * item)
332 {
333         struct dentry * dentry = dget(item->ci_dentry);
334
335         if (!dentry)
336                 return;
337
338         remove_dir(dentry);
339         /**
340          * Drop reference from dget() on entrance.
341          */
342         dput(dentry);
343 }
344
345
346 /* attaches attribute's configfs_dirent to the dentry corresponding to the
347  * attribute file
348  */
349 static int configfs_attach_attr(struct configfs_dirent * sd, struct dentry * dentry)
350 {
351         struct configfs_attribute * attr = sd->s_element;
352         int error;
353
354         dentry->d_fsdata = configfs_get(sd);
355         sd->s_dentry = dentry;
356         error = configfs_create(dentry, (attr->ca_mode & S_IALLUGO) | S_IFREG,
357                                 configfs_init_file);
358         if (error) {
359                 configfs_put(sd);
360                 return error;
361         }
362
363         dentry->d_op = &configfs_dentry_ops;
364         d_rehash(dentry);
365
366         return 0;
367 }
368
369 static struct dentry * configfs_lookup(struct inode *dir,
370                                        struct dentry *dentry,
371                                        struct nameidata *nd)
372 {
373         struct configfs_dirent * parent_sd = dentry->d_parent->d_fsdata;
374         struct configfs_dirent * sd;
375         int found = 0;
376         int err;
377
378         /*
379          * Fake invisibility if dir belongs to a group/default groups hierarchy
380          * being attached
381          *
382          * This forbids userspace to read/write attributes of items which may
383          * not complete their initialization, since the dentries of the
384          * attributes won't be instantiated.
385          */
386         err = -ENOENT;
387         if (!configfs_dirent_is_ready(parent_sd))
388                 goto out;
389
390         list_for_each_entry(sd, &parent_sd->s_children, s_sibling) {
391                 if (sd->s_type & CONFIGFS_NOT_PINNED) {
392                         const unsigned char * name = configfs_get_name(sd);
393
394                         if (strcmp(name, dentry->d_name.name))
395                                 continue;
396
397                         found = 1;
398                         err = configfs_attach_attr(sd, dentry);
399                         break;
400                 }
401         }
402
403         if (!found) {
404                 /*
405                  * If it doesn't exist and it isn't a NOT_PINNED item,
406                  * it must be negative.
407                  */
408                 return simple_lookup(dir, dentry, nd);
409         }
410
411 out:
412         return ERR_PTR(err);
413 }
414
415 /*
416  * Only subdirectories count here.  Files (CONFIGFS_NOT_PINNED) are
417  * attributes and are removed by rmdir().  We recurse, setting
418  * CONFIGFS_USET_DROPPING on all children that are candidates for
419  * default detach.
420  * If there is an error, the caller will reset the flags via
421  * configfs_detach_rollback().
422  */
423 static int configfs_detach_prep(struct dentry *dentry, struct mutex **wait_mutex)
424 {
425         struct configfs_dirent *parent_sd = dentry->d_fsdata;
426         struct configfs_dirent *sd;
427         int ret;
428
429         /* Mark that we're trying to drop the group */
430         parent_sd->s_type |= CONFIGFS_USET_DROPPING;
431
432         ret = -EBUSY;
433         if (!list_empty(&parent_sd->s_links))
434                 goto out;
435
436         ret = 0;
437         list_for_each_entry(sd, &parent_sd->s_children, s_sibling) {
438                 if (sd->s_type & CONFIGFS_NOT_PINNED)
439                         continue;
440                 if (sd->s_type & CONFIGFS_USET_DEFAULT) {
441                         /* Abort if racing with mkdir() */
442                         if (sd->s_type & CONFIGFS_USET_IN_MKDIR) {
443                                 if (wait_mutex)
444                                         *wait_mutex = &sd->s_dentry->d_inode->i_mutex;
445                                 return -EAGAIN;
446                         }
447
448                         /*
449                          * Yup, recursive.  If there's a problem, blame
450                          * deep nesting of default_groups
451                          */
452                         ret = configfs_detach_prep(sd->s_dentry, wait_mutex);
453                         if (!ret)
454                                 continue;
455                 } else
456                         ret = -ENOTEMPTY;
457
458                 break;
459         }
460
461 out:
462         return ret;
463 }
464
465 /*
466  * Walk the tree, resetting CONFIGFS_USET_DROPPING wherever it was
467  * set.
468  */
469 static void configfs_detach_rollback(struct dentry *dentry)
470 {
471         struct configfs_dirent *parent_sd = dentry->d_fsdata;
472         struct configfs_dirent *sd;
473
474         parent_sd->s_type &= ~CONFIGFS_USET_DROPPING;
475
476         list_for_each_entry(sd, &parent_sd->s_children, s_sibling)
477                 if (sd->s_type & CONFIGFS_USET_DEFAULT)
478                         configfs_detach_rollback(sd->s_dentry);
479 }
480
481 static void detach_attrs(struct config_item * item)
482 {
483         struct dentry * dentry = dget(item->ci_dentry);
484         struct configfs_dirent * parent_sd;
485         struct configfs_dirent * sd, * tmp;
486
487         if (!dentry)
488                 return;
489
490         pr_debug("configfs %s: dropping attrs for  dir\n",
491                  dentry->d_name.name);
492
493         parent_sd = dentry->d_fsdata;
494         list_for_each_entry_safe(sd, tmp, &parent_sd->s_children, s_sibling) {
495                 if (!sd->s_element || !(sd->s_type & CONFIGFS_NOT_PINNED))
496                         continue;
497                 spin_lock(&configfs_dirent_lock);
498                 list_del_init(&sd->s_sibling);
499                 spin_unlock(&configfs_dirent_lock);
500                 configfs_drop_dentry(sd, dentry);
501                 configfs_put(sd);
502         }
503
504         /**
505          * Drop reference from dget() on entrance.
506          */
507         dput(dentry);
508 }
509
510 static int populate_attrs(struct config_item *item)
511 {
512         struct config_item_type *t = item->ci_type;
513         struct configfs_attribute *attr;
514         int error = 0;
515         int i;
516
517         if (!t)
518                 return -EINVAL;
519         if (t->ct_attrs) {
520                 for (i = 0; (attr = t->ct_attrs[i]) != NULL; i++) {
521                         if ((error = configfs_create_file(item, attr)))
522                                 break;
523                 }
524         }
525
526         if (error)
527                 detach_attrs(item);
528
529         return error;
530 }
531
532 static int configfs_attach_group(struct config_item *parent_item,
533                                  struct config_item *item,
534                                  struct dentry *dentry);
535 static void configfs_detach_group(struct config_item *item);
536
537 static void detach_groups(struct config_group *group)
538 {
539         struct dentry * dentry = dget(group->cg_item.ci_dentry);
540         struct dentry *child;
541         struct configfs_dirent *parent_sd;
542         struct configfs_dirent *sd, *tmp;
543
544         if (!dentry)
545                 return;
546
547         parent_sd = dentry->d_fsdata;
548         list_for_each_entry_safe(sd, tmp, &parent_sd->s_children, s_sibling) {
549                 if (!sd->s_element ||
550                     !(sd->s_type & CONFIGFS_USET_DEFAULT))
551                         continue;
552
553                 child = sd->s_dentry;
554
555                 mutex_lock(&child->d_inode->i_mutex);
556
557                 configfs_detach_group(sd->s_element);
558                 child->d_inode->i_flags |= S_DEAD;
559
560                 mutex_unlock(&child->d_inode->i_mutex);
561
562                 d_delete(child);
563                 dput(child);
564         }
565
566         /**
567          * Drop reference from dget() on entrance.
568          */
569         dput(dentry);
570 }
571
572 /*
573  * This fakes mkdir(2) on a default_groups[] entry.  It
574  * creates a dentry, attachs it, and then does fixup
575  * on the sd->s_type.
576  *
577  * We could, perhaps, tweak our parent's ->mkdir for a minute and
578  * try using vfs_mkdir.  Just a thought.
579  */
580 static int create_default_group(struct config_group *parent_group,
581                                 struct config_group *group)
582 {
583         int ret;
584         struct qstr name;
585         struct configfs_dirent *sd;
586         /* We trust the caller holds a reference to parent */
587         struct dentry *child, *parent = parent_group->cg_item.ci_dentry;
588
589         if (!group->cg_item.ci_name)
590                 group->cg_item.ci_name = group->cg_item.ci_namebuf;
591         name.name = group->cg_item.ci_name;
592         name.len = strlen(name.name);
593         name.hash = full_name_hash(name.name, name.len);
594
595         ret = -ENOMEM;
596         child = d_alloc(parent, &name);
597         if (child) {
598                 d_add(child, NULL);
599
600                 ret = configfs_attach_group(&parent_group->cg_item,
601                                             &group->cg_item, child);
602                 if (!ret) {
603                         sd = child->d_fsdata;
604                         sd->s_type |= CONFIGFS_USET_DEFAULT;
605                 } else {
606                         d_delete(child);
607                         dput(child);
608                 }
609         }
610
611         return ret;
612 }
613
614 static int populate_groups(struct config_group *group)
615 {
616         struct config_group *new_group;
617         int ret = 0;
618         int i;
619
620         if (group->default_groups) {
621                 for (i = 0; group->default_groups[i]; i++) {
622                         new_group = group->default_groups[i];
623
624                         ret = create_default_group(group, new_group);
625                         if (ret) {
626                                 detach_groups(group);
627                                 break;
628                         }
629                 }
630         }
631
632         return ret;
633 }
634
635 /*
636  * All of link_obj/unlink_obj/link_group/unlink_group require that
637  * subsys->su_mutex is held.
638  */
639
640 static void unlink_obj(struct config_item *item)
641 {
642         struct config_group *group;
643
644         group = item->ci_group;
645         if (group) {
646                 list_del_init(&item->ci_entry);
647
648                 item->ci_group = NULL;
649                 item->ci_parent = NULL;
650
651                 /* Drop the reference for ci_entry */
652                 config_item_put(item);
653
654                 /* Drop the reference for ci_parent */
655                 config_group_put(group);
656         }
657 }
658
659 static void link_obj(struct config_item *parent_item, struct config_item *item)
660 {
661         /*
662          * Parent seems redundant with group, but it makes certain
663          * traversals much nicer.
664          */
665         item->ci_parent = parent_item;
666
667         /*
668          * We hold a reference on the parent for the child's ci_parent
669          * link.
670          */
671         item->ci_group = config_group_get(to_config_group(parent_item));
672         list_add_tail(&item->ci_entry, &item->ci_group->cg_children);
673
674         /*
675          * We hold a reference on the child for ci_entry on the parent's
676          * cg_children
677          */
678         config_item_get(item);
679 }
680
681 static void unlink_group(struct config_group *group)
682 {
683         int i;
684         struct config_group *new_group;
685
686         if (group->default_groups) {
687                 for (i = 0; group->default_groups[i]; i++) {
688                         new_group = group->default_groups[i];
689                         unlink_group(new_group);
690                 }
691         }
692
693         group->cg_subsys = NULL;
694         unlink_obj(&group->cg_item);
695 }
696
697 static void link_group(struct config_group *parent_group, struct config_group *group)
698 {
699         int i;
700         struct config_group *new_group;
701         struct configfs_subsystem *subsys = NULL; /* gcc is a turd */
702
703         link_obj(&parent_group->cg_item, &group->cg_item);
704
705         if (parent_group->cg_subsys)
706                 subsys = parent_group->cg_subsys;
707         else if (configfs_is_root(&parent_group->cg_item))
708                 subsys = to_configfs_subsystem(group);
709         else
710                 BUG();
711         group->cg_subsys = subsys;
712
713         if (group->default_groups) {
714                 for (i = 0; group->default_groups[i]; i++) {
715                         new_group = group->default_groups[i];
716                         link_group(group, new_group);
717                 }
718         }
719 }
720
721 /*
722  * The goal is that configfs_attach_item() (and
723  * configfs_attach_group()) can be called from either the VFS or this
724  * module.  That is, they assume that the items have been created,
725  * the dentry allocated, and the dcache is all ready to go.
726  *
727  * If they fail, they must clean up after themselves as if they
728  * had never been called.  The caller (VFS or local function) will
729  * handle cleaning up the dcache bits.
730  *
731  * configfs_detach_group() and configfs_detach_item() behave similarly on
732  * the way out.  They assume that the proper semaphores are held, they
733  * clean up the configfs items, and they expect their callers will
734  * handle the dcache bits.
735  */
736 static int configfs_attach_item(struct config_item *parent_item,
737                                 struct config_item *item,
738                                 struct dentry *dentry)
739 {
740         int ret;
741
742         ret = configfs_create_dir(item, dentry);
743         if (!ret) {
744                 ret = populate_attrs(item);
745                 if (ret) {
746                         /*
747                          * We are going to remove an inode and its dentry but
748                          * the VFS may already have hit and used them. Thus,
749                          * we must lock them as rmdir() would.
750                          */
751                         mutex_lock(&dentry->d_inode->i_mutex);
752                         configfs_remove_dir(item);
753                         dentry->d_inode->i_flags |= S_DEAD;
754                         mutex_unlock(&dentry->d_inode->i_mutex);
755                         d_delete(dentry);
756                 }
757         }
758
759         return ret;
760 }
761
762 /* Caller holds the mutex of the item's inode */
763 static void configfs_detach_item(struct config_item *item)
764 {
765         detach_attrs(item);
766         configfs_remove_dir(item);
767 }
768
769 static int configfs_attach_group(struct config_item *parent_item,
770                                  struct config_item *item,
771                                  struct dentry *dentry)
772 {
773         int ret;
774         struct configfs_dirent *sd;
775
776         ret = configfs_attach_item(parent_item, item, dentry);
777         if (!ret) {
778                 sd = dentry->d_fsdata;
779                 sd->s_type |= CONFIGFS_USET_DIR;
780
781                 /*
782                  * FYI, we're faking mkdir in populate_groups()
783                  * We must lock the group's inode to avoid races with the VFS
784                  * which can already hit the inode and try to add/remove entries
785                  * under it.
786                  *
787                  * We must also lock the inode to remove it safely in case of
788                  * error, as rmdir() would.
789                  */
790                 mutex_lock_nested(&dentry->d_inode->i_mutex, I_MUTEX_CHILD);
791                 ret = populate_groups(to_config_group(item));
792                 if (ret) {
793                         configfs_detach_item(item);
794                         dentry->d_inode->i_flags |= S_DEAD;
795                 }
796                 mutex_unlock(&dentry->d_inode->i_mutex);
797                 if (ret)
798                         d_delete(dentry);
799         }
800
801         return ret;
802 }
803
804 /* Caller holds the mutex of the group's inode */
805 static void configfs_detach_group(struct config_item *item)
806 {
807         detach_groups(to_config_group(item));
808         configfs_detach_item(item);
809 }
810
811 /*
812  * After the item has been detached from the filesystem view, we are
813  * ready to tear it out of the hierarchy.  Notify the client before
814  * we do that so they can perform any cleanup that requires
815  * navigating the hierarchy.  A client does not need to provide this
816  * callback.  The subsystem semaphore MUST be held by the caller, and
817  * references must be valid for both items.  It also assumes the
818  * caller has validated ci_type.
819  */
820 static void client_disconnect_notify(struct config_item *parent_item,
821                                      struct config_item *item)
822 {
823         struct config_item_type *type;
824
825         type = parent_item->ci_type;
826         BUG_ON(!type);
827
828         if (type->ct_group_ops && type->ct_group_ops->disconnect_notify)
829                 type->ct_group_ops->disconnect_notify(to_config_group(parent_item),
830                                                       item);
831 }
832
833 /*
834  * Drop the initial reference from make_item()/make_group()
835  * This function assumes that reference is held on item
836  * and that item holds a valid reference to the parent.  Also, it
837  * assumes the caller has validated ci_type.
838  */
839 static void client_drop_item(struct config_item *parent_item,
840                              struct config_item *item)
841 {
842         struct config_item_type *type;
843
844         type = parent_item->ci_type;
845         BUG_ON(!type);
846
847         /*
848          * If ->drop_item() exists, it is responsible for the
849          * config_item_put().
850          */
851         if (type->ct_group_ops && type->ct_group_ops->drop_item)
852                 type->ct_group_ops->drop_item(to_config_group(parent_item),
853                                               item);
854         else
855                 config_item_put(item);
856 }
857
858 #ifdef DEBUG
859 static void configfs_dump_one(struct configfs_dirent *sd, int level)
860 {
861         printk(KERN_INFO "%*s\"%s\":\n", level, " ", configfs_get_name(sd));
862
863 #define type_print(_type) if (sd->s_type & _type) printk(KERN_INFO "%*s %s\n", level, " ", #_type);
864         type_print(CONFIGFS_ROOT);
865         type_print(CONFIGFS_DIR);
866         type_print(CONFIGFS_ITEM_ATTR);
867         type_print(CONFIGFS_ITEM_LINK);
868         type_print(CONFIGFS_USET_DIR);
869         type_print(CONFIGFS_USET_DEFAULT);
870         type_print(CONFIGFS_USET_DROPPING);
871 #undef type_print
872 }
873
874 static int configfs_dump(struct configfs_dirent *sd, int level)
875 {
876         struct configfs_dirent *child_sd;
877         int ret = 0;
878
879         configfs_dump_one(sd, level);
880
881         if (!(sd->s_type & (CONFIGFS_DIR|CONFIGFS_ROOT)))
882                 return 0;
883
884         list_for_each_entry(child_sd, &sd->s_children, s_sibling) {
885                 ret = configfs_dump(child_sd, level + 2);
886                 if (ret)
887                         break;
888         }
889
890         return ret;
891 }
892 #endif
893
894
895 /*
896  * configfs_depend_item() and configfs_undepend_item()
897  *
898  * WARNING: Do not call these from a configfs callback!
899  *
900  * This describes these functions and their helpers.
901  *
902  * Allow another kernel system to depend on a config_item.  If this
903  * happens, the item cannot go away until the dependant can live without
904  * it.  The idea is to give client modules as simple an interface as
905  * possible.  When a system asks them to depend on an item, they just
906  * call configfs_depend_item().  If the item is live and the client
907  * driver is in good shape, we'll happily do the work for them.
908  *
909  * Why is the locking complex?  Because configfs uses the VFS to handle
910  * all locking, but this function is called outside the normal
911  * VFS->configfs path.  So it must take VFS locks to prevent the
912  * VFS->configfs stuff (configfs_mkdir(), configfs_rmdir(), etc).  This is
913  * why you can't call these functions underneath configfs callbacks.
914  *
915  * Note, btw, that this can be called at *any* time, even when a configfs
916  * subsystem isn't registered, or when configfs is loading or unloading.
917  * Just like configfs_register_subsystem().  So we take the same
918  * precautions.  We pin the filesystem.  We lock each i_mutex _in_order_
919  * on our way down the tree.  If we can find the target item in the
920  * configfs tree, it must be part of the subsystem tree as well, so we
921  * do not need the subsystem semaphore.  Holding the i_mutex chain locks
922  * out mkdir() and rmdir(), who might be racing us.
923  */
924
925 /*
926  * configfs_depend_prep()
927  *
928  * Only subdirectories count here.  Files (CONFIGFS_NOT_PINNED) are
929  * attributes.  This is similar but not the same to configfs_detach_prep().
930  * Note that configfs_detach_prep() expects the parent to be locked when it
931  * is called, but we lock the parent *inside* configfs_depend_prep().  We
932  * do that so we can unlock it if we find nothing.
933  *
934  * Here we do a depth-first search of the dentry hierarchy looking for
935  * our object.  We take i_mutex on each step of the way down.  IT IS
936  * ESSENTIAL THAT i_mutex LOCKING IS ORDERED.  If we come back up a branch,
937  * we'll drop the i_mutex.
938  *
939  * If the target is not found, -ENOENT is bubbled up and we have released
940  * all locks.  If the target was found, the locks will be cleared by
941  * configfs_depend_rollback().
942  *
943  * This adds a requirement that all config_items be unique!
944  *
945  * This is recursive because the locking traversal is tricky.  There isn't
946  * much on the stack, though, so folks that need this function - be careful
947  * about your stack!  Patches will be accepted to make it iterative.
948  */
949 static int configfs_depend_prep(struct dentry *origin,
950                                 struct config_item *target)
951 {
952         struct configfs_dirent *child_sd, *sd = origin->d_fsdata;
953         int ret = 0;
954
955         BUG_ON(!origin || !sd);
956
957         /* Lock this guy on the way down */
958         mutex_lock(&sd->s_dentry->d_inode->i_mutex);
959         if (sd->s_element == target)  /* Boo-yah */
960                 goto out;
961
962         list_for_each_entry(child_sd, &sd->s_children, s_sibling) {
963                 if (child_sd->s_type & CONFIGFS_DIR) {
964                         ret = configfs_depend_prep(child_sd->s_dentry,
965                                                    target);
966                         if (!ret)
967                                 goto out;  /* Child path boo-yah */
968                 }
969         }
970
971         /* We looped all our children and didn't find target */
972         mutex_unlock(&sd->s_dentry->d_inode->i_mutex);
973         ret = -ENOENT;
974
975 out:
976         return ret;
977 }
978
979 /*
980  * This is ONLY called if configfs_depend_prep() did its job.  So we can
981  * trust the entire path from item back up to origin.
982  *
983  * We walk backwards from item, unlocking each i_mutex.  We finish by
984  * unlocking origin.
985  */
986 static void configfs_depend_rollback(struct dentry *origin,
987                                      struct config_item *item)
988 {
989         struct dentry *dentry = item->ci_dentry;
990
991         while (dentry != origin) {
992                 mutex_unlock(&dentry->d_inode->i_mutex);
993                 dentry = dentry->d_parent;
994         }
995
996         mutex_unlock(&origin->d_inode->i_mutex);
997 }
998
999 int configfs_depend_item(struct configfs_subsystem *subsys,
1000                          struct config_item *target)
1001 {
1002         int ret;
1003         struct configfs_dirent *p, *root_sd, *subsys_sd = NULL;
1004         struct config_item *s_item = &subsys->su_group.cg_item;
1005
1006         /*
1007          * Pin the configfs filesystem.  This means we can safely access
1008          * the root of the configfs filesystem.
1009          */
1010         ret = configfs_pin_fs();
1011         if (ret)
1012                 return ret;
1013
1014         /*
1015          * Next, lock the root directory.  We're going to check that the
1016          * subsystem is really registered, and so we need to lock out
1017          * configfs_[un]register_subsystem().
1018          */
1019         mutex_lock(&configfs_sb->s_root->d_inode->i_mutex);
1020
1021         root_sd = configfs_sb->s_root->d_fsdata;
1022
1023         list_for_each_entry(p, &root_sd->s_children, s_sibling) {
1024                 if (p->s_type & CONFIGFS_DIR) {
1025                         if (p->s_element == s_item) {
1026                                 subsys_sd = p;
1027                                 break;
1028                         }
1029                 }
1030         }
1031
1032         if (!subsys_sd) {
1033                 ret = -ENOENT;
1034                 goto out_unlock_fs;
1035         }
1036
1037         /* Ok, now we can trust subsys/s_item */
1038
1039         /* Scan the tree, locking i_mutex recursively, return 0 if found */
1040         ret = configfs_depend_prep(subsys_sd->s_dentry, target);
1041         if (ret)
1042                 goto out_unlock_fs;
1043
1044         /* We hold all i_mutexes from the subsystem down to the target */
1045         p = target->ci_dentry->d_fsdata;
1046         p->s_dependent_count += 1;
1047
1048         configfs_depend_rollback(subsys_sd->s_dentry, target);
1049
1050 out_unlock_fs:
1051         mutex_unlock(&configfs_sb->s_root->d_inode->i_mutex);
1052
1053         /*
1054          * If we succeeded, the fs is pinned via other methods.  If not,
1055          * we're done with it anyway.  So release_fs() is always right.
1056          */
1057         configfs_release_fs();
1058
1059         return ret;
1060 }
1061 EXPORT_SYMBOL(configfs_depend_item);
1062
1063 /*
1064  * Release the dependent linkage.  This is much simpler than
1065  * configfs_depend_item() because we know that that the client driver is
1066  * pinned, thus the subsystem is pinned, and therefore configfs is pinned.
1067  */
1068 void configfs_undepend_item(struct configfs_subsystem *subsys,
1069                             struct config_item *target)
1070 {
1071         struct configfs_dirent *sd;
1072
1073         /*
1074          * Since we can trust everything is pinned, we just need i_mutex
1075          * on the item.
1076          */
1077         mutex_lock(&target->ci_dentry->d_inode->i_mutex);
1078
1079         sd = target->ci_dentry->d_fsdata;
1080         BUG_ON(sd->s_dependent_count < 1);
1081
1082         sd->s_dependent_count -= 1;
1083
1084         /*
1085          * After this unlock, we cannot trust the item to stay alive!
1086          * DO NOT REFERENCE item after this unlock.
1087          */
1088         mutex_unlock(&target->ci_dentry->d_inode->i_mutex);
1089 }
1090 EXPORT_SYMBOL(configfs_undepend_item);
1091
1092 static int configfs_mkdir(struct inode *dir, struct dentry *dentry, int mode)
1093 {
1094         int ret = 0;
1095         int module_got = 0;
1096         struct config_group *group = NULL;
1097         struct config_item *item = NULL;
1098         struct config_item *parent_item;
1099         struct configfs_subsystem *subsys;
1100         struct configfs_dirent *sd;
1101         struct config_item_type *type;
1102         struct module *owner = NULL;
1103         char *name;
1104
1105         if (dentry->d_parent == configfs_sb->s_root) {
1106                 ret = -EPERM;
1107                 goto out;
1108         }
1109
1110         sd = dentry->d_parent->d_fsdata;
1111
1112         /*
1113          * Fake invisibility if dir belongs to a group/default groups hierarchy
1114          * being attached
1115          */
1116         if (!configfs_dirent_is_ready(sd)) {
1117                 ret = -ENOENT;
1118                 goto out;
1119         }
1120
1121         if (!(sd->s_type & CONFIGFS_USET_DIR)) {
1122                 ret = -EPERM;
1123                 goto out;
1124         }
1125
1126         /* Get a working ref for the duration of this function */
1127         parent_item = configfs_get_config_item(dentry->d_parent);
1128         type = parent_item->ci_type;
1129         subsys = to_config_group(parent_item)->cg_subsys;
1130         BUG_ON(!subsys);
1131
1132         if (!type || !type->ct_group_ops ||
1133             (!type->ct_group_ops->make_group &&
1134              !type->ct_group_ops->make_item)) {
1135                 ret = -EPERM;  /* Lack-of-mkdir returns -EPERM */
1136                 goto out_put;
1137         }
1138
1139         name = kmalloc(dentry->d_name.len + 1, GFP_KERNEL);
1140         if (!name) {
1141                 ret = -ENOMEM;
1142                 goto out_put;
1143         }
1144
1145         snprintf(name, dentry->d_name.len + 1, "%s", dentry->d_name.name);
1146
1147         mutex_lock(&subsys->su_mutex);
1148         if (type->ct_group_ops->make_group) {
1149                 group = type->ct_group_ops->make_group(to_config_group(parent_item), name);
1150                 if (!group)
1151                         group = ERR_PTR(-ENOMEM);
1152                 if (!IS_ERR(group)) {
1153                         link_group(to_config_group(parent_item), group);
1154                         item = &group->cg_item;
1155                 } else
1156                         ret = PTR_ERR(group);
1157         } else {
1158                 item = type->ct_group_ops->make_item(to_config_group(parent_item), name);
1159                 if (!item)
1160                         item = ERR_PTR(-ENOMEM);
1161                 if (!IS_ERR(item))
1162                         link_obj(parent_item, item);
1163                 else
1164                         ret = PTR_ERR(item);
1165         }
1166         mutex_unlock(&subsys->su_mutex);
1167
1168         kfree(name);
1169         if (ret) {
1170                 /*
1171                  * If ret != 0, then link_obj() was never called.
1172                  * There are no extra references to clean up.
1173                  */
1174                 goto out_put;
1175         }
1176
1177         /*
1178          * link_obj() has been called (via link_group() for groups).
1179          * From here on out, errors must clean that up.
1180          */
1181
1182         type = item->ci_type;
1183         if (!type) {
1184                 ret = -EINVAL;
1185                 goto out_unlink;
1186         }
1187
1188         owner = type->ct_owner;
1189         if (!try_module_get(owner)) {
1190                 ret = -EINVAL;
1191                 goto out_unlink;
1192         }
1193
1194         /*
1195          * I hate doing it this way, but if there is
1196          * an error,  module_put() probably should
1197          * happen after any cleanup.
1198          */
1199         module_got = 1;
1200
1201         /*
1202          * Make racing rmdir() fail if it did not tag parent with
1203          * CONFIGFS_USET_DROPPING
1204          * Note: if CONFIGFS_USET_DROPPING is already set, attach_group() will
1205          * fail and let rmdir() terminate correctly
1206          */
1207         spin_lock(&configfs_dirent_lock);
1208         /* This will make configfs_detach_prep() fail */
1209         sd->s_type |= CONFIGFS_USET_IN_MKDIR;
1210         spin_unlock(&configfs_dirent_lock);
1211
1212         if (group)
1213                 ret = configfs_attach_group(parent_item, item, dentry);
1214         else
1215                 ret = configfs_attach_item(parent_item, item, dentry);
1216
1217         spin_lock(&configfs_dirent_lock);
1218         sd->s_type &= ~CONFIGFS_USET_IN_MKDIR;
1219         if (!ret)
1220                 configfs_dir_set_ready(dentry->d_fsdata);
1221         spin_unlock(&configfs_dirent_lock);
1222
1223 out_unlink:
1224         if (ret) {
1225                 /* Tear down everything we built up */
1226                 mutex_lock(&subsys->su_mutex);
1227
1228                 client_disconnect_notify(parent_item, item);
1229                 if (group)
1230                         unlink_group(group);
1231                 else
1232                         unlink_obj(item);
1233                 client_drop_item(parent_item, item);
1234
1235                 mutex_unlock(&subsys->su_mutex);
1236
1237                 if (module_got)
1238                         module_put(owner);
1239         }
1240
1241 out_put:
1242         /*
1243          * link_obj()/link_group() took a reference from child->parent,
1244          * so the parent is safely pinned.  We can drop our working
1245          * reference.
1246          */
1247         config_item_put(parent_item);
1248
1249 out:
1250         return ret;
1251 }
1252
1253 static int configfs_rmdir(struct inode *dir, struct dentry *dentry)
1254 {
1255         struct config_item *parent_item;
1256         struct config_item *item;
1257         struct configfs_subsystem *subsys;
1258         struct configfs_dirent *sd;
1259         struct module *owner = NULL;
1260         int ret;
1261
1262         if (dentry->d_parent == configfs_sb->s_root)
1263                 return -EPERM;
1264
1265         sd = dentry->d_fsdata;
1266         if (sd->s_type & CONFIGFS_USET_DEFAULT)
1267                 return -EPERM;
1268
1269         /*
1270          * Here's where we check for dependents.  We're protected by
1271          * i_mutex.
1272          */
1273         if (sd->s_dependent_count)
1274                 return -EBUSY;
1275
1276         /* Get a working ref until we have the child */
1277         parent_item = configfs_get_config_item(dentry->d_parent);
1278         subsys = to_config_group(parent_item)->cg_subsys;
1279         BUG_ON(!subsys);
1280
1281         if (!parent_item->ci_type) {
1282                 config_item_put(parent_item);
1283                 return -EINVAL;
1284         }
1285
1286         /*
1287          * Ensure that no racing symlink() will make detach_prep() fail while
1288          * the new link is temporarily attached
1289          */
1290         mutex_lock(&configfs_symlink_mutex);
1291         spin_lock(&configfs_dirent_lock);
1292         do {
1293                 struct mutex *wait_mutex;
1294
1295                 ret = configfs_detach_prep(dentry, &wait_mutex);
1296                 if (ret) {
1297                         configfs_detach_rollback(dentry);
1298                         spin_unlock(&configfs_dirent_lock);
1299                         mutex_unlock(&configfs_symlink_mutex);
1300                         if (ret != -EAGAIN) {
1301                                 config_item_put(parent_item);
1302                                 return ret;
1303                         }
1304
1305                         /* Wait until the racing operation terminates */
1306                         mutex_lock(wait_mutex);
1307                         mutex_unlock(wait_mutex);
1308
1309                         mutex_lock(&configfs_symlink_mutex);
1310                         spin_lock(&configfs_dirent_lock);
1311                 }
1312         } while (ret == -EAGAIN);
1313         spin_unlock(&configfs_dirent_lock);
1314         mutex_unlock(&configfs_symlink_mutex);
1315
1316         /* Get a working ref for the duration of this function */
1317         item = configfs_get_config_item(dentry);
1318
1319         /* Drop reference from above, item already holds one. */
1320         config_item_put(parent_item);
1321
1322         if (item->ci_type)
1323                 owner = item->ci_type->ct_owner;
1324
1325         if (sd->s_type & CONFIGFS_USET_DIR) {
1326                 configfs_detach_group(item);
1327
1328                 mutex_lock(&subsys->su_mutex);
1329                 client_disconnect_notify(parent_item, item);
1330                 unlink_group(to_config_group(item));
1331         } else {
1332                 configfs_detach_item(item);
1333
1334                 mutex_lock(&subsys->su_mutex);
1335                 client_disconnect_notify(parent_item, item);
1336                 unlink_obj(item);
1337         }
1338
1339         client_drop_item(parent_item, item);
1340         mutex_unlock(&subsys->su_mutex);
1341
1342         /* Drop our reference from above */
1343         config_item_put(item);
1344
1345         module_put(owner);
1346
1347         return 0;
1348 }
1349
1350 const struct inode_operations configfs_dir_inode_operations = {
1351         .mkdir          = configfs_mkdir,
1352         .rmdir          = configfs_rmdir,
1353         .symlink        = configfs_symlink,
1354         .unlink         = configfs_unlink,
1355         .lookup         = configfs_lookup,
1356         .setattr        = configfs_setattr,
1357 };
1358
1359 #if 0
1360 int configfs_rename_dir(struct config_item * item, const char *new_name)
1361 {
1362         int error = 0;
1363         struct dentry * new_dentry, * parent;
1364
1365         if (!strcmp(config_item_name(item), new_name))
1366                 return -EINVAL;
1367
1368         if (!item->parent)
1369                 return -EINVAL;
1370
1371         down_write(&configfs_rename_sem);
1372         parent = item->parent->dentry;
1373
1374         mutex_lock(&parent->d_inode->i_mutex);
1375
1376         new_dentry = lookup_one_len(new_name, parent, strlen(new_name));
1377         if (!IS_ERR(new_dentry)) {
1378                 if (!new_dentry->d_inode) {
1379                         error = config_item_set_name(item, "%s", new_name);
1380                         if (!error) {
1381                                 d_add(new_dentry, NULL);
1382                                 d_move(item->dentry, new_dentry);
1383                         }
1384                         else
1385                                 d_delete(new_dentry);
1386                 } else
1387                         error = -EEXIST;
1388                 dput(new_dentry);
1389         }
1390         mutex_unlock(&parent->d_inode->i_mutex);
1391         up_write(&configfs_rename_sem);
1392
1393         return error;
1394 }
1395 #endif
1396
1397 static int configfs_dir_open(struct inode *inode, struct file *file)
1398 {
1399         struct dentry * dentry = file->f_path.dentry;
1400         struct configfs_dirent * parent_sd = dentry->d_fsdata;
1401         int err;
1402
1403         mutex_lock(&dentry->d_inode->i_mutex);
1404         /*
1405          * Fake invisibility if dir belongs to a group/default groups hierarchy
1406          * being attached
1407          */
1408         err = -ENOENT;
1409         if (configfs_dirent_is_ready(parent_sd)) {
1410                 file->private_data = configfs_new_dirent(parent_sd, NULL);
1411                 if (IS_ERR(file->private_data))
1412                         err = PTR_ERR(file->private_data);
1413                 else
1414                         err = 0;
1415         }
1416         mutex_unlock(&dentry->d_inode->i_mutex);
1417
1418         return err;
1419 }
1420
1421 static int configfs_dir_close(struct inode *inode, struct file *file)
1422 {
1423         struct dentry * dentry = file->f_path.dentry;
1424         struct configfs_dirent * cursor = file->private_data;
1425
1426         mutex_lock(&dentry->d_inode->i_mutex);
1427         spin_lock(&configfs_dirent_lock);
1428         list_del_init(&cursor->s_sibling);
1429         spin_unlock(&configfs_dirent_lock);
1430         mutex_unlock(&dentry->d_inode->i_mutex);
1431
1432         release_configfs_dirent(cursor);
1433
1434         return 0;
1435 }
1436
1437 /* Relationship between s_mode and the DT_xxx types */
1438 static inline unsigned char dt_type(struct configfs_dirent *sd)
1439 {
1440         return (sd->s_mode >> 12) & 15;
1441 }
1442
1443 static int configfs_readdir(struct file * filp, void * dirent, filldir_t filldir)
1444 {
1445         struct dentry *dentry = filp->f_path.dentry;
1446         struct configfs_dirent * parent_sd = dentry->d_fsdata;
1447         struct configfs_dirent *cursor = filp->private_data;
1448         struct list_head *p, *q = &cursor->s_sibling;
1449         ino_t ino;
1450         int i = filp->f_pos;
1451
1452         switch (i) {
1453                 case 0:
1454                         ino = dentry->d_inode->i_ino;
1455                         if (filldir(dirent, ".", 1, i, ino, DT_DIR) < 0)
1456                                 break;
1457                         filp->f_pos++;
1458                         i++;
1459                         /* fallthrough */
1460                 case 1:
1461                         ino = parent_ino(dentry);
1462                         if (filldir(dirent, "..", 2, i, ino, DT_DIR) < 0)
1463                                 break;
1464                         filp->f_pos++;
1465                         i++;
1466                         /* fallthrough */
1467                 default:
1468                         if (filp->f_pos == 2) {
1469                                 spin_lock(&configfs_dirent_lock);
1470                                 list_move(q, &parent_sd->s_children);
1471                                 spin_unlock(&configfs_dirent_lock);
1472                         }
1473                         for (p=q->next; p!= &parent_sd->s_children; p=p->next) {
1474                                 struct configfs_dirent *next;
1475                                 const char * name;
1476                                 int len;
1477
1478                                 next = list_entry(p, struct configfs_dirent,
1479                                                    s_sibling);
1480                                 if (!next->s_element)
1481                                         continue;
1482
1483                                 name = configfs_get_name(next);
1484                                 len = strlen(name);
1485                                 if (next->s_dentry)
1486                                         ino = next->s_dentry->d_inode->i_ino;
1487                                 else
1488                                         ino = iunique(configfs_sb, 2);
1489
1490                                 if (filldir(dirent, name, len, filp->f_pos, ino,
1491                                                  dt_type(next)) < 0)
1492                                         return 0;
1493
1494                                 spin_lock(&configfs_dirent_lock);
1495                                 list_move(q, p);
1496                                 spin_unlock(&configfs_dirent_lock);
1497                                 p = q;
1498                                 filp->f_pos++;
1499                         }
1500         }
1501         return 0;
1502 }
1503
1504 static loff_t configfs_dir_lseek(struct file * file, loff_t offset, int origin)
1505 {
1506         struct dentry * dentry = file->f_path.dentry;
1507
1508         mutex_lock(&dentry->d_inode->i_mutex);
1509         switch (origin) {
1510                 case 1:
1511                         offset += file->f_pos;
1512                 case 0:
1513                         if (offset >= 0)
1514                                 break;
1515                 default:
1516                         mutex_unlock(&file->f_path.dentry->d_inode->i_mutex);
1517                         return -EINVAL;
1518         }
1519         if (offset != file->f_pos) {
1520                 file->f_pos = offset;
1521                 if (file->f_pos >= 2) {
1522                         struct configfs_dirent *sd = dentry->d_fsdata;
1523                         struct configfs_dirent *cursor = file->private_data;
1524                         struct list_head *p;
1525                         loff_t n = file->f_pos - 2;
1526
1527                         spin_lock(&configfs_dirent_lock);
1528                         list_del(&cursor->s_sibling);
1529                         p = sd->s_children.next;
1530                         while (n && p != &sd->s_children) {
1531                                 struct configfs_dirent *next;
1532                                 next = list_entry(p, struct configfs_dirent,
1533                                                    s_sibling);
1534                                 if (next->s_element)
1535                                         n--;
1536                                 p = p->next;
1537                         }
1538                         list_add_tail(&cursor->s_sibling, p);
1539                         spin_unlock(&configfs_dirent_lock);
1540                 }
1541         }
1542         mutex_unlock(&dentry->d_inode->i_mutex);
1543         return offset;
1544 }
1545
1546 const struct file_operations configfs_dir_operations = {
1547         .open           = configfs_dir_open,
1548         .release        = configfs_dir_close,
1549         .llseek         = configfs_dir_lseek,
1550         .read           = generic_read_dir,
1551         .readdir        = configfs_readdir,
1552 };
1553
1554 int configfs_register_subsystem(struct configfs_subsystem *subsys)
1555 {
1556         int err;
1557         struct config_group *group = &subsys->su_group;
1558         struct qstr name;
1559         struct dentry *dentry;
1560         struct configfs_dirent *sd;
1561
1562         err = configfs_pin_fs();
1563         if (err)
1564                 return err;
1565
1566         if (!group->cg_item.ci_name)
1567                 group->cg_item.ci_name = group->cg_item.ci_namebuf;
1568
1569         sd = configfs_sb->s_root->d_fsdata;
1570         link_group(to_config_group(sd->s_element), group);
1571
1572         mutex_lock_nested(&configfs_sb->s_root->d_inode->i_mutex,
1573                         I_MUTEX_PARENT);
1574
1575         name.name = group->cg_item.ci_name;
1576         name.len = strlen(name.name);
1577         name.hash = full_name_hash(name.name, name.len);
1578
1579         err = -ENOMEM;
1580         dentry = d_alloc(configfs_sb->s_root, &name);
1581         if (dentry) {
1582                 d_add(dentry, NULL);
1583
1584                 err = configfs_attach_group(sd->s_element, &group->cg_item,
1585                                             dentry);
1586                 if (err) {
1587                         d_delete(dentry);
1588                         dput(dentry);
1589                 } else {
1590                         spin_lock(&configfs_dirent_lock);
1591                         configfs_dir_set_ready(dentry->d_fsdata);
1592                         spin_unlock(&configfs_dirent_lock);
1593                 }
1594         }
1595
1596         mutex_unlock(&configfs_sb->s_root->d_inode->i_mutex);
1597
1598         if (err) {
1599                 unlink_group(group);
1600                 configfs_release_fs();
1601         }
1602
1603         return err;
1604 }
1605
1606 void configfs_unregister_subsystem(struct configfs_subsystem *subsys)
1607 {
1608         struct config_group *group = &subsys->su_group;
1609         struct dentry *dentry = group->cg_item.ci_dentry;
1610
1611         if (dentry->d_parent != configfs_sb->s_root) {
1612                 printk(KERN_ERR "configfs: Tried to unregister non-subsystem!\n");
1613                 return;
1614         }
1615
1616         mutex_lock_nested(&configfs_sb->s_root->d_inode->i_mutex,
1617                           I_MUTEX_PARENT);
1618         mutex_lock_nested(&dentry->d_inode->i_mutex, I_MUTEX_CHILD);
1619         mutex_lock(&configfs_symlink_mutex);
1620         spin_lock(&configfs_dirent_lock);
1621         if (configfs_detach_prep(dentry, NULL)) {
1622                 printk(KERN_ERR "configfs: Tried to unregister non-empty subsystem!\n");
1623         }
1624         spin_unlock(&configfs_dirent_lock);
1625         mutex_unlock(&configfs_symlink_mutex);
1626         configfs_detach_group(&group->cg_item);
1627         dentry->d_inode->i_flags |= S_DEAD;
1628         mutex_unlock(&dentry->d_inode->i_mutex);
1629
1630         d_delete(dentry);
1631
1632         mutex_unlock(&configfs_sb->s_root->d_inode->i_mutex);
1633
1634         dput(dentry);
1635
1636         unlink_group(group);
1637         configfs_release_fs();
1638 }
1639
1640 EXPORT_SYMBOL(configfs_register_subsystem);
1641 EXPORT_SYMBOL(configfs_unregister_subsystem);