SAFE public projects git trees. - safe/jmp/linux-2.6/blob - fs/dlm/recoverd.c

   1 /******************************************************************************
   2 *******************************************************************************
   3 **
   4 **  Copyright (C) Sistina Software, Inc.  1997-2003  All rights reserved.
   5 **  Copyright (C) 2004-2005 Red Hat, Inc.  All rights reserved.
   6 **
   7 **  This copyrighted material is made available to anyone wishing to use,
   8 **  modify, copy, or redistribute it subject to the terms and conditions
   9 **  of the GNU General Public License v.2.
  10 **
  11 *******************************************************************************
  12 ******************************************************************************/
  13
  14 #include "dlm_internal.h"
  15 #include "lockspace.h"
  16 #include "member.h"
  17 #include "dir.h"
  18 #include "ast.h"
  19 #include "recover.h"
  20 #include "lowcomms.h"
  21 #include "lock.h"
  22 #include "requestqueue.h"
  23 #include "recoverd.h"
  24
  25
  26 /* If the start for which we're re-enabling locking (seq) has been superseded
  27    by a newer stop (ls_recover_seq), we need to leave locking disabled. */
  28
  29 static int enable_locking(struct dlm_ls *ls, uint64_t seq)
  30 {
  31         int error = -EINTR;
  32
  33         spin_lock(&ls->ls_recover_lock);
  34         if (ls->ls_recover_seq == seq) {
  35                 set_bit(LSFL_RUNNING, &ls->ls_flags);
  36                 up_write(&ls->ls_in_recovery);
  37                 error = 0;
  38         }
  39         spin_unlock(&ls->ls_recover_lock);
  40         return error;
  41 }
  42
  43 static int ls_recover(struct dlm_ls *ls, struct dlm_recover *rv)
  44 {
  45         unsigned long start;
  46         int error, neg = 0;
  47
  48         log_debug(ls, "recover %llx", rv->seq);
  49
  50         mutex_lock(&ls->ls_recoverd_active);
  51
  52         /*
  53          * Suspending and resuming dlm_astd ensures that no lkb's from this ls
  54          * will be processed by dlm_astd during recovery.
  55          */
  56
  57         dlm_astd_suspend();
  58         dlm_astd_resume();
  59
  60         /*
  61          * This list of root rsb's will be the basis of most of the recovery
  62          * routines.
  63          */
  64
  65         dlm_create_root_list(ls);
  66
  67         /*
  68          * Free all the tossed rsb's so we don't have to recover them.
  69          */
  70
  71         dlm_clear_toss_list(ls);
  72
  73         /*
  74          * Add or remove nodes from the lockspace's ls_nodes list.
  75          * Also waits for all nodes to complete dlm_recover_members.
  76          */
  77
  78         error = dlm_recover_members(ls, rv, &neg);
  79         if (error) {
  80                 log_error(ls, "recover_members failed %d", error);
  81                 goto fail;
  82         }
  83         start = jiffies;
  84
  85         /*
  86          * Rebuild our own share of the directory by collecting from all other
  87          * nodes their master rsb names that hash to us.
  88          */
  89
  90         error = dlm_recover_directory(ls);
  91         if (error) {
  92                 log_error(ls, "recover_directory failed %d", error);
  93                 goto fail;
  94         }
  95
  96         /*
  97          * Purge directory-related requests that are saved in requestqueue.
  98          * All dir requests from before recovery are invalid now due to the dir
  99          * rebuild and will be resent by the requesting nodes.
 100          */
 101
 102         dlm_purge_requestqueue(ls);
 103
 104         /*
 105          * Wait for all nodes to complete directory rebuild.
 106          */
 107
 108         error = dlm_recover_directory_wait(ls);
 109         if (error) {
 110                 log_error(ls, "recover_directory_wait failed %d", error);
 111                 goto fail;
 112         }
 113
 114         /*
 115          * We may have outstanding operations that are waiting for a reply from
 116          * a failed node.  Mark these to be resent after recovery.  Unlock and
 117          * cancel ops can just be completed.
 118          */
 119
 120         dlm_recover_waiters_pre(ls);
 121
 122         error = dlm_recovery_stopped(ls);
 123         if (error)
 124                 goto fail;
 125
 126         if (neg || dlm_no_directory(ls)) {
 127                 /*
 128                  * Clear lkb's for departed nodes.
 129                  */
 130
 131                 dlm_purge_locks(ls);
 132
 133                 /*
 134                  * Get new master nodeid's for rsb's that were mastered on
 135                  * departed nodes.
 136                  */
 137
 138                 error = dlm_recover_masters(ls);
 139                 if (error) {
 140                         log_error(ls, "recover_masters failed %d", error);
 141                         goto fail;
 142                 }
 143
 144                 /*
 145                  * Send our locks on remastered rsb's to the new masters.
 146                  */
 147
 148                 error = dlm_recover_locks(ls);
 149                 if (error) {
 150                         log_error(ls, "recover_locks failed %d", error);
 151                         goto fail;
 152                 }
 153
 154                 error = dlm_recover_locks_wait(ls);
 155                 if (error) {
 156                         log_error(ls, "recover_locks_wait failed %d", error);
 157                         goto fail;
 158                 }
 159
 160                 /*
 161                  * Finalize state in master rsb's now that all locks can be
 162                  * checked.  This includes conversion resolution and lvb
 163                  * settings.
 164                  */
 165
 166                 dlm_recover_rsbs(ls);
 167         } else {
 168                 /*
 169                  * Other lockspace members may be going through the "neg" steps
 170                  * while also adding us to the lockspace, in which case they'll
 171                  * be doing the recover_locks (RS_LOCKS) barrier.
 172                  */
 173                 dlm_set_recover_status(ls, DLM_RS_LOCKS);
 174
 175                 error = dlm_recover_locks_wait(ls);
 176                 if (error) {
 177                         log_error(ls, "recover_locks_wait failed %d", error);
 178                         goto fail;
 179                 }
 180         }
 181
 182         dlm_release_root_list(ls);
 183
 184         dlm_set_recover_status(ls, DLM_RS_DONE);
 185         error = dlm_recover_done_wait(ls);
 186         if (error) {
 187                 log_error(ls, "recover_done_wait failed %d", error);
 188                 goto fail;
 189         }
 190
 191         dlm_clear_members_gone(ls);
 192
 193         error = enable_locking(ls, rv->seq);
 194         if (error) {
 195                 log_error(ls, "enable_locking failed %d", error);
 196                 goto fail;
 197         }
 198
 199         error = dlm_process_requestqueue(ls);
 200         if (error) {
 201                 log_error(ls, "process_requestqueue failed %d", error);
 202                 goto fail;
 203         }
 204
 205         error = dlm_recover_waiters_post(ls);
 206         if (error) {
 207                 log_error(ls, "recover_waiters_post failed %d", error);
 208                 goto fail;
 209         }
 210
 211         dlm_grant_after_purge(ls);
 212
 213         dlm_astd_wake();
 214
 215         log_debug(ls, "recover %llx done: %u ms", rv->seq,
 216                   jiffies_to_msecs(jiffies - start));
 217         mutex_unlock(&ls->ls_recoverd_active);
 218
 219         return 0;
 220
 221  fail:
 222         dlm_release_root_list(ls);
 223         log_debug(ls, "recover %llx error %d", rv->seq, error);
 224         mutex_unlock(&ls->ls_recoverd_active);
 225         return error;
 226 }
 227
 228 /* The dlm_ls_start() that created the rv we take here may already have been
 229    stopped via dlm_ls_stop(); in that case we need to leave the RECOVERY_STOP
 230    flag set. */
 231
 232 static void do_ls_recovery(struct dlm_ls *ls)
 233 {
 234         struct dlm_recover *rv = NULL;
 235
 236         spin_lock(&ls->ls_recover_lock);
 237         rv = ls->ls_recover_args;
 238         ls->ls_recover_args = NULL;
 239         if (rv && ls->ls_recover_seq == rv->seq)
 240                 clear_bit(LSFL_RECOVERY_STOP, &ls->ls_flags);
 241         spin_unlock(&ls->ls_recover_lock);
 242
 243         if (rv) {
 244                 ls_recover(ls, rv);
 245                 kfree(rv->nodeids);
 246                 kfree(rv);
 247         }
 248 }
 249
 250 static int dlm_recoverd(void *arg)
 251 {
 252         struct dlm_ls *ls;
 253
 254         ls = dlm_find_lockspace_local(arg);
 255         if (!ls) {
 256                 log_print("dlm_recoverd: no lockspace %p", arg);
 257                 return -1;
 258         }
 259
 260         while (!kthread_should_stop()) {
 261                 set_current_state(TASK_INTERRUPTIBLE);
 262                 if (!test_bit(LSFL_WORK, &ls->ls_flags))
 263                         schedule();
 264                 set_current_state(TASK_RUNNING);
 265
 266                 if (test_and_clear_bit(LSFL_WORK, &ls->ls_flags))
 267                         do_ls_recovery(ls);
 268         }
 269
 270         dlm_put_lockspace(ls);
 271         return 0;
 272 }
 273
 274 void dlm_recoverd_kick(struct dlm_ls *ls)
 275 {
 276         set_bit(LSFL_WORK, &ls->ls_flags);
 277         wake_up_process(ls->ls_recoverd_task);
 278 }
 279
 280 int dlm_recoverd_start(struct dlm_ls *ls)
 281 {
 282         struct task_struct *p;
 283         int error = 0;
 284
 285         p = kthread_run(dlm_recoverd, ls, "dlm_recoverd");
 286         if (IS_ERR(p))
 287                 error = PTR_ERR(p);
 288         else
 289                 ls->ls_recoverd_task = p;
 290         return error;
 291 }
 292
 293 void dlm_recoverd_stop(struct dlm_ls *ls)
 294 {
 295         kthread_stop(ls->ls_recoverd_task);
 296 }
 297
 298 void dlm_recoverd_suspend(struct dlm_ls *ls)
 299 {
 300         wake_up(&ls->ls_wait_general);
 301         mutex_lock(&ls->ls_recoverd_active);
 302 }
 303
 304 void dlm_recoverd_resume(struct dlm_ls *ls)
 305 {
 306         mutex_unlock(&ls->ls_recoverd_active);
 307 }
 308