md: don't retry recovery of raid1 that fails due to error on source drive.

author NeilBrown <neilb@suse.de>

Thu, 8 Jan 2009 21:31:11 +0000 (08:31 +1100)

committer NeilBrown <neilb@suse.de>

Thu, 8 Jan 2009 21:31:11 +0000 (08:31 +1100)
author NeilBrown <neilb@suse.de>
Thu, 8 Jan 2009 21:31:11 +0000 (08:31 +1100)
committer NeilBrown <neilb@suse.de>
Thu, 8 Jan 2009 21:31:11 +0000 (08:31 +1100)
diff --git a/drivers/md/md.c b/drivers/md/md.c

index f5cbb9d..41e2509 100644 (file)
--- a/drivers/md/md.c
+++ b/drivers/md/md.c
@@ -1500,6 +1500,9 @@ static int bind_rdev_to_array(mdk_rdev_t * rdev, mddev_t * mddev)
  
         list_add_rcu(&rdev->same_set, &mddev->disks);
         bd_claim_by_disk(rdev->bdev, rdev->bdev->bd_holder, mddev->gendisk);
+
+       /* May as well allow recovery to be retried once */
+       mddev->recovery_disabled = 0;
         return 0;
  
   fail:
@@ -6175,7 +6178,7 @@ static int remove_and_add_spares(mddev_t *mddev)
                         }
                 }
  
-       if (mddev->degraded && ! mddev->ro) {
+       if (mddev->degraded && ! mddev->ro && !mddev->recovery_disabled) {
                 list_for_each_entry(rdev, &mddev->disks, same_set) {
                         if (rdev->raid_disk >= 0 &&
                             !test_bit(In_sync, &rdev->flags) &&
diff --git a/drivers/md/raid1.c b/drivers/md/raid1.c

index c165b1e..7b4f5f7 100644 (file)
--- a/drivers/md/raid1.c
+++ b/drivers/md/raid1.c
@@ -1016,12 +1016,16 @@ static void error(mddev_t *mddev, mdk_rdev_t *rdev)
          * else mark the drive as failed
          */
         if (test_bit(In_sync, &rdev->flags)
-           && (conf->raid_disks - mddev->degraded) == 1)
+           && (conf->raid_disks - mddev->degraded) == 1) {
                 /*
                  * Don't fail the drive, act as though we were just a
-                * normal single drive
+                * normal single drive.
+                * However don't try a recovery from this drive as
+                * it is very likely to fail.
                  */
+               mddev->recovery_disabled = 1;
                 return;
+       }
         if (test_and_clear_bit(In_sync, &rdev->flags)) {
                 unsigned long flags;
                 spin_lock_irqsave(&conf->device_lock, flags);
diff --git a/include/linux/raid/md_k.h b/include/linux/raid/md_k.h

index dac4217..9743e4d 100644 (file)
--- a/include/linux/raid/md_k.h
+++ b/include/linux/raid/md_k.h
@@ -218,6 +218,9 @@ struct mddev_s
  #define        MD_RECOVERY_FROZEN      9
  
         unsigned long                   recovery;
+       int                             recovery_disabled; /* if we detect that recovery
+                                                           * will always fail, set this
+                                                           * so we don't loop trying */
  
         int                             in_sync;        /* know to not need resync */
         struct mutex                    reconfig_mutex;
author	NeilBrown <neilb@suse.de>
	Thu, 8 Jan 2009 21:31:11 +0000 (08:31 +1100)
committer	NeilBrown <neilb@suse.de>
	Thu, 8 Jan 2009 21:31:11 +0000 (08:31 +1100)
drivers/md/md.c		patch \| blob \| history
drivers/md/raid1.c		patch \| blob \| history
include/linux/raid/md_k.h		patch \| blob \| history