ceph: avoid reopening osd connections when address hasn't changed

author Sage Weil <sage@newdream.net>

Mon, 22 Mar 2010 21:51:18 +0000 (14:51 -0700)

committer Sage Weil <sage@newdream.net>

Tue, 23 Mar 2010 14:47:01 +0000 (07:47 -0700)
author Sage Weil <sage@newdream.net>
Mon, 22 Mar 2010 21:51:18 +0000 (14:51 -0700)
committer Sage Weil <sage@newdream.net>
Tue, 23 Mar 2010 14:47:01 +0000 (07:47 -0700)
diff --git a/fs/ceph/messenger.c b/fs/ceph/messenger.c

index 9832855..a32f0f8 100644 (file)
--- a/fs/ceph/messenger.c
+++ b/fs/ceph/messenger.c
@@ -366,6 +366,14 @@ void ceph_con_open(struct ceph_connection *con, struct ceph_entity_addr *addr)
  }
  
  /*
+ * return true if this connection ever successfully opened
+ */
+bool ceph_con_opened(struct ceph_connection *con)
+{
+       return con->connect_seq > 0;
+}
+
+/*
   * generic get/put
   */
  struct ceph_connection *ceph_con_get(struct ceph_connection *con)
diff --git a/fs/ceph/messenger.h b/fs/ceph/messenger.h

index 4caaa59..a343dae 100644 (file)
--- a/fs/ceph/messenger.h
+++ b/fs/ceph/messenger.h
@@ -223,6 +223,7 @@ extern void ceph_con_init(struct ceph_messenger *msgr,
                           struct ceph_connection *con);
  extern void ceph_con_open(struct ceph_connection *con,
                           struct ceph_entity_addr *addr);
+extern bool ceph_con_opened(struct ceph_connection *con);
  extern void ceph_con_close(struct ceph_connection *con);
  extern void ceph_con_send(struct ceph_connection *con, struct ceph_msg *msg);
  extern void ceph_con_revoke(struct ceph_connection *con, struct ceph_msg *msg);
diff --git a/fs/ceph/osd_client.c b/fs/ceph/osd_client.c

index 0435921..c7b4ded 100644 (file)
--- a/fs/ceph/osd_client.c
+++ b/fs/ceph/osd_client.c
@@ -413,11 +413,22 @@ static void remove_old_osds(struct ceph_osd_client *osdc, int remove_all)
   */
  static int __reset_osd(struct ceph_osd_client *osdc, struct ceph_osd *osd)
  {
+       struct ceph_osd_request *req;
         int ret = 0;
  
         dout("__reset_osd %p osd%d\n", osd, osd->o_osd);
         if (list_empty(&osd->o_requests)) {
                 __remove_osd(osdc, osd);
+       } else if (memcmp(&osdc->osdmap->osd_addr[osd->o_osd],
+                         &osd->o_con.peer_addr,
+                         sizeof(osd->o_con.peer_addr)) == 0 &&
+                  !ceph_con_opened(&osd->o_con)) {
+               dout(" osd addr hasn't changed and connection never opened,"
+                    " letting msgr retry");
+               /* touch each r_stamp for handle_timeout()'s benfit */
+               list_for_each_entry(req, &osd->o_requests, r_osd_item)
+                       req->r_stamp = jiffies;
+               ret = -EAGAIN;
         } else {
                 ceph_con_close(&osd->o_con);
                 ceph_con_open(&osd->o_con, &osdc->osdmap->osd_addr[osd->o_osd]);
@@ -862,7 +873,9 @@ static int __kick_requests(struct ceph_osd_client *osdc,
  
         dout("kick_requests osd%d\n", kickosd ? kickosd->o_osd : -1);
         if (kickosd) {
-               __reset_osd(osdc, kickosd);
+               err = __reset_osd(osdc, kickosd);
+               if (err == -EAGAIN)
+                       return 1;
         } else {
                 for (p = rb_first(&osdc->osds); p; p = n) {
                         struct ceph_osd *osd =
author	Sage Weil <sage@newdream.net>
	Mon, 22 Mar 2010 21:51:18 +0000 (14:51 -0700)
committer	Sage Weil <sage@newdream.net>
	Tue, 23 Mar 2010 14:47:01 +0000 (07:47 -0700)
fs/ceph/messenger.c		patch \| blob \| history
fs/ceph/messenger.h		patch \| blob \| history
fs/ceph/osd_client.c		patch \| blob \| history