KVM: Replace pic_lock()/pic_unlock() with direct call to spinlock functions
[safe/jmp/linux-2.6] / net / unix / af_unix.c
index 7d2e4f8..fc3ebb9 100644 (file)
@@ -164,7 +164,7 @@ static inline int unix_our_peer(struct sock *sk, struct sock *osk)
 
 static inline int unix_may_send(struct sock *sk, struct sock *osk)
 {
-       return (unix_peer(osk) == NULL || unix_our_peer(sk, osk));
+       return unix_peer(osk) == NULL || unix_our_peer(sk, osk);
 }
 
 static inline int unix_recvq_full(struct sock const *sk)
@@ -197,7 +197,7 @@ static inline void unix_release_addr(struct unix_address *addr)
  *             - if started by zero, it is abstract name.
  */
 
-static int unix_mkname(struct sockaddr_un * sunaddr, int len, unsigned *hashp)
+static int unix_mkname(struct sockaddr_un *sunaddr, int len, unsigned *hashp)
 {
        if (len <= sizeof(short) || len > sizeof(*sunaddr))
                return -EINVAL;
@@ -216,7 +216,7 @@ static int unix_mkname(struct sockaddr_un * sunaddr, int len, unsigned *hashp)
                return len;
        }
 
-       *hashp = unix_hash_fold(csum_partial((char*)sunaddr, len, 0));
+       *hashp = unix_hash_fold(csum_partial(sunaddr, len, 0));
        return len;
 }
 
@@ -295,8 +295,7 @@ static struct sock *unix_find_socket_byinode(struct net *net, struct inode *i)
                if (!net_eq(sock_net(s), net))
                        continue;
 
-               if(dentry && dentry->d_inode == i)
-               {
+               if (dentry && dentry->d_inode == i) {
                        sock_hold(s);
                        goto found;
                }
@@ -316,7 +315,7 @@ static void unix_write_space(struct sock *sk)
 {
        read_lock(&sk->sk_callback_lock);
        if (unix_writable(sk)) {
-               if (sk->sk_sleep && waitqueue_active(sk->sk_sleep))
+               if (sk_has_sleeper(sk))
                        wake_up_interruptible_sync(sk->sk_sleep);
                sk_wake_async(sk, SOCK_WAKE_SPACE, POLL_OUT);
        }
@@ -354,7 +353,7 @@ static void unix_sock_destructor(struct sock *sk)
        WARN_ON(!sk_unhashed(sk));
        WARN_ON(sk->sk_socket);
        if (!sock_flag(sk, SOCK_DEAD)) {
-               printk("Attempt to release alive unix socket: %p\n", sk);
+               printk(KERN_INFO "Attempt to release alive unix socket: %p\n", sk);
                return;
        }
 
@@ -362,12 +361,16 @@ static void unix_sock_destructor(struct sock *sk)
                unix_release_addr(u->addr);
 
        atomic_dec(&unix_nr_socks);
+       local_bh_disable();
+       sock_prot_inuse_add(sock_net(sk), sk->sk_prot, -1);
+       local_bh_enable();
 #ifdef UNIX_REFCNT_DEBUG
-       printk(KERN_DEBUG "UNIX %p is destroyed, %d are still alive.\n", sk, atomic_read(&unix_nr_socks));
+       printk(KERN_DEBUG "UNIX %p is destroyed, %d are still alive.\n", sk,
+               atomic_read(&unix_nr_socks));
 #endif
 }
 
-static int unix_release_sock (struct sock *sk, int embrion)
+static int unix_release_sock(struct sock *sk, int embrion)
 {
        struct unix_sock *u = unix_sk(sk);
        struct dentry *dentry;
@@ -453,11 +456,11 @@ static int unix_listen(struct socket *sock, int backlog)
        struct unix_sock *u = unix_sk(sk);
 
        err = -EOPNOTSUPP;
-       if (sock->type!=SOCK_STREAM && sock->type!=SOCK_SEQPACKET)
-               goto out;                       /* Only stream/seqpacket sockets accept */
+       if (sock->type != SOCK_STREAM && sock->type != SOCK_SEQPACKET)
+               goto out;       /* Only stream/seqpacket sockets accept */
        err = -EINVAL;
        if (!u->addr)
-               goto out;                       /* No listens on an unbound socket */
+               goto out;       /* No listens on an unbound socket */
        unix_state_lock(sk);
        if (sk->sk_state != TCP_CLOSE && sk->sk_state != TCP_LISTEN)
                goto out_unlock;
@@ -467,8 +470,7 @@ static int unix_listen(struct socket *sock, int backlog)
        sk->sk_state            = TCP_LISTEN;
        /* set credentials so connect can copy them */
        sk->sk_peercred.pid     = task_tgid_vnr(current);
-       sk->sk_peercred.uid     = current->euid;
-       sk->sk_peercred.gid     = current->egid;
+       current_euid_egid(&sk->sk_peercred.uid, &sk->sk_peercred.gid);
        err = 0;
 
 out_unlock:
@@ -566,9 +568,9 @@ static const struct proto_ops unix_seqpacket_ops = {
 };
 
 static struct proto unix_proto = {
-       .name     = "UNIX",
-       .owner    = THIS_MODULE,
-       .obj_size = sizeof(struct unix_sock),
+       .name                   = "UNIX",
+       .owner                  = THIS_MODULE,
+       .obj_size               = sizeof(struct unix_sock),
 };
 
 /*
@@ -579,7 +581,7 @@ static struct proto unix_proto = {
  */
 static struct lock_class_key af_unix_sk_receive_queue_lock_key;
 
-static struct sock * unix_create1(struct net *net, struct socket *sock)
+static struct sock *unix_create1(struct net *net, struct socket *sock)
 {
        struct sock *sk = NULL;
        struct unix_sock *u;
@@ -592,7 +594,7 @@ static struct sock * unix_create1(struct net *net, struct socket *sock)
        if (!sk)
                goto out;
 
-       sock_init_data(sock,sk);
+       sock_init_data(sock, sk);
        lockdep_set_class(&sk->sk_receive_queue.lock,
                                &af_unix_sk_receive_queue_lock_key);
 
@@ -611,6 +613,11 @@ static struct sock * unix_create1(struct net *net, struct socket *sock)
 out:
        if (sk == NULL)
                atomic_dec(&unix_nr_socks);
+       else {
+               local_bh_disable();
+               sock_prot_inuse_add(sock_net(sk), sk->sk_prot, 1);
+               local_bh_enable();
+       }
        return sk;
 }
 
@@ -653,7 +660,7 @@ static int unix_release(struct socket *sock)
 
        sock->sk = NULL;
 
-       return unix_release_sock (sk, 0);
+       return unix_release_sock(sk, 0);
 }
 
 static int unix_autobind(struct socket *sock)
@@ -662,7 +669,7 @@ static int unix_autobind(struct socket *sock)
        struct net *net = sock_net(sk);
        struct unix_sock *u = unix_sk(sk);
        static u32 ordernum = 1;
-       struct unix_address * addr;
+       struct unix_address *addr;
        int err;
 
        mutex_lock(&u->readlock);
@@ -681,7 +688,7 @@ static int unix_autobind(struct socket *sock)
 
 retry:
        addr->len = sprintf(addr->name->sun_path+1, "%05x", ordernum) + 1 + sizeof(short);
-       addr->hash = unix_hash_fold(csum_partial((void*)addr->name, addr->len, 0));
+       addr->hash = unix_hash_fold(csum_partial(addr->name, addr->len, 0));
 
        spin_lock(&unix_table_lock);
        ordernum = (ordernum+1)&0xFFFFF;
@@ -768,7 +775,7 @@ static int unix_bind(struct socket *sock, struct sockaddr *uaddr, int addr_len)
        struct net *net = sock_net(sk);
        struct unix_sock *u = unix_sk(sk);
        struct sockaddr_un *sunaddr = (struct sockaddr_un *)uaddr;
-       struct dentry * dentry = NULL;
+       struct dentry *dentry = NULL;
        struct nameidata nd;
        int err;
        unsigned hash;
@@ -825,11 +832,15 @@ static int unix_bind(struct socket *sock, struct sockaddr *uaddr, int addr_len)
                 * All right, let's create it.
                 */
                mode = S_IFSOCK |
-                      (SOCK_INODE(sock)->i_mode & ~current->fs->umask);
+                      (SOCK_INODE(sock)->i_mode & ~current_umask());
                err = mnt_want_write(nd.path.mnt);
                if (err)
                        goto out_mknod_dput;
+               err = security_path_mknod(&nd.path, dentry, mode, 0);
+               if (err)
+                       goto out_mknod_drop_write;
                err = vfs_mknod(nd.path.dentry->d_inode, dentry, mode, 0);
+out_mknod_drop_write:
                mnt_drop_write(nd.path.mnt);
                if (err)
                        goto out_mknod_dput;
@@ -1126,8 +1137,7 @@ restart:
        newsk->sk_state         = TCP_ESTABLISHED;
        newsk->sk_type          = sk->sk_type;
        newsk->sk_peercred.pid  = task_tgid_vnr(current);
-       newsk->sk_peercred.uid  = current->euid;
-       newsk->sk_peercred.gid  = current->egid;
+       current_euid_egid(&newsk->sk_peercred.uid, &newsk->sk_peercred.gid);
        newu = unix_sk(newsk);
        newsk->sk_sleep         = &newu->peer_wait;
        otheru = unix_sk(other);
@@ -1168,8 +1178,7 @@ out_unlock:
                unix_state_unlock(other);
 
 out:
-       if (skb)
-               kfree_skb(skb);
+       kfree_skb(skb);
        if (newsk)
                unix_release_sock(newsk, 0);
        if (other)
@@ -1187,8 +1196,9 @@ static int unix_socketpair(struct socket *socka, struct socket *sockb)
        unix_peer(ska) = skb;
        unix_peer(skb) = ska;
        ska->sk_peercred.pid = skb->sk_peercred.pid = task_tgid_vnr(current);
-       ska->sk_peercred.uid = skb->sk_peercred.uid = current->euid;
-       ska->sk_peercred.gid = skb->sk_peercred.gid = current->egid;
+       current_euid_egid(&skb->sk_peercred.uid, &skb->sk_peercred.gid);
+       ska->sk_peercred.uid = skb->sk_peercred.uid;
+       ska->sk_peercred.gid = skb->sk_peercred.gid;
 
        if (ska->sk_type != SOCK_DGRAM) {
                ska->sk_state = TCP_ESTABLISHED;
@@ -1207,7 +1217,7 @@ static int unix_accept(struct socket *sock, struct socket *newsock, int flags)
        int err;
 
        err = -EOPNOTSUPP;
-       if (sock->type!=SOCK_STREAM && sock->type!=SOCK_SEQPACKET)
+       if (sock->type != SOCK_STREAM && sock->type != SOCK_SEQPACKET)
                goto out;
 
        err = -EINVAL;
@@ -1286,7 +1296,7 @@ static void unix_detach_fds(struct scm_cookie *scm, struct sk_buff *skb)
        skb->destructor = sock_wfree;
        UNIXCB(skb).fp = NULL;
 
-       for (i=scm->fp->count-1; i>=0; i--)
+       for (i = scm->fp->count-1; i >= 0; i--)
                unix_notinflight(scm->fp->fp[i]);
 }
 
@@ -1302,14 +1312,23 @@ static void unix_destruct_fds(struct sk_buff *skb)
        sock_wfree(skb);
 }
 
-static void unix_attach_fds(struct scm_cookie *scm, struct sk_buff *skb)
+static int unix_attach_fds(struct scm_cookie *scm, struct sk_buff *skb)
 {
        int i;
-       for (i=scm->fp->count-1; i>=0; i--)
+
+       /*
+        * Need to duplicate file references for the sake of garbage
+        * collection.  Otherwise a socket in the fps might become a
+        * candidate for GC while the skb is not yet queued.
+        */
+       UNIXCB(skb).fp = scm_fp_dup(scm->fp);
+       if (!UNIXCB(skb).fp)
+               return -ENOMEM;
+
+       for (i = scm->fp->count-1; i >= 0; i--)
                unix_inflight(scm->fp->fp[i]);
-       UNIXCB(skb).fp = scm->fp;
        skb->destructor = unix_destruct_fds;
-       scm->fp = NULL;
+       return 0;
 }
 
 /*
@@ -1334,6 +1353,7 @@ static int unix_dgram_sendmsg(struct kiocb *kiocb, struct socket *sock,
 
        if (NULL == siocb->scm)
                siocb->scm = &tmp_scm;
+       wait_for_unix_gc();
        err = scm_send(sock, msg, siocb->scm);
        if (err < 0)
                return err;
@@ -1368,12 +1388,15 @@ static int unix_dgram_sendmsg(struct kiocb *kiocb, struct socket *sock,
                goto out;
 
        memcpy(UNIXCREDS(skb), &siocb->scm->creds, sizeof(struct ucred));
-       if (siocb->scm->fp)
-               unix_attach_fds(siocb->scm, skb);
+       if (siocb->scm->fp) {
+               err = unix_attach_fds(siocb->scm, skb);
+               if (err)
+                       goto out_free;
+       }
        unix_get_secdata(siocb->scm, skb);
 
        skb_reset_transport_header(skb);
-       err = memcpy_fromiovec(skb_put(skb,len), msg->msg_iov, len);
+       err = memcpy_fromiovec(skb_put(skb, len), msg->msg_iov, len);
        if (err)
                goto out_free;
 
@@ -1474,13 +1497,14 @@ static int unix_stream_sendmsg(struct kiocb *kiocb, struct socket *sock,
        struct sock *sk = sock->sk;
        struct sock *other = NULL;
        struct sockaddr_un *sunaddr = msg->msg_name;
-       int err,size;
+       int err, size;
        struct sk_buff *skb;
        int sent = 0;
        struct scm_cookie tmp_scm;
 
        if (NULL == siocb->scm)
                siocb->scm = &tmp_scm;
+       wait_for_unix_gc();
        err = scm_send(sock, msg, siocb->scm);
        if (err < 0)
                return err;
@@ -1503,8 +1527,7 @@ static int unix_stream_sendmsg(struct kiocb *kiocb, struct socket *sock,
        if (sk->sk_shutdown & SEND_SHUTDOWN)
                goto pipe_err;
 
-       while(sent < len)
-       {
+       while (sent < len) {
                /*
                 *      Optimisation for the fact that under 0.01% of X
                 *      messages typically need breaking up.
@@ -1523,7 +1546,8 @@ static int unix_stream_sendmsg(struct kiocb *kiocb, struct socket *sock,
                 *      Grab a buffer
                 */
 
-               skb = sock_alloc_send_skb(sk,size,msg->msg_flags&MSG_DONTWAIT, &err);
+               skb = sock_alloc_send_skb(sk, size, msg->msg_flags&MSG_DONTWAIT,
+                                         &err);
 
                if (skb == NULL)
                        goto out_err;
@@ -1538,10 +1562,16 @@ static int unix_stream_sendmsg(struct kiocb *kiocb, struct socket *sock,
                size = min_t(int, size, skb_tailroom(skb));
 
                memcpy(UNIXCREDS(skb), &siocb->scm->creds, sizeof(struct ucred));
-               if (siocb->scm->fp)
-                       unix_attach_fds(siocb->scm, skb);
+               if (siocb->scm->fp) {
+                       err = unix_attach_fds(siocb->scm, skb);
+                       if (err) {
+                               kfree_skb(skb);
+                               goto out_err;
+                       }
+               }
 
-               if ((err = memcpy_fromiovec(skb_put(skb,size), msg->msg_iov, size)) != 0) {
+               err = memcpy_fromiovec(skb_put(skb, size), msg->msg_iov, size);
+               if (err) {
                        kfree_skb(skb);
                        goto out_err;
                }
@@ -1567,8 +1597,8 @@ pipe_err_free:
        unix_state_unlock(other);
        kfree_skb(skb);
 pipe_err:
-       if (sent==0 && !(msg->msg_flags&MSG_NOSIGNAL))
-               send_sig(SIGPIPE,current,0);
+       if (sent == 0 && !(msg->msg_flags&MSG_NOSIGNAL))
+               send_sig(SIGPIPE, current, 0);
        err = -EPIPE;
 out_err:
        scm_destroy(siocb->scm);
@@ -1658,13 +1688,10 @@ static int unix_dgram_recvmsg(struct kiocb *iocb, struct socket *sock,
        siocb->scm->creds = *UNIXCREDS(skb);
        unix_set_secdata(siocb->scm, skb);
 
-       if (!(flags & MSG_PEEK))
-       {
+       if (!(flags & MSG_PEEK)) {
                if (UNIXCB(skb).fp)
                        unix_detach_fds(siocb->scm, skb);
-       }
-       else
-       {
+       } else {
                /* It is questionable: on PEEK we could:
                   - do not return fds - good, but too simple 8)
                   - return fds, and do not return them on read (old strategy,
@@ -1685,7 +1712,7 @@ static int unix_dgram_recvmsg(struct kiocb *iocb, struct socket *sock,
        scm_recv(sock, msg, siocb->scm, flags);
 
 out_free:
-       skb_free_datagram(sk,skb);
+       skb_free_datagram(sk, skb);
 out_unlock:
        mutex_unlock(&u->readlock);
 out:
@@ -1696,7 +1723,7 @@ out:
  *     Sleep until data has arrive. But check for races..
  */
 
-static long unix_stream_data_wait(struct sock * sk, long timeo)
+static long unix_stream_data_wait(struct sock *sk, long timeo)
 {
        DEFINE_WAIT(wait);
 
@@ -1765,15 +1792,13 @@ static int unix_stream_recvmsg(struct kiocb *iocb, struct socket *sock,
 
        mutex_lock(&u->readlock);
 
-       do
-       {
+       do {
                int chunk;
                struct sk_buff *skb;
 
                unix_state_lock(sk);
                skb = skb_dequeue(&sk->sk_receive_queue);
-               if (skb == NULL)
-               {
+               if (skb == NULL) {
                        if (copied >= target)
                                goto unlock;
 
@@ -1781,7 +1806,8 @@ static int unix_stream_recvmsg(struct kiocb *iocb, struct socket *sock,
                         *      POSIX 1003.1g mandates this order.
                         */
 
-                       if ((err = sock_error(sk)) != 0)
+                       err = sock_error(sk);
+                       if (err)
                                goto unlock;
                        if (sk->sk_shutdown & RCV_SHUTDOWN)
                                goto unlock;
@@ -1808,7 +1834,8 @@ static int unix_stream_recvmsg(struct kiocb *iocb, struct socket *sock,
 
                if (check_creds) {
                        /* Never glue messages from different writers */
-                       if (memcmp(UNIXCREDS(skb), &siocb->scm->creds, sizeof(siocb->scm->creds)) != 0) {
+                       if (memcmp(UNIXCREDS(skb), &siocb->scm->creds,
+                                  sizeof(siocb->scm->creds)) != 0) {
                                skb_queue_head(&sk->sk_receive_queue, skb);
                                break;
                        }
@@ -1819,8 +1846,7 @@ static int unix_stream_recvmsg(struct kiocb *iocb, struct socket *sock,
                }
 
                /* Copy address just once */
-               if (sunaddr)
-               {
+               if (sunaddr) {
                        unix_copy_addr(msg, skb->sk);
                        sunaddr = NULL;
                }
@@ -1836,16 +1862,14 @@ static int unix_stream_recvmsg(struct kiocb *iocb, struct socket *sock,
                size -= chunk;
 
                /* Mark read part of skb as used */
-               if (!(flags & MSG_PEEK))
-               {
+               if (!(flags & MSG_PEEK)) {
                        skb_pull(skb, chunk);
 
                        if (UNIXCB(skb).fp)
                                unix_detach_fds(siocb->scm, skb);
 
                        /* put the skb back if we didn't use it up.. */
-                       if (skb->len)
-                       {
+                       if (skb->len) {
                                skb_queue_head(&sk->sk_receive_queue, skb);
                                break;
                        }
@@ -1854,9 +1878,7 @@ static int unix_stream_recvmsg(struct kiocb *iocb, struct socket *sock,
 
                        if (siocb->scm->fp)
                                break;
-               }
-               else
-               {
+               } else {
                        /* It is questionable, see note in unix_dgram_recvmsg.
                         */
                        if (UNIXCB(skb).fp)
@@ -1922,13 +1944,12 @@ static int unix_ioctl(struct socket *sock, unsigned int cmd, unsigned long arg)
        long amount = 0;
        int err;
 
-       switch(cmd)
-       {
-               case SIOCOUTQ:
-                       amount = atomic_read(&sk->sk_wmem_alloc);
-                       err = put_user(amount, (int __user *)arg);
-                       break;
-               case SIOCINQ:
+       switch (cmd) {
+       case SIOCOUTQ:
+               amount = sk_wmem_alloc_get(sk);
+               err = put_user(amount, (int __user *)arg);
+               break;
+       case SIOCINQ:
                {
                        struct sk_buff *skb;
 
@@ -1952,19 +1973,19 @@ static int unix_ioctl(struct socket *sock, unsigned int cmd, unsigned long arg)
                        break;
                }
 
-               default:
-                       err = -ENOIOCTLCMD;
-                       break;
+       default:
+               err = -ENOIOCTLCMD;
+               break;
        }
        return err;
 }
 
-static unsigned int unix_poll(struct file * file, struct socket *sock, poll_table *wait)
+static unsigned int unix_poll(struct file *file, struct socket *sock, poll_table *wait)
 {
        struct sock *sk = sock->sk;
        unsigned int mask;
 
-       poll_wait(file, sk->sk_sleep, wait);
+       sock_poll_wait(file, sk->sk_sleep, wait);
        mask = 0;
 
        /* exceptional events? */
@@ -1981,7 +2002,8 @@ static unsigned int unix_poll(struct file * file, struct socket *sock, poll_tabl
                mask |= POLLIN | POLLRDNORM;
 
        /* Connection-based need to check for termination and startup */
-       if ((sk->sk_type == SOCK_STREAM || sk->sk_type == SOCK_SEQPACKET) && sk->sk_state == TCP_CLOSE)
+       if ((sk->sk_type == SOCK_STREAM || sk->sk_type == SOCK_SEQPACKET) &&
+           sk->sk_state == TCP_CLOSE)
                mask |= POLLHUP;
 
        /*
@@ -2000,7 +2022,7 @@ static unsigned int unix_dgram_poll(struct file *file, struct socket *sock,
        struct sock *sk = sock->sk, *other;
        unsigned int mask, writable;
 
-       poll_wait(file, sk->sk_sleep, wait);
+       sock_poll_wait(file, sk->sk_sleep, wait);
        mask = 0;
 
        /* exceptional events? */
@@ -2031,7 +2053,7 @@ static unsigned int unix_dgram_poll(struct file *file, struct socket *sock,
                other = unix_peer_get(sk);
                if (other) {
                        if (unix_peer(other) != sk) {
-                               poll_wait(file, &unix_sk(other)->peer_wait,
+                               sock_poll_wait(file, &unix_sk(other)->peer_wait,
                                          wait);
                                if (unix_recvq_full(other))
                                        writable = 0;