net: pppoe - code cleanup and helpers
[safe/jmp/linux-2.6] / drivers / net / pppoe.c
1 /** -*- linux-c -*- ***********************************************************
2  * Linux PPP over Ethernet (PPPoX/PPPoE) Sockets
3  *
4  * PPPoX --- Generic PPP encapsulation socket family
5  * PPPoE --- PPP over Ethernet (RFC 2516)
6  *
7  *
8  * Version:     0.7.0
9  *
10  * 070228 :     Fix to allow multiple sessions with same remote MAC and same
11  *              session id by including the local device ifindex in the
12  *              tuple identifying a session. This also ensures packets can't
13  *              be injected into a session from interfaces other than the one
14  *              specified by userspace. Florian Zumbiehl <florz@florz.de>
15  *              (Oh, BTW, this one is YYMMDD, in case you were wondering ...)
16  * 220102 :     Fix module use count on failure in pppoe_create, pppox_sk -acme
17  * 030700 :     Fixed connect logic to allow for disconnect.
18  * 270700 :     Fixed potential SMP problems; we must protect against
19  *              simultaneous invocation of ppp_input
20  *              and ppp_unregister_channel.
21  * 040800 :     Respect reference count mechanisms on net-devices.
22  * 200800 :     fix kfree(skb) in pppoe_rcv (acme)
23  *              Module reference count is decremented in the right spot now,
24  *              guards against sock_put not actually freeing the sk
25  *              in pppoe_release.
26  * 051000 :     Initialization cleanup.
27  * 111100 :     Fix recvmsg.
28  * 050101 :     Fix PADT procesing.
29  * 140501 :     Use pppoe_rcv_core to handle all backlog. (Alexey)
30  * 170701 :     Do not lock_sock with rwlock held. (DaveM)
31  *              Ignore discovery frames if user has socket
32  *              locked. (DaveM)
33  *              Ignore return value of dev_queue_xmit in __pppoe_xmit
34  *              or else we may kfree an SKB twice. (DaveM)
35  * 190701 :     When doing copies of skb's in __pppoe_xmit, always delete
36  *              the original skb that was passed in on success, never on
37  *              failure.  Delete the copy of the skb on failure to avoid
38  *              a memory leak.
39  * 081001 :     Misc. cleanup (licence string, non-blocking, prevent
40  *              reference of device on close).
41  * 121301 :     New ppp channels interface; cannot unregister a channel
42  *              from interrupts.  Thus, we mark the socket as a ZOMBIE
43  *              and do the unregistration later.
44  * 081002 :     seq_file support for proc stuff -acme
45  * 111602 :     Merge all 2.4 fixes into 2.5/2.6 tree.  Label 2.5/2.6
46  *              as version 0.7.  Spacing cleanup.
47  * Author:      Michal Ostrowski <mostrows@speakeasy.net>
48  * Contributors:
49  *              Arnaldo Carvalho de Melo <acme@conectiva.com.br>
50  *              David S. Miller (davem@redhat.com)
51  *
52  * License:
53  *              This program is free software; you can redistribute it and/or
54  *              modify it under the terms of the GNU General Public License
55  *              as published by the Free Software Foundation; either version
56  *              2 of the License, or (at your option) any later version.
57  *
58  */
59
60 #include <linux/string.h>
61 #include <linux/module.h>
62 #include <linux/kernel.h>
63 #include <linux/slab.h>
64 #include <linux/errno.h>
65 #include <linux/netdevice.h>
66 #include <linux/net.h>
67 #include <linux/inetdevice.h>
68 #include <linux/etherdevice.h>
69 #include <linux/skbuff.h>
70 #include <linux/init.h>
71 #include <linux/if_ether.h>
72 #include <linux/if_pppox.h>
73 #include <linux/ppp_channel.h>
74 #include <linux/ppp_defs.h>
75 #include <linux/if_ppp.h>
76 #include <linux/notifier.h>
77 #include <linux/file.h>
78 #include <linux/proc_fs.h>
79 #include <linux/seq_file.h>
80
81 #include <net/net_namespace.h>
82 #include <net/sock.h>
83
84 #include <asm/uaccess.h>
85
86 #define PPPOE_HASH_BITS 4
87 #define PPPOE_HASH_SIZE (1 << PPPOE_HASH_BITS)
88 #define PPPOE_HASH_MASK (PPPOE_HASH_SIZE - 1)
89
90 static int pppoe_ioctl(struct socket *sock, unsigned int cmd, unsigned long arg);
91 static int pppoe_xmit(struct ppp_channel *chan, struct sk_buff *skb);
92 static int __pppoe_xmit(struct sock *sk, struct sk_buff *skb);
93
94 static const struct proto_ops pppoe_ops;
95 static struct ppp_channel_ops pppoe_chan_ops;
96 static DEFINE_RWLOCK(pppoe_hash_lock);
97
98 /*
99  * PPPoE could be in the following stages:
100  * 1) Discovery stage (to obtain remote MAC and Session ID)
101  * 2) Session stage (MAC and SID are known)
102  *
103  * Ethernet frames have a special tag for this but
104  * we use simplier approach based on session id
105  */
106 static inline bool stage_session(__be16 sid)
107 {
108         return sid != 0;
109 }
110
111 static inline int cmp_2_addr(struct pppoe_addr *a, struct pppoe_addr *b)
112 {
113         return a->sid == b->sid &&
114                 (memcmp(a->remote, b->remote, ETH_ALEN) == 0);
115 }
116
117 static inline int cmp_addr(struct pppoe_addr *a, __be16 sid, char *addr)
118 {
119         return a->sid == sid &&
120                 (memcmp(a->remote, addr, ETH_ALEN) == 0);
121 }
122
123 #if 8 % PPPOE_HASH_BITS
124 #error 8 must be a multiple of PPPOE_HASH_BITS
125 #endif
126
127 static int hash_item(__be16 sid, unsigned char *addr)
128 {
129         unsigned char hash = 0;
130         unsigned int i;
131
132         for (i = 0; i < ETH_ALEN; i++)
133                 hash ^= addr[i];
134         for (i = 0; i < sizeof(sid_t) * 8; i += 8)
135                 hash ^= (__force __u32)sid >> i;
136         for (i = 8; (i >>= 1) >= PPPOE_HASH_BITS;)
137                 hash ^= hash >> i;
138
139         return hash & PPPOE_HASH_MASK;
140 }
141
142 /* zeroed because its in .bss */
143 static struct pppox_sock *item_hash_table[PPPOE_HASH_SIZE];
144
145 /**********************************************************************
146  *
147  *  Set/get/delete/rehash items  (internal versions)
148  *
149  **********************************************************************/
150 static struct pppox_sock *__get_item(__be16 sid, unsigned char *addr, int ifindex)
151 {
152         int hash = hash_item(sid, addr);
153         struct pppox_sock *ret;
154
155         ret = item_hash_table[hash];
156
157         while (ret) {
158                 if (cmp_addr(&ret->pppoe_pa, sid, addr) &&
159                     ret->pppoe_ifindex == ifindex)
160                         return ret;
161
162                 ret = ret->next;
163         }
164
165         return NULL;
166 }
167
168 static int __set_item(struct pppox_sock *po)
169 {
170         int hash = hash_item(po->pppoe_pa.sid, po->pppoe_pa.remote);
171         struct pppox_sock *ret;
172
173         ret = item_hash_table[hash];
174         while (ret) {
175                 if (cmp_2_addr(&ret->pppoe_pa, &po->pppoe_pa) &&
176                     ret->pppoe_ifindex == po->pppoe_ifindex)
177                         return -EALREADY;
178
179                 ret = ret->next;
180         }
181
182         po->next = item_hash_table[hash];
183         item_hash_table[hash] = po;
184
185         return 0;
186 }
187
188 static struct pppox_sock *__delete_item(__be16 sid, char *addr, int ifindex)
189 {
190         int hash = hash_item(sid, addr);
191         struct pppox_sock *ret, **src;
192
193         ret = item_hash_table[hash];
194         src = &item_hash_table[hash];
195
196         while (ret) {
197                 if (cmp_addr(&ret->pppoe_pa, sid, addr) &&
198                     ret->pppoe_ifindex == ifindex) {
199                         *src = ret->next;
200                         break;
201                 }
202
203                 src = &ret->next;
204                 ret = ret->next;
205         }
206
207         return ret;
208 }
209
210 /**********************************************************************
211  *
212  *  Set/get/delete/rehash items
213  *
214  **********************************************************************/
215 static inline struct pppox_sock *get_item(__be16 sid,
216                                          unsigned char *addr, int ifindex)
217 {
218         struct pppox_sock *po;
219
220         read_lock_bh(&pppoe_hash_lock);
221         po = __get_item(sid, addr, ifindex);
222         if (po)
223                 sock_hold(sk_pppox(po));
224         read_unlock_bh(&pppoe_hash_lock);
225
226         return po;
227 }
228
229 static inline struct pppox_sock *get_item_by_addr(struct sockaddr_pppox *sp)
230 {
231         struct net_device *dev;
232         int ifindex;
233
234         dev = dev_get_by_name(&init_net, sp->sa_addr.pppoe.dev);
235         if (!dev)
236                 return NULL;
237         ifindex = dev->ifindex;
238         dev_put(dev);
239         return get_item(sp->sa_addr.pppoe.sid, sp->sa_addr.pppoe.remote, ifindex);
240 }
241
242 static inline struct pppox_sock *delete_item(__be16 sid, char *addr, int ifindex)
243 {
244         struct pppox_sock *ret;
245
246         write_lock_bh(&pppoe_hash_lock);
247         ret = __delete_item(sid, addr, ifindex);
248         write_unlock_bh(&pppoe_hash_lock);
249
250         return ret;
251 }
252
253
254
255 /***************************************************************************
256  *
257  *  Handler for device events.
258  *  Certain device events require that sockets be unconnected.
259  *
260  **************************************************************************/
261
262 static void pppoe_flush_dev(struct net_device *dev)
263 {
264         int hash;
265         BUG_ON(dev == NULL);
266
267         write_lock_bh(&pppoe_hash_lock);
268         for (hash = 0; hash < PPPOE_HASH_SIZE; hash++) {
269                 struct pppox_sock *po = item_hash_table[hash];
270
271                 while (po != NULL) {
272                         struct sock *sk = sk_pppox(po);
273                         if (po->pppoe_dev != dev) {
274                                 po = po->next;
275                                 continue;
276                         }
277                         po->pppoe_dev = NULL;
278                         dev_put(dev);
279
280
281                         /* We always grab the socket lock, followed by the
282                          * pppoe_hash_lock, in that order.  Since we should
283                          * hold the sock lock while doing any unbinding,
284                          * we need to release the lock we're holding.
285                          * Hold a reference to the sock so it doesn't disappear
286                          * as we're jumping between locks.
287                          */
288
289                         sock_hold(sk);
290
291                         write_unlock_bh(&pppoe_hash_lock);
292                         lock_sock(sk);
293
294                         if (sk->sk_state & (PPPOX_CONNECTED | PPPOX_BOUND)) {
295                                 pppox_unbind_sock(sk);
296                                 sk->sk_state = PPPOX_ZOMBIE;
297                                 sk->sk_state_change(sk);
298                         }
299
300                         release_sock(sk);
301                         sock_put(sk);
302
303                         /* Restart scan at the beginning of this hash chain.
304                          * While the lock was dropped the chain contents may
305                          * have changed.
306                          */
307                         write_lock_bh(&pppoe_hash_lock);
308                         po = item_hash_table[hash];
309                 }
310         }
311         write_unlock_bh(&pppoe_hash_lock);
312 }
313
314 static int pppoe_device_event(struct notifier_block *this,
315                               unsigned long event, void *ptr)
316 {
317         struct net_device *dev = (struct net_device *) ptr;
318
319         if (dev_net(dev) != &init_net)
320                 return NOTIFY_DONE;
321
322         /* Only look at sockets that are using this specific device. */
323         switch (event) {
324         case NETDEV_CHANGEMTU:
325                 /* A change in mtu is a bad thing, requiring
326                  * LCP re-negotiation.
327                  */
328
329         case NETDEV_GOING_DOWN:
330         case NETDEV_DOWN:
331                 /* Find every socket on this device and kill it. */
332                 pppoe_flush_dev(dev);
333                 break;
334
335         default:
336                 break;
337         };
338
339         return NOTIFY_DONE;
340 }
341
342
343 static struct notifier_block pppoe_notifier = {
344         .notifier_call = pppoe_device_event,
345 };
346
347 /************************************************************************
348  *
349  * Do the real work of receiving a PPPoE Session frame.
350  *
351  ***********************************************************************/
352 static int pppoe_rcv_core(struct sock *sk, struct sk_buff *skb)
353 {
354         struct pppox_sock *po = pppox_sk(sk);
355         struct pppox_sock *relay_po;
356
357         if (sk->sk_state & PPPOX_BOUND) {
358                 ppp_input(&po->chan, skb);
359         } else if (sk->sk_state & PPPOX_RELAY) {
360                 relay_po = get_item_by_addr(&po->pppoe_relay);
361
362                 if (relay_po == NULL)
363                         goto abort_kfree;
364
365                 if ((sk_pppox(relay_po)->sk_state & PPPOX_CONNECTED) == 0)
366                         goto abort_put;
367
368                 if (!__pppoe_xmit(sk_pppox(relay_po), skb))
369                         goto abort_put;
370         } else {
371                 if (sock_queue_rcv_skb(sk, skb))
372                         goto abort_kfree;
373         }
374
375         return NET_RX_SUCCESS;
376
377 abort_put:
378         sock_put(sk_pppox(relay_po));
379
380 abort_kfree:
381         kfree_skb(skb);
382         return NET_RX_DROP;
383 }
384
385 /************************************************************************
386  *
387  * Receive wrapper called in BH context.
388  *
389  ***********************************************************************/
390 static int pppoe_rcv(struct sk_buff *skb,
391                      struct net_device *dev,
392                      struct packet_type *pt,
393                      struct net_device *orig_dev)
394
395 {
396         struct pppoe_hdr *ph;
397         struct pppox_sock *po;
398         int len;
399
400         skb = skb_share_check(skb, GFP_ATOMIC);
401         if (!skb)
402                 goto out;
403
404         if (dev_net(dev) != &init_net)
405                 goto drop;
406
407         if (!pskb_may_pull(skb, sizeof(struct pppoe_hdr)))
408                 goto drop;
409
410         ph = pppoe_hdr(skb);
411         len = ntohs(ph->length);
412
413         skb_pull_rcsum(skb, sizeof(*ph));
414         if (skb->len < len)
415                 goto drop;
416
417         if (pskb_trim_rcsum(skb, len))
418                 goto drop;
419
420         po = get_item(ph->sid, eth_hdr(skb)->h_source, dev->ifindex);
421         if (!po)
422                 goto drop;
423
424         return sk_receive_skb(sk_pppox(po), skb, 0);
425
426 drop:
427         kfree_skb(skb);
428 out:
429         return NET_RX_DROP;
430 }
431
432 /************************************************************************
433  *
434  * Receive a PPPoE Discovery frame.
435  * This is solely for detection of PADT frames
436  *
437  ***********************************************************************/
438 static int pppoe_disc_rcv(struct sk_buff *skb,
439                           struct net_device *dev,
440                           struct packet_type *pt,
441                           struct net_device *orig_dev)
442
443 {
444         struct pppoe_hdr *ph;
445         struct pppox_sock *po;
446
447         if (dev_net(dev) != &init_net)
448                 goto abort;
449
450         skb = skb_share_check(skb, GFP_ATOMIC);
451         if (!skb)
452                 goto out;
453
454         if (!pskb_may_pull(skb, sizeof(struct pppoe_hdr)))
455                 goto abort;
456
457         ph = pppoe_hdr(skb);
458         if (ph->code != PADT_CODE)
459                 goto abort;
460
461         po = get_item(ph->sid, eth_hdr(skb)->h_source, dev->ifindex);
462         if (po) {
463                 struct sock *sk = sk_pppox(po);
464
465                 bh_lock_sock(sk);
466
467                 /* If the user has locked the socket, just ignore
468                  * the packet.  With the way two rcv protocols hook into
469                  * one socket family type, we cannot (easily) distinguish
470                  * what kind of SKB it is during backlog rcv.
471                  */
472                 if (sock_owned_by_user(sk) == 0) {
473                         /* We're no longer connect at the PPPOE layer,
474                          * and must wait for ppp channel to disconnect us.
475                          */
476                         sk->sk_state = PPPOX_ZOMBIE;
477                 }
478
479                 bh_unlock_sock(sk);
480                 sock_put(sk);
481         }
482
483 abort:
484         kfree_skb(skb);
485 out:
486         return NET_RX_SUCCESS; /* Lies... :-) */
487 }
488
489 static struct packet_type pppoes_ptype = {
490         .type   = __constant_htons(ETH_P_PPP_SES),
491         .func   = pppoe_rcv,
492 };
493
494 static struct packet_type pppoed_ptype = {
495         .type   = __constant_htons(ETH_P_PPP_DISC),
496         .func   = pppoe_disc_rcv,
497 };
498
499 static struct proto pppoe_sk_proto = {
500         .name     = "PPPOE",
501         .owner    = THIS_MODULE,
502         .obj_size = sizeof(struct pppox_sock),
503 };
504
505 /***********************************************************************
506  *
507  * Initialize a new struct sock.
508  *
509  **********************************************************************/
510 static int pppoe_create(struct net *net, struct socket *sock)
511 {
512         struct sock *sk;
513
514         sk = sk_alloc(net, PF_PPPOX, GFP_KERNEL, &pppoe_sk_proto);
515         if (!sk)
516                 return -ENOMEM;
517
518         sock_init_data(sock, sk);
519
520         sock->state = SS_UNCONNECTED;
521         sock->ops   = &pppoe_ops;
522
523         sk->sk_backlog_rcv = pppoe_rcv_core;
524         sk->sk_state       = PPPOX_NONE;
525         sk->sk_type        = SOCK_STREAM;
526         sk->sk_family      = PF_PPPOX;
527         sk->sk_protocol    = PX_PROTO_OE;
528
529         return 0;
530 }
531
532 static int pppoe_release(struct socket *sock)
533 {
534         struct sock *sk = sock->sk;
535         struct pppox_sock *po;
536
537         if (!sk)
538                 return 0;
539
540         lock_sock(sk);
541         if (sock_flag(sk, SOCK_DEAD)) {
542                 release_sock(sk);
543                 return -EBADF;
544         }
545
546         pppox_unbind_sock(sk);
547
548         /* Signal the death of the socket. */
549         sk->sk_state = PPPOX_DEAD;
550
551
552         /* Write lock on hash lock protects the entire "po" struct from
553          * concurrent updates via pppoe_flush_dev. The "po" struct should
554          * be considered part of the hash table contents, thus protected
555          * by the hash table lock */
556         write_lock_bh(&pppoe_hash_lock);
557
558         po = pppox_sk(sk);
559         if (stage_session(po->pppoe_pa.sid)) {
560                 __delete_item(po->pppoe_pa.sid,
561                               po->pppoe_pa.remote, po->pppoe_ifindex);
562         }
563
564         if (po->pppoe_dev) {
565                 dev_put(po->pppoe_dev);
566                 po->pppoe_dev = NULL;
567         }
568
569         write_unlock_bh(&pppoe_hash_lock);
570
571         sock_orphan(sk);
572         sock->sk = NULL;
573
574         skb_queue_purge(&sk->sk_receive_queue);
575         release_sock(sk);
576         sock_put(sk);
577
578         return 0;
579 }
580
581 static int pppoe_connect(struct socket *sock, struct sockaddr *uservaddr,
582                   int sockaddr_len, int flags)
583 {
584         struct sock *sk = sock->sk;
585         struct net_device *dev;
586         struct sockaddr_pppox *sp = (struct sockaddr_pppox *) uservaddr;
587         struct pppox_sock *po = pppox_sk(sk);
588         int error;
589
590         lock_sock(sk);
591
592         error = -EINVAL;
593         if (sp->sa_protocol != PX_PROTO_OE)
594                 goto end;
595
596         /* Check for already bound sockets */
597         error = -EBUSY;
598         if ((sk->sk_state & PPPOX_CONNECTED) &&
599              stage_session(sp->sa_addr.pppoe.sid))
600                 goto end;
601
602         /* Check for already disconnected sockets, on attempts to disconnect */
603         error = -EALREADY;
604         if ((sk->sk_state & PPPOX_DEAD) &&
605              !stage_session(sp->sa_addr.pppoe.sid))
606                 goto end;
607
608         error = 0;
609
610         /* Delete the old binding */
611         if (stage_session(po->pppoe_pa.sid)) {
612                 pppox_unbind_sock(sk);
613                 delete_item(po->pppoe_pa.sid, po->pppoe_pa.remote, po->pppoe_ifindex);
614                 if (po->pppoe_dev)
615                         dev_put(po->pppoe_dev);
616                 memset(sk_pppox(po) + 1, 0,
617                        sizeof(struct pppox_sock) - sizeof(struct sock));
618                 sk->sk_state = PPPOX_NONE;
619         }
620
621         /* Re-bind in session stage only */
622         if (stage_session(sp->sa_addr.pppoe.sid)) {
623                 dev = dev_get_by_name(&init_net, sp->sa_addr.pppoe.dev);
624
625                 error = -ENODEV;
626                 if (!dev)
627                         goto end;
628
629                 po->pppoe_dev = dev;
630                 po->pppoe_ifindex = dev->ifindex;
631
632                 write_lock_bh(&pppoe_hash_lock);
633                 if (!(dev->flags & IFF_UP)) {
634                         write_unlock_bh(&pppoe_hash_lock);
635                         goto err_put;
636                 }
637
638                 memcpy(&po->pppoe_pa,
639                        &sp->sa_addr.pppoe,
640                        sizeof(struct pppoe_addr));
641
642                 error = __set_item(po);
643                 write_unlock_bh(&pppoe_hash_lock);
644                 if (error < 0)
645                         goto err_put;
646
647                 po->chan.hdrlen = (sizeof(struct pppoe_hdr) +
648                                    dev->hard_header_len);
649
650                 po->chan.mtu = dev->mtu - sizeof(struct pppoe_hdr);
651                 po->chan.private = sk;
652                 po->chan.ops = &pppoe_chan_ops;
653
654                 error = ppp_register_channel(&po->chan);
655                 if (error)
656                         goto err_put;
657
658                 sk->sk_state = PPPOX_CONNECTED;
659         }
660
661         po->num = sp->sa_addr.pppoe.sid;
662
663 end:
664         release_sock(sk);
665         return error;
666 err_put:
667         if (po->pppoe_dev) {
668                 dev_put(po->pppoe_dev);
669                 po->pppoe_dev = NULL;
670         }
671         goto end;
672 }
673
674 static int pppoe_getname(struct socket *sock, struct sockaddr *uaddr,
675                   int *usockaddr_len, int peer)
676 {
677         int len = sizeof(struct sockaddr_pppox);
678         struct sockaddr_pppox sp;
679
680         sp.sa_family    = AF_PPPOX;
681         sp.sa_protocol  = PX_PROTO_OE;
682         memcpy(&sp.sa_addr.pppoe, &pppox_sk(sock->sk)->pppoe_pa,
683                sizeof(struct pppoe_addr));
684
685         memcpy(uaddr, &sp, len);
686
687         *usockaddr_len = len;
688
689         return 0;
690 }
691
692 static int pppoe_ioctl(struct socket *sock, unsigned int cmd,
693                 unsigned long arg)
694 {
695         struct sock *sk = sock->sk;
696         struct pppox_sock *po = pppox_sk(sk);
697         int val;
698         int err;
699
700         switch (cmd) {
701         case PPPIOCGMRU:
702                 err = -ENXIO;
703
704                 if (!(sk->sk_state & PPPOX_CONNECTED))
705                         break;
706
707                 err = -EFAULT;
708                 if (put_user(po->pppoe_dev->mtu -
709                              sizeof(struct pppoe_hdr) -
710                              PPP_HDRLEN,
711                              (int __user *) arg))
712                         break;
713                 err = 0;
714                 break;
715
716         case PPPIOCSMRU:
717                 err = -ENXIO;
718                 if (!(sk->sk_state & PPPOX_CONNECTED))
719                         break;
720
721                 err = -EFAULT;
722                 if (get_user(val, (int __user *)arg))
723                         break;
724
725                 if (val < (po->pppoe_dev->mtu
726                            - sizeof(struct pppoe_hdr)
727                            - PPP_HDRLEN))
728                         err = 0;
729                 else
730                         err = -EINVAL;
731                 break;
732
733         case PPPIOCSFLAGS:
734                 err = -EFAULT;
735                 if (get_user(val, (int __user *)arg))
736                         break;
737                 err = 0;
738                 break;
739
740         case PPPOEIOCSFWD:
741         {
742                 struct pppox_sock *relay_po;
743
744                 err = -EBUSY;
745                 if (sk->sk_state & (PPPOX_BOUND | PPPOX_ZOMBIE | PPPOX_DEAD))
746                         break;
747
748                 err = -ENOTCONN;
749                 if (!(sk->sk_state & PPPOX_CONNECTED))
750                         break;
751
752                 /* PPPoE address from the user specifies an outbound
753                    PPPoE address which frames are forwarded to */
754                 err = -EFAULT;
755                 if (copy_from_user(&po->pppoe_relay,
756                                    (void __user *)arg,
757                                    sizeof(struct sockaddr_pppox)))
758                         break;
759
760                 err = -EINVAL;
761                 if (po->pppoe_relay.sa_family != AF_PPPOX ||
762                     po->pppoe_relay.sa_protocol != PX_PROTO_OE)
763                         break;
764
765                 /* Check that the socket referenced by the address
766                    actually exists. */
767                 relay_po = get_item_by_addr(&po->pppoe_relay);
768
769                 if (!relay_po)
770                         break;
771
772                 sock_put(sk_pppox(relay_po));
773                 sk->sk_state |= PPPOX_RELAY;
774                 err = 0;
775                 break;
776         }
777
778         case PPPOEIOCDFWD:
779                 err = -EALREADY;
780                 if (!(sk->sk_state & PPPOX_RELAY))
781                         break;
782
783                 sk->sk_state &= ~PPPOX_RELAY;
784                 err = 0;
785                 break;
786
787         default:
788                 err = -ENOTTY;
789         }
790
791         return err;
792 }
793
794 static int pppoe_sendmsg(struct kiocb *iocb, struct socket *sock,
795                   struct msghdr *m, size_t total_len)
796 {
797         struct sk_buff *skb;
798         struct sock *sk = sock->sk;
799         struct pppox_sock *po = pppox_sk(sk);
800         int error;
801         struct pppoe_hdr hdr;
802         struct pppoe_hdr *ph;
803         struct net_device *dev;
804         char *start;
805
806         lock_sock(sk);
807         if (sock_flag(sk, SOCK_DEAD) || !(sk->sk_state & PPPOX_CONNECTED)) {
808                 error = -ENOTCONN;
809                 goto end;
810         }
811
812         hdr.ver = 1;
813         hdr.type = 1;
814         hdr.code = 0;
815         hdr.sid = po->num;
816
817         dev = po->pppoe_dev;
818
819         error = -EMSGSIZE;
820         if (total_len > (dev->mtu + dev->hard_header_len))
821                 goto end;
822
823
824         skb = sock_wmalloc(sk, total_len + dev->hard_header_len + 32,
825                            0, GFP_KERNEL);
826         if (!skb) {
827                 error = -ENOMEM;
828                 goto end;
829         }
830
831         /* Reserve space for headers. */
832         skb_reserve(skb, dev->hard_header_len);
833         skb_reset_network_header(skb);
834
835         skb->dev = dev;
836
837         skb->priority = sk->sk_priority;
838         skb->protocol = __constant_htons(ETH_P_PPP_SES);
839
840         ph = (struct pppoe_hdr *) skb_put(skb, total_len + sizeof(struct pppoe_hdr));
841         start = (char *) &ph->tag[0];
842
843         error = memcpy_fromiovec(start, m->msg_iov, total_len);
844
845         if (error < 0) {
846                 kfree_skb(skb);
847                 goto end;
848         }
849
850         error = total_len;
851         dev_hard_header(skb, dev, ETH_P_PPP_SES,
852                         po->pppoe_pa.remote, NULL, total_len);
853
854         memcpy(ph, &hdr, sizeof(struct pppoe_hdr));
855
856         ph->length = htons(total_len);
857
858         dev_queue_xmit(skb);
859
860 end:
861         release_sock(sk);
862         return error;
863 }
864
865 /************************************************************************
866  *
867  * xmit function for internal use.
868  *
869  ***********************************************************************/
870 static int __pppoe_xmit(struct sock *sk, struct sk_buff *skb)
871 {
872         struct pppox_sock *po = pppox_sk(sk);
873         struct net_device *dev = po->pppoe_dev;
874         struct pppoe_hdr *ph;
875         int data_len = skb->len;
876
877         if (sock_flag(sk, SOCK_DEAD) || !(sk->sk_state & PPPOX_CONNECTED))
878                 goto abort;
879
880         if (!dev)
881                 goto abort;
882
883         /* Copy the data if there is no space for the header or if it's
884          * read-only.
885          */
886         if (skb_cow_head(skb, sizeof(*ph) + dev->hard_header_len))
887                 goto abort;
888
889         __skb_push(skb, sizeof(*ph));
890         skb_reset_network_header(skb);
891
892         ph = pppoe_hdr(skb);
893         ph->ver = 1;
894         ph->type = 1;
895         ph->code = 0;
896         ph->sid = po->num;
897         ph->length = htons(data_len);
898
899         skb->protocol = __constant_htons(ETH_P_PPP_SES);
900         skb->dev = dev;
901
902         dev_hard_header(skb, dev, ETH_P_PPP_SES,
903                         po->pppoe_pa.remote, NULL, data_len);
904
905         dev_queue_xmit(skb);
906
907         return 1;
908
909 abort:
910         kfree_skb(skb);
911         return 1;
912 }
913
914 /************************************************************************
915  *
916  * xmit function called by generic PPP driver
917  * sends PPP frame over PPPoE socket
918  *
919  ***********************************************************************/
920 static int pppoe_xmit(struct ppp_channel *chan, struct sk_buff *skb)
921 {
922         struct sock *sk = (struct sock *) chan->private;
923         return __pppoe_xmit(sk, skb);
924 }
925
926 static struct ppp_channel_ops pppoe_chan_ops = {
927         .start_xmit = pppoe_xmit,
928 };
929
930 static int pppoe_recvmsg(struct kiocb *iocb, struct socket *sock,
931                   struct msghdr *m, size_t total_len, int flags)
932 {
933         struct sock *sk = sock->sk;
934         struct sk_buff *skb;
935         int error = 0;
936
937         if (sk->sk_state & PPPOX_BOUND) {
938                 error = -EIO;
939                 goto end;
940         }
941
942         skb = skb_recv_datagram(sk, flags & ~MSG_DONTWAIT,
943                                 flags & MSG_DONTWAIT, &error);
944
945         if (error < 0)
946                 goto end;
947
948         m->msg_namelen = 0;
949
950         if (skb) {
951                 total_len = min_t(size_t, total_len, skb->len);
952                 error = skb_copy_datagram_iovec(skb, 0, m->msg_iov, total_len);
953                 if (error == 0)
954                         error = total_len;
955         }
956
957         kfree_skb(skb);
958 end:
959         return error;
960 }
961
962 #ifdef CONFIG_PROC_FS
963 static int pppoe_seq_show(struct seq_file *seq, void *v)
964 {
965         struct pppox_sock *po;
966         char *dev_name;
967
968         if (v == SEQ_START_TOKEN) {
969                 seq_puts(seq, "Id       Address              Device\n");
970                 goto out;
971         }
972
973         po = v;
974         dev_name = po->pppoe_pa.dev;
975
976         seq_printf(seq, "%08X %pM %8s\n",
977                    po->pppoe_pa.sid, po->pppoe_pa.remote, dev_name);
978 out:
979         return 0;
980 }
981
982 static __inline__ struct pppox_sock *pppoe_get_idx(loff_t pos)
983 {
984         struct pppox_sock *po;
985         int i;
986
987         for (i = 0; i < PPPOE_HASH_SIZE; i++) {
988                 po = item_hash_table[i];
989                 while (po) {
990                         if (!pos--)
991                                 goto out;
992                         po = po->next;
993                 }
994         }
995 out:
996         return po;
997 }
998
999 static void *pppoe_seq_start(struct seq_file *seq, loff_t *pos)
1000         __acquires(pppoe_hash_lock)
1001 {
1002         loff_t l = *pos;
1003
1004         read_lock_bh(&pppoe_hash_lock);
1005         return l ? pppoe_get_idx(--l) : SEQ_START_TOKEN;
1006 }
1007
1008 static void *pppoe_seq_next(struct seq_file *seq, void *v, loff_t *pos)
1009 {
1010         struct pppox_sock *po;
1011
1012         ++*pos;
1013         if (v == SEQ_START_TOKEN) {
1014                 po = pppoe_get_idx(0);
1015                 goto out;
1016         }
1017         po = v;
1018         if (po->next)
1019                 po = po->next;
1020         else {
1021                 int hash = hash_item(po->pppoe_pa.sid, po->pppoe_pa.remote);
1022
1023                 while (++hash < PPPOE_HASH_SIZE) {
1024                         po = item_hash_table[hash];
1025                         if (po)
1026                                 break;
1027                 }
1028         }
1029 out:
1030         return po;
1031 }
1032
1033 static void pppoe_seq_stop(struct seq_file *seq, void *v)
1034         __releases(pppoe_hash_lock)
1035 {
1036         read_unlock_bh(&pppoe_hash_lock);
1037 }
1038
1039 static const struct seq_operations pppoe_seq_ops = {
1040         .start          = pppoe_seq_start,
1041         .next           = pppoe_seq_next,
1042         .stop           = pppoe_seq_stop,
1043         .show           = pppoe_seq_show,
1044 };
1045
1046 static int pppoe_seq_open(struct inode *inode, struct file *file)
1047 {
1048         return seq_open(file, &pppoe_seq_ops);
1049 }
1050
1051 static const struct file_operations pppoe_seq_fops = {
1052         .owner          = THIS_MODULE,
1053         .open           = pppoe_seq_open,
1054         .read           = seq_read,
1055         .llseek         = seq_lseek,
1056         .release        = seq_release,
1057 };
1058
1059 static int __init pppoe_proc_init(void)
1060 {
1061         struct proc_dir_entry *p;
1062
1063         p = proc_net_fops_create(&init_net, "pppoe", S_IRUGO, &pppoe_seq_fops);
1064         if (!p)
1065                 return -ENOMEM;
1066         return 0;
1067 }
1068 #else /* CONFIG_PROC_FS */
1069 static inline int pppoe_proc_init(void) { return 0; }
1070 #endif /* CONFIG_PROC_FS */
1071
1072 static const struct proto_ops pppoe_ops = {
1073         .family         = AF_PPPOX,
1074         .owner          = THIS_MODULE,
1075         .release        = pppoe_release,
1076         .bind           = sock_no_bind,
1077         .connect        = pppoe_connect,
1078         .socketpair     = sock_no_socketpair,
1079         .accept         = sock_no_accept,
1080         .getname        = pppoe_getname,
1081         .poll           = datagram_poll,
1082         .listen         = sock_no_listen,
1083         .shutdown       = sock_no_shutdown,
1084         .setsockopt     = sock_no_setsockopt,
1085         .getsockopt     = sock_no_getsockopt,
1086         .sendmsg        = pppoe_sendmsg,
1087         .recvmsg        = pppoe_recvmsg,
1088         .mmap           = sock_no_mmap,
1089         .ioctl          = pppox_ioctl,
1090 };
1091
1092 static struct pppox_proto pppoe_proto = {
1093         .create = pppoe_create,
1094         .ioctl  = pppoe_ioctl,
1095         .owner  = THIS_MODULE,
1096 };
1097
1098 static int __init pppoe_init(void)
1099 {
1100         int err = proto_register(&pppoe_sk_proto, 0);
1101
1102         if (err)
1103                 goto out;
1104
1105         err = register_pppox_proto(PX_PROTO_OE, &pppoe_proto);
1106         if (err)
1107                 goto out_unregister_pppoe_proto;
1108
1109         err = pppoe_proc_init();
1110         if (err)
1111                 goto out_unregister_pppox_proto;
1112
1113         dev_add_pack(&pppoes_ptype);
1114         dev_add_pack(&pppoed_ptype);
1115         register_netdevice_notifier(&pppoe_notifier);
1116 out:
1117         return err;
1118 out_unregister_pppox_proto:
1119         unregister_pppox_proto(PX_PROTO_OE);
1120 out_unregister_pppoe_proto:
1121         proto_unregister(&pppoe_sk_proto);
1122         goto out;
1123 }
1124
1125 static void __exit pppoe_exit(void)
1126 {
1127         unregister_pppox_proto(PX_PROTO_OE);
1128         dev_remove_pack(&pppoes_ptype);
1129         dev_remove_pack(&pppoed_ptype);
1130         unregister_netdevice_notifier(&pppoe_notifier);
1131         remove_proc_entry("pppoe", init_net.proc_net);
1132         proto_unregister(&pppoe_sk_proto);
1133 }
1134
1135 module_init(pppoe_init);
1136 module_exit(pppoe_exit);
1137
1138 MODULE_AUTHOR("Michal Ostrowski <mostrows@speakeasy.net>");
1139 MODULE_DESCRIPTION("PPP over Ethernet driver");
1140 MODULE_LICENSE("GPL");
1141 MODULE_ALIAS_NETPROTO(PF_PPPOX);