net: fix softnet_stat
[safe/jmp/linux-2.6] / net / sched / sch_dsmark.c
index 3c6fd18..63d41f8 100644 (file)
@@ -5,34 +5,18 @@
 
 #include <linux/module.h>
 #include <linux/init.h>
+#include <linux/slab.h>
 #include <linux/types.h>
 #include <linux/string.h>
 #include <linux/errno.h>
 #include <linux/skbuff.h>
-#include <linux/netdevice.h> /* for pkt_sched */
 #include <linux/rtnetlink.h>
+#include <linux/bitops.h>
 #include <net/pkt_sched.h>
 #include <net/dsfield.h>
 #include <net/inet_ecn.h>
 #include <asm/byteorder.h>
 
-
-#if 0 /* control */
-#define DPRINTK(format,args...) printk(KERN_DEBUG format,##args)
-#else
-#define DPRINTK(format,args...)
-#endif
-
-#if 0 /* data */
-#define D2PRINTK(format,args...) printk(KERN_DEBUG format,##args)
-#else
-#define D2PRINTK(format,args...)
-#endif
-
-
-#define PRIV(sch) ((struct dsmark_qdisc_data *) qdisc_priv(sch))
-
-
 /*
  * classid     class           marking
  * -------     -----           -------
@@ -61,17 +45,6 @@ struct dsmark_qdisc_data {
        int                     set_tc_index;
 };
 
-static inline int dsmark_valid_indices(u16 indices)
-{
-       while (indices != 1) {
-               if (indices & 1)
-                       return 0;
-               indices >>= 1;
-       }
-
-       return 1;
-}
-
 static inline int dsmark_valid_index(struct dsmark_qdisc_data *p, u16 index)
 {
        return (index <= p->indices && index > 0);
@@ -82,20 +55,22 @@ static inline int dsmark_valid_index(struct dsmark_qdisc_data *p, u16 index)
 static int dsmark_graft(struct Qdisc *sch, unsigned long arg,
                        struct Qdisc *new, struct Qdisc **old)
 {
-       struct dsmark_qdisc_data *p = PRIV(sch);
+       struct dsmark_qdisc_data *p = qdisc_priv(sch);
 
-       DPRINTK("dsmark_graft(sch %p,[qdisc %p],new %p,old %p)\n",
+       pr_debug("dsmark_graft(sch %p,[qdisc %p],new %p,old %p)\n",
                sch, p, new, old);
 
        if (new == NULL) {
-               new = qdisc_create_dflt(sch->dev, &pfifo_qdisc_ops,
+               new = qdisc_create_dflt(qdisc_dev(sch), sch->dev_queue,
+                                       &pfifo_qdisc_ops,
                                        sch->handle);
                if (new == NULL)
                        new = &noop_qdisc;
        }
 
        sch_tree_lock(sch);
-       *old = xchg(&p->q, new);
+       *old = p->q;
+       p->q = new;
        qdisc_tree_decrease_qlen(*old, (*old)->q.qlen);
        qdisc_reset(*old);
        sch_tree_unlock(sch);
@@ -105,13 +80,14 @@ static int dsmark_graft(struct Qdisc *sch, unsigned long arg,
 
 static struct Qdisc *dsmark_leaf(struct Qdisc *sch, unsigned long arg)
 {
-       return PRIV(sch)->q;
+       struct dsmark_qdisc_data *p = qdisc_priv(sch);
+       return p->q;
 }
 
 static unsigned long dsmark_get(struct Qdisc *sch, u32 classid)
 {
-       DPRINTK("dsmark_get(sch %p,[qdisc %p],classid %x)\n",
-               sch, PRIV(sch), classid);
+       pr_debug("dsmark_get(sch %p,[qdisc %p],classid %x)\n",
+               sch, qdisc_priv(sch), classid);
 
        return TC_H_MIN(classid) + 1;
 }
@@ -126,44 +102,56 @@ static void dsmark_put(struct Qdisc *sch, unsigned long cl)
 {
 }
 
+static const struct nla_policy dsmark_policy[TCA_DSMARK_MAX + 1] = {
+       [TCA_DSMARK_INDICES]            = { .type = NLA_U16 },
+       [TCA_DSMARK_DEFAULT_INDEX]      = { .type = NLA_U16 },
+       [TCA_DSMARK_SET_TC_INDEX]       = { .type = NLA_FLAG },
+       [TCA_DSMARK_MASK]               = { .type = NLA_U8 },
+       [TCA_DSMARK_VALUE]              = { .type = NLA_U8 },
+};
+
 static int dsmark_change(struct Qdisc *sch, u32 classid, u32 parent,
-                        struct rtattr **tca, unsigned long *arg)
+                        struct nlattr **tca, unsigned long *arg)
 {
-       struct dsmark_qdisc_data *p = PRIV(sch);
-       struct rtattr *opt = tca[TCA_OPTIONS-1];
-       struct rtattr *tb[TCA_DSMARK_MAX];
+       struct dsmark_qdisc_data *p = qdisc_priv(sch);
+       struct nlattr *opt = tca[TCA_OPTIONS];
+       struct nlattr *tb[TCA_DSMARK_MAX + 1];
        int err = -EINVAL;
        u8 mask = 0;
 
-       DPRINTK("dsmark_change(sch %p,[qdisc %p],classid %x,parent %x),"
+       pr_debug("dsmark_change(sch %p,[qdisc %p],classid %x,parent %x),"
                "arg 0x%lx\n", sch, p, classid, parent, *arg);
 
        if (!dsmark_valid_index(p, *arg)) {
                err = -ENOENT;
-               goto rtattr_failure;
+               goto errout;
        }
 
-       if (!opt || rtattr_parse_nested(tb, TCA_DSMARK_MAX, opt))
-               goto rtattr_failure;
+       if (!opt)
+               goto errout;
 
-       if (tb[TCA_DSMARK_MASK-1])
-               mask = RTA_GET_U8(tb[TCA_DSMARK_MASK-1]);
+       err = nla_parse_nested(tb, TCA_DSMARK_MAX, opt, dsmark_policy);
+       if (err < 0)
+               goto errout;
+
+       if (tb[TCA_DSMARK_MASK])
+               mask = nla_get_u8(tb[TCA_DSMARK_MASK]);
 
-       if (tb[TCA_DSMARK_VALUE-1])
-               p->value[*arg-1] = RTA_GET_U8(tb[TCA_DSMARK_VALUE-1]);
+       if (tb[TCA_DSMARK_VALUE])
+               p->value[*arg-1] = nla_get_u8(tb[TCA_DSMARK_VALUE]);
 
-       if (tb[TCA_DSMARK_MASK-1])
+       if (tb[TCA_DSMARK_MASK])
                p->mask[*arg-1] = mask;
 
        err = 0;
 
-rtattr_failure:
+errout:
        return err;
 }
 
 static int dsmark_delete(struct Qdisc *sch, unsigned long arg)
 {
-       struct dsmark_qdisc_data *p = PRIV(sch);
+       struct dsmark_qdisc_data *p = qdisc_priv(sch);
 
        if (!dsmark_valid_index(p, arg))
                return -EINVAL;
@@ -174,12 +162,12 @@ static int dsmark_delete(struct Qdisc *sch, unsigned long arg)
        return 0;
 }
 
-static void dsmark_walk(struct Qdisc *sch,struct qdisc_walker *walker)
+static void dsmark_walk(struct Qdisc *sch, struct qdisc_walker *walker)
 {
-       struct dsmark_qdisc_data *p = PRIV(sch);
+       struct dsmark_qdisc_data *p = qdisc_priv(sch);
        int i;
 
-       DPRINTK("dsmark_walk(sch %p,[qdisc %p],walker %p)\n", sch, p, walker);
+       pr_debug("dsmark_walk(sch %p,[qdisc %p],walker %p)\n", sch, p, walker);
 
        if (walker->stop)
                return;
@@ -198,34 +186,42 @@ ignore:
        }
 }
 
-static struct tcf_proto **dsmark_find_tcf(struct Qdisc *sch,unsigned long cl)
+static inline struct tcf_proto **dsmark_find_tcf(struct Qdisc *sch,
+                                                unsigned long cl)
 {
-       return &PRIV(sch)->filter_list;
+       struct dsmark_qdisc_data *p = qdisc_priv(sch);
+       return &p->filter_list;
 }
 
 /* --------------------------- Qdisc operations ---------------------------- */
 
-static int dsmark_enqueue(struct sk_buff *skb,struct Qdisc *sch)
+static int dsmark_enqueue(struct sk_buff *skb, struct Qdisc *sch)
 {
-       struct dsmark_qdisc_data *p = PRIV(sch);
+       struct dsmark_qdisc_data *p = qdisc_priv(sch);
        int err;
 
-       D2PRINTK("dsmark_enqueue(skb %p,sch %p,[qdisc %p])\n", skb, sch, p);
+       pr_debug("dsmark_enqueue(skb %p,sch %p,[qdisc %p])\n", skb, sch, p);
 
        if (p->set_tc_index) {
-               /* FIXME: Safe with non-linear skbs? --RR */
                switch (skb->protocol) {
-                       case __constant_htons(ETH_P_IP):
-                               skb->tc_index = ipv4_get_dsfield(ip_hdr(skb))
-                                       & ~INET_ECN_MASK;
-                               break;
-                       case __constant_htons(ETH_P_IPV6):
-                               skb->tc_index = ipv6_get_dsfield(ipv6_hdr(skb))
-                                       & ~INET_ECN_MASK;
-                               break;
-                       default:
-                               skb->tc_index = 0;
-                               break;
+               case htons(ETH_P_IP):
+                       if (skb_cow_head(skb, sizeof(struct iphdr)))
+                               goto drop;
+
+                       skb->tc_index = ipv4_get_dsfield(ip_hdr(skb))
+                               & ~INET_ECN_MASK;
+                       break;
+
+               case htons(ETH_P_IPV6):
+                       if (skb_cow_head(skb, sizeof(struct ipv6hdr)))
+                               goto drop;
+
+                       skb->tc_index = ipv6_get_dsfield(ipv6_hdr(skb))
+                               & ~INET_ECN_MASK;
+                       break;
+               default:
+                       skb->tc_index = 0;
+                       break;
                }
        }
 
@@ -235,51 +231,55 @@ static int dsmark_enqueue(struct sk_buff *skb,struct Qdisc *sch)
                struct tcf_result res;
                int result = tc_classify(skb, p->filter_list, &res);
 
-               D2PRINTK("result %d class 0x%04x\n", result, res.classid);
+               pr_debug("result %d class 0x%04x\n", result, res.classid);
 
                switch (result) {
-#ifdef CONFIG_NET_CLS_POLICE
-                       case TC_POLICE_SHOT:
-                               kfree_skb(skb);
-                               sch->qstats.drops++;
-                               return NET_XMIT_POLICED;
-#if 0
-                       case TC_POLICE_RECLASSIFY:
-                               /* FIXME: what to do here ??? */
+#ifdef CONFIG_NET_CLS_ACT
+               case TC_ACT_QUEUED:
+               case TC_ACT_STOLEN:
+                       kfree_skb(skb);
+                       return NET_XMIT_SUCCESS | __NET_XMIT_STOLEN;
+
+               case TC_ACT_SHOT:
+                       goto drop;
 #endif
-#endif
-                       case TC_POLICE_OK:
-                               skb->tc_index = TC_H_MIN(res.classid);
-                               break;
-                       case TC_POLICE_UNSPEC:
-                               /* fall through */
-                       default:
-                               if (p->default_index != NO_DEFAULT_INDEX)
-                                       skb->tc_index = p->default_index;
-                               break;
+               case TC_ACT_OK:
+                       skb->tc_index = TC_H_MIN(res.classid);
+                       break;
+
+               default:
+                       if (p->default_index != NO_DEFAULT_INDEX)
+                               skb->tc_index = p->default_index;
+                       break;
                }
        }
 
-       err = p->q->enqueue(skb,p->q);
+       err = qdisc_enqueue(skb, p->q);
        if (err != NET_XMIT_SUCCESS) {
-               sch->qstats.drops++;
+               if (net_xmit_drop_count(err))
+                       sch->qstats.drops++;
                return err;
        }
 
-       sch->bstats.bytes += skb->len;
+       sch->bstats.bytes += qdisc_pkt_len(skb);
        sch->bstats.packets++;
        sch->q.qlen++;
 
        return NET_XMIT_SUCCESS;
+
+drop:
+       kfree_skb(skb);
+       sch->qstats.drops++;
+       return NET_XMIT_SUCCESS | __NET_XMIT_BYPASS;
 }
 
 static struct sk_buff *dsmark_dequeue(struct Qdisc *sch)
 {
-       struct dsmark_qdisc_data *p = PRIV(sch);
+       struct dsmark_qdisc_data *p = qdisc_priv(sch);
        struct sk_buff *skb;
        u32 index;
 
-       D2PRINTK("dsmark_dequeue(sch %p,[qdisc %p])\n", sch, p);
+       pr_debug("dsmark_dequeue(sch %p,[qdisc %p])\n", sch, p);
 
        skb = p->q->ops->dequeue(p->q);
        if (skb == NULL)
@@ -288,58 +288,48 @@ static struct sk_buff *dsmark_dequeue(struct Qdisc *sch)
        sch->q.qlen--;
 
        index = skb->tc_index & (p->indices - 1);
-       D2PRINTK("index %d->%d\n", skb->tc_index, index);
+       pr_debug("index %d->%d\n", skb->tc_index, index);
 
        switch (skb->protocol) {
-               case __constant_htons(ETH_P_IP):
-                       ipv4_change_dsfield(ip_hdr(skb), p->mask[index],
-                                           p->value[index]);
+       case htons(ETH_P_IP):
+               ipv4_change_dsfield(ip_hdr(skb), p->mask[index],
+                                   p->value[index]);
                        break;
-               case __constant_htons(ETH_P_IPV6):
-                       ipv6_change_dsfield(ipv6_hdr(skb), p->mask[index],
-                                           p->value[index]);
-                       break;
-               default:
-                       /*
-                        * Only complain if a change was actually attempted.
-                        * This way, we can send non-IP traffic through dsmark
-                        * and don't need yet another qdisc as a bypass.
-                        */
-                       if (p->mask[index] != 0xff || p->value[index])
-                               printk(KERN_WARNING "dsmark_dequeue: "
-                                      "unsupported protocol %d\n",
-                                      ntohs(skb->protocol));
+       case htons(ETH_P_IPV6):
+               ipv6_change_dsfield(ipv6_hdr(skb), p->mask[index],
+                                   p->value[index]);
                        break;
+       default:
+               /*
+                * Only complain if a change was actually attempted.
+                * This way, we can send non-IP traffic through dsmark
+                * and don't need yet another qdisc as a bypass.
+                */
+               if (p->mask[index] != 0xff || p->value[index])
+                       printk(KERN_WARNING
+                              "dsmark_dequeue: unsupported protocol %d\n",
+                              ntohs(skb->protocol));
+               break;
        }
 
        return skb;
 }
 
-static int dsmark_requeue(struct sk_buff *skb,struct Qdisc *sch)
+static struct sk_buff *dsmark_peek(struct Qdisc *sch)
 {
-       struct dsmark_qdisc_data *p = PRIV(sch);
-       int err;
-
-       D2PRINTK("dsmark_requeue(skb %p,sch %p,[qdisc %p])\n", skb, sch, p);
-
-       err = p->q->ops->requeue(skb, p->q);
-       if (err != NET_XMIT_SUCCESS) {
-               sch->qstats.drops++;
-               return err;
-       }
+       struct dsmark_qdisc_data *p = qdisc_priv(sch);
 
-       sch->q.qlen++;
-       sch->qstats.requeues++;
+       pr_debug("dsmark_peek(sch %p,[qdisc %p])\n", sch, p);
 
-       return NET_XMIT_SUCCESS;
+       return p->q->ops->peek(p->q);
 }
 
 static unsigned int dsmark_drop(struct Qdisc *sch)
 {
-       struct dsmark_qdisc_data *p = PRIV(sch);
+       struct dsmark_qdisc_data *p = qdisc_priv(sch);
        unsigned int len;
 
-       DPRINTK("dsmark_reset(sch %p,[qdisc %p])\n", sch, p);
+       pr_debug("dsmark_reset(sch %p,[qdisc %p])\n", sch, p);
 
        if (p->q->ops->drop == NULL)
                return 0;
@@ -351,26 +341,32 @@ static unsigned int dsmark_drop(struct Qdisc *sch)
        return len;
 }
 
-static int dsmark_init(struct Qdisc *sch, struct rtattr *opt)
+static int dsmark_init(struct Qdisc *sch, struct nlattr *opt)
 {
-       struct dsmark_qdisc_data *p = PRIV(sch);
-       struct rtattr *tb[TCA_DSMARK_MAX];
+       struct dsmark_qdisc_data *p = qdisc_priv(sch);
+       struct nlattr *tb[TCA_DSMARK_MAX + 1];
        int err = -EINVAL;
        u32 default_index = NO_DEFAULT_INDEX;
        u16 indices;
        u8 *mask;
 
-       DPRINTK("dsmark_init(sch %p,[qdisc %p],opt %p)\n", sch, p, opt);
+       pr_debug("dsmark_init(sch %p,[qdisc %p],opt %p)\n", sch, p, opt);
 
-       if (!opt || rtattr_parse_nested(tb, TCA_DSMARK_MAX, opt) < 0)
+       if (!opt)
                goto errout;
 
-       indices = RTA_GET_U16(tb[TCA_DSMARK_INDICES-1]);
-       if (!indices || !dsmark_valid_indices(indices))
+       err = nla_parse_nested(tb, TCA_DSMARK_MAX, opt, dsmark_policy);
+       if (err < 0)
+               goto errout;
+
+       err = -EINVAL;
+       indices = nla_get_u16(tb[TCA_DSMARK_INDICES]);
+
+       if (hweight32(indices) != 1)
                goto errout;
 
-       if (tb[TCA_DSMARK_DEFAULT_INDEX-1])
-               default_index = RTA_GET_U16(tb[TCA_DSMARK_DEFAULT_INDEX-1]);
+       if (tb[TCA_DSMARK_DEFAULT_INDEX])
+               default_index = nla_get_u16(tb[TCA_DSMARK_DEFAULT_INDEX]);
 
        mask = kmalloc(indices * 2, GFP_KERNEL);
        if (mask == NULL) {
@@ -386,36 +382,36 @@ static int dsmark_init(struct Qdisc *sch, struct rtattr *opt)
 
        p->indices = indices;
        p->default_index = default_index;
-       p->set_tc_index = RTA_GET_FLAG(tb[TCA_DSMARK_SET_TC_INDEX-1]);
+       p->set_tc_index = nla_get_flag(tb[TCA_DSMARK_SET_TC_INDEX]);
 
-       p->q = qdisc_create_dflt(sch->dev, &pfifo_qdisc_ops, sch->handle);
+       p->q = qdisc_create_dflt(qdisc_dev(sch), sch->dev_queue,
+                                &pfifo_qdisc_ops, sch->handle);
        if (p->q == NULL)
                p->q = &noop_qdisc;
 
-       DPRINTK("dsmark_init: qdisc %p\n", p->q);
+       pr_debug("dsmark_init: qdisc %p\n", p->q);
 
        err = 0;
 errout:
-rtattr_failure:
        return err;
 }
 
 static void dsmark_reset(struct Qdisc *sch)
 {
-       struct dsmark_qdisc_data *p = PRIV(sch);
+       struct dsmark_qdisc_data *p = qdisc_priv(sch);
 
-       DPRINTK("dsmark_reset(sch %p,[qdisc %p])\n", sch, p);
+       pr_debug("dsmark_reset(sch %p,[qdisc %p])\n", sch, p);
        qdisc_reset(p->q);
        sch->q.qlen = 0;
 }
 
 static void dsmark_destroy(struct Qdisc *sch)
 {
-       struct dsmark_qdisc_data *p = PRIV(sch);
+       struct dsmark_qdisc_data *p = qdisc_priv(sch);
 
-       DPRINTK("dsmark_destroy(sch %p,[qdisc %p])\n", sch, p);
+       pr_debug("dsmark_destroy(sch %p,[qdisc %p])\n", sch, p);
 
-       tcf_destroy_chain(p->filter_list);
+       tcf_destroy_chain(&p->filter_list);
        qdisc_destroy(p->q);
        kfree(p->mask);
 }
@@ -423,10 +419,10 @@ static void dsmark_destroy(struct Qdisc *sch)
 static int dsmark_dump_class(struct Qdisc *sch, unsigned long cl,
                             struct sk_buff *skb, struct tcmsg *tcm)
 {
-       struct dsmark_qdisc_data *p = PRIV(sch);
-       struct rtattr *opts = NULL;
+       struct dsmark_qdisc_data *p = qdisc_priv(sch);
+       struct nlattr *opts = NULL;
 
-       DPRINTK("dsmark_dump_class(sch %p,[qdisc %p],class %ld\n", sch, p, cl);
+       pr_debug("dsmark_dump_class(sch %p,[qdisc %p],class %ld\n", sch, p, cl);
 
        if (!dsmark_valid_index(p, cl))
                return -EINVAL;
@@ -434,37 +430,43 @@ static int dsmark_dump_class(struct Qdisc *sch, unsigned long cl,
        tcm->tcm_handle = TC_H_MAKE(TC_H_MAJ(sch->handle), cl-1);
        tcm->tcm_info = p->q->handle;
 
-       opts = RTA_NEST(skb, TCA_OPTIONS);
-       RTA_PUT_U8(skb,TCA_DSMARK_MASK, p->mask[cl-1]);
-       RTA_PUT_U8(skb,TCA_DSMARK_VALUE, p->value[cl-1]);
+       opts = nla_nest_start(skb, TCA_OPTIONS);
+       if (opts == NULL)
+               goto nla_put_failure;
+       NLA_PUT_U8(skb, TCA_DSMARK_MASK, p->mask[cl-1]);
+       NLA_PUT_U8(skb, TCA_DSMARK_VALUE, p->value[cl-1]);
 
-       return RTA_NEST_END(skb, opts);
+       return nla_nest_end(skb, opts);
 
-rtattr_failure:
-       return RTA_NEST_CANCEL(skb, opts);
+nla_put_failure:
+       nla_nest_cancel(skb, opts);
+       return -EMSGSIZE;
 }
 
 static int dsmark_dump(struct Qdisc *sch, struct sk_buff *skb)
 {
-       struct dsmark_qdisc_data *p = PRIV(sch);
-       struct rtattr *opts = NULL;
+       struct dsmark_qdisc_data *p = qdisc_priv(sch);
+       struct nlattr *opts = NULL;
 
-       opts = RTA_NEST(skb, TCA_OPTIONS);
-       RTA_PUT_U16(skb, TCA_DSMARK_INDICES, p->indices);
+       opts = nla_nest_start(skb, TCA_OPTIONS);
+       if (opts == NULL)
+               goto nla_put_failure;
+       NLA_PUT_U16(skb, TCA_DSMARK_INDICES, p->indices);
 
        if (p->default_index != NO_DEFAULT_INDEX)
-               RTA_PUT_U16(skb, TCA_DSMARK_DEFAULT_INDEX, p->default_index);
+               NLA_PUT_U16(skb, TCA_DSMARK_DEFAULT_INDEX, p->default_index);
 
        if (p->set_tc_index)
-               RTA_PUT_FLAG(skb, TCA_DSMARK_SET_TC_INDEX);
+               NLA_PUT_FLAG(skb, TCA_DSMARK_SET_TC_INDEX);
 
-       return RTA_NEST_END(skb, opts);
+       return nla_nest_end(skb, opts);
 
-rtattr_failure:
-       return RTA_NEST_CANCEL(skb, opts);
+nla_put_failure:
+       nla_nest_cancel(skb, opts);
+       return -EMSGSIZE;
 }
 
-static struct Qdisc_class_ops dsmark_class_ops = {
+static const struct Qdisc_class_ops dsmark_class_ops = {
        .graft          =       dsmark_graft,
        .leaf           =       dsmark_leaf,
        .get            =       dsmark_get,
@@ -478,14 +480,14 @@ static struct Qdisc_class_ops dsmark_class_ops = {
        .dump           =       dsmark_dump_class,
 };
 
-static struct Qdisc_ops dsmark_qdisc_ops = {
+static struct Qdisc_ops dsmark_qdisc_ops __read_mostly = {
        .next           =       NULL,
        .cl_ops         =       &dsmark_class_ops,
        .id             =       "dsmark",
        .priv_size      =       sizeof(struct dsmark_qdisc_data),
        .enqueue        =       dsmark_enqueue,
        .dequeue        =       dsmark_dequeue,
-       .requeue        =       dsmark_requeue,
+       .peek           =       dsmark_peek,
        .drop           =       dsmark_drop,
        .init           =       dsmark_init,
        .reset          =       dsmark_reset,