[IPV6] ROUTE: Routing by FWMARK.
[safe/jmp/linux-2.6] / net / ipv4 / fib_rules.c
1 /*
2  * INET         An implementation of the TCP/IP protocol suite for the LINUX
3  *              operating system.  INET is implemented using the  BSD Socket
4  *              interface as the means of communication with the user level.
5  *
6  *              IPv4 Forwarding Information Base: policy rules.
7  *
8  * Authors:     Alexey Kuznetsov, <kuznet@ms2.inr.ac.ru>
9  *              Thomas Graf <tgraf@suug.ch>
10  *
11  *              This program is free software; you can redistribute it and/or
12  *              modify it under the terms of the GNU General Public License
13  *              as published by the Free Software Foundation; either version
14  *              2 of the License, or (at your option) any later version.
15  *
16  * Fixes:
17  *              Rani Assaf      :       local_rule cannot be deleted
18  *              Marc Boucher    :       routing by fwmark
19  */
20
21 #include <linux/types.h>
22 #include <linux/kernel.h>
23 #include <linux/netdevice.h>
24 #include <linux/netlink.h>
25 #include <linux/inetdevice.h>
26 #include <linux/init.h>
27 #include <linux/list.h>
28 #include <linux/rcupdate.h>
29 #include <net/ip.h>
30 #include <net/route.h>
31 #include <net/tcp.h>
32 #include <net/ip_fib.h>
33 #include <net/fib_rules.h>
34
35 static struct fib_rules_ops fib4_rules_ops;
36
37 struct fib4_rule
38 {
39         struct fib_rule         common;
40         u8                      dst_len;
41         u8                      src_len;
42         u8                      tos;
43         u32                     src;
44         u32                     srcmask;
45         u32                     dst;
46         u32                     dstmask;
47 #ifdef CONFIG_IP_ROUTE_FWMARK
48         u32                     fwmark;
49 #endif
50 #ifdef CONFIG_NET_CLS_ROUTE
51         u32                     tclassid;
52 #endif
53 };
54
55 static struct fib4_rule default_rule = {
56         .common = {
57                 .refcnt =       ATOMIC_INIT(2),
58                 .pref =         0x7FFF,
59                 .table =        RT_TABLE_DEFAULT,
60                 .action =       FR_ACT_TO_TBL,
61         },
62 };
63
64 static struct fib4_rule main_rule = {
65         .common = {
66                 .refcnt =       ATOMIC_INIT(2),
67                 .pref =         0x7FFE,
68                 .table =        RT_TABLE_MAIN,
69                 .action =       FR_ACT_TO_TBL,
70         },
71 };
72
73 static struct fib4_rule local_rule = {
74         .common = {
75                 .refcnt =       ATOMIC_INIT(2),
76                 .table =        RT_TABLE_LOCAL,
77                 .action =       FR_ACT_TO_TBL,
78                 .flags =        FIB_RULE_PERMANENT,
79         },
80 };
81
82 static LIST_HEAD(fib4_rules);
83
84 #ifdef CONFIG_NET_CLS_ROUTE
85 u32 fib_rules_tclass(struct fib_result *res)
86 {
87         return res->r ? ((struct fib4_rule *) res->r)->tclassid : 0;
88 }
89 #endif
90
91 int fib_lookup(struct flowi *flp, struct fib_result *res)
92 {
93         struct fib_lookup_arg arg = {
94                 .result = res,
95         };
96         int err;
97
98         err = fib_rules_lookup(&fib4_rules_ops, flp, 0, &arg);
99         res->r = arg.rule;
100
101         return err;
102 }
103
104 static int fib4_rule_action(struct fib_rule *rule, struct flowi *flp,
105                             int flags, struct fib_lookup_arg *arg)
106 {
107         int err = -EAGAIN;
108         struct fib_table *tbl;
109
110         switch (rule->action) {
111         case FR_ACT_TO_TBL:
112                 break;
113
114         case FR_ACT_UNREACHABLE:
115                 err = -ENETUNREACH;
116                 goto errout;
117
118         case FR_ACT_PROHIBIT:
119                 err = -EACCES;
120                 goto errout;
121
122         case FR_ACT_BLACKHOLE:
123         default:
124                 err = -EINVAL;
125                 goto errout;
126         }
127
128         if ((tbl = fib_get_table(rule->table)) == NULL)
129                 goto errout;
130
131         err = tbl->tb_lookup(tbl, flp, (struct fib_result *) arg->result);
132         if (err > 0)
133                 err = -EAGAIN;
134 errout:
135         return err;
136 }
137
138
139 void fib_select_default(const struct flowi *flp, struct fib_result *res)
140 {
141         if (res->r && res->r->action == FR_ACT_TO_TBL &&
142             FIB_RES_GW(*res) && FIB_RES_NH(*res).nh_scope == RT_SCOPE_LINK) {
143                 struct fib_table *tb;
144                 if ((tb = fib_get_table(res->r->table)) != NULL)
145                         tb->tb_select_default(tb, flp, res);
146         }
147 }
148
149 static int fib4_rule_match(struct fib_rule *rule, struct flowi *fl, int flags)
150 {
151         struct fib4_rule *r = (struct fib4_rule *) rule;
152         u32 daddr = fl->fl4_dst;
153         u32 saddr = fl->fl4_src;
154
155         if (((saddr ^ r->src) & r->srcmask) ||
156             ((daddr ^ r->dst) & r->dstmask))
157                 return 0;
158
159         if (r->tos && (r->tos != fl->fl4_tos))
160                 return 0;
161
162 #ifdef CONFIG_IP_ROUTE_FWMARK
163         if (r->fwmark && (r->fwmark != fl->fl4_fwmark))
164                 return 0;
165 #endif
166
167         return 1;
168 }
169
170 static struct fib_table *fib_empty_table(void)
171 {
172         u32 id;
173
174         for (id = 1; id <= RT_TABLE_MAX; id++)
175                 if (fib_get_table(id) == NULL)
176                         return fib_new_table(id);
177         return NULL;
178 }
179
180 static struct nla_policy fib4_rule_policy[FRA_MAX+1] __read_mostly = {
181         [FRA_IFNAME]    = { .type = NLA_STRING },
182         [FRA_PRIORITY]  = { .type = NLA_U32 },
183         [FRA_SRC]       = { .type = NLA_U32 },
184         [FRA_DST]       = { .type = NLA_U32 },
185         [FRA_FWMARK]    = { .type = NLA_U32 },
186         [FRA_FLOW]      = { .type = NLA_U32 },
187         [FRA_TABLE]     = { .type = NLA_U32 },
188 };
189
190 static int fib4_rule_configure(struct fib_rule *rule, struct sk_buff *skb,
191                                struct nlmsghdr *nlh, struct fib_rule_hdr *frh,
192                                struct nlattr **tb)
193 {
194         int err = -EINVAL;
195         struct fib4_rule *rule4 = (struct fib4_rule *) rule;
196
197         if (frh->src_len > 32 || frh->dst_len > 32 ||
198             (frh->tos & ~IPTOS_TOS_MASK))
199                 goto errout;
200
201         if (rule->table == RT_TABLE_UNSPEC) {
202                 if (rule->action == FR_ACT_TO_TBL) {
203                         struct fib_table *table;
204
205                         table = fib_empty_table();
206                         if (table == NULL) {
207                                 err = -ENOBUFS;
208                                 goto errout;
209                         }
210
211                         rule->table = table->tb_id;
212                 }
213         }
214
215         if (tb[FRA_SRC])
216                 rule4->src = nla_get_u32(tb[FRA_SRC]);
217
218         if (tb[FRA_DST])
219                 rule4->dst = nla_get_u32(tb[FRA_DST]);
220
221 #ifdef CONFIG_IP_ROUTE_FWMARK
222         if (tb[FRA_FWMARK])
223                 rule4->fwmark = nla_get_u32(tb[FRA_FWMARK]);
224 #endif
225
226 #ifdef CONFIG_NET_CLS_ROUTE
227         if (tb[FRA_FLOW])
228                 rule4->tclassid = nla_get_u32(tb[FRA_FLOW]);
229 #endif
230
231         rule4->src_len = frh->src_len;
232         rule4->srcmask = inet_make_mask(rule4->src_len);
233         rule4->dst_len = frh->dst_len;
234         rule4->dstmask = inet_make_mask(rule4->dst_len);
235         rule4->tos = frh->tos;
236
237         err = 0;
238 errout:
239         return err;
240 }
241
242 static int fib4_rule_compare(struct fib_rule *rule, struct fib_rule_hdr *frh,
243                              struct nlattr **tb)
244 {
245         struct fib4_rule *rule4 = (struct fib4_rule *) rule;
246
247         if (frh->src_len && (rule4->src_len != frh->src_len))
248                 return 0;
249
250         if (frh->dst_len && (rule4->dst_len != frh->dst_len))
251                 return 0;
252
253         if (frh->tos && (rule4->tos != frh->tos))
254                 return 0;
255
256 #ifdef CONFIG_IP_ROUTE_FWMARK
257         if (tb[FRA_FWMARK] && (rule4->fwmark != nla_get_u32(tb[FRA_FWMARK])))
258                 return 0;
259 #endif
260
261 #ifdef CONFIG_NET_CLS_ROUTE
262         if (tb[FRA_FLOW] && (rule4->tclassid != nla_get_u32(tb[FRA_FLOW])))
263                 return 0;
264 #endif
265
266         if (tb[FRA_SRC] && (rule4->src != nla_get_u32(tb[FRA_SRC])))
267                 return 0;
268
269         if (tb[FRA_DST] && (rule4->dst != nla_get_u32(tb[FRA_DST])))
270                 return 0;
271
272         return 1;
273 }
274
275 static int fib4_rule_fill(struct fib_rule *rule, struct sk_buff *skb,
276                           struct nlmsghdr *nlh, struct fib_rule_hdr *frh)
277 {
278         struct fib4_rule *rule4 = (struct fib4_rule *) rule;
279
280         frh->family = AF_INET;
281         frh->dst_len = rule4->dst_len;
282         frh->src_len = rule4->src_len;
283         frh->tos = rule4->tos;
284
285 #ifdef CONFIG_IP_ROUTE_FWMARK
286         if (rule4->fwmark)
287                 NLA_PUT_U32(skb, FRA_FWMARK, rule4->fwmark);
288 #endif
289
290         if (rule4->dst_len)
291                 NLA_PUT_U32(skb, FRA_DST, rule4->dst);
292
293         if (rule4->src_len)
294                 NLA_PUT_U32(skb, FRA_SRC, rule4->src);
295
296 #ifdef CONFIG_NET_CLS_ROUTE
297         if (rule4->tclassid)
298                 NLA_PUT_U32(skb, FRA_FLOW, rule4->tclassid);
299 #endif
300         return 0;
301
302 nla_put_failure:
303         return -ENOBUFS;
304 }
305
306 int fib4_rules_dump(struct sk_buff *skb, struct netlink_callback *cb)
307 {
308         return fib_rules_dump(skb, cb, AF_INET);
309 }
310
311 static u32 fib4_rule_default_pref(void)
312 {
313         struct list_head *pos;
314         struct fib_rule *rule;
315
316         if (!list_empty(&fib4_rules)) {
317                 pos = fib4_rules.next;
318                 if (pos->next != &fib4_rules) {
319                         rule = list_entry(pos->next, struct fib_rule, list);
320                         if (rule->pref)
321                                 return rule->pref - 1;
322                 }
323         }
324
325         return 0;
326 }
327
328 static struct fib_rules_ops fib4_rules_ops = {
329         .family         = AF_INET,
330         .rule_size      = sizeof(struct fib4_rule),
331         .action         = fib4_rule_action,
332         .match          = fib4_rule_match,
333         .configure      = fib4_rule_configure,
334         .compare        = fib4_rule_compare,
335         .fill           = fib4_rule_fill,
336         .default_pref   = fib4_rule_default_pref,
337         .nlgroup        = RTNLGRP_IPV4_RULE,
338         .policy         = fib4_rule_policy,
339         .rules_list     = &fib4_rules,
340         .owner          = THIS_MODULE,
341 };
342
343 void __init fib4_rules_init(void)
344 {
345         list_add_tail(&local_rule.common.list, &fib4_rules);
346         list_add_tail(&main_rule.common.list, &fib4_rules);
347         list_add_tail(&default_rule.common.list, &fib4_rules);
348
349         fib_rules_register(&fib4_rules_ops);
350 }