PCI: Always set prefetchable base/limit upper32 registers
[safe/jmp/linux-2.6] / drivers / pci / probe.c
1 /*
2  * probe.c - PCI detection and setup code
3  */
4
5 #include <linux/kernel.h>
6 #include <linux/delay.h>
7 #include <linux/init.h>
8 #include <linux/pci.h>
9 #include <linux/slab.h>
10 #include <linux/module.h>
11 #include <linux/cpumask.h>
12 #include <linux/pci-aspm.h>
13 #include <linux/iommu.h>
14 #include <acpi/acpi_hest.h>
15 #include <xen/xen.h>
16 #include "pci.h"
17
18 #define CARDBUS_LATENCY_TIMER   176     /* secondary latency timer */
19 #define CARDBUS_RESERVE_BUSNR   3
20
21 /* Ugh.  Need to stop exporting this to modules. */
22 LIST_HEAD(pci_root_buses);
23 EXPORT_SYMBOL(pci_root_buses);
24
25
26 static int find_anything(struct device *dev, void *data)
27 {
28         return 1;
29 }
30
31 /*
32  * Some device drivers need know if pci is initiated.
33  * Basically, we think pci is not initiated when there
34  * is no device to be found on the pci_bus_type.
35  */
36 int no_pci_devices(void)
37 {
38         struct device *dev;
39         int no_devices;
40
41         dev = bus_find_device(&pci_bus_type, NULL, NULL, find_anything);
42         no_devices = (dev == NULL);
43         put_device(dev);
44         return no_devices;
45 }
46 EXPORT_SYMBOL(no_pci_devices);
47
48 /*
49  * PCI Bus Class Devices
50  */
51 static ssize_t pci_bus_show_cpuaffinity(struct device *dev,
52                                         int type,
53                                         struct device_attribute *attr,
54                                         char *buf)
55 {
56         int ret;
57         const struct cpumask *cpumask;
58
59         cpumask = cpumask_of_pcibus(to_pci_bus(dev));
60         ret = type?
61                 cpulist_scnprintf(buf, PAGE_SIZE-2, cpumask) :
62                 cpumask_scnprintf(buf, PAGE_SIZE-2, cpumask);
63         buf[ret++] = '\n';
64         buf[ret] = '\0';
65         return ret;
66 }
67
68 static ssize_t inline pci_bus_show_cpumaskaffinity(struct device *dev,
69                                         struct device_attribute *attr,
70                                         char *buf)
71 {
72         return pci_bus_show_cpuaffinity(dev, 0, attr, buf);
73 }
74
75 static ssize_t inline pci_bus_show_cpulistaffinity(struct device *dev,
76                                         struct device_attribute *attr,
77                                         char *buf)
78 {
79         return pci_bus_show_cpuaffinity(dev, 1, attr, buf);
80 }
81
82 DEVICE_ATTR(cpuaffinity,     S_IRUGO, pci_bus_show_cpumaskaffinity, NULL);
83 DEVICE_ATTR(cpulistaffinity, S_IRUGO, pci_bus_show_cpulistaffinity, NULL);
84
85 /*
86  * PCI Bus Class
87  */
88 static void release_pcibus_dev(struct device *dev)
89 {
90         struct pci_bus *pci_bus = to_pci_bus(dev);
91
92         if (pci_bus->bridge)
93                 put_device(pci_bus->bridge);
94         kfree(pci_bus);
95 }
96
97 static struct class pcibus_class = {
98         .name           = "pci_bus",
99         .dev_release    = &release_pcibus_dev,
100 };
101
102 static int __init pcibus_class_init(void)
103 {
104         return class_register(&pcibus_class);
105 }
106 postcore_initcall(pcibus_class_init);
107
108 /*
109  * Translate the low bits of the PCI base
110  * to the resource type
111  */
112 static inline unsigned int pci_calc_resource_flags(unsigned int flags)
113 {
114         if (flags & PCI_BASE_ADDRESS_SPACE_IO)
115                 return IORESOURCE_IO;
116
117         if (flags & PCI_BASE_ADDRESS_MEM_PREFETCH)
118                 return IORESOURCE_MEM | IORESOURCE_PREFETCH;
119
120         return IORESOURCE_MEM;
121 }
122
123 static u64 pci_size(u64 base, u64 maxbase, u64 mask)
124 {
125         u64 size = mask & maxbase;      /* Find the significant bits */
126         if (!size)
127                 return 0;
128
129         /* Get the lowest of them to find the decode size, and
130            from that the extent.  */
131         size = (size & ~(size-1)) - 1;
132
133         /* base == maxbase can be valid only if the BAR has
134            already been programmed with all 1s.  */
135         if (base == maxbase && ((base | size) & mask) != mask)
136                 return 0;
137
138         return size;
139 }
140
141 static inline enum pci_bar_type decode_bar(struct resource *res, u32 bar)
142 {
143         if ((bar & PCI_BASE_ADDRESS_SPACE) == PCI_BASE_ADDRESS_SPACE_IO) {
144                 res->flags = bar & ~PCI_BASE_ADDRESS_IO_MASK;
145                 return pci_bar_io;
146         }
147
148         res->flags = bar & ~PCI_BASE_ADDRESS_MEM_MASK;
149
150         if (res->flags & PCI_BASE_ADDRESS_MEM_TYPE_64)
151                 return pci_bar_mem64;
152         return pci_bar_mem32;
153 }
154
155 /**
156  * pci_read_base - read a PCI BAR
157  * @dev: the PCI device
158  * @type: type of the BAR
159  * @res: resource buffer to be filled in
160  * @pos: BAR position in the config space
161  *
162  * Returns 1 if the BAR is 64-bit, or 0 if 32-bit.
163  */
164 int __pci_read_base(struct pci_dev *dev, enum pci_bar_type type,
165                         struct resource *res, unsigned int pos)
166 {
167         u32 l, sz, mask;
168
169         mask = type ? PCI_ROM_ADDRESS_MASK : ~0;
170
171         res->name = pci_name(dev);
172
173         pci_read_config_dword(dev, pos, &l);
174         pci_write_config_dword(dev, pos, l | mask);
175         pci_read_config_dword(dev, pos, &sz);
176         pci_write_config_dword(dev, pos, l);
177
178         /*
179          * All bits set in sz means the device isn't working properly.
180          * If the BAR isn't implemented, all bits must be 0.  If it's a
181          * memory BAR or a ROM, bit 0 must be clear; if it's an io BAR, bit
182          * 1 must be clear.
183          */
184         if (!sz || sz == 0xffffffff)
185                 goto fail;
186
187         /*
188          * I don't know how l can have all bits set.  Copied from old code.
189          * Maybe it fixes a bug on some ancient platform.
190          */
191         if (l == 0xffffffff)
192                 l = 0;
193
194         if (type == pci_bar_unknown) {
195                 type = decode_bar(res, l);
196                 res->flags |= pci_calc_resource_flags(l) | IORESOURCE_SIZEALIGN;
197                 if (type == pci_bar_io) {
198                         l &= PCI_BASE_ADDRESS_IO_MASK;
199                         mask = PCI_BASE_ADDRESS_IO_MASK & IO_SPACE_LIMIT;
200                 } else {
201                         l &= PCI_BASE_ADDRESS_MEM_MASK;
202                         mask = (u32)PCI_BASE_ADDRESS_MEM_MASK;
203                 }
204         } else {
205                 res->flags |= (l & IORESOURCE_ROM_ENABLE);
206                 l &= PCI_ROM_ADDRESS_MASK;
207                 mask = (u32)PCI_ROM_ADDRESS_MASK;
208         }
209
210         if (type == pci_bar_mem64) {
211                 u64 l64 = l;
212                 u64 sz64 = sz;
213                 u64 mask64 = mask | (u64)~0 << 32;
214
215                 pci_read_config_dword(dev, pos + 4, &l);
216                 pci_write_config_dword(dev, pos + 4, ~0);
217                 pci_read_config_dword(dev, pos + 4, &sz);
218                 pci_write_config_dword(dev, pos + 4, l);
219
220                 l64 |= ((u64)l << 32);
221                 sz64 |= ((u64)sz << 32);
222
223                 sz64 = pci_size(l64, sz64, mask64);
224
225                 if (!sz64)
226                         goto fail;
227
228                 if ((sizeof(resource_size_t) < 8) && (sz64 > 0x100000000ULL)) {
229                         dev_err(&dev->dev, "reg %x: can't handle 64-bit BAR\n",
230                                 pos);
231                         goto fail;
232                 }
233
234                 res->flags |= IORESOURCE_MEM_64;
235                 if ((sizeof(resource_size_t) < 8) && l) {
236                         /* Address above 32-bit boundary; disable the BAR */
237                         pci_write_config_dword(dev, pos, 0);
238                         pci_write_config_dword(dev, pos + 4, 0);
239                         res->start = 0;
240                         res->end = sz64;
241                 } else {
242                         res->start = l64;
243                         res->end = l64 + sz64;
244                         dev_printk(KERN_DEBUG, &dev->dev, "reg %x: %pR\n",
245                                    pos, res);
246                 }
247         } else {
248                 sz = pci_size(l, sz, mask);
249
250                 if (!sz)
251                         goto fail;
252
253                 res->start = l;
254                 res->end = l + sz;
255
256                 dev_printk(KERN_DEBUG, &dev->dev, "reg %x: %pR\n", pos, res);
257         }
258
259  out:
260         return (type == pci_bar_mem64) ? 1 : 0;
261  fail:
262         res->flags = 0;
263         goto out;
264 }
265
266 static void pci_read_bases(struct pci_dev *dev, unsigned int howmany, int rom)
267 {
268         unsigned int pos, reg;
269
270         for (pos = 0; pos < howmany; pos++) {
271                 struct resource *res = &dev->resource[pos];
272                 reg = PCI_BASE_ADDRESS_0 + (pos << 2);
273                 pos += __pci_read_base(dev, pci_bar_unknown, res, reg);
274         }
275
276         if (rom) {
277                 struct resource *res = &dev->resource[PCI_ROM_RESOURCE];
278                 dev->rom_base_reg = rom;
279                 res->flags = IORESOURCE_MEM | IORESOURCE_PREFETCH |
280                                 IORESOURCE_READONLY | IORESOURCE_CACHEABLE |
281                                 IORESOURCE_SIZEALIGN;
282                 __pci_read_base(dev, pci_bar_mem32, res, rom);
283         }
284 }
285
286 void __devinit pci_read_bridge_bases(struct pci_bus *child)
287 {
288         struct pci_dev *dev = child->self;
289         u8 io_base_lo, io_limit_lo;
290         u16 mem_base_lo, mem_limit_lo;
291         unsigned long base, limit;
292         struct resource *res;
293         int i;
294
295         if (pci_is_root_bus(child))     /* It's a host bus, nothing to read */
296                 return;
297
298         dev_info(&dev->dev, "PCI bridge to [bus %02x-%02x]%s\n",
299                  child->secondary, child->subordinate,
300                  dev->transparent ? " (subtractive decode)": "");
301
302         if (dev->transparent) {
303                 for(i = 3; i < PCI_BUS_NUM_RESOURCES; i++)
304                         child->resource[i] = child->parent->resource[i - 3];
305         }
306
307         res = child->resource[0];
308         pci_read_config_byte(dev, PCI_IO_BASE, &io_base_lo);
309         pci_read_config_byte(dev, PCI_IO_LIMIT, &io_limit_lo);
310         base = (io_base_lo & PCI_IO_RANGE_MASK) << 8;
311         limit = (io_limit_lo & PCI_IO_RANGE_MASK) << 8;
312
313         if ((io_base_lo & PCI_IO_RANGE_TYPE_MASK) == PCI_IO_RANGE_TYPE_32) {
314                 u16 io_base_hi, io_limit_hi;
315                 pci_read_config_word(dev, PCI_IO_BASE_UPPER16, &io_base_hi);
316                 pci_read_config_word(dev, PCI_IO_LIMIT_UPPER16, &io_limit_hi);
317                 base |= (io_base_hi << 16);
318                 limit |= (io_limit_hi << 16);
319         }
320
321         if (base <= limit) {
322                 res->flags = (io_base_lo & PCI_IO_RANGE_TYPE_MASK) | IORESOURCE_IO;
323                 if (!res->start)
324                         res->start = base;
325                 if (!res->end)
326                         res->end = limit + 0xfff;
327                 dev_printk(KERN_DEBUG, &dev->dev, "  bridge window %pR\n", res);
328         }
329
330         res = child->resource[1];
331         pci_read_config_word(dev, PCI_MEMORY_BASE, &mem_base_lo);
332         pci_read_config_word(dev, PCI_MEMORY_LIMIT, &mem_limit_lo);
333         base = (mem_base_lo & PCI_MEMORY_RANGE_MASK) << 16;
334         limit = (mem_limit_lo & PCI_MEMORY_RANGE_MASK) << 16;
335         if (base <= limit) {
336                 res->flags = (mem_base_lo & PCI_MEMORY_RANGE_TYPE_MASK) | IORESOURCE_MEM;
337                 res->start = base;
338                 res->end = limit + 0xfffff;
339                 dev_printk(KERN_DEBUG, &dev->dev, "  bridge window %pR\n", res);
340         }
341
342         res = child->resource[2];
343         pci_read_config_word(dev, PCI_PREF_MEMORY_BASE, &mem_base_lo);
344         pci_read_config_word(dev, PCI_PREF_MEMORY_LIMIT, &mem_limit_lo);
345         base = (mem_base_lo & PCI_PREF_RANGE_MASK) << 16;
346         limit = (mem_limit_lo & PCI_PREF_RANGE_MASK) << 16;
347
348         if ((mem_base_lo & PCI_PREF_RANGE_TYPE_MASK) == PCI_PREF_RANGE_TYPE_64) {
349                 u32 mem_base_hi, mem_limit_hi;
350                 pci_read_config_dword(dev, PCI_PREF_BASE_UPPER32, &mem_base_hi);
351                 pci_read_config_dword(dev, PCI_PREF_LIMIT_UPPER32, &mem_limit_hi);
352
353                 /*
354                  * Some bridges set the base > limit by default, and some
355                  * (broken) BIOSes do not initialize them.  If we find
356                  * this, just assume they are not being used.
357                  */
358                 if (mem_base_hi <= mem_limit_hi) {
359 #if BITS_PER_LONG == 64
360                         base |= ((long) mem_base_hi) << 32;
361                         limit |= ((long) mem_limit_hi) << 32;
362 #else
363                         if (mem_base_hi || mem_limit_hi) {
364                                 dev_err(&dev->dev, "can't handle 64-bit "
365                                         "address space for bridge\n");
366                                 return;
367                         }
368 #endif
369                 }
370         }
371         if (base <= limit) {
372                 res->flags = (mem_base_lo & PCI_PREF_RANGE_TYPE_MASK) |
373                                          IORESOURCE_MEM | IORESOURCE_PREFETCH;
374                 if (res->flags & PCI_PREF_RANGE_TYPE_64)
375                         res->flags |= IORESOURCE_MEM_64;
376                 res->start = base;
377                 res->end = limit + 0xfffff;
378                 dev_printk(KERN_DEBUG, &dev->dev, "  bridge window %pR\n", res);
379         }
380 }
381
382 static struct pci_bus * pci_alloc_bus(void)
383 {
384         struct pci_bus *b;
385
386         b = kzalloc(sizeof(*b), GFP_KERNEL);
387         if (b) {
388                 INIT_LIST_HEAD(&b->node);
389                 INIT_LIST_HEAD(&b->children);
390                 INIT_LIST_HEAD(&b->devices);
391                 INIT_LIST_HEAD(&b->slots);
392         }
393         return b;
394 }
395
396 static struct pci_bus *pci_alloc_child_bus(struct pci_bus *parent,
397                                            struct pci_dev *bridge, int busnr)
398 {
399         struct pci_bus *child;
400         int i;
401
402         /*
403          * Allocate a new bus, and inherit stuff from the parent..
404          */
405         child = pci_alloc_bus();
406         if (!child)
407                 return NULL;
408
409         child->parent = parent;
410         child->ops = parent->ops;
411         child->sysdata = parent->sysdata;
412         child->bus_flags = parent->bus_flags;
413
414         /* initialize some portions of the bus device, but don't register it
415          * now as the parent is not properly set up yet.  This device will get
416          * registered later in pci_bus_add_devices()
417          */
418         child->dev.class = &pcibus_class;
419         dev_set_name(&child->dev, "%04x:%02x", pci_domain_nr(child), busnr);
420
421         /*
422          * Set up the primary, secondary and subordinate
423          * bus numbers.
424          */
425         child->number = child->secondary = busnr;
426         child->primary = parent->secondary;
427         child->subordinate = 0xff;
428
429         if (!bridge)
430                 return child;
431
432         child->self = bridge;
433         child->bridge = get_device(&bridge->dev);
434
435         /* Set up default resource pointers and names.. */
436         for (i = 0; i < PCI_BRIDGE_RESOURCE_NUM; i++) {
437                 child->resource[i] = &bridge->resource[PCI_BRIDGE_RESOURCES+i];
438                 child->resource[i]->name = child->name;
439         }
440         bridge->subordinate = child;
441
442         return child;
443 }
444
445 struct pci_bus *__ref pci_add_new_bus(struct pci_bus *parent, struct pci_dev *dev, int busnr)
446 {
447         struct pci_bus *child;
448
449         child = pci_alloc_child_bus(parent, dev, busnr);
450         if (child) {
451                 down_write(&pci_bus_sem);
452                 list_add_tail(&child->node, &parent->children);
453                 up_write(&pci_bus_sem);
454         }
455         return child;
456 }
457
458 static void pci_fixup_parent_subordinate_busnr(struct pci_bus *child, int max)
459 {
460         struct pci_bus *parent = child->parent;
461
462         /* Attempts to fix that up are really dangerous unless
463            we're going to re-assign all bus numbers. */
464         if (!pcibios_assign_all_busses())
465                 return;
466
467         while (parent->parent && parent->subordinate < max) {
468                 parent->subordinate = max;
469                 pci_write_config_byte(parent->self, PCI_SUBORDINATE_BUS, max);
470                 parent = parent->parent;
471         }
472 }
473
474 /*
475  * If it's a bridge, configure it and scan the bus behind it.
476  * For CardBus bridges, we don't scan behind as the devices will
477  * be handled by the bridge driver itself.
478  *
479  * We need to process bridges in two passes -- first we scan those
480  * already configured by the BIOS and after we are done with all of
481  * them, we proceed to assigning numbers to the remaining buses in
482  * order to avoid overlaps between old and new bus numbers.
483  */
484 int __devinit pci_scan_bridge(struct pci_bus *bus, struct pci_dev *dev, int max, int pass)
485 {
486         struct pci_bus *child;
487         int is_cardbus = (dev->hdr_type == PCI_HEADER_TYPE_CARDBUS);
488         u32 buses, i, j = 0;
489         u16 bctl;
490         int broken = 0;
491
492         pci_read_config_dword(dev, PCI_PRIMARY_BUS, &buses);
493
494         dev_dbg(&dev->dev, "scanning behind bridge, config %06x, pass %d\n",
495                 buses & 0xffffff, pass);
496
497         /* Check if setup is sensible at all */
498         if (!pass &&
499             ((buses & 0xff) != bus->number || ((buses >> 8) & 0xff) <= bus->number)) {
500                 dev_dbg(&dev->dev, "bus configuration invalid, reconfiguring\n");
501                 broken = 1;
502         }
503
504         /* Disable MasterAbortMode during probing to avoid reporting
505            of bus errors (in some architectures) */ 
506         pci_read_config_word(dev, PCI_BRIDGE_CONTROL, &bctl);
507         pci_write_config_word(dev, PCI_BRIDGE_CONTROL,
508                               bctl & ~PCI_BRIDGE_CTL_MASTER_ABORT);
509
510         if ((buses & 0xffff00) && !pcibios_assign_all_busses() && !is_cardbus && !broken) {
511                 unsigned int cmax, busnr;
512                 /*
513                  * Bus already configured by firmware, process it in the first
514                  * pass and just note the configuration.
515                  */
516                 if (pass)
517                         goto out;
518                 busnr = (buses >> 8) & 0xFF;
519
520                 /*
521                  * If we already got to this bus through a different bridge,
522                  * don't re-add it. This can happen with the i450NX chipset.
523                  *
524                  * However, we continue to descend down the hierarchy and
525                  * scan remaining child buses.
526                  */
527                 child = pci_find_bus(pci_domain_nr(bus), busnr);
528                 if (!child) {
529                         child = pci_add_new_bus(bus, dev, busnr);
530                         if (!child)
531                                 goto out;
532                         child->primary = buses & 0xFF;
533                         child->subordinate = (buses >> 16) & 0xFF;
534                         child->bridge_ctl = bctl;
535                 }
536
537                 cmax = pci_scan_child_bus(child);
538                 if (cmax > max)
539                         max = cmax;
540                 if (child->subordinate > max)
541                         max = child->subordinate;
542         } else {
543                 /*
544                  * We need to assign a number to this bus which we always
545                  * do in the second pass.
546                  */
547                 if (!pass) {
548                         if (pcibios_assign_all_busses() || broken)
549                                 /* Temporarily disable forwarding of the
550                                    configuration cycles on all bridges in
551                                    this bus segment to avoid possible
552                                    conflicts in the second pass between two
553                                    bridges programmed with overlapping
554                                    bus ranges. */
555                                 pci_write_config_dword(dev, PCI_PRIMARY_BUS,
556                                                        buses & ~0xffffff);
557                         goto out;
558                 }
559
560                 /* Clear errors */
561                 pci_write_config_word(dev, PCI_STATUS, 0xffff);
562
563                 /* Prevent assigning a bus number that already exists.
564                  * This can happen when a bridge is hot-plugged */
565                 if (pci_find_bus(pci_domain_nr(bus), max+1))
566                         goto out;
567                 child = pci_add_new_bus(bus, dev, ++max);
568                 buses = (buses & 0xff000000)
569                       | ((unsigned int)(child->primary)     <<  0)
570                       | ((unsigned int)(child->secondary)   <<  8)
571                       | ((unsigned int)(child->subordinate) << 16);
572
573                 /*
574                  * yenta.c forces a secondary latency timer of 176.
575                  * Copy that behaviour here.
576                  */
577                 if (is_cardbus) {
578                         buses &= ~0xff000000;
579                         buses |= CARDBUS_LATENCY_TIMER << 24;
580                 }
581                         
582                 /*
583                  * We need to blast all three values with a single write.
584                  */
585                 pci_write_config_dword(dev, PCI_PRIMARY_BUS, buses);
586
587                 if (!is_cardbus) {
588                         child->bridge_ctl = bctl;
589                         /*
590                          * Adjust subordinate busnr in parent buses.
591                          * We do this before scanning for children because
592                          * some devices may not be detected if the bios
593                          * was lazy.
594                          */
595                         pci_fixup_parent_subordinate_busnr(child, max);
596                         /* Now we can scan all subordinate buses... */
597                         max = pci_scan_child_bus(child);
598                         /*
599                          * now fix it up again since we have found
600                          * the real value of max.
601                          */
602                         pci_fixup_parent_subordinate_busnr(child, max);
603                 } else {
604                         /*
605                          * For CardBus bridges, we leave 4 bus numbers
606                          * as cards with a PCI-to-PCI bridge can be
607                          * inserted later.
608                          */
609                         for (i=0; i<CARDBUS_RESERVE_BUSNR; i++) {
610                                 struct pci_bus *parent = bus;
611                                 if (pci_find_bus(pci_domain_nr(bus),
612                                                         max+i+1))
613                                         break;
614                                 while (parent->parent) {
615                                         if ((!pcibios_assign_all_busses()) &&
616                                             (parent->subordinate > max) &&
617                                             (parent->subordinate <= max+i)) {
618                                                 j = 1;
619                                         }
620                                         parent = parent->parent;
621                                 }
622                                 if (j) {
623                                         /*
624                                          * Often, there are two cardbus bridges
625                                          * -- try to leave one valid bus number
626                                          * for each one.
627                                          */
628                                         i /= 2;
629                                         break;
630                                 }
631                         }
632                         max += i;
633                         pci_fixup_parent_subordinate_busnr(child, max);
634                 }
635                 /*
636                  * Set the subordinate bus number to its real value.
637                  */
638                 child->subordinate = max;
639                 pci_write_config_byte(dev, PCI_SUBORDINATE_BUS, max);
640         }
641
642         sprintf(child->name,
643                 (is_cardbus ? "PCI CardBus %04x:%02x" : "PCI Bus %04x:%02x"),
644                 pci_domain_nr(bus), child->number);
645
646         /* Has only triggered on CardBus, fixup is in yenta_socket */
647         while (bus->parent) {
648                 if ((child->subordinate > bus->subordinate) ||
649                     (child->number > bus->subordinate) ||
650                     (child->number < bus->number) ||
651                     (child->subordinate < bus->number)) {
652                         dev_info(&child->dev, "[bus %02x-%02x] %s "
653                                 "hidden behind%s bridge %s [bus %02x-%02x]\n",
654                                 child->number, child->subordinate,
655                                 (bus->number > child->subordinate &&
656                                  bus->subordinate < child->number) ?
657                                         "wholly" : "partially",
658                                 bus->self->transparent ? " transparent" : "",
659                                 dev_name(&bus->dev),
660                                 bus->number, bus->subordinate);
661                 }
662                 bus = bus->parent;
663         }
664
665 out:
666         pci_write_config_word(dev, PCI_BRIDGE_CONTROL, bctl);
667
668         return max;
669 }
670
671 /*
672  * Read interrupt line and base address registers.
673  * The architecture-dependent code can tweak these, of course.
674  */
675 static void pci_read_irq(struct pci_dev *dev)
676 {
677         unsigned char irq;
678
679         pci_read_config_byte(dev, PCI_INTERRUPT_PIN, &irq);
680         dev->pin = irq;
681         if (irq)
682                 pci_read_config_byte(dev, PCI_INTERRUPT_LINE, &irq);
683         dev->irq = irq;
684 }
685
686 static void set_pcie_port_type(struct pci_dev *pdev)
687 {
688         int pos;
689         u16 reg16;
690
691         pos = pci_find_capability(pdev, PCI_CAP_ID_EXP);
692         if (!pos)
693                 return;
694         pdev->is_pcie = 1;
695         pdev->pcie_cap = pos;
696         pci_read_config_word(pdev, pos + PCI_EXP_FLAGS, &reg16);
697         pdev->pcie_type = (reg16 & PCI_EXP_FLAGS_TYPE) >> 4;
698 }
699
700 static void set_pcie_hotplug_bridge(struct pci_dev *pdev)
701 {
702         int pos;
703         u16 reg16;
704         u32 reg32;
705
706         pos = pci_pcie_cap(pdev);
707         if (!pos)
708                 return;
709         pci_read_config_word(pdev, pos + PCI_EXP_FLAGS, &reg16);
710         if (!(reg16 & PCI_EXP_FLAGS_SLOT))
711                 return;
712         pci_read_config_dword(pdev, pos + PCI_EXP_SLTCAP, &reg32);
713         if (reg32 & PCI_EXP_SLTCAP_HPC)
714                 pdev->is_hotplug_bridge = 1;
715 }
716
717 static void set_pci_aer_firmware_first(struct pci_dev *pdev)
718 {
719         if (acpi_hest_firmware_first_pci(pdev))
720                 pdev->aer_firmware_first = 1;
721 }
722
723 #define LEGACY_IO_RESOURCE      (IORESOURCE_IO | IORESOURCE_PCI_FIXED)
724
725 /**
726  * pci_setup_device - fill in class and map information of a device
727  * @dev: the device structure to fill
728  *
729  * Initialize the device structure with information about the device's 
730  * vendor,class,memory and IO-space addresses,IRQ lines etc.
731  * Called at initialisation of the PCI subsystem and by CardBus services.
732  * Returns 0 on success and negative if unknown type of device (not normal,
733  * bridge or CardBus).
734  */
735 int pci_setup_device(struct pci_dev *dev)
736 {
737         u32 class;
738         u8 hdr_type;
739         struct pci_slot *slot;
740         int pos = 0;
741
742         if (pci_read_config_byte(dev, PCI_HEADER_TYPE, &hdr_type))
743                 return -EIO;
744
745         dev->sysdata = dev->bus->sysdata;
746         dev->dev.parent = dev->bus->bridge;
747         dev->dev.bus = &pci_bus_type;
748         dev->hdr_type = hdr_type & 0x7f;
749         dev->multifunction = !!(hdr_type & 0x80);
750         dev->error_state = pci_channel_io_normal;
751         set_pcie_port_type(dev);
752         set_pci_aer_firmware_first(dev);
753
754         list_for_each_entry(slot, &dev->bus->slots, list)
755                 if (PCI_SLOT(dev->devfn) == slot->number)
756                         dev->slot = slot;
757
758         /* Assume 32-bit PCI; let 64-bit PCI cards (which are far rarer)
759            set this higher, assuming the system even supports it.  */
760         dev->dma_mask = 0xffffffff;
761
762         dev_set_name(&dev->dev, "%04x:%02x:%02x.%d", pci_domain_nr(dev->bus),
763                      dev->bus->number, PCI_SLOT(dev->devfn),
764                      PCI_FUNC(dev->devfn));
765
766         pci_read_config_dword(dev, PCI_CLASS_REVISION, &class);
767         dev->revision = class & 0xff;
768         class >>= 8;                                /* upper 3 bytes */
769         dev->class = class;
770         class >>= 8;
771
772         dev_dbg(&dev->dev, "found [%04x:%04x] class %06x header type %02x\n",
773                  dev->vendor, dev->device, class, dev->hdr_type);
774
775         /* need to have dev->class ready */
776         dev->cfg_size = pci_cfg_space_size(dev);
777
778         /* "Unknown power state" */
779         dev->current_state = PCI_UNKNOWN;
780
781         /* Early fixups, before probing the BARs */
782         pci_fixup_device(pci_fixup_early, dev);
783         /* device class may be changed after fixup */
784         class = dev->class >> 8;
785
786         switch (dev->hdr_type) {                    /* header type */
787         case PCI_HEADER_TYPE_NORMAL:                /* standard header */
788                 if (class == PCI_CLASS_BRIDGE_PCI)
789                         goto bad;
790                 pci_read_irq(dev);
791                 pci_read_bases(dev, 6, PCI_ROM_ADDRESS);
792                 pci_read_config_word(dev, PCI_SUBSYSTEM_VENDOR_ID, &dev->subsystem_vendor);
793                 pci_read_config_word(dev, PCI_SUBSYSTEM_ID, &dev->subsystem_device);
794
795                 /*
796                  *      Do the ugly legacy mode stuff here rather than broken chip
797                  *      quirk code. Legacy mode ATA controllers have fixed
798                  *      addresses. These are not always echoed in BAR0-3, and
799                  *      BAR0-3 in a few cases contain junk!
800                  */
801                 if (class == PCI_CLASS_STORAGE_IDE) {
802                         u8 progif;
803                         pci_read_config_byte(dev, PCI_CLASS_PROG, &progif);
804                         if ((progif & 1) == 0) {
805                                 dev->resource[0].start = 0x1F0;
806                                 dev->resource[0].end = 0x1F7;
807                                 dev->resource[0].flags = LEGACY_IO_RESOURCE;
808                                 dev->resource[1].start = 0x3F6;
809                                 dev->resource[1].end = 0x3F6;
810                                 dev->resource[1].flags = LEGACY_IO_RESOURCE;
811                         }
812                         if ((progif & 4) == 0) {
813                                 dev->resource[2].start = 0x170;
814                                 dev->resource[2].end = 0x177;
815                                 dev->resource[2].flags = LEGACY_IO_RESOURCE;
816                                 dev->resource[3].start = 0x376;
817                                 dev->resource[3].end = 0x376;
818                                 dev->resource[3].flags = LEGACY_IO_RESOURCE;
819                         }
820                 }
821                 break;
822
823         case PCI_HEADER_TYPE_BRIDGE:                /* bridge header */
824                 if (class != PCI_CLASS_BRIDGE_PCI)
825                         goto bad;
826                 /* The PCI-to-PCI bridge spec requires that subtractive
827                    decoding (i.e. transparent) bridge must have programming
828                    interface code of 0x01. */ 
829                 pci_read_irq(dev);
830                 dev->transparent = ((dev->class & 0xff) == 1);
831                 pci_read_bases(dev, 2, PCI_ROM_ADDRESS1);
832                 set_pcie_hotplug_bridge(dev);
833                 pos = pci_find_capability(dev, PCI_CAP_ID_SSVID);
834                 if (pos) {
835                         pci_read_config_word(dev, pos + PCI_SSVID_VENDOR_ID, &dev->subsystem_vendor);
836                         pci_read_config_word(dev, pos + PCI_SSVID_DEVICE_ID, &dev->subsystem_device);
837                 }
838                 break;
839
840         case PCI_HEADER_TYPE_CARDBUS:               /* CardBus bridge header */
841                 if (class != PCI_CLASS_BRIDGE_CARDBUS)
842                         goto bad;
843                 pci_read_irq(dev);
844                 pci_read_bases(dev, 1, 0);
845                 pci_read_config_word(dev, PCI_CB_SUBSYSTEM_VENDOR_ID, &dev->subsystem_vendor);
846                 pci_read_config_word(dev, PCI_CB_SUBSYSTEM_ID, &dev->subsystem_device);
847                 break;
848
849         default:                                    /* unknown header */
850                 dev_err(&dev->dev, "unknown header type %02x, "
851                         "ignoring device\n", dev->hdr_type);
852                 return -EIO;
853
854         bad:
855                 dev_err(&dev->dev, "ignoring class %02x (doesn't match header "
856                         "type %02x)\n", class, dev->hdr_type);
857                 dev->class = PCI_CLASS_NOT_DEFINED;
858         }
859
860         /* We found a fine healthy device, go go go... */
861         return 0;
862 }
863
864 static void pci_release_capabilities(struct pci_dev *dev)
865 {
866         pci_vpd_release(dev);
867         pci_iov_release(dev);
868 }
869
870 /**
871  * pci_release_dev - free a pci device structure when all users of it are finished.
872  * @dev: device that's been disconnected
873  *
874  * Will be called only by the device core when all users of this pci device are
875  * done.
876  */
877 static void pci_release_dev(struct device *dev)
878 {
879         struct pci_dev *pci_dev;
880
881         pci_dev = to_pci_dev(dev);
882         pci_release_capabilities(pci_dev);
883         kfree(pci_dev);
884 }
885
886 /**
887  * pci_cfg_space_size - get the configuration space size of the PCI device.
888  * @dev: PCI device
889  *
890  * Regular PCI devices have 256 bytes, but PCI-X 2 and PCI Express devices
891  * have 4096 bytes.  Even if the device is capable, that doesn't mean we can
892  * access it.  Maybe we don't have a way to generate extended config space
893  * accesses, or the device is behind a reverse Express bridge.  So we try
894  * reading the dword at 0x100 which must either be 0 or a valid extended
895  * capability header.
896  */
897 int pci_cfg_space_size_ext(struct pci_dev *dev)
898 {
899         u32 status;
900         int pos = PCI_CFG_SPACE_SIZE;
901
902         if (pci_read_config_dword(dev, pos, &status) != PCIBIOS_SUCCESSFUL)
903                 goto fail;
904         if (status == 0xffffffff)
905                 goto fail;
906
907         return PCI_CFG_SPACE_EXP_SIZE;
908
909  fail:
910         return PCI_CFG_SPACE_SIZE;
911 }
912
913 int pci_cfg_space_size(struct pci_dev *dev)
914 {
915         int pos;
916         u32 status;
917         u16 class;
918
919         class = dev->class >> 8;
920         if (class == PCI_CLASS_BRIDGE_HOST)
921                 return pci_cfg_space_size_ext(dev);
922
923         pos = pci_pcie_cap(dev);
924         if (!pos) {
925                 pos = pci_find_capability(dev, PCI_CAP_ID_PCIX);
926                 if (!pos)
927                         goto fail;
928
929                 pci_read_config_dword(dev, pos + PCI_X_STATUS, &status);
930                 if (!(status & (PCI_X_STATUS_266MHZ | PCI_X_STATUS_533MHZ)))
931                         goto fail;
932         }
933
934         return pci_cfg_space_size_ext(dev);
935
936  fail:
937         return PCI_CFG_SPACE_SIZE;
938 }
939
940 static void pci_release_bus_bridge_dev(struct device *dev)
941 {
942         kfree(dev);
943 }
944
945 struct pci_dev *alloc_pci_dev(void)
946 {
947         struct pci_dev *dev;
948
949         dev = kzalloc(sizeof(struct pci_dev), GFP_KERNEL);
950         if (!dev)
951                 return NULL;
952
953         INIT_LIST_HEAD(&dev->bus_list);
954
955         return dev;
956 }
957 EXPORT_SYMBOL(alloc_pci_dev);
958
959 /*
960  * Read the config data for a PCI device, sanity-check it
961  * and fill in the dev structure...
962  */
963 static struct pci_dev *pci_scan_device(struct pci_bus *bus, int devfn)
964 {
965         struct pci_dev *dev;
966         u32 l;
967         int delay = 1;
968
969         if (pci_bus_read_config_dword(bus, devfn, PCI_VENDOR_ID, &l))
970                 return NULL;
971
972         /* some broken boards return 0 or ~0 if a slot is empty: */
973         if (l == 0xffffffff || l == 0x00000000 ||
974             l == 0x0000ffff || l == 0xffff0000)
975                 return NULL;
976
977         /* Configuration request Retry Status */
978         while (l == 0xffff0001) {
979                 msleep(delay);
980                 delay *= 2;
981                 if (pci_bus_read_config_dword(bus, devfn, PCI_VENDOR_ID, &l))
982                         return NULL;
983                 /* Card hasn't responded in 60 seconds?  Must be stuck. */
984                 if (delay > 60 * 1000) {
985                         printk(KERN_WARNING "pci %04x:%02x:%02x.%d: not "
986                                         "responding\n", pci_domain_nr(bus),
987                                         bus->number, PCI_SLOT(devfn),
988                                         PCI_FUNC(devfn));
989                         return NULL;
990                 }
991         }
992
993         dev = alloc_pci_dev();
994         if (!dev)
995                 return NULL;
996
997         dev->bus = bus;
998         dev->devfn = devfn;
999         dev->vendor = l & 0xffff;
1000         dev->device = (l >> 16) & 0xffff;
1001
1002         if (pci_setup_device(dev)) {
1003                 kfree(dev);
1004                 return NULL;
1005         }
1006
1007         return dev;
1008 }
1009
1010 static void pci_init_capabilities(struct pci_dev *dev)
1011 {
1012         /* MSI/MSI-X list */
1013         pci_msi_init_pci_dev(dev);
1014
1015         /* Buffers for saving PCIe and PCI-X capabilities */
1016         pci_allocate_cap_save_buffers(dev);
1017
1018         /* Power Management */
1019         pci_pm_init(dev);
1020         platform_pci_wakeup_init(dev);
1021
1022         /* Vital Product Data */
1023         pci_vpd_pci22_init(dev);
1024
1025         /* Alternative Routing-ID Forwarding */
1026         pci_enable_ari(dev);
1027
1028         /* Single Root I/O Virtualization */
1029         pci_iov_init(dev);
1030
1031         /* Enable ACS P2P upstream forwarding */
1032         if (iommu_found() || xen_initial_domain())
1033                 pci_enable_acs(dev);
1034 }
1035
1036 void pci_device_add(struct pci_dev *dev, struct pci_bus *bus)
1037 {
1038         device_initialize(&dev->dev);
1039         dev->dev.release = pci_release_dev;
1040         pci_dev_get(dev);
1041
1042         dev->dev.dma_mask = &dev->dma_mask;
1043         dev->dev.dma_parms = &dev->dma_parms;
1044         dev->dev.coherent_dma_mask = 0xffffffffull;
1045
1046         pci_set_dma_max_seg_size(dev, 65536);
1047         pci_set_dma_seg_boundary(dev, 0xffffffff);
1048
1049         /* Fix up broken headers */
1050         pci_fixup_device(pci_fixup_header, dev);
1051
1052         /* Clear the state_saved flag. */
1053         dev->state_saved = false;
1054
1055         /* Initialize various capabilities */
1056         pci_init_capabilities(dev);
1057
1058         /*
1059          * Add the device to our list of discovered devices
1060          * and the bus list for fixup functions, etc.
1061          */
1062         down_write(&pci_bus_sem);
1063         list_add_tail(&dev->bus_list, &bus->devices);
1064         up_write(&pci_bus_sem);
1065 }
1066
1067 struct pci_dev *__ref pci_scan_single_device(struct pci_bus *bus, int devfn)
1068 {
1069         struct pci_dev *dev;
1070
1071         dev = pci_get_slot(bus, devfn);
1072         if (dev) {
1073                 pci_dev_put(dev);
1074                 return dev;
1075         }
1076
1077         dev = pci_scan_device(bus, devfn);
1078         if (!dev)
1079                 return NULL;
1080
1081         pci_device_add(dev, bus);
1082
1083         return dev;
1084 }
1085 EXPORT_SYMBOL(pci_scan_single_device);
1086
1087 /**
1088  * pci_scan_slot - scan a PCI slot on a bus for devices.
1089  * @bus: PCI bus to scan
1090  * @devfn: slot number to scan (must have zero function.)
1091  *
1092  * Scan a PCI slot on the specified PCI bus for devices, adding
1093  * discovered devices to the @bus->devices list.  New devices
1094  * will not have is_added set.
1095  *
1096  * Returns the number of new devices found.
1097  */
1098 int pci_scan_slot(struct pci_bus *bus, int devfn)
1099 {
1100         int fn, nr = 0;
1101         struct pci_dev *dev;
1102
1103         dev = pci_scan_single_device(bus, devfn);
1104         if (dev && !dev->is_added)      /* new device? */
1105                 nr++;
1106
1107         if (dev && dev->multifunction) {
1108                 for (fn = 1; fn < 8; fn++) {
1109                         dev = pci_scan_single_device(bus, devfn + fn);
1110                         if (dev) {
1111                                 if (!dev->is_added)
1112                                         nr++;
1113                                 dev->multifunction = 1;
1114                         }
1115                 }
1116         }
1117
1118         /* only one slot has pcie device */
1119         if (bus->self && nr)
1120                 pcie_aspm_init_link_state(bus->self);
1121
1122         return nr;
1123 }
1124
1125 unsigned int __devinit pci_scan_child_bus(struct pci_bus *bus)
1126 {
1127         unsigned int devfn, pass, max = bus->secondary;
1128         struct pci_dev *dev;
1129
1130         dev_dbg(&bus->dev, "scanning bus\n");
1131
1132         /* Go find them, Rover! */
1133         for (devfn = 0; devfn < 0x100; devfn += 8)
1134                 pci_scan_slot(bus, devfn);
1135
1136         /* Reserve buses for SR-IOV capability. */
1137         max += pci_iov_bus_range(bus);
1138
1139         /*
1140          * After performing arch-dependent fixup of the bus, look behind
1141          * all PCI-to-PCI bridges on this bus.
1142          */
1143         if (!bus->is_added) {
1144                 dev_dbg(&bus->dev, "fixups for bus\n");
1145                 pcibios_fixup_bus(bus);
1146                 if (pci_is_root_bus(bus))
1147                         bus->is_added = 1;
1148         }
1149
1150         for (pass=0; pass < 2; pass++)
1151                 list_for_each_entry(dev, &bus->devices, bus_list) {
1152                         if (dev->hdr_type == PCI_HEADER_TYPE_BRIDGE ||
1153                             dev->hdr_type == PCI_HEADER_TYPE_CARDBUS)
1154                                 max = pci_scan_bridge(bus, dev, max, pass);
1155                 }
1156
1157         /*
1158          * We've scanned the bus and so we know all about what's on
1159          * the other side of any bridges that may be on this bus plus
1160          * any devices.
1161          *
1162          * Return how far we've got finding sub-buses.
1163          */
1164         dev_dbg(&bus->dev, "bus scan returning with max=%02x\n", max);
1165         return max;
1166 }
1167
1168 struct pci_bus * pci_create_bus(struct device *parent,
1169                 int bus, struct pci_ops *ops, void *sysdata)
1170 {
1171         int error;
1172         struct pci_bus *b, *b2;
1173         struct device *dev;
1174
1175         b = pci_alloc_bus();
1176         if (!b)
1177                 return NULL;
1178
1179         dev = kzalloc(sizeof(*dev), GFP_KERNEL);
1180         if (!dev){
1181                 kfree(b);
1182                 return NULL;
1183         }
1184
1185         b->sysdata = sysdata;
1186         b->ops = ops;
1187
1188         b2 = pci_find_bus(pci_domain_nr(b), bus);
1189         if (b2) {
1190                 /* If we already got to this bus through a different bridge, ignore it */
1191                 dev_dbg(&b2->dev, "bus already known\n");
1192                 goto err_out;
1193         }
1194
1195         down_write(&pci_bus_sem);
1196         list_add_tail(&b->node, &pci_root_buses);
1197         up_write(&pci_bus_sem);
1198
1199         dev->parent = parent;
1200         dev->release = pci_release_bus_bridge_dev;
1201         dev_set_name(dev, "pci%04x:%02x", pci_domain_nr(b), bus);
1202         error = device_register(dev);
1203         if (error)
1204                 goto dev_reg_err;
1205         b->bridge = get_device(dev);
1206
1207         if (!parent)
1208                 set_dev_node(b->bridge, pcibus_to_node(b));
1209
1210         b->dev.class = &pcibus_class;
1211         b->dev.parent = b->bridge;
1212         dev_set_name(&b->dev, "%04x:%02x", pci_domain_nr(b), bus);
1213         error = device_register(&b->dev);
1214         if (error)
1215                 goto class_dev_reg_err;
1216         error = device_create_file(&b->dev, &dev_attr_cpuaffinity);
1217         if (error)
1218                 goto dev_create_file_err;
1219
1220         /* Create legacy_io and legacy_mem files for this bus */
1221         pci_create_legacy_files(b);
1222
1223         b->number = b->secondary = bus;
1224         b->resource[0] = &ioport_resource;
1225         b->resource[1] = &iomem_resource;
1226
1227         return b;
1228
1229 dev_create_file_err:
1230         device_unregister(&b->dev);
1231 class_dev_reg_err:
1232         device_unregister(dev);
1233 dev_reg_err:
1234         down_write(&pci_bus_sem);
1235         list_del(&b->node);
1236         up_write(&pci_bus_sem);
1237 err_out:
1238         kfree(dev);
1239         kfree(b);
1240         return NULL;
1241 }
1242
1243 struct pci_bus * __devinit pci_scan_bus_parented(struct device *parent,
1244                 int bus, struct pci_ops *ops, void *sysdata)
1245 {
1246         struct pci_bus *b;
1247
1248         b = pci_create_bus(parent, bus, ops, sysdata);
1249         if (b)
1250                 b->subordinate = pci_scan_child_bus(b);
1251         return b;
1252 }
1253 EXPORT_SYMBOL(pci_scan_bus_parented);
1254
1255 #ifdef CONFIG_HOTPLUG
1256 /**
1257  * pci_rescan_bus - scan a PCI bus for devices.
1258  * @bus: PCI bus to scan
1259  *
1260  * Scan a PCI bus and child buses for new devices, adds them,
1261  * and enables them.
1262  *
1263  * Returns the max number of subordinate bus discovered.
1264  */
1265 unsigned int __ref pci_rescan_bus(struct pci_bus *bus)
1266 {
1267         unsigned int max;
1268         struct pci_dev *dev;
1269
1270         max = pci_scan_child_bus(bus);
1271
1272         down_read(&pci_bus_sem);
1273         list_for_each_entry(dev, &bus->devices, bus_list)
1274                 if (dev->hdr_type == PCI_HEADER_TYPE_BRIDGE ||
1275                     dev->hdr_type == PCI_HEADER_TYPE_CARDBUS)
1276                         if (dev->subordinate)
1277                                 pci_bus_size_bridges(dev->subordinate);
1278         up_read(&pci_bus_sem);
1279
1280         pci_bus_assign_resources(bus);
1281         pci_enable_bridges(bus);
1282         pci_bus_add_devices(bus);
1283
1284         return max;
1285 }
1286 EXPORT_SYMBOL_GPL(pci_rescan_bus);
1287
1288 EXPORT_SYMBOL(pci_add_new_bus);
1289 EXPORT_SYMBOL(pci_scan_slot);
1290 EXPORT_SYMBOL(pci_scan_bridge);
1291 EXPORT_SYMBOL_GPL(pci_scan_child_bus);
1292 #endif
1293
1294 static int __init pci_sort_bf_cmp(const struct device *d_a, const struct device *d_b)
1295 {
1296         const struct pci_dev *a = to_pci_dev(d_a);
1297         const struct pci_dev *b = to_pci_dev(d_b);
1298
1299         if      (pci_domain_nr(a->bus) < pci_domain_nr(b->bus)) return -1;
1300         else if (pci_domain_nr(a->bus) > pci_domain_nr(b->bus)) return  1;
1301
1302         if      (a->bus->number < b->bus->number) return -1;
1303         else if (a->bus->number > b->bus->number) return  1;
1304
1305         if      (a->devfn < b->devfn) return -1;
1306         else if (a->devfn > b->devfn) return  1;
1307
1308         return 0;
1309 }
1310
1311 void __init pci_sort_breadthfirst(void)
1312 {
1313         bus_sort_breadthfirst(&pci_bus_type, &pci_sort_bf_cmp);
1314 }