Merge git://git.infradead.org/iommu-2.6

[safe/jmp/linux-2.6] / arch / x86 / kernel / pci-dma.c
diff --git a/arch/x86/kernel/pci-dma.c b/arch/x86/kernel/pci-dma.c

index b75c81a..1972266 100644 (file)
--- a/arch/x86/kernel/pci-dma.c
+++ b/arch/x86/kernel/pci-dma.c
@@ -5,13 +5,11 @@
  
  #include <asm/proto.h>
  #include <asm/dma.h>
-#include <asm/gart.h>
+#include <asm/iommu.h>
  #include <asm/calgary.h>
+#include <asm/amd_iommu.h>
  
-int forbid_dac __read_mostly;
-EXPORT_SYMBOL(forbid_dac);
-
-const struct dma_mapping_ops *dma_ops;
+struct dma_mapping_ops *dma_ops;
  EXPORT_SYMBOL(dma_ops);
  
  static int iommu_sac_force __read_mostly;
@@ -41,11 +39,12 @@ EXPORT_SYMBOL(bad_dma_address);
  /* Dummy device used for NULL arguments (normally ISA). Better would
     be probably a smaller DMA mask, but this is bug-to-bug compatible
     to older i386. */
-struct device fallback_dev = {
+struct device x86_dma_fallback_dev = {
         .bus_id = "fallback device",
         .coherent_dma_mask = DMA_32BIT_MASK,
-       .dma_mask = &fallback_dev.coherent_dma_mask,
+       .dma_mask = &x86_dma_fallback_dev.coherent_dma_mask,
  };
+EXPORT_SYMBOL(x86_dma_fallback_dev);
  
  int dma_set_mask(struct device *dev, u64 mask)
  {
@@ -74,13 +73,17 @@ early_param("dma32_size", parse_dma32_size_opt);
  void __init dma32_reserve_bootmem(void)
  {
         unsigned long size, align;
-       if (end_pfn <= MAX_DMA32_PFN)
+       if (max_pfn <= MAX_DMA32_PFN)
                 return;
  
+       /*
+        * check aperture_64.c allocate_aperture() for reason about
+        * using 512M as goal
+        */
         align = 64ULL<<20;
-       size = round_up(dma32_bootmem_size, align);
+       size = roundup(dma32_bootmem_size, align);
         dma32_bootmem_ptr = __alloc_bootmem_nopanic(size, align,
-                                __pa(MAX_DMA_ADDRESS));
+                                512ULL<<20);
         if (dma32_bootmem_ptr)
                 dma32_bootmem_size = size;
         else
@@ -88,17 +91,14 @@ void __init dma32_reserve_bootmem(void)
  }
  static void __init dma32_free_bootmem(void)
  {
-       int node;
  
-       if (end_pfn <= MAX_DMA32_PFN)
+       if (max_pfn <= MAX_DMA32_PFN)
                 return;
  
         if (!dma32_bootmem_ptr)
                 return;
  
-       for_each_online_node(node)
-               free_bootmem_node(NODE_DATA(node), __pa(dma32_bootmem_ptr),
-                                 dma32_bootmem_size);
+       free_bootmem(__pa(dma32_bootmem_ptr), dma32_bootmem_size);
  
         dma32_bootmem_ptr = NULL;
         dma32_bootmem_size = 0;
@@ -112,22 +112,57 @@ void __init pci_iommu_alloc(void)
          * The order of these functions is important for
          * fall-back/fail-over reasons
          */
-#ifdef CONFIG_GART_IOMMU
         gart_iommu_hole_init();
-#endif
  
-#ifdef CONFIG_CALGARY_IOMMU
         detect_calgary();
-#endif
  
         detect_intel_iommu();
  
-#ifdef CONFIG_SWIOTLB
+       amd_iommu_detect();
+
         pci_swiotlb_init();
-#endif
  }
+
+unsigned long iommu_nr_pages(unsigned long addr, unsigned long len)
+{
+       unsigned long size = roundup((addr & ~PAGE_MASK) + len, PAGE_SIZE);
+
+       return size >> PAGE_SHIFT;
+}
+EXPORT_SYMBOL(iommu_nr_pages);
  #endif
  
+void *dma_generic_alloc_coherent(struct device *dev, size_t size,
+                                dma_addr_t *dma_addr, gfp_t flag)
+{
+       unsigned long dma_mask;
+       struct page *page;
+       dma_addr_t addr;
+
+       dma_mask = dma_alloc_coherent_mask(dev, flag);
+
+       flag |= __GFP_ZERO;
+again:
+       page = alloc_pages_node(dev_to_node(dev), flag, get_order(size));
+       if (!page)
+               return NULL;
+
+       addr = page_to_phys(page);
+       if (!is_buffer_dma_capable(dma_mask, addr, size)) {
+               __free_pages(page, get_order(size));
+
+               if (dma_mask < DMA_32BIT_MASK && !(flag & GFP_DMA)) {
+                       flag = (flag & ~GFP_DMA32) | GFP_DMA;
+                       goto again;
+               }
+
+               return NULL;
+       }
+
+       *dma_addr = addr;
+       return page_address(page);
+}
+
  /*
   * See <Documentation/x86_64/boot-options.txt> for the iommu kernel parameter
   * documentation.
@@ -180,9 +215,7 @@ static __init int iommu_setup(char *p)
                         swiotlb = 1;
  #endif
  
-#ifdef CONFIG_GART_IOMMU
                 gart_parse_options(p);
-#endif
  
  #ifdef CONFIG_CALGARY_IOMMU
                 if (!strncmp(p, "calgary", 7))
@@ -199,16 +232,17 @@ early_param("iommu", iommu_setup);
  
  int dma_supported(struct device *dev, u64 mask)
  {
+       struct dma_mapping_ops *ops = get_dma_ops(dev);
+
  #ifdef CONFIG_PCI
         if (mask > 0xffffffff && forbid_dac > 0) {
-               printk(KERN_INFO "PCI: Disallowing DAC for device %s\n",
-                                dev->bus_id);
+               dev_info(dev, "PCI: Disallowing DAC for device\n");
                 return 0;
         }
  #endif
  
-       if (dma_ops->dma_supported)
-               return dma_ops->dma_supported(dev, mask);
+       if (ops->dma_supported)
+               return ops->dma_supported(dev, mask);
  
         /* Copied from i386. Doesn't make much sense, because it will
            only work for pci_alloc_coherent.
@@ -229,8 +263,7 @@ int dma_supported(struct device *dev, u64 mask)
            type. Normally this doesn't make any difference, but gives
            more gentle handling of IOMMU overflow. */
         if (iommu_sac_force && (mask >= DMA_40BIT_MASK)) {
-               printk(KERN_INFO "%s: Force SAC with mask %Lx\n",
-                                dev->bus_id, mask);
+               dev_info(dev, "Force SAC with mask %Lx\n", mask);
                 return 0;
         }
  
@@ -238,155 +271,15 @@ int dma_supported(struct device *dev, u64 mask)
  }
  EXPORT_SYMBOL(dma_supported);
  
-/* Allocate DMA memory on node near device */
-noinline struct page *
-dma_alloc_pages(struct device *dev, gfp_t gfp, unsigned order)
-{
-       int node;
-
-       node = dev_to_node(dev);
-
-       return alloc_pages_node(node, gfp, order);
-}
-
-/*
- * Allocate memory for a coherent mapping.
- */
-void *
-dma_alloc_coherent(struct device *dev, size_t size, dma_addr_t *dma_handle,
-                  gfp_t gfp)
-{
-       void *memory = NULL;
-       struct page *page;
-       unsigned long dma_mask = 0;
-       dma_addr_t bus;
-       int noretry = 0;
-
-       /* ignore region specifiers */
-       gfp &= ~(__GFP_DMA | __GFP_HIGHMEM | __GFP_DMA32);
-
-       if (dma_alloc_from_coherent(dev, size, dma_handle, &memory))
-               return memory;
-
-       if (!dev) {
-               dev = &fallback_dev;
-               gfp |= GFP_DMA;
-       }
-       dma_mask = dev->coherent_dma_mask;
-       if (dma_mask == 0)
-               dma_mask = (gfp & GFP_DMA) ? DMA_24BIT_MASK : DMA_32BIT_MASK;
-
-       /* Device not DMA able */
-       if (dev->dma_mask == NULL)
-               return NULL;
-
-       /* Don't invoke OOM killer or retry in lower 16MB DMA zone */
-       if (gfp & __GFP_DMA)
-               noretry = 1;
-
-#ifdef CONFIG_X86_64
-       /* Why <=? Even when the mask is smaller than 4GB it is often
-          larger than 16MB and in this case we have a chance of
-          finding fitting memory in the next higher zone first. If
-          not retry with true GFP_DMA. -AK */
-       if (dma_mask <= DMA_32BIT_MASK && !(gfp & GFP_DMA)) {
-               gfp |= GFP_DMA32;
-               if (dma_mask < DMA_32BIT_MASK)
-                       noretry = 1;
-       }
-#endif
-
- again:
-       page = dma_alloc_pages(dev,
-               noretry ? gfp | __GFP_NORETRY : gfp, get_order(size));
-       if (page == NULL)
-               return NULL;
-
-       {
-               int high, mmu;
-               bus = page_to_phys(page);
-               memory = page_address(page);
-               high = (bus + size) >= dma_mask;
-               mmu = high;
-               if (force_iommu && !(gfp & GFP_DMA))
-                       mmu = 1;
-               else if (high) {
-                       free_pages((unsigned long)memory,
-                                  get_order(size));
-
-                       /* Don't use the 16MB ZONE_DMA unless absolutely
-                          needed. It's better to use remapping first. */
-                       if (dma_mask < DMA_32BIT_MASK && !(gfp & GFP_DMA)) {
-                               gfp = (gfp & ~GFP_DMA32) | GFP_DMA;
-                               goto again;
-                       }
-
-                       /* Let low level make its own zone decisions */
-                       gfp &= ~(GFP_DMA32|GFP_DMA);
-
-                       if (dma_ops->alloc_coherent)
-                               return dma_ops->alloc_coherent(dev, size,
-                                                          dma_handle, gfp);
-                       return NULL;
-               }
-
-               memset(memory, 0, size);
-               if (!mmu) {
-                       *dma_handle = bus;
-                       return memory;
-               }
-       }
-
-       if (dma_ops->alloc_coherent) {
-               free_pages((unsigned long)memory, get_order(size));
-               gfp &= ~(GFP_DMA|GFP_DMA32);
-               return dma_ops->alloc_coherent(dev, size, dma_handle, gfp);
-       }
-
-       if (dma_ops->map_simple) {
-               *dma_handle = dma_ops->map_simple(dev, virt_to_phys(memory),
-                                             size,
-                                             PCI_DMA_BIDIRECTIONAL);
-               if (*dma_handle != bad_dma_address)
-                       return memory;
-       }
-
-       if (panic_on_overflow)
-               panic("dma_alloc_coherent: IOMMU overflow by %lu bytes\n",
-                     (unsigned long)size);
-       free_pages((unsigned long)memory, get_order(size));
-       return NULL;
-}
-EXPORT_SYMBOL(dma_alloc_coherent);
-
-/*
- * Unmap coherent memory.
- * The caller must ensure that the device has finished accessing the mapping.
- */
-void dma_free_coherent(struct device *dev, size_t size,
-                        void *vaddr, dma_addr_t bus)
-{
-       int order = get_order(size);
-       WARN_ON(irqs_disabled());       /* for portability */
-       if (dma_release_from_coherent(dev, order, vaddr))
-               return;
-       if (dma_ops->unmap_single)
-               dma_ops->unmap_single(dev, bus, size, 0);
-       free_pages((unsigned long)vaddr, order);
-}
-EXPORT_SYMBOL(dma_free_coherent);
-
  static int __init pci_iommu_init(void)
  {
-#ifdef CONFIG_CALGARY_IOMMU
         calgary_iommu_init();
-#endif
  
         intel_iommu_init();
  
-#ifdef CONFIG_GART_IOMMU
+       amd_iommu_init();
+
         gart_iommu_init();
-#endif
  
         no_iommu_init();
         return 0;
@@ -398,17 +291,3 @@ void pci_iommu_shutdown(void)
  }
  /* Must execute after PCI subsystem */
  fs_initcall(pci_iommu_init);
-
-#ifdef CONFIG_PCI
-/* Many VIA bridges seem to corrupt data for DAC. Disable it here */
-
-static __devinit void via_no_dac(struct pci_dev *dev)
-{
-       if ((dev->class >> 8) == PCI_CLASS_BRIDGE_PCI && forbid_dac == 0) {
-               printk(KERN_INFO "PCI: VIA PCI bridge detected."
-                                "Disabling DAC.\n");
-               forbid_dac = 1;
-       }
-}
-DECLARE_PCI_FIXUP_FINAL(PCI_VENDOR_ID_VIA, PCI_ANY_ID, via_no_dac);
-#endif