Merge branch 'master'
[safe/jmp/linux-2.6] / drivers / scsi / sata_mv.c
1 /*
2  * sata_mv.c - Marvell SATA support
3  *
4  * Copyright 2005: EMC Corporation, all rights reserved. 
5  *
6  * Please ALWAYS copy linux-ide@vger.kernel.org on emails.
7  *
8  * This program is free software; you can redistribute it and/or modify
9  * it under the terms of the GNU General Public License as published by
10  * the Free Software Foundation; version 2 of the License.
11  *
12  * This program is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with this program; if not, write to the Free Software
19  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
20  *
21  */
22
23 #include <linux/kernel.h>
24 #include <linux/module.h>
25 #include <linux/pci.h>
26 #include <linux/init.h>
27 #include <linux/blkdev.h>
28 #include <linux/delay.h>
29 #include <linux/interrupt.h>
30 #include <linux/sched.h>
31 #include <linux/dma-mapping.h>
32 #include "scsi.h"
33 #include <scsi/scsi_host.h>
34 #include <linux/libata.h>
35 #include <asm/io.h>
36
37 #define DRV_NAME        "sata_mv"
38 #define DRV_VERSION     "0.25"
39
40 enum {
41         /* BAR's are enumerated in terms of pci_resource_start() terms */
42         MV_PRIMARY_BAR          = 0,    /* offset 0x10: memory space */
43         MV_IO_BAR               = 2,    /* offset 0x18: IO space */
44         MV_MISC_BAR             = 3,    /* offset 0x1c: FLASH, NVRAM, SRAM */
45
46         MV_MAJOR_REG_AREA_SZ    = 0x10000,      /* 64KB */
47         MV_MINOR_REG_AREA_SZ    = 0x2000,       /* 8KB */
48
49         MV_PCI_REG_BASE         = 0,
50         MV_IRQ_COAL_REG_BASE    = 0x18000,      /* 6xxx part only */
51         MV_SATAHC0_REG_BASE     = 0x20000,
52
53         MV_PCI_REG_SZ           = MV_MAJOR_REG_AREA_SZ,
54         MV_SATAHC_REG_SZ        = MV_MAJOR_REG_AREA_SZ,
55         MV_SATAHC_ARBTR_REG_SZ  = MV_MINOR_REG_AREA_SZ,         /* arbiter */
56         MV_PORT_REG_SZ          = MV_MINOR_REG_AREA_SZ,
57
58         MV_USE_Q_DEPTH          = ATA_DEF_QUEUE,
59
60         MV_MAX_Q_DEPTH          = 32,
61         MV_MAX_Q_DEPTH_MASK     = MV_MAX_Q_DEPTH - 1,
62
63         /* CRQB needs alignment on a 1KB boundary. Size == 1KB
64          * CRPB needs alignment on a 256B boundary. Size == 256B
65          * SG count of 176 leads to MV_PORT_PRIV_DMA_SZ == 4KB
66          * ePRD (SG) entries need alignment on a 16B boundary. Size == 16B
67          */
68         MV_CRQB_Q_SZ            = (32 * MV_MAX_Q_DEPTH),
69         MV_CRPB_Q_SZ            = (8 * MV_MAX_Q_DEPTH),
70         MV_MAX_SG_CT            = 176,
71         MV_SG_TBL_SZ            = (16 * MV_MAX_SG_CT),
72         MV_PORT_PRIV_DMA_SZ     = (MV_CRQB_Q_SZ + MV_CRPB_Q_SZ + MV_SG_TBL_SZ),
73
74         /* Our DMA boundary is determined by an ePRD being unable to handle
75          * anything larger than 64KB
76          */
77         MV_DMA_BOUNDARY         = 0xffffU,
78
79         MV_PORTS_PER_HC         = 4,
80         /* == (port / MV_PORTS_PER_HC) to determine HC from 0-7 port */
81         MV_PORT_HC_SHIFT        = 2,
82         /* == (port % MV_PORTS_PER_HC) to determine hard port from 0-7 port */
83         MV_PORT_MASK            = 3,
84
85         /* Host Flags */
86         MV_FLAG_DUAL_HC         = (1 << 30),  /* two SATA Host Controllers */
87         MV_FLAG_IRQ_COALESCE    = (1 << 29),  /* IRQ coalescing capability */
88         MV_FLAG_GLBL_SFT_RST    = (1 << 28),  /* Global Soft Reset support */
89         MV_COMMON_FLAGS         = (ATA_FLAG_SATA | ATA_FLAG_NO_LEGACY |
90                                    ATA_FLAG_SATA_RESET | ATA_FLAG_MMIO),
91         MV_6XXX_FLAGS           = (MV_FLAG_IRQ_COALESCE | 
92                                    MV_FLAG_GLBL_SFT_RST),
93
94         chip_504x               = 0,
95         chip_508x               = 1,
96         chip_604x               = 2,
97         chip_608x               = 3,
98
99         CRQB_FLAG_READ          = (1 << 0),
100         CRQB_TAG_SHIFT          = 1,
101         CRQB_CMD_ADDR_SHIFT     = 8,
102         CRQB_CMD_CS             = (0x2 << 11),
103         CRQB_CMD_LAST           = (1 << 15),
104
105         CRPB_FLAG_STATUS_SHIFT  = 8,
106
107         EPRD_FLAG_END_OF_TBL    = (1 << 31),
108
109         /* PCI interface registers */
110
111         PCI_COMMAND_OFS         = 0xc00,
112
113         PCI_MAIN_CMD_STS_OFS    = 0xd30,
114         STOP_PCI_MASTER         = (1 << 2),
115         PCI_MASTER_EMPTY        = (1 << 3),
116         GLOB_SFT_RST            = (1 << 4),
117
118         PCI_IRQ_CAUSE_OFS       = 0x1d58,
119         PCI_IRQ_MASK_OFS        = 0x1d5c,
120         PCI_UNMASK_ALL_IRQS     = 0x7fffff,     /* bits 22-0 */
121
122         HC_MAIN_IRQ_CAUSE_OFS   = 0x1d60,
123         HC_MAIN_IRQ_MASK_OFS    = 0x1d64,
124         PORT0_ERR               = (1 << 0),     /* shift by port # */
125         PORT0_DONE              = (1 << 1),     /* shift by port # */
126         HC0_IRQ_PEND            = 0x1ff,        /* bits 0-8 = HC0's ports */
127         HC_SHIFT                = 9,            /* bits 9-17 = HC1's ports */
128         PCI_ERR                 = (1 << 18),
129         TRAN_LO_DONE            = (1 << 19),    /* 6xxx: IRQ coalescing */
130         TRAN_HI_DONE            = (1 << 20),    /* 6xxx: IRQ coalescing */
131         PORTS_0_7_COAL_DONE     = (1 << 21),    /* 6xxx: IRQ coalescing */
132         GPIO_INT                = (1 << 22),
133         SELF_INT                = (1 << 23),
134         TWSI_INT                = (1 << 24),
135         HC_MAIN_RSVD            = (0x7f << 25), /* bits 31-25 */
136         HC_MAIN_MASKED_IRQS     = (TRAN_LO_DONE | TRAN_HI_DONE | 
137                                    PORTS_0_7_COAL_DONE | GPIO_INT | TWSI_INT |
138                                    HC_MAIN_RSVD),
139
140         /* SATAHC registers */
141         HC_CFG_OFS              = 0,
142
143         HC_IRQ_CAUSE_OFS        = 0x14,
144         CRPB_DMA_DONE           = (1 << 0),     /* shift by port # */
145         HC_IRQ_COAL             = (1 << 4),     /* IRQ coalescing */
146         DEV_IRQ                 = (1 << 8),     /* shift by port # */
147
148         /* Shadow block registers */
149         SHD_BLK_OFS             = 0x100,
150         SHD_CTL_AST_OFS         = 0x20,         /* ofs from SHD_BLK_OFS */
151
152         /* SATA registers */
153         SATA_STATUS_OFS         = 0x300,  /* ctrl, err regs follow status */
154         SATA_ACTIVE_OFS         = 0x350,
155
156         /* Port registers */
157         EDMA_CFG_OFS            = 0,
158         EDMA_CFG_Q_DEPTH        = 0,                    /* queueing disabled */
159         EDMA_CFG_NCQ            = (1 << 5),
160         EDMA_CFG_NCQ_GO_ON_ERR  = (1 << 14),            /* continue on error */
161         EDMA_CFG_RD_BRST_EXT    = (1 << 11),            /* read burst 512B */
162         EDMA_CFG_WR_BUFF_LEN    = (1 << 13),            /* write buffer 512B */
163
164         EDMA_ERR_IRQ_CAUSE_OFS  = 0x8,
165         EDMA_ERR_IRQ_MASK_OFS   = 0xc,
166         EDMA_ERR_D_PAR          = (1 << 0),
167         EDMA_ERR_PRD_PAR        = (1 << 1),
168         EDMA_ERR_DEV            = (1 << 2),
169         EDMA_ERR_DEV_DCON       = (1 << 3),
170         EDMA_ERR_DEV_CON        = (1 << 4),
171         EDMA_ERR_SERR           = (1 << 5),
172         EDMA_ERR_SELF_DIS       = (1 << 7),
173         EDMA_ERR_BIST_ASYNC     = (1 << 8),
174         EDMA_ERR_CRBQ_PAR       = (1 << 9),
175         EDMA_ERR_CRPB_PAR       = (1 << 10),
176         EDMA_ERR_INTRL_PAR      = (1 << 11),
177         EDMA_ERR_IORDY          = (1 << 12),
178         EDMA_ERR_LNK_CTRL_RX    = (0xf << 13),
179         EDMA_ERR_LNK_CTRL_RX_2  = (1 << 15),
180         EDMA_ERR_LNK_DATA_RX    = (0xf << 17),
181         EDMA_ERR_LNK_CTRL_TX    = (0x1f << 21),
182         EDMA_ERR_LNK_DATA_TX    = (0x1f << 26),
183         EDMA_ERR_TRANS_PROTO    = (1 << 31),
184         EDMA_ERR_FATAL          = (EDMA_ERR_D_PAR | EDMA_ERR_PRD_PAR | 
185                                    EDMA_ERR_DEV_DCON | EDMA_ERR_CRBQ_PAR |
186                                    EDMA_ERR_CRPB_PAR | EDMA_ERR_INTRL_PAR |
187                                    EDMA_ERR_IORDY | EDMA_ERR_LNK_CTRL_RX_2 | 
188                                    EDMA_ERR_LNK_DATA_RX |
189                                    EDMA_ERR_LNK_DATA_TX | 
190                                    EDMA_ERR_TRANS_PROTO),
191
192         EDMA_REQ_Q_BASE_HI_OFS  = 0x10,
193         EDMA_REQ_Q_IN_PTR_OFS   = 0x14,         /* also contains BASE_LO */
194         EDMA_REQ_Q_BASE_LO_MASK = 0xfffffc00U,
195
196         EDMA_REQ_Q_OUT_PTR_OFS  = 0x18,
197         EDMA_REQ_Q_PTR_SHIFT    = 5,
198
199         EDMA_RSP_Q_BASE_HI_OFS  = 0x1c,
200         EDMA_RSP_Q_IN_PTR_OFS   = 0x20,
201         EDMA_RSP_Q_OUT_PTR_OFS  = 0x24,         /* also contains BASE_LO */
202         EDMA_RSP_Q_BASE_LO_MASK = 0xffffff00U,
203         EDMA_RSP_Q_PTR_SHIFT    = 3,
204
205         EDMA_CMD_OFS            = 0x28,
206         EDMA_EN                 = (1 << 0),
207         EDMA_DS                 = (1 << 1),
208         ATA_RST                 = (1 << 2),
209
210         /* Host private flags (hp_flags) */
211         MV_HP_FLAG_MSI          = (1 << 0),
212
213         /* Port private flags (pp_flags) */
214         MV_PP_FLAG_EDMA_EN      = (1 << 0),
215         MV_PP_FLAG_EDMA_DS_ACT  = (1 << 1),
216 };
217
218 /* Command ReQuest Block: 32B */
219 struct mv_crqb {
220         u32                     sg_addr;
221         u32                     sg_addr_hi;
222         u16                     ctrl_flags;
223         u16                     ata_cmd[11];
224 };
225
226 /* Command ResPonse Block: 8B */
227 struct mv_crpb {
228         u16                     id;
229         u16                     flags;
230         u32                     tmstmp;
231 };
232
233 /* EDMA Physical Region Descriptor (ePRD); A.K.A. SG */
234 struct mv_sg {
235         u32                     addr;
236         u32                     flags_size;
237         u32                     addr_hi;
238         u32                     reserved;
239 };
240
241 struct mv_port_priv {
242         struct mv_crqb          *crqb;
243         dma_addr_t              crqb_dma;
244         struct mv_crpb          *crpb;
245         dma_addr_t              crpb_dma;
246         struct mv_sg            *sg_tbl;
247         dma_addr_t              sg_tbl_dma;
248
249         unsigned                req_producer;           /* cp of req_in_ptr */
250         unsigned                rsp_consumer;           /* cp of rsp_out_ptr */
251         u32                     pp_flags;
252 };
253
254 struct mv_host_priv {
255         u32                     hp_flags;
256 };
257
258 static void mv_irq_clear(struct ata_port *ap);
259 static u32 mv_scr_read(struct ata_port *ap, unsigned int sc_reg_in);
260 static void mv_scr_write(struct ata_port *ap, unsigned int sc_reg_in, u32 val);
261 static u8 mv_check_err(struct ata_port *ap);
262 static void mv_phy_reset(struct ata_port *ap);
263 static void mv_host_stop(struct ata_host_set *host_set);
264 static int mv_port_start(struct ata_port *ap);
265 static void mv_port_stop(struct ata_port *ap);
266 static void mv_qc_prep(struct ata_queued_cmd *qc);
267 static int mv_qc_issue(struct ata_queued_cmd *qc);
268 static irqreturn_t mv_interrupt(int irq, void *dev_instance,
269                                 struct pt_regs *regs);
270 static void mv_eng_timeout(struct ata_port *ap);
271 static int mv_init_one(struct pci_dev *pdev, const struct pci_device_id *ent);
272
273 static Scsi_Host_Template mv_sht = {
274         .module                 = THIS_MODULE,
275         .name                   = DRV_NAME,
276         .ioctl                  = ata_scsi_ioctl,
277         .queuecommand           = ata_scsi_queuecmd,
278         .eh_strategy_handler    = ata_scsi_error,
279         .can_queue              = MV_USE_Q_DEPTH,
280         .this_id                = ATA_SHT_THIS_ID,
281         .sg_tablesize           = MV_MAX_SG_CT,
282         .max_sectors            = ATA_MAX_SECTORS,
283         .cmd_per_lun            = ATA_SHT_CMD_PER_LUN,
284         .emulated               = ATA_SHT_EMULATED,
285         .use_clustering         = ATA_SHT_USE_CLUSTERING,
286         .proc_name              = DRV_NAME,
287         .dma_boundary           = MV_DMA_BOUNDARY,
288         .slave_configure        = ata_scsi_slave_config,
289         .bios_param             = ata_std_bios_param,
290         .ordered_flush          = 1,
291 };
292
293 static const struct ata_port_operations mv_ops = {
294         .port_disable           = ata_port_disable,
295
296         .tf_load                = ata_tf_load,
297         .tf_read                = ata_tf_read,
298         .check_status           = ata_check_status,
299         .check_err              = mv_check_err,
300         .exec_command           = ata_exec_command,
301         .dev_select             = ata_std_dev_select,
302
303         .phy_reset              = mv_phy_reset,
304
305         .qc_prep                = mv_qc_prep,
306         .qc_issue               = mv_qc_issue,
307
308         .eng_timeout            = mv_eng_timeout,
309
310         .irq_handler            = mv_interrupt,
311         .irq_clear              = mv_irq_clear,
312
313         .scr_read               = mv_scr_read,
314         .scr_write              = mv_scr_write,
315
316         .port_start             = mv_port_start,
317         .port_stop              = mv_port_stop,
318         .host_stop              = mv_host_stop,
319 };
320
321 static struct ata_port_info mv_port_info[] = {
322         {  /* chip_504x */
323                 .sht            = &mv_sht,
324                 .host_flags     = MV_COMMON_FLAGS,
325                 .pio_mask       = 0x1f, /* pio0-4 */
326                 .udma_mask      = 0,    /* 0x7f (udma0-6 disabled for now) */
327                 .port_ops       = &mv_ops,
328         },
329         {  /* chip_508x */
330                 .sht            = &mv_sht,
331                 .host_flags     = (MV_COMMON_FLAGS | MV_FLAG_DUAL_HC),
332                 .pio_mask       = 0x1f, /* pio0-4 */
333                 .udma_mask      = 0,    /* 0x7f (udma0-6 disabled for now) */
334                 .port_ops       = &mv_ops,
335         },
336         {  /* chip_604x */
337                 .sht            = &mv_sht,
338                 .host_flags     = (MV_COMMON_FLAGS | MV_6XXX_FLAGS),
339                 .pio_mask       = 0x1f, /* pio0-4 */
340                 .udma_mask      = 0x7f, /* udma0-6 */
341                 .port_ops       = &mv_ops,
342         },
343         {  /* chip_608x */
344                 .sht            = &mv_sht,
345                 .host_flags     = (MV_COMMON_FLAGS | MV_6XXX_FLAGS | 
346                                    MV_FLAG_DUAL_HC),
347                 .pio_mask       = 0x1f, /* pio0-4 */
348                 .udma_mask      = 0x7f, /* udma0-6 */
349                 .port_ops       = &mv_ops,
350         },
351 };
352
353 static struct pci_device_id mv_pci_tbl[] = {
354         {PCI_DEVICE(PCI_VENDOR_ID_MARVELL, 0x5040), 0, 0, chip_504x},
355         {PCI_DEVICE(PCI_VENDOR_ID_MARVELL, 0x5041), 0, 0, chip_504x},
356         {PCI_DEVICE(PCI_VENDOR_ID_MARVELL, 0x5080), 0, 0, chip_508x},
357         {PCI_DEVICE(PCI_VENDOR_ID_MARVELL, 0x5081), 0, 0, chip_508x},
358
359         {PCI_DEVICE(PCI_VENDOR_ID_MARVELL, 0x6040), 0, 0, chip_604x},
360         {PCI_DEVICE(PCI_VENDOR_ID_MARVELL, 0x6041), 0, 0, chip_604x},
361         {PCI_DEVICE(PCI_VENDOR_ID_MARVELL, 0x6080), 0, 0, chip_608x},
362         {PCI_DEVICE(PCI_VENDOR_ID_MARVELL, 0x6081), 0, 0, chip_608x},
363         {}                      /* terminate list */
364 };
365
366 static struct pci_driver mv_pci_driver = {
367         .name                   = DRV_NAME,
368         .id_table               = mv_pci_tbl,
369         .probe                  = mv_init_one,
370         .remove                 = ata_pci_remove_one,
371 };
372
373 /*
374  * Functions
375  */
376
377 static inline void writelfl(unsigned long data, void __iomem *addr)
378 {
379         writel(data, addr);
380         (void) readl(addr);     /* flush to avoid PCI posted write */
381 }
382
383 static inline void __iomem *mv_hc_base(void __iomem *base, unsigned int hc)
384 {
385         return (base + MV_SATAHC0_REG_BASE + (hc * MV_SATAHC_REG_SZ));
386 }
387
388 static inline void __iomem *mv_port_base(void __iomem *base, unsigned int port)
389 {
390         return (mv_hc_base(base, port >> MV_PORT_HC_SHIFT) +
391                 MV_SATAHC_ARBTR_REG_SZ + 
392                 ((port & MV_PORT_MASK) * MV_PORT_REG_SZ));
393 }
394
395 static inline void __iomem *mv_ap_base(struct ata_port *ap)
396 {
397         return mv_port_base(ap->host_set->mmio_base, ap->port_no);
398 }
399
400 static inline int mv_get_hc_count(unsigned long hp_flags)
401 {
402         return ((hp_flags & MV_FLAG_DUAL_HC) ? 2 : 1);
403 }
404
405 static void mv_irq_clear(struct ata_port *ap)
406 {
407 }
408
409 /**
410  *      mv_start_dma - Enable eDMA engine
411  *      @base: port base address
412  *      @pp: port private data
413  *
414  *      Verify the local cache of the eDMA state is accurate with an
415  *      assert.
416  *
417  *      LOCKING:
418  *      Inherited from caller.
419  */
420 static void mv_start_dma(void __iomem *base, struct mv_port_priv *pp)
421 {
422         if (!(MV_PP_FLAG_EDMA_EN & pp->pp_flags)) {
423                 writelfl(EDMA_EN, base + EDMA_CMD_OFS);
424                 pp->pp_flags |= MV_PP_FLAG_EDMA_EN;
425         }
426         assert(EDMA_EN & readl(base + EDMA_CMD_OFS));
427 }
428
429 /**
430  *      mv_stop_dma - Disable eDMA engine
431  *      @ap: ATA channel to manipulate
432  *
433  *      Verify the local cache of the eDMA state is accurate with an
434  *      assert.
435  *
436  *      LOCKING:
437  *      Inherited from caller.
438  */
439 static void mv_stop_dma(struct ata_port *ap)
440 {
441         void __iomem *port_mmio = mv_ap_base(ap);
442         struct mv_port_priv *pp = ap->private_data;
443         u32 reg;
444         int i;
445
446         if (MV_PP_FLAG_EDMA_EN & pp->pp_flags) {
447                 /* Disable EDMA if active.   The disable bit auto clears.
448                  */
449                 writelfl(EDMA_DS, port_mmio + EDMA_CMD_OFS);
450                 pp->pp_flags &= ~MV_PP_FLAG_EDMA_EN;
451         } else {
452                 assert(!(EDMA_EN & readl(port_mmio + EDMA_CMD_OFS)));
453         }
454         
455         /* now properly wait for the eDMA to stop */
456         for (i = 1000; i > 0; i--) {
457                 reg = readl(port_mmio + EDMA_CMD_OFS);
458                 if (!(EDMA_EN & reg)) {
459                         break;
460                 }
461                 udelay(100);
462         }
463
464         if (EDMA_EN & reg) {
465                 printk(KERN_ERR "ata%u: Unable to stop eDMA\n", ap->id);
466                 /* FIXME: Consider doing a reset here to recover */
467         }
468 }
469
470 #ifdef ATA_DEBUG
471 static void mv_dump_mem(void __iomem *start, unsigned bytes)
472 {
473         int b, w;
474         for (b = 0; b < bytes; ) {
475                 DPRINTK("%p: ", start + b);
476                 for (w = 0; b < bytes && w < 4; w++) {
477                         printk("%08x ",readl(start + b));
478                         b += sizeof(u32);
479                 }
480                 printk("\n");
481         }
482 }
483 #endif
484
485 static void mv_dump_pci_cfg(struct pci_dev *pdev, unsigned bytes)
486 {
487 #ifdef ATA_DEBUG
488         int b, w;
489         u32 dw;
490         for (b = 0; b < bytes; ) {
491                 DPRINTK("%02x: ", b);
492                 for (w = 0; b < bytes && w < 4; w++) {
493                         (void) pci_read_config_dword(pdev,b,&dw);
494                         printk("%08x ",dw);
495                         b += sizeof(u32);
496                 }
497                 printk("\n");
498         }
499 #endif
500 }
501 static void mv_dump_all_regs(void __iomem *mmio_base, int port,
502                              struct pci_dev *pdev)
503 {
504 #ifdef ATA_DEBUG
505         void __iomem *hc_base = mv_hc_base(mmio_base, 
506                                            port >> MV_PORT_HC_SHIFT);
507         void __iomem *port_base;
508         int start_port, num_ports, p, start_hc, num_hcs, hc;
509
510         if (0 > port) {
511                 start_hc = start_port = 0;
512                 num_ports = 8;          /* shld be benign for 4 port devs */
513                 num_hcs = 2;
514         } else {
515                 start_hc = port >> MV_PORT_HC_SHIFT;
516                 start_port = port;
517                 num_ports = num_hcs = 1;
518         }
519         DPRINTK("All registers for port(s) %u-%u:\n", start_port, 
520                 num_ports > 1 ? num_ports - 1 : start_port);
521
522         if (NULL != pdev) {
523                 DPRINTK("PCI config space regs:\n");
524                 mv_dump_pci_cfg(pdev, 0x68);
525         }
526         DPRINTK("PCI regs:\n");
527         mv_dump_mem(mmio_base+0xc00, 0x3c);
528         mv_dump_mem(mmio_base+0xd00, 0x34);
529         mv_dump_mem(mmio_base+0xf00, 0x4);
530         mv_dump_mem(mmio_base+0x1d00, 0x6c);
531         for (hc = start_hc; hc < start_hc + num_hcs; hc++) {
532                 hc_base = mv_hc_base(mmio_base, port >> MV_PORT_HC_SHIFT);
533                 DPRINTK("HC regs (HC %i):\n", hc);
534                 mv_dump_mem(hc_base, 0x1c);
535         }
536         for (p = start_port; p < start_port + num_ports; p++) {
537                 port_base = mv_port_base(mmio_base, p);
538                 DPRINTK("EDMA regs (port %i):\n",p);
539                 mv_dump_mem(port_base, 0x54);
540                 DPRINTK("SATA regs (port %i):\n",p);
541                 mv_dump_mem(port_base+0x300, 0x60);
542         }
543 #endif
544 }
545
546 static unsigned int mv_scr_offset(unsigned int sc_reg_in)
547 {
548         unsigned int ofs;
549
550         switch (sc_reg_in) {
551         case SCR_STATUS:
552         case SCR_CONTROL:
553         case SCR_ERROR:
554                 ofs = SATA_STATUS_OFS + (sc_reg_in * sizeof(u32));
555                 break;
556         case SCR_ACTIVE:
557                 ofs = SATA_ACTIVE_OFS;   /* active is not with the others */
558                 break;
559         default:
560                 ofs = 0xffffffffU;
561                 break;
562         }
563         return ofs;
564 }
565
566 static u32 mv_scr_read(struct ata_port *ap, unsigned int sc_reg_in)
567 {
568         unsigned int ofs = mv_scr_offset(sc_reg_in);
569
570         if (0xffffffffU != ofs) {
571                 return readl(mv_ap_base(ap) + ofs);
572         } else {
573                 return (u32) ofs;
574         }
575 }
576
577 static void mv_scr_write(struct ata_port *ap, unsigned int sc_reg_in, u32 val)
578 {
579         unsigned int ofs = mv_scr_offset(sc_reg_in);
580
581         if (0xffffffffU != ofs) {
582                 writelfl(val, mv_ap_base(ap) + ofs);
583         }
584 }
585
586 /**
587  *      mv_global_soft_reset - Perform the 6xxx global soft reset
588  *      @mmio_base: base address of the HBA
589  *
590  *      This routine only applies to 6xxx parts.
591  *
592  *      LOCKING:
593  *      Inherited from caller.
594  */
595 static int mv_global_soft_reset(void __iomem *mmio_base)
596 {
597         void __iomem *reg = mmio_base + PCI_MAIN_CMD_STS_OFS;
598         int i, rc = 0;
599         u32 t;
600
601         /* Following procedure defined in PCI "main command and status
602          * register" table.
603          */
604         t = readl(reg);
605         writel(t | STOP_PCI_MASTER, reg);
606
607         for (i = 0; i < 1000; i++) {
608                 udelay(1);
609                 t = readl(reg);
610                 if (PCI_MASTER_EMPTY & t) {
611                         break;
612                 }
613         }
614         if (!(PCI_MASTER_EMPTY & t)) {
615                 printk(KERN_ERR DRV_NAME ": PCI master won't flush\n");
616                 rc = 1;
617                 goto done;
618         }
619
620         /* set reset */
621         i = 5;
622         do {
623                 writel(t | GLOB_SFT_RST, reg);
624                 t = readl(reg);
625                 udelay(1);
626         } while (!(GLOB_SFT_RST & t) && (i-- > 0));
627
628         if (!(GLOB_SFT_RST & t)) {
629                 printk(KERN_ERR DRV_NAME ": can't set global reset\n");
630                 rc = 1;
631                 goto done;
632         }
633
634         /* clear reset and *reenable the PCI master* (not mentioned in spec) */
635         i = 5;
636         do {
637                 writel(t & ~(GLOB_SFT_RST | STOP_PCI_MASTER), reg);
638                 t = readl(reg);
639                 udelay(1);
640         } while ((GLOB_SFT_RST & t) && (i-- > 0));
641
642         if (GLOB_SFT_RST & t) {
643                 printk(KERN_ERR DRV_NAME ": can't clear global reset\n");
644                 rc = 1;
645         }
646 done:
647         return rc;
648 }
649
650 /**
651  *      mv_host_stop - Host specific cleanup/stop routine.
652  *      @host_set: host data structure
653  *
654  *      Disable ints, cleanup host memory, call general purpose
655  *      host_stop.
656  *
657  *      LOCKING:
658  *      Inherited from caller.
659  */
660 static void mv_host_stop(struct ata_host_set *host_set)
661 {
662         struct mv_host_priv *hpriv = host_set->private_data;
663         struct pci_dev *pdev = to_pci_dev(host_set->dev);
664
665         if (hpriv->hp_flags & MV_HP_FLAG_MSI) {
666                 pci_disable_msi(pdev);
667         } else {
668                 pci_intx(pdev, 0);
669         }
670         kfree(hpriv);
671         ata_host_stop(host_set);
672 }
673
674 /**
675  *      mv_port_start - Port specific init/start routine.
676  *      @ap: ATA channel to manipulate
677  *
678  *      Allocate and point to DMA memory, init port private memory,
679  *      zero indices.
680  *
681  *      LOCKING:
682  *      Inherited from caller.
683  */
684 static int mv_port_start(struct ata_port *ap)
685 {
686         struct device *dev = ap->host_set->dev;
687         struct mv_port_priv *pp;
688         void __iomem *port_mmio = mv_ap_base(ap);
689         void *mem;
690         dma_addr_t mem_dma;
691
692         pp = kmalloc(sizeof(*pp), GFP_KERNEL);
693         if (!pp) {
694                 return -ENOMEM;
695         }
696         memset(pp, 0, sizeof(*pp));
697
698         mem = dma_alloc_coherent(dev, MV_PORT_PRIV_DMA_SZ, &mem_dma, 
699                                  GFP_KERNEL);
700         if (!mem) {
701                 kfree(pp);
702                 return -ENOMEM;
703         }
704         memset(mem, 0, MV_PORT_PRIV_DMA_SZ);
705
706         /* First item in chunk of DMA memory: 
707          * 32-slot command request table (CRQB), 32 bytes each in size
708          */
709         pp->crqb = mem;
710         pp->crqb_dma = mem_dma;
711         mem += MV_CRQB_Q_SZ;
712         mem_dma += MV_CRQB_Q_SZ;
713
714         /* Second item: 
715          * 32-slot command response table (CRPB), 8 bytes each in size
716          */
717         pp->crpb = mem;
718         pp->crpb_dma = mem_dma;
719         mem += MV_CRPB_Q_SZ;
720         mem_dma += MV_CRPB_Q_SZ;
721
722         /* Third item:
723          * Table of scatter-gather descriptors (ePRD), 16 bytes each
724          */
725         pp->sg_tbl = mem;
726         pp->sg_tbl_dma = mem_dma;
727
728         writelfl(EDMA_CFG_Q_DEPTH | EDMA_CFG_RD_BRST_EXT | 
729                  EDMA_CFG_WR_BUFF_LEN, port_mmio + EDMA_CFG_OFS);
730
731         writel((pp->crqb_dma >> 16) >> 16, port_mmio + EDMA_REQ_Q_BASE_HI_OFS);
732         writelfl(pp->crqb_dma & EDMA_REQ_Q_BASE_LO_MASK, 
733                  port_mmio + EDMA_REQ_Q_IN_PTR_OFS);
734
735         writelfl(0, port_mmio + EDMA_REQ_Q_OUT_PTR_OFS);
736         writelfl(0, port_mmio + EDMA_RSP_Q_IN_PTR_OFS);
737
738         writel((pp->crpb_dma >> 16) >> 16, port_mmio + EDMA_RSP_Q_BASE_HI_OFS);
739         writelfl(pp->crpb_dma & EDMA_RSP_Q_BASE_LO_MASK, 
740                  port_mmio + EDMA_RSP_Q_OUT_PTR_OFS);
741
742         pp->req_producer = pp->rsp_consumer = 0;
743
744         /* Don't turn on EDMA here...do it before DMA commands only.  Else
745          * we'll be unable to send non-data, PIO, etc due to restricted access
746          * to shadow regs.
747          */
748         ap->private_data = pp;
749         return 0;
750 }
751
752 /**
753  *      mv_port_stop - Port specific cleanup/stop routine.
754  *      @ap: ATA channel to manipulate
755  *
756  *      Stop DMA, cleanup port memory.
757  *
758  *      LOCKING:
759  *      This routine uses the host_set lock to protect the DMA stop.
760  */
761 static void mv_port_stop(struct ata_port *ap)
762 {
763         struct device *dev = ap->host_set->dev;
764         struct mv_port_priv *pp = ap->private_data;
765         unsigned long flags;
766
767         spin_lock_irqsave(&ap->host_set->lock, flags);
768         mv_stop_dma(ap);
769         spin_unlock_irqrestore(&ap->host_set->lock, flags);
770
771         ap->private_data = NULL;
772         dma_free_coherent(dev, MV_PORT_PRIV_DMA_SZ, pp->crpb, pp->crpb_dma);
773         kfree(pp);
774 }
775
776 /**
777  *      mv_fill_sg - Fill out the Marvell ePRD (scatter gather) entries
778  *      @qc: queued command whose SG list to source from
779  *
780  *      Populate the SG list and mark the last entry.
781  *
782  *      LOCKING:
783  *      Inherited from caller.
784  */
785 static void mv_fill_sg(struct ata_queued_cmd *qc)
786 {
787         struct mv_port_priv *pp = qc->ap->private_data;
788         unsigned int i = 0;
789         struct scatterlist *sg;
790
791         ata_for_each_sg(sg, qc) {
792                 u32 sg_len;
793                 dma_addr_t addr;
794
795                 addr = sg_dma_address(sg);
796                 sg_len = sg_dma_len(sg);
797
798                 pp->sg_tbl[i].addr = cpu_to_le32(addr & 0xffffffff);
799                 pp->sg_tbl[i].addr_hi = cpu_to_le32((addr >> 16) >> 16);
800                 assert(0 == (sg_len & ~MV_DMA_BOUNDARY));
801                 pp->sg_tbl[i].flags_size = cpu_to_le32(sg_len);
802                 if (ata_sg_is_last(sg, qc))
803                         pp->sg_tbl[i].flags_size |= cpu_to_le32(EPRD_FLAG_END_OF_TBL);
804
805                 i++;
806         }
807 }
808
809 static inline unsigned mv_inc_q_index(unsigned *index)
810 {
811         *index = (*index + 1) & MV_MAX_Q_DEPTH_MASK;
812         return *index;
813 }
814
815 static inline void mv_crqb_pack_cmd(u16 *cmdw, u8 data, u8 addr, unsigned last)
816 {
817         *cmdw = data | (addr << CRQB_CMD_ADDR_SHIFT) | CRQB_CMD_CS |
818                 (last ? CRQB_CMD_LAST : 0);
819 }
820
821 /**
822  *      mv_qc_prep - Host specific command preparation.
823  *      @qc: queued command to prepare
824  *
825  *      This routine simply redirects to the general purpose routine
826  *      if command is not DMA.  Else, it handles prep of the CRQB
827  *      (command request block), does some sanity checking, and calls
828  *      the SG load routine.
829  *
830  *      LOCKING:
831  *      Inherited from caller.
832  */
833 static void mv_qc_prep(struct ata_queued_cmd *qc)
834 {
835         struct ata_port *ap = qc->ap;
836         struct mv_port_priv *pp = ap->private_data;
837         u16 *cw;
838         struct ata_taskfile *tf;
839         u16 flags = 0;
840
841         if (ATA_PROT_DMA != qc->tf.protocol) {
842                 return;
843         }
844
845         /* the req producer index should be the same as we remember it */
846         assert(((readl(mv_ap_base(qc->ap) + EDMA_REQ_Q_IN_PTR_OFS) >> 
847                  EDMA_REQ_Q_PTR_SHIFT) & MV_MAX_Q_DEPTH_MASK) ==
848                pp->req_producer);
849
850         /* Fill in command request block
851          */
852         if (!(qc->tf.flags & ATA_TFLAG_WRITE)) {
853                 flags |= CRQB_FLAG_READ;
854         }
855         assert(MV_MAX_Q_DEPTH > qc->tag);
856         flags |= qc->tag << CRQB_TAG_SHIFT;
857
858         pp->crqb[pp->req_producer].sg_addr = 
859                 cpu_to_le32(pp->sg_tbl_dma & 0xffffffff);
860         pp->crqb[pp->req_producer].sg_addr_hi = 
861                 cpu_to_le32((pp->sg_tbl_dma >> 16) >> 16);
862         pp->crqb[pp->req_producer].ctrl_flags = cpu_to_le16(flags);
863
864         cw = &pp->crqb[pp->req_producer].ata_cmd[0];
865         tf = &qc->tf;
866
867         /* Sadly, the CRQB cannot accomodate all registers--there are
868          * only 11 bytes...so we must pick and choose required
869          * registers based on the command.  So, we drop feature and
870          * hob_feature for [RW] DMA commands, but they are needed for
871          * NCQ.  NCQ will drop hob_nsect.
872          */
873         switch (tf->command) {
874         case ATA_CMD_READ:
875         case ATA_CMD_READ_EXT:
876         case ATA_CMD_WRITE:
877         case ATA_CMD_WRITE_EXT:
878                 mv_crqb_pack_cmd(cw++, tf->hob_nsect, ATA_REG_NSECT, 0);
879                 break;
880 #ifdef LIBATA_NCQ               /* FIXME: remove this line when NCQ added */
881         case ATA_CMD_FPDMA_READ:
882         case ATA_CMD_FPDMA_WRITE:
883                 mv_crqb_pack_cmd(cw++, tf->hob_feature, ATA_REG_FEATURE, 0); 
884                 mv_crqb_pack_cmd(cw++, tf->feature, ATA_REG_FEATURE, 0);
885                 break;
886 #endif                          /* FIXME: remove this line when NCQ added */
887         default:
888                 /* The only other commands EDMA supports in non-queued and
889                  * non-NCQ mode are: [RW] STREAM DMA and W DMA FUA EXT, none
890                  * of which are defined/used by Linux.  If we get here, this
891                  * driver needs work.
892                  *
893                  * FIXME: modify libata to give qc_prep a return value and
894                  * return error here.
895                  */
896                 BUG_ON(tf->command);
897                 break;
898         }
899         mv_crqb_pack_cmd(cw++, tf->nsect, ATA_REG_NSECT, 0);
900         mv_crqb_pack_cmd(cw++, tf->hob_lbal, ATA_REG_LBAL, 0);
901         mv_crqb_pack_cmd(cw++, tf->lbal, ATA_REG_LBAL, 0);
902         mv_crqb_pack_cmd(cw++, tf->hob_lbam, ATA_REG_LBAM, 0);
903         mv_crqb_pack_cmd(cw++, tf->lbam, ATA_REG_LBAM, 0);
904         mv_crqb_pack_cmd(cw++, tf->hob_lbah, ATA_REG_LBAH, 0);
905         mv_crqb_pack_cmd(cw++, tf->lbah, ATA_REG_LBAH, 0);
906         mv_crqb_pack_cmd(cw++, tf->device, ATA_REG_DEVICE, 0);
907         mv_crqb_pack_cmd(cw++, tf->command, ATA_REG_CMD, 1);    /* last */
908
909         if (!(qc->flags & ATA_QCFLAG_DMAMAP)) {
910                 return;
911         }
912         mv_fill_sg(qc);
913 }
914
915 /**
916  *      mv_qc_issue - Initiate a command to the host
917  *      @qc: queued command to start
918  *
919  *      This routine simply redirects to the general purpose routine
920  *      if command is not DMA.  Else, it sanity checks our local
921  *      caches of the request producer/consumer indices then enables
922  *      DMA and bumps the request producer index.
923  *
924  *      LOCKING:
925  *      Inherited from caller.
926  */
927 static int mv_qc_issue(struct ata_queued_cmd *qc)
928 {
929         void __iomem *port_mmio = mv_ap_base(qc->ap);
930         struct mv_port_priv *pp = qc->ap->private_data;
931         u32 in_ptr;
932
933         if (ATA_PROT_DMA != qc->tf.protocol) {
934                 /* We're about to send a non-EDMA capable command to the
935                  * port.  Turn off EDMA so there won't be problems accessing
936                  * shadow block, etc registers.
937                  */
938                 mv_stop_dma(qc->ap);
939                 return ata_qc_issue_prot(qc);
940         }
941
942         in_ptr = readl(port_mmio + EDMA_REQ_Q_IN_PTR_OFS);
943
944         /* the req producer index should be the same as we remember it */
945         assert(((in_ptr >> EDMA_REQ_Q_PTR_SHIFT) & MV_MAX_Q_DEPTH_MASK) ==
946                pp->req_producer);
947         /* until we do queuing, the queue should be empty at this point */
948         assert(((in_ptr >> EDMA_REQ_Q_PTR_SHIFT) & MV_MAX_Q_DEPTH_MASK) ==
949                ((readl(port_mmio + EDMA_REQ_Q_OUT_PTR_OFS) >> 
950                  EDMA_REQ_Q_PTR_SHIFT) & MV_MAX_Q_DEPTH_MASK));
951
952         mv_inc_q_index(&pp->req_producer);      /* now incr producer index */
953
954         mv_start_dma(port_mmio, pp);
955
956         /* and write the request in pointer to kick the EDMA to life */
957         in_ptr &= EDMA_REQ_Q_BASE_LO_MASK;
958         in_ptr |= pp->req_producer << EDMA_REQ_Q_PTR_SHIFT;
959         writelfl(in_ptr, port_mmio + EDMA_REQ_Q_IN_PTR_OFS);
960
961         return 0;
962 }
963
964 /**
965  *      mv_get_crpb_status - get status from most recently completed cmd
966  *      @ap: ATA channel to manipulate
967  *
968  *      This routine is for use when the port is in DMA mode, when it
969  *      will be using the CRPB (command response block) method of
970  *      returning command completion information.  We assert indices
971  *      are good, grab status, and bump the response consumer index to
972  *      prove that we're up to date.
973  *
974  *      LOCKING:
975  *      Inherited from caller.
976  */
977 static u8 mv_get_crpb_status(struct ata_port *ap)
978 {
979         void __iomem *port_mmio = mv_ap_base(ap);
980         struct mv_port_priv *pp = ap->private_data;
981         u32 out_ptr;
982
983         out_ptr = readl(port_mmio + EDMA_RSP_Q_OUT_PTR_OFS);
984
985         /* the response consumer index should be the same as we remember it */
986         assert(((out_ptr >> EDMA_RSP_Q_PTR_SHIFT) & MV_MAX_Q_DEPTH_MASK) == 
987                pp->rsp_consumer);
988
989         /* increment our consumer index... */
990         pp->rsp_consumer = mv_inc_q_index(&pp->rsp_consumer);
991         
992         /* and, until we do NCQ, there should only be 1 CRPB waiting */
993         assert(((readl(port_mmio + EDMA_RSP_Q_IN_PTR_OFS) >> 
994                  EDMA_RSP_Q_PTR_SHIFT) & MV_MAX_Q_DEPTH_MASK) == 
995                pp->rsp_consumer);
996
997         /* write out our inc'd consumer index so EDMA knows we're caught up */
998         out_ptr &= EDMA_RSP_Q_BASE_LO_MASK;
999         out_ptr |= pp->rsp_consumer << EDMA_RSP_Q_PTR_SHIFT;
1000         writelfl(out_ptr, port_mmio + EDMA_RSP_Q_OUT_PTR_OFS);
1001
1002         /* Return ATA status register for completed CRPB */
1003         return (pp->crpb[pp->rsp_consumer].flags >> CRPB_FLAG_STATUS_SHIFT);
1004 }
1005
1006 /**
1007  *      mv_err_intr - Handle error interrupts on the port
1008  *      @ap: ATA channel to manipulate
1009  *
1010  *      In most cases, just clear the interrupt and move on.  However,
1011  *      some cases require an eDMA reset, which is done right before
1012  *      the COMRESET in mv_phy_reset().  The SERR case requires a
1013  *      clear of pending errors in the SATA SERROR register.  Finally,
1014  *      if the port disabled DMA, update our cached copy to match.
1015  *
1016  *      LOCKING:
1017  *      Inherited from caller.
1018  */
1019 static void mv_err_intr(struct ata_port *ap)
1020 {
1021         void __iomem *port_mmio = mv_ap_base(ap);
1022         u32 edma_err_cause, serr = 0;
1023
1024         edma_err_cause = readl(port_mmio + EDMA_ERR_IRQ_CAUSE_OFS);
1025
1026         if (EDMA_ERR_SERR & edma_err_cause) {
1027                 serr = scr_read(ap, SCR_ERROR);
1028                 scr_write_flush(ap, SCR_ERROR, serr);
1029         }
1030         if (EDMA_ERR_SELF_DIS & edma_err_cause) {
1031                 struct mv_port_priv *pp = ap->private_data;
1032                 pp->pp_flags &= ~MV_PP_FLAG_EDMA_EN;
1033         }
1034         DPRINTK(KERN_ERR "ata%u: port error; EDMA err cause: 0x%08x "
1035                 "SERR: 0x%08x\n", ap->id, edma_err_cause, serr);
1036
1037         /* Clear EDMA now that SERR cleanup done */
1038         writelfl(0, port_mmio + EDMA_ERR_IRQ_CAUSE_OFS);
1039
1040         /* check for fatal here and recover if needed */
1041         if (EDMA_ERR_FATAL & edma_err_cause) {
1042                 mv_phy_reset(ap);
1043         }
1044 }
1045
1046 /**
1047  *      mv_host_intr - Handle all interrupts on the given host controller
1048  *      @host_set: host specific structure
1049  *      @relevant: port error bits relevant to this host controller
1050  *      @hc: which host controller we're to look at
1051  *
1052  *      Read then write clear the HC interrupt status then walk each
1053  *      port connected to the HC and see if it needs servicing.  Port
1054  *      success ints are reported in the HC interrupt status reg, the
1055  *      port error ints are reported in the higher level main
1056  *      interrupt status register and thus are passed in via the
1057  *      'relevant' argument.
1058  *
1059  *      LOCKING:
1060  *      Inherited from caller.
1061  */
1062 static void mv_host_intr(struct ata_host_set *host_set, u32 relevant,
1063                          unsigned int hc)
1064 {
1065         void __iomem *mmio = host_set->mmio_base;
1066         void __iomem *hc_mmio = mv_hc_base(mmio, hc);
1067         struct ata_port *ap;
1068         struct ata_queued_cmd *qc;
1069         u32 hc_irq_cause;
1070         int shift, port, port0, hard_port, handled;
1071         u8 ata_status = 0;
1072
1073         if (hc == 0) {
1074                 port0 = 0;
1075         } else {
1076                 port0 = MV_PORTS_PER_HC;
1077         }
1078
1079         /* we'll need the HC success int register in most cases */
1080         hc_irq_cause = readl(hc_mmio + HC_IRQ_CAUSE_OFS);
1081         if (hc_irq_cause) {
1082                 writelfl(~hc_irq_cause, hc_mmio + HC_IRQ_CAUSE_OFS);
1083         }
1084
1085         VPRINTK("ENTER, hc%u relevant=0x%08x HC IRQ cause=0x%08x\n",
1086                 hc,relevant,hc_irq_cause);
1087
1088         for (port = port0; port < port0 + MV_PORTS_PER_HC; port++) {
1089                 ap = host_set->ports[port];
1090                 hard_port = port & MV_PORT_MASK;        /* range 0-3 */
1091                 handled = 0;    /* ensure ata_status is set if handled++ */
1092
1093                 if ((CRPB_DMA_DONE << hard_port) & hc_irq_cause) {
1094                         /* new CRPB on the queue; just one at a time until NCQ
1095                          */
1096                         ata_status = mv_get_crpb_status(ap);
1097                         handled++;
1098                 } else if ((DEV_IRQ << hard_port) & hc_irq_cause) {
1099                         /* received ATA IRQ; read the status reg to clear INTRQ
1100                          */
1101                         ata_status = readb((void __iomem *)
1102                                            ap->ioaddr.status_addr);
1103                         handled++;
1104                 }
1105
1106                 shift = port << 1;              /* (port * 2) */
1107                 if (port >= MV_PORTS_PER_HC) {
1108                         shift++;        /* skip bit 8 in the HC Main IRQ reg */
1109                 }
1110                 if ((PORT0_ERR << shift) & relevant) {
1111                         mv_err_intr(ap);
1112                         /* OR in ATA_ERR to ensure libata knows we took one */
1113                         ata_status = readb((void __iomem *)
1114                                            ap->ioaddr.status_addr) | ATA_ERR;
1115                         handled++;
1116                 }
1117                 
1118                 if (handled && ap) {
1119                         qc = ata_qc_from_tag(ap, ap->active_tag);
1120                         if (NULL != qc) {
1121                                 VPRINTK("port %u IRQ found for qc, "
1122                                         "ata_status 0x%x\n", port,ata_status);
1123                                 /* mark qc status appropriately */
1124                                 ata_qc_complete(qc, ata_status);
1125                         }
1126                 }
1127         }
1128         VPRINTK("EXIT\n");
1129 }
1130
1131 /**
1132  *      mv_interrupt - 
1133  *      @irq: unused
1134  *      @dev_instance: private data; in this case the host structure
1135  *      @regs: unused
1136  *
1137  *      Read the read only register to determine if any host
1138  *      controllers have pending interrupts.  If so, call lower level
1139  *      routine to handle.  Also check for PCI errors which are only
1140  *      reported here.
1141  *
1142  *      LOCKING: 
1143  *      This routine holds the host_set lock while processing pending
1144  *      interrupts.
1145  */
1146 static irqreturn_t mv_interrupt(int irq, void *dev_instance,
1147                                 struct pt_regs *regs)
1148 {
1149         struct ata_host_set *host_set = dev_instance;
1150         unsigned int hc, handled = 0, n_hcs;
1151         void __iomem *mmio = host_set->mmio_base;
1152         u32 irq_stat;
1153
1154         irq_stat = readl(mmio + HC_MAIN_IRQ_CAUSE_OFS);
1155
1156         /* check the cases where we either have nothing pending or have read
1157          * a bogus register value which can indicate HW removal or PCI fault
1158          */
1159         if (!irq_stat || (0xffffffffU == irq_stat)) {
1160                 return IRQ_NONE;
1161         }
1162
1163         n_hcs = mv_get_hc_count(host_set->ports[0]->flags);
1164         spin_lock(&host_set->lock);
1165
1166         for (hc = 0; hc < n_hcs; hc++) {
1167                 u32 relevant = irq_stat & (HC0_IRQ_PEND << (hc * HC_SHIFT));
1168                 if (relevant) {
1169                         mv_host_intr(host_set, relevant, hc);
1170                         handled++;
1171                 }
1172         }
1173         if (PCI_ERR & irq_stat) {
1174                 printk(KERN_ERR DRV_NAME ": PCI ERROR; PCI IRQ cause=0x%08x\n",
1175                        readl(mmio + PCI_IRQ_CAUSE_OFS));
1176
1177                 DPRINTK("All regs @ PCI error\n");
1178                 mv_dump_all_regs(mmio, -1, to_pci_dev(host_set->dev));
1179
1180                 writelfl(0, mmio + PCI_IRQ_CAUSE_OFS);
1181                 handled++;
1182         }
1183         spin_unlock(&host_set->lock);
1184
1185         return IRQ_RETVAL(handled);
1186 }
1187
1188 /**
1189  *      mv_check_err - Return the error shadow register to caller.
1190  *      @ap: ATA channel to manipulate
1191  *
1192  *      Marvell requires DMA to be stopped before accessing shadow
1193  *      registers.  So we do that, then return the needed register.
1194  *
1195  *      LOCKING:
1196  *      Inherited from caller.  FIXME: protect mv_stop_dma with lock?
1197  */
1198 static u8 mv_check_err(struct ata_port *ap)
1199 {
1200         mv_stop_dma(ap);                /* can't read shadow regs if DMA on */
1201         return readb((void __iomem *) ap->ioaddr.error_addr);
1202 }
1203
1204 /**
1205  *      mv_phy_reset - Perform eDMA reset followed by COMRESET
1206  *      @ap: ATA channel to manipulate
1207  *
1208  *      Part of this is taken from __sata_phy_reset and modified to
1209  *      not sleep since this routine gets called from interrupt level.
1210  *
1211  *      LOCKING:
1212  *      Inherited from caller.  This is coded to safe to call at
1213  *      interrupt level, i.e. it does not sleep.
1214  */
1215 static void mv_phy_reset(struct ata_port *ap)
1216 {
1217         void __iomem *port_mmio = mv_ap_base(ap);
1218         struct ata_taskfile tf;
1219         struct ata_device *dev = &ap->device[0];
1220         unsigned long timeout;
1221
1222         VPRINTK("ENTER, port %u, mmio 0x%p\n", ap->port_no, port_mmio);
1223
1224         mv_stop_dma(ap);
1225
1226         writelfl(ATA_RST, port_mmio + EDMA_CMD_OFS);
1227         udelay(25);             /* allow reset propagation */
1228
1229         /* Spec never mentions clearing the bit.  Marvell's driver does
1230          * clear the bit, however.
1231          */
1232         writelfl(0, port_mmio + EDMA_CMD_OFS);
1233
1234         VPRINTK("S-regs after ATA_RST: SStat 0x%08x SErr 0x%08x "
1235                 "SCtrl 0x%08x\n", mv_scr_read(ap, SCR_STATUS),
1236                 mv_scr_read(ap, SCR_ERROR), mv_scr_read(ap, SCR_CONTROL));
1237
1238         /* proceed to init communications via the scr_control reg */
1239         scr_write_flush(ap, SCR_CONTROL, 0x301);
1240         mdelay(1);
1241         scr_write_flush(ap, SCR_CONTROL, 0x300);
1242         timeout = jiffies + (HZ * 1);
1243         do {
1244                 mdelay(10);
1245                 if ((scr_read(ap, SCR_STATUS) & 0xf) != 1)
1246                         break;
1247         } while (time_before(jiffies, timeout));
1248
1249         VPRINTK("S-regs after PHY wake: SStat 0x%08x SErr 0x%08x "
1250                 "SCtrl 0x%08x\n", mv_scr_read(ap, SCR_STATUS),
1251                 mv_scr_read(ap, SCR_ERROR), mv_scr_read(ap, SCR_CONTROL));
1252
1253         if (sata_dev_present(ap)) {
1254                 ata_port_probe(ap);
1255         } else {
1256                 printk(KERN_INFO "ata%u: no device found (phy stat %08x)\n",
1257                        ap->id, scr_read(ap, SCR_STATUS));
1258                 ata_port_disable(ap);
1259                 return;
1260         }
1261         ap->cbl = ATA_CBL_SATA;
1262
1263         tf.lbah = readb((void __iomem *) ap->ioaddr.lbah_addr);
1264         tf.lbam = readb((void __iomem *) ap->ioaddr.lbam_addr);
1265         tf.lbal = readb((void __iomem *) ap->ioaddr.lbal_addr);
1266         tf.nsect = readb((void __iomem *) ap->ioaddr.nsect_addr);
1267
1268         dev->class = ata_dev_classify(&tf);
1269         if (!ata_dev_present(dev)) {
1270                 VPRINTK("Port disabled post-sig: No device present.\n");
1271                 ata_port_disable(ap);
1272         }
1273         VPRINTK("EXIT\n");
1274 }
1275
1276 /**
1277  *      mv_eng_timeout - Routine called by libata when SCSI times out I/O
1278  *      @ap: ATA channel to manipulate
1279  *
1280  *      Intent is to clear all pending error conditions, reset the
1281  *      chip/bus, fail the command, and move on.
1282  *
1283  *      LOCKING:
1284  *      This routine holds the host_set lock while failing the command.
1285  */
1286 static void mv_eng_timeout(struct ata_port *ap)
1287 {
1288         struct ata_queued_cmd *qc;
1289         unsigned long flags;
1290
1291         printk(KERN_ERR "ata%u: Entering mv_eng_timeout\n",ap->id);
1292         DPRINTK("All regs @ start of eng_timeout\n");
1293         mv_dump_all_regs(ap->host_set->mmio_base, ap->port_no, 
1294                          to_pci_dev(ap->host_set->dev));
1295
1296         qc = ata_qc_from_tag(ap, ap->active_tag);
1297         printk(KERN_ERR "mmio_base %p ap %p qc %p scsi_cmnd %p &cmnd %p\n",
1298                ap->host_set->mmio_base, ap, qc, qc->scsicmd, 
1299                &qc->scsicmd->cmnd);
1300
1301         mv_err_intr(ap);
1302         mv_phy_reset(ap);
1303
1304         if (!qc) {
1305                 printk(KERN_ERR "ata%u: BUG: timeout without command\n",
1306                        ap->id);
1307         } else {
1308                 /* hack alert!  We cannot use the supplied completion
1309                  * function from inside the ->eh_strategy_handler() thread.
1310                  * libata is the only user of ->eh_strategy_handler() in
1311                  * any kernel, so the default scsi_done() assumes it is
1312                  * not being called from the SCSI EH.
1313                  */
1314                 spin_lock_irqsave(&ap->host_set->lock, flags);
1315                 qc->scsidone = scsi_finish_command;
1316                 ata_qc_complete(qc, ATA_ERR);
1317                 spin_unlock_irqrestore(&ap->host_set->lock, flags);
1318         }
1319 }
1320
1321 /**
1322  *      mv_port_init - Perform some early initialization on a single port.
1323  *      @port: libata data structure storing shadow register addresses
1324  *      @port_mmio: base address of the port
1325  *
1326  *      Initialize shadow register mmio addresses, clear outstanding
1327  *      interrupts on the port, and unmask interrupts for the future
1328  *      start of the port.
1329  *
1330  *      LOCKING:
1331  *      Inherited from caller.
1332  */
1333 static void mv_port_init(struct ata_ioports *port,  void __iomem *port_mmio)
1334 {
1335         unsigned long shd_base = (unsigned long) port_mmio + SHD_BLK_OFS;
1336         unsigned serr_ofs;
1337
1338         /* PIO related setup 
1339          */
1340         port->data_addr = shd_base + (sizeof(u32) * ATA_REG_DATA);
1341         port->error_addr = 
1342                 port->feature_addr = shd_base + (sizeof(u32) * ATA_REG_ERR);
1343         port->nsect_addr = shd_base + (sizeof(u32) * ATA_REG_NSECT);
1344         port->lbal_addr = shd_base + (sizeof(u32) * ATA_REG_LBAL);
1345         port->lbam_addr = shd_base + (sizeof(u32) * ATA_REG_LBAM);
1346         port->lbah_addr = shd_base + (sizeof(u32) * ATA_REG_LBAH);
1347         port->device_addr = shd_base + (sizeof(u32) * ATA_REG_DEVICE);
1348         port->status_addr = 
1349                 port->command_addr = shd_base + (sizeof(u32) * ATA_REG_STATUS);
1350         /* special case: control/altstatus doesn't have ATA_REG_ address */
1351         port->altstatus_addr = port->ctl_addr = shd_base + SHD_CTL_AST_OFS;
1352
1353         /* unused: */
1354         port->cmd_addr = port->bmdma_addr = port->scr_addr = 0;
1355
1356         /* Clear any currently outstanding port interrupt conditions */
1357         serr_ofs = mv_scr_offset(SCR_ERROR);
1358         writelfl(readl(port_mmio + serr_ofs), port_mmio + serr_ofs);
1359         writelfl(0, port_mmio + EDMA_ERR_IRQ_CAUSE_OFS);
1360
1361         /* unmask all EDMA error interrupts */
1362         writelfl(~0, port_mmio + EDMA_ERR_IRQ_MASK_OFS);
1363
1364         VPRINTK("EDMA cfg=0x%08x EDMA IRQ err cause/mask=0x%08x/0x%08x\n", 
1365                 readl(port_mmio + EDMA_CFG_OFS),
1366                 readl(port_mmio + EDMA_ERR_IRQ_CAUSE_OFS),
1367                 readl(port_mmio + EDMA_ERR_IRQ_MASK_OFS));
1368 }
1369
1370 /**
1371  *      mv_host_init - Perform some early initialization of the host.
1372  *      @probe_ent: early data struct representing the host
1373  *
1374  *      If possible, do an early global reset of the host.  Then do
1375  *      our port init and clear/unmask all/relevant host interrupts.
1376  *
1377  *      LOCKING:
1378  *      Inherited from caller.
1379  */
1380 static int mv_host_init(struct ata_probe_ent *probe_ent)
1381 {
1382         int rc = 0, n_hc, port, hc;
1383         void __iomem *mmio = probe_ent->mmio_base;
1384         void __iomem *port_mmio;
1385
1386         if ((MV_FLAG_GLBL_SFT_RST & probe_ent->host_flags) && 
1387             mv_global_soft_reset(probe_ent->mmio_base)) {
1388                 rc = 1;
1389                 goto done;
1390         }
1391
1392         n_hc = mv_get_hc_count(probe_ent->host_flags);
1393         probe_ent->n_ports = MV_PORTS_PER_HC * n_hc;
1394
1395         for (port = 0; port < probe_ent->n_ports; port++) {
1396                 port_mmio = mv_port_base(mmio, port);
1397                 mv_port_init(&probe_ent->port[port], port_mmio);
1398         }
1399
1400         for (hc = 0; hc < n_hc; hc++) {
1401                 void __iomem *hc_mmio = mv_hc_base(mmio, hc);
1402
1403                 VPRINTK("HC%i: HC config=0x%08x HC IRQ cause "
1404                         "(before clear)=0x%08x\n", hc,
1405                         readl(hc_mmio + HC_CFG_OFS),
1406                         readl(hc_mmio + HC_IRQ_CAUSE_OFS));
1407
1408                 /* Clear any currently outstanding hc interrupt conditions */
1409                 writelfl(0, hc_mmio + HC_IRQ_CAUSE_OFS);
1410         }
1411
1412         /* Clear any currently outstanding host interrupt conditions */
1413         writelfl(0, mmio + PCI_IRQ_CAUSE_OFS);
1414
1415         /* and unmask interrupt generation for host regs */
1416         writelfl(PCI_UNMASK_ALL_IRQS, mmio + PCI_IRQ_MASK_OFS);
1417         writelfl(~HC_MAIN_MASKED_IRQS, mmio + HC_MAIN_IRQ_MASK_OFS);
1418
1419         VPRINTK("HC MAIN IRQ cause/mask=0x%08x/0x%08x "
1420                 "PCI int cause/mask=0x%08x/0x%08x\n", 
1421                 readl(mmio + HC_MAIN_IRQ_CAUSE_OFS),
1422                 readl(mmio + HC_MAIN_IRQ_MASK_OFS),
1423                 readl(mmio + PCI_IRQ_CAUSE_OFS),
1424                 readl(mmio + PCI_IRQ_MASK_OFS));
1425 done:
1426         return rc;
1427 }
1428
1429 /**
1430  *      mv_print_info - Dump key info to kernel log for perusal.
1431  *      @probe_ent: early data struct representing the host
1432  *
1433  *      FIXME: complete this.
1434  *
1435  *      LOCKING:
1436  *      Inherited from caller.
1437  */
1438 static void mv_print_info(struct ata_probe_ent *probe_ent)
1439 {
1440         struct pci_dev *pdev = to_pci_dev(probe_ent->dev);
1441         struct mv_host_priv *hpriv = probe_ent->private_data;
1442         u8 rev_id, scc;
1443         const char *scc_s;
1444
1445         /* Use this to determine the HW stepping of the chip so we know
1446          * what errata to workaround
1447          */
1448         pci_read_config_byte(pdev, PCI_REVISION_ID, &rev_id);
1449
1450         pci_read_config_byte(pdev, PCI_CLASS_DEVICE, &scc);
1451         if (scc == 0)
1452                 scc_s = "SCSI";
1453         else if (scc == 0x01)
1454                 scc_s = "RAID";
1455         else
1456                 scc_s = "unknown";
1457
1458         printk(KERN_INFO DRV_NAME 
1459                "(%s) %u slots %u ports %s mode IRQ via %s\n",
1460                pci_name(pdev), (unsigned)MV_MAX_Q_DEPTH, probe_ent->n_ports, 
1461                scc_s, (MV_HP_FLAG_MSI & hpriv->hp_flags) ? "MSI" : "INTx");
1462 }
1463
1464 /**
1465  *      mv_init_one - handle a positive probe of a Marvell host
1466  *      @pdev: PCI device found
1467  *      @ent: PCI device ID entry for the matched host
1468  *
1469  *      LOCKING:
1470  *      Inherited from caller.
1471  */
1472 static int mv_init_one(struct pci_dev *pdev, const struct pci_device_id *ent)
1473 {
1474         static int printed_version = 0;
1475         struct ata_probe_ent *probe_ent = NULL;
1476         struct mv_host_priv *hpriv;
1477         unsigned int board_idx = (unsigned int)ent->driver_data;
1478         void __iomem *mmio_base;
1479         int pci_dev_busy = 0, rc;
1480
1481         if (!printed_version++) {
1482                 printk(KERN_INFO DRV_NAME " version " DRV_VERSION "\n");
1483         }
1484
1485         rc = pci_enable_device(pdev);
1486         if (rc) {
1487                 return rc;
1488         }
1489
1490         rc = pci_request_regions(pdev, DRV_NAME);
1491         if (rc) {
1492                 pci_dev_busy = 1;
1493                 goto err_out;
1494         }
1495
1496         probe_ent = kmalloc(sizeof(*probe_ent), GFP_KERNEL);
1497         if (probe_ent == NULL) {
1498                 rc = -ENOMEM;
1499                 goto err_out_regions;
1500         }
1501
1502         memset(probe_ent, 0, sizeof(*probe_ent));
1503         probe_ent->dev = pci_dev_to_dev(pdev);
1504         INIT_LIST_HEAD(&probe_ent->node);
1505
1506         mmio_base = pci_iomap(pdev, MV_PRIMARY_BAR, 0);
1507         if (mmio_base == NULL) {
1508                 rc = -ENOMEM;
1509                 goto err_out_free_ent;
1510         }
1511
1512         hpriv = kmalloc(sizeof(*hpriv), GFP_KERNEL);
1513         if (!hpriv) {
1514                 rc = -ENOMEM;
1515                 goto err_out_iounmap;
1516         }
1517         memset(hpriv, 0, sizeof(*hpriv));
1518
1519         probe_ent->sht = mv_port_info[board_idx].sht;
1520         probe_ent->host_flags = mv_port_info[board_idx].host_flags;
1521         probe_ent->pio_mask = mv_port_info[board_idx].pio_mask;
1522         probe_ent->udma_mask = mv_port_info[board_idx].udma_mask;
1523         probe_ent->port_ops = mv_port_info[board_idx].port_ops;
1524
1525         probe_ent->irq = pdev->irq;
1526         probe_ent->irq_flags = SA_SHIRQ;
1527         probe_ent->mmio_base = mmio_base;
1528         probe_ent->private_data = hpriv;
1529
1530         /* initialize adapter */
1531         rc = mv_host_init(probe_ent);
1532         if (rc) {
1533                 goto err_out_hpriv;
1534         }
1535
1536         /* Enable interrupts */
1537         if (pci_enable_msi(pdev) == 0) {
1538                 hpriv->hp_flags |= MV_HP_FLAG_MSI;
1539         } else {
1540                 pci_intx(pdev, 1);
1541         }
1542
1543         mv_dump_pci_cfg(pdev, 0x68);
1544         mv_print_info(probe_ent);
1545
1546         if (ata_device_add(probe_ent) == 0) {
1547                 rc = -ENODEV;           /* No devices discovered */
1548                 goto err_out_dev_add;
1549         }
1550
1551         kfree(probe_ent);
1552         return 0;
1553
1554 err_out_dev_add:
1555         if (MV_HP_FLAG_MSI & hpriv->hp_flags) {
1556                 pci_disable_msi(pdev);
1557         } else {
1558                 pci_intx(pdev, 0);
1559         }
1560 err_out_hpriv:
1561         kfree(hpriv);
1562 err_out_iounmap:
1563         pci_iounmap(pdev, mmio_base);
1564 err_out_free_ent:
1565         kfree(probe_ent);
1566 err_out_regions:
1567         pci_release_regions(pdev);
1568 err_out:
1569         if (!pci_dev_busy) {
1570                 pci_disable_device(pdev);
1571         }
1572
1573         return rc;
1574 }
1575
1576 static int __init mv_init(void)
1577 {
1578         return pci_module_init(&mv_pci_driver);
1579 }
1580
1581 static void __exit mv_exit(void)
1582 {
1583         pci_unregister_driver(&mv_pci_driver);
1584 }
1585
1586 MODULE_AUTHOR("Brett Russ");
1587 MODULE_DESCRIPTION("SCSI low-level driver for Marvell SATA controllers");
1588 MODULE_LICENSE("GPL");
1589 MODULE_DEVICE_TABLE(pci, mv_pci_tbl);
1590 MODULE_VERSION(DRV_VERSION);
1591
1592 module_init(mv_init);
1593 module_exit(mv_exit);