x86: move boot_cpu_physical_apicid to apic_64.c
[safe/jmp/linux-2.6] / arch / x86 / kernel / apic_64.c
1 /*
2  *      Local APIC handling, local APIC timers
3  *
4  *      (c) 1999, 2000 Ingo Molnar <mingo@redhat.com>
5  *
6  *      Fixes
7  *      Maciej W. Rozycki       :       Bits for genuine 82489DX APICs;
8  *                                      thanks to Eric Gilmore
9  *                                      and Rolf G. Tews
10  *                                      for testing these extensively.
11  *      Maciej W. Rozycki       :       Various updates and fixes.
12  *      Mikael Pettersson       :       Power Management for UP-APIC.
13  *      Pavel Machek and
14  *      Mikael Pettersson       :       PM converted to driver model.
15  */
16
17 #include <linux/init.h>
18
19 #include <linux/mm.h>
20 #include <linux/delay.h>
21 #include <linux/bootmem.h>
22 #include <linux/interrupt.h>
23 #include <linux/mc146818rtc.h>
24 #include <linux/kernel_stat.h>
25 #include <linux/sysdev.h>
26 #include <linux/ioport.h>
27 #include <linux/clockchips.h>
28 #include <linux/acpi_pmtmr.h>
29 #include <linux/module.h>
30
31 #include <asm/atomic.h>
32 #include <asm/smp.h>
33 #include <asm/mtrr.h>
34 #include <asm/mpspec.h>
35 #include <asm/hpet.h>
36 #include <asm/pgalloc.h>
37 #include <asm/nmi.h>
38 #include <asm/idle.h>
39 #include <asm/proto.h>
40 #include <asm/timex.h>
41 #include <asm/apic.h>
42
43 #include <mach_ipi.h>
44 #include <mach_apic.h>
45
46 int disable_apic_timer __cpuinitdata;
47 static int apic_calibrate_pmtmr __initdata;
48 int disable_apic;
49
50 /* Local APIC timer works in C2 */
51 int local_apic_timer_c2_ok;
52 EXPORT_SYMBOL_GPL(local_apic_timer_c2_ok);
53
54 /*
55  * Debug level, exported for io_apic.c
56  */
57 int apic_verbosity;
58
59 static struct resource lapic_resource = {
60         .name = "Local APIC",
61         .flags = IORESOURCE_MEM | IORESOURCE_BUSY,
62 };
63
64 static unsigned int calibration_result;
65
66 static int lapic_next_event(unsigned long delta,
67                             struct clock_event_device *evt);
68 static void lapic_timer_setup(enum clock_event_mode mode,
69                               struct clock_event_device *evt);
70 static void lapic_timer_broadcast(cpumask_t mask);
71 static void apic_pm_activate(void);
72
73 static struct clock_event_device lapic_clockevent = {
74         .name           = "lapic",
75         .features       = CLOCK_EVT_FEAT_PERIODIC | CLOCK_EVT_FEAT_ONESHOT
76                         | CLOCK_EVT_FEAT_C3STOP | CLOCK_EVT_FEAT_DUMMY,
77         .shift          = 32,
78         .set_mode       = lapic_timer_setup,
79         .set_next_event = lapic_next_event,
80         .broadcast      = lapic_timer_broadcast,
81         .rating         = 100,
82         .irq            = -1,
83 };
84 static DEFINE_PER_CPU(struct clock_event_device, lapic_events);
85
86 static unsigned long apic_phys;
87
88 unsigned long mp_lapic_addr;
89
90 /* Processor that is doing the boot up */
91 unsigned int boot_cpu_physical_apicid = -1U;
92 EXPORT_SYMBOL(boot_cpu_physical_apicid);
93
94 /*
95  * Get the LAPIC version
96  */
97 static inline int lapic_get_version(void)
98 {
99         return GET_APIC_VERSION(apic_read(APIC_LVR));
100 }
101
102 /*
103  * Check, if the APIC is integrated or a seperate chip
104  */
105 static inline int lapic_is_integrated(void)
106 {
107         return 1;
108 }
109
110 /*
111  * Check, whether this is a modern or a first generation APIC
112  */
113 static int modern_apic(void)
114 {
115         /* AMD systems use old APIC versions, so check the CPU */
116         if (boot_cpu_data.x86_vendor == X86_VENDOR_AMD &&
117             boot_cpu_data.x86 >= 0xf)
118                 return 1;
119         return lapic_get_version() >= 0x14;
120 }
121
122 void apic_wait_icr_idle(void)
123 {
124         while (apic_read(APIC_ICR) & APIC_ICR_BUSY)
125                 cpu_relax();
126 }
127
128 u32 safe_apic_wait_icr_idle(void)
129 {
130         u32 send_status;
131         int timeout;
132
133         timeout = 0;
134         do {
135                 send_status = apic_read(APIC_ICR) & APIC_ICR_BUSY;
136                 if (!send_status)
137                         break;
138                 udelay(100);
139         } while (timeout++ < 1000);
140
141         return send_status;
142 }
143
144 /**
145  * enable_NMI_through_LVT0 - enable NMI through local vector table 0
146  */
147 void __cpuinit enable_NMI_through_LVT0(void)
148 {
149         unsigned int v;
150
151         /* unmask and set to NMI */
152         v = APIC_DM_NMI;
153         apic_write(APIC_LVT0, v);
154 }
155
156 /**
157  * lapic_get_maxlvt - get the maximum number of local vector table entries
158  */
159 int lapic_get_maxlvt(void)
160 {
161         unsigned int v, maxlvt;
162
163         v = apic_read(APIC_LVR);
164         maxlvt = GET_APIC_MAXLVT(v);
165         return maxlvt;
166 }
167
168 /*
169  * This function sets up the local APIC timer, with a timeout of
170  * 'clocks' APIC bus clock. During calibration we actually call
171  * this function twice on the boot CPU, once with a bogus timeout
172  * value, second time for real. The other (noncalibrating) CPUs
173  * call this function only once, with the real, calibrated value.
174  *
175  * We do reads before writes even if unnecessary, to get around the
176  * P5 APIC double write bug.
177  */
178
179 static void __setup_APIC_LVTT(unsigned int clocks, int oneshot, int irqen)
180 {
181         unsigned int lvtt_value, tmp_value;
182
183         lvtt_value = LOCAL_TIMER_VECTOR;
184         if (!oneshot)
185                 lvtt_value |= APIC_LVT_TIMER_PERIODIC;
186         if (!irqen)
187                 lvtt_value |= APIC_LVT_MASKED;
188
189         apic_write(APIC_LVTT, lvtt_value);
190
191         /*
192          * Divide PICLK by 16
193          */
194         tmp_value = apic_read(APIC_TDCR);
195         apic_write(APIC_TDCR, (tmp_value
196                                 & ~(APIC_TDR_DIV_1 | APIC_TDR_DIV_TMBASE))
197                                 | APIC_TDR_DIV_16);
198
199         if (!oneshot)
200                 apic_write(APIC_TMICT, clocks);
201 }
202
203 /*
204  * Setup extended LVT, AMD specific (K8, family 10h)
205  *
206  * Vector mappings are hard coded. On K8 only offset 0 (APIC500) and
207  * MCE interrupts are supported. Thus MCE offset must be set to 0.
208  */
209
210 #define APIC_EILVT_LVTOFF_MCE 0
211 #define APIC_EILVT_LVTOFF_IBS 1
212
213 static void setup_APIC_eilvt(u8 lvt_off, u8 vector, u8 msg_type, u8 mask)
214 {
215         unsigned long reg = (lvt_off << 4) + APIC_EILVT0;
216         unsigned int  v   = (mask << 16) | (msg_type << 8) | vector;
217
218         apic_write(reg, v);
219 }
220
221 u8 setup_APIC_eilvt_mce(u8 vector, u8 msg_type, u8 mask)
222 {
223         setup_APIC_eilvt(APIC_EILVT_LVTOFF_MCE, vector, msg_type, mask);
224         return APIC_EILVT_LVTOFF_MCE;
225 }
226
227 u8 setup_APIC_eilvt_ibs(u8 vector, u8 msg_type, u8 mask)
228 {
229         setup_APIC_eilvt(APIC_EILVT_LVTOFF_IBS, vector, msg_type, mask);
230         return APIC_EILVT_LVTOFF_IBS;
231 }
232
233 /*
234  * Program the next event, relative to now
235  */
236 static int lapic_next_event(unsigned long delta,
237                             struct clock_event_device *evt)
238 {
239         apic_write(APIC_TMICT, delta);
240         return 0;
241 }
242
243 /*
244  * Setup the lapic timer in periodic or oneshot mode
245  */
246 static void lapic_timer_setup(enum clock_event_mode mode,
247                               struct clock_event_device *evt)
248 {
249         unsigned long flags;
250         unsigned int v;
251
252         /* Lapic used as dummy for broadcast ? */
253         if (evt->features & CLOCK_EVT_FEAT_DUMMY)
254                 return;
255
256         local_irq_save(flags);
257
258         switch (mode) {
259         case CLOCK_EVT_MODE_PERIODIC:
260         case CLOCK_EVT_MODE_ONESHOT:
261                 __setup_APIC_LVTT(calibration_result,
262                                   mode != CLOCK_EVT_MODE_PERIODIC, 1);
263                 break;
264         case CLOCK_EVT_MODE_UNUSED:
265         case CLOCK_EVT_MODE_SHUTDOWN:
266                 v = apic_read(APIC_LVTT);
267                 v |= (APIC_LVT_MASKED | LOCAL_TIMER_VECTOR);
268                 apic_write(APIC_LVTT, v);
269                 break;
270         case CLOCK_EVT_MODE_RESUME:
271                 /* Nothing to do here */
272                 break;
273         }
274
275         local_irq_restore(flags);
276 }
277
278 /*
279  * Local APIC timer broadcast function
280  */
281 static void lapic_timer_broadcast(cpumask_t mask)
282 {
283 #ifdef CONFIG_SMP
284         send_IPI_mask(mask, LOCAL_TIMER_VECTOR);
285 #endif
286 }
287
288 /*
289  * Setup the local APIC timer for this CPU. Copy the initilized values
290  * of the boot CPU and register the clock event in the framework.
291  */
292 static void setup_APIC_timer(void)
293 {
294         struct clock_event_device *levt = &__get_cpu_var(lapic_events);
295
296         memcpy(levt, &lapic_clockevent, sizeof(*levt));
297         levt->cpumask = cpumask_of_cpu(smp_processor_id());
298
299         clockevents_register_device(levt);
300 }
301
302 /*
303  * In this function we calibrate APIC bus clocks to the external
304  * timer. Unfortunately we cannot use jiffies and the timer irq
305  * to calibrate, since some later bootup code depends on getting
306  * the first irq? Ugh.
307  *
308  * We want to do the calibration only once since we
309  * want to have local timer irqs syncron. CPUs connected
310  * by the same APIC bus have the very same bus frequency.
311  * And we want to have irqs off anyways, no accidental
312  * APIC irq that way.
313  */
314
315 #define TICK_COUNT 100000000
316
317 static void __init calibrate_APIC_clock(void)
318 {
319         unsigned apic, apic_start;
320         unsigned long tsc, tsc_start;
321         int result;
322
323         local_irq_disable();
324
325         /*
326          * Put whatever arbitrary (but long enough) timeout
327          * value into the APIC clock, we just want to get the
328          * counter running for calibration.
329          *
330          * No interrupt enable !
331          */
332         __setup_APIC_LVTT(250000000, 0, 0);
333
334         apic_start = apic_read(APIC_TMCCT);
335 #ifdef CONFIG_X86_PM_TIMER
336         if (apic_calibrate_pmtmr && pmtmr_ioport) {
337                 pmtimer_wait(5000);  /* 5ms wait */
338                 apic = apic_read(APIC_TMCCT);
339                 result = (apic_start - apic) * 1000L / 5;
340         } else
341 #endif
342         {
343                 rdtscll(tsc_start);
344
345                 do {
346                         apic = apic_read(APIC_TMCCT);
347                         rdtscll(tsc);
348                 } while ((tsc - tsc_start) < TICK_COUNT &&
349                                 (apic_start - apic) < TICK_COUNT);
350
351                 result = (apic_start - apic) * 1000L * tsc_khz /
352                                         (tsc - tsc_start);
353         }
354
355         local_irq_enable();
356
357         printk(KERN_DEBUG "APIC timer calibration result %d\n", result);
358
359         printk(KERN_INFO "Detected %d.%03d MHz APIC timer.\n",
360                 result / 1000 / 1000, result / 1000 % 1000);
361
362         /* Calculate the scaled math multiplication factor */
363         lapic_clockevent.mult = div_sc(result, NSEC_PER_SEC, 32);
364         lapic_clockevent.max_delta_ns =
365                 clockevent_delta2ns(0x7FFFFF, &lapic_clockevent);
366         lapic_clockevent.min_delta_ns =
367                 clockevent_delta2ns(0xF, &lapic_clockevent);
368
369         calibration_result = result / HZ;
370 }
371
372 /*
373  * Setup the boot APIC
374  *
375  * Calibrate and verify the result.
376  */
377 void __init setup_boot_APIC_clock(void)
378 {
379         /*
380          * The local apic timer can be disabled via the kernel commandline.
381          * Register the lapic timer as a dummy clock event source on SMP
382          * systems, so the broadcast mechanism is used. On UP systems simply
383          * ignore it.
384          */
385         if (disable_apic_timer) {
386                 printk(KERN_INFO "Disabling APIC timer\n");
387                 /* No broadcast on UP ! */
388                 if (num_possible_cpus() > 1) {
389                         lapic_clockevent.mult = 1;
390                         setup_APIC_timer();
391                 }
392                 return;
393         }
394
395         printk(KERN_INFO "Using local APIC timer interrupts.\n");
396         calibrate_APIC_clock();
397
398         /*
399          * Do a sanity check on the APIC calibration result
400          */
401         if (calibration_result < (1000000 / HZ)) {
402                 printk(KERN_WARNING
403                        "APIC frequency too slow, disabling apic timer\n");
404                 /* No broadcast on UP ! */
405                 if (num_possible_cpus() > 1)
406                         setup_APIC_timer();
407                 return;
408         }
409
410         /*
411          * If nmi_watchdog is set to IO_APIC, we need the
412          * PIT/HPET going.  Otherwise register lapic as a dummy
413          * device.
414          */
415         if (nmi_watchdog != NMI_IO_APIC)
416                 lapic_clockevent.features &= ~CLOCK_EVT_FEAT_DUMMY;
417         else
418                 printk(KERN_WARNING "APIC timer registered as dummy,"
419                        " due to nmi_watchdog=1!\n");
420
421         setup_APIC_timer();
422 }
423
424 /*
425  * AMD C1E enabled CPUs have a real nasty problem: Some BIOSes set the
426  * C1E flag only in the secondary CPU, so when we detect the wreckage
427  * we already have enabled the boot CPU local apic timer. Check, if
428  * disable_apic_timer is set and the DUMMY flag is cleared. If yes,
429  * set the DUMMY flag again and force the broadcast mode in the
430  * clockevents layer.
431  */
432 void __cpuinit check_boot_apic_timer_broadcast(void)
433 {
434         if (!disable_apic_timer ||
435             (lapic_clockevent.features & CLOCK_EVT_FEAT_DUMMY))
436                 return;
437
438         printk(KERN_INFO "AMD C1E detected late. Force timer broadcast.\n");
439         lapic_clockevent.features |= CLOCK_EVT_FEAT_DUMMY;
440
441         local_irq_enable();
442         clockevents_notify(CLOCK_EVT_NOTIFY_BROADCAST_FORCE,
443                            &boot_cpu_physical_apicid);
444         local_irq_disable();
445 }
446
447 void __cpuinit setup_secondary_APIC_clock(void)
448 {
449         check_boot_apic_timer_broadcast();
450         setup_APIC_timer();
451 }
452
453 /*
454  * The guts of the apic timer interrupt
455  */
456 static void local_apic_timer_interrupt(void)
457 {
458         int cpu = smp_processor_id();
459         struct clock_event_device *evt = &per_cpu(lapic_events, cpu);
460
461         /*
462          * Normally we should not be here till LAPIC has been initialized but
463          * in some cases like kdump, its possible that there is a pending LAPIC
464          * timer interrupt from previous kernel's context and is delivered in
465          * new kernel the moment interrupts are enabled.
466          *
467          * Interrupts are enabled early and LAPIC is setup much later, hence
468          * its possible that when we get here evt->event_handler is NULL.
469          * Check for event_handler being NULL and discard the interrupt as
470          * spurious.
471          */
472         if (!evt->event_handler) {
473                 printk(KERN_WARNING
474                        "Spurious LAPIC timer interrupt on cpu %d\n", cpu);
475                 /* Switch it off */
476                 lapic_timer_setup(CLOCK_EVT_MODE_SHUTDOWN, evt);
477                 return;
478         }
479
480         /*
481          * the NMI deadlock-detector uses this.
482          */
483         add_pda(apic_timer_irqs, 1);
484
485         evt->event_handler(evt);
486 }
487
488 /*
489  * Local APIC timer interrupt. This is the most natural way for doing
490  * local interrupts, but local timer interrupts can be emulated by
491  * broadcast interrupts too. [in case the hw doesn't support APIC timers]
492  *
493  * [ if a single-CPU system runs an SMP kernel then we call the local
494  *   interrupt as well. Thus we cannot inline the local irq ... ]
495  */
496 void smp_apic_timer_interrupt(struct pt_regs *regs)
497 {
498         struct pt_regs *old_regs = set_irq_regs(regs);
499
500         /*
501          * NOTE! We'd better ACK the irq immediately,
502          * because timer handling can be slow.
503          */
504         ack_APIC_irq();
505         /*
506          * update_process_times() expects us to have done irq_enter().
507          * Besides, if we don't timer interrupts ignore the global
508          * interrupt lock, which is the WrongThing (tm) to do.
509          */
510         exit_idle();
511         irq_enter();
512         local_apic_timer_interrupt();
513         irq_exit();
514         set_irq_regs(old_regs);
515 }
516
517 int setup_profiling_timer(unsigned int multiplier)
518 {
519         return -EINVAL;
520 }
521
522
523 /*
524  * Local APIC start and shutdown
525  */
526
527 /**
528  * clear_local_APIC - shutdown the local APIC
529  *
530  * This is called, when a CPU is disabled and before rebooting, so the state of
531  * the local APIC has no dangling leftovers. Also used to cleanout any BIOS
532  * leftovers during boot.
533  */
534 void clear_local_APIC(void)
535 {
536         int maxlvt = lapic_get_maxlvt();
537         u32 v;
538
539         /* APIC hasn't been mapped yet */
540         if (!apic_phys)
541                 return;
542
543         maxlvt = lapic_get_maxlvt();
544         /*
545          * Masking an LVT entry can trigger a local APIC error
546          * if the vector is zero. Mask LVTERR first to prevent this.
547          */
548         if (maxlvt >= 3) {
549                 v = ERROR_APIC_VECTOR; /* any non-zero vector will do */
550                 apic_write(APIC_LVTERR, v | APIC_LVT_MASKED);
551         }
552         /*
553          * Careful: we have to set masks only first to deassert
554          * any level-triggered sources.
555          */
556         v = apic_read(APIC_LVTT);
557         apic_write(APIC_LVTT, v | APIC_LVT_MASKED);
558         v = apic_read(APIC_LVT0);
559         apic_write(APIC_LVT0, v | APIC_LVT_MASKED);
560         v = apic_read(APIC_LVT1);
561         apic_write(APIC_LVT1, v | APIC_LVT_MASKED);
562         if (maxlvt >= 4) {
563                 v = apic_read(APIC_LVTPC);
564                 apic_write(APIC_LVTPC, v | APIC_LVT_MASKED);
565         }
566
567         /*
568          * Clean APIC state for other OSs:
569          */
570         apic_write(APIC_LVTT, APIC_LVT_MASKED);
571         apic_write(APIC_LVT0, APIC_LVT_MASKED);
572         apic_write(APIC_LVT1, APIC_LVT_MASKED);
573         if (maxlvt >= 3)
574                 apic_write(APIC_LVTERR, APIC_LVT_MASKED);
575         if (maxlvt >= 4)
576                 apic_write(APIC_LVTPC, APIC_LVT_MASKED);
577         apic_write(APIC_ESR, 0);
578         apic_read(APIC_ESR);
579 }
580
581 /**
582  * disable_local_APIC - clear and disable the local APIC
583  */
584 void disable_local_APIC(void)
585 {
586         unsigned int value;
587
588         clear_local_APIC();
589
590         /*
591          * Disable APIC (implies clearing of registers
592          * for 82489DX!).
593          */
594         value = apic_read(APIC_SPIV);
595         value &= ~APIC_SPIV_APIC_ENABLED;
596         apic_write(APIC_SPIV, value);
597 }
598
599 void lapic_shutdown(void)
600 {
601         unsigned long flags;
602
603         if (!cpu_has_apic)
604                 return;
605
606         local_irq_save(flags);
607
608         disable_local_APIC();
609
610         local_irq_restore(flags);
611 }
612
613 /*
614  * This is to verify that we're looking at a real local APIC.
615  * Check these against your board if the CPUs aren't getting
616  * started for no apparent reason.
617  */
618 int __init verify_local_APIC(void)
619 {
620         unsigned int reg0, reg1;
621
622         /*
623          * The version register is read-only in a real APIC.
624          */
625         reg0 = apic_read(APIC_LVR);
626         apic_printk(APIC_DEBUG, "Getting VERSION: %x\n", reg0);
627         apic_write(APIC_LVR, reg0 ^ APIC_LVR_MASK);
628         reg1 = apic_read(APIC_LVR);
629         apic_printk(APIC_DEBUG, "Getting VERSION: %x\n", reg1);
630
631         /*
632          * The two version reads above should print the same
633          * numbers.  If the second one is different, then we
634          * poke at a non-APIC.
635          */
636         if (reg1 != reg0)
637                 return 0;
638
639         /*
640          * Check if the version looks reasonably.
641          */
642         reg1 = GET_APIC_VERSION(reg0);
643         if (reg1 == 0x00 || reg1 == 0xff)
644                 return 0;
645         reg1 = lapic_get_maxlvt();
646         if (reg1 < 0x02 || reg1 == 0xff)
647                 return 0;
648
649         /*
650          * The ID register is read/write in a real APIC.
651          */
652         reg0 = apic_read(APIC_ID);
653         apic_printk(APIC_DEBUG, "Getting ID: %x\n", reg0);
654         apic_write(APIC_ID, reg0 ^ APIC_ID_MASK);
655         reg1 = apic_read(APIC_ID);
656         apic_printk(APIC_DEBUG, "Getting ID: %x\n", reg1);
657         apic_write(APIC_ID, reg0);
658         if (reg1 != (reg0 ^ APIC_ID_MASK))
659                 return 0;
660
661         /*
662          * The next two are just to see if we have sane values.
663          * They're only really relevant if we're in Virtual Wire
664          * compatibility mode, but most boxes are anymore.
665          */
666         reg0 = apic_read(APIC_LVT0);
667         apic_printk(APIC_DEBUG, "Getting LVT0: %x\n", reg0);
668         reg1 = apic_read(APIC_LVT1);
669         apic_printk(APIC_DEBUG, "Getting LVT1: %x\n", reg1);
670
671         return 1;
672 }
673
674 /**
675  * sync_Arb_IDs - synchronize APIC bus arbitration IDs
676  */
677 void __init sync_Arb_IDs(void)
678 {
679         /* Unsupported on P4 - see Intel Dev. Manual Vol. 3, Ch. 8.6.1 */
680         if (modern_apic())
681                 return;
682
683         /*
684          * Wait for idle.
685          */
686         apic_wait_icr_idle();
687
688         apic_printk(APIC_DEBUG, "Synchronizing Arb IDs.\n");
689         apic_write(APIC_ICR, APIC_DEST_ALLINC | APIC_INT_LEVELTRIG
690                                 | APIC_DM_INIT);
691 }
692
693 /*
694  * An initial setup of the virtual wire mode.
695  */
696 void __init init_bsp_APIC(void)
697 {
698         unsigned int value;
699
700         /*
701          * Don't do the setup now if we have a SMP BIOS as the
702          * through-I/O-APIC virtual wire mode might be active.
703          */
704         if (smp_found_config || !cpu_has_apic)
705                 return;
706
707         value = apic_read(APIC_LVR);
708
709         /*
710          * Do not trust the local APIC being empty at bootup.
711          */
712         clear_local_APIC();
713
714         /*
715          * Enable APIC.
716          */
717         value = apic_read(APIC_SPIV);
718         value &= ~APIC_VECTOR_MASK;
719         value |= APIC_SPIV_APIC_ENABLED;
720         value |= APIC_SPIV_FOCUS_DISABLED;
721         value |= SPURIOUS_APIC_VECTOR;
722         apic_write(APIC_SPIV, value);
723
724         /*
725          * Set up the virtual wire mode.
726          */
727         apic_write(APIC_LVT0, APIC_DM_EXTINT);
728         value = APIC_DM_NMI;
729         apic_write(APIC_LVT1, value);
730 }
731
732 /**
733  * setup_local_APIC - setup the local APIC
734  */
735 void __cpuinit setup_local_APIC(void)
736 {
737         unsigned int value;
738         int i, j;
739
740         value = apic_read(APIC_LVR);
741
742         BUILD_BUG_ON((SPURIOUS_APIC_VECTOR & 0x0f) != 0x0f);
743
744         /*
745          * Double-check whether this APIC is really registered.
746          * This is meaningless in clustered apic mode, so we skip it.
747          */
748         if (!apic_id_registered())
749                 BUG();
750
751         /*
752          * Intel recommends to set DFR, LDR and TPR before enabling
753          * an APIC.  See e.g. "AP-388 82489DX User's Manual" (Intel
754          * document number 292116).  So here it goes...
755          */
756         init_apic_ldr();
757
758         /*
759          * Set Task Priority to 'accept all'. We never change this
760          * later on.
761          */
762         value = apic_read(APIC_TASKPRI);
763         value &= ~APIC_TPRI_MASK;
764         apic_write(APIC_TASKPRI, value);
765
766         /*
767          * After a crash, we no longer service the interrupts and a pending
768          * interrupt from previous kernel might still have ISR bit set.
769          *
770          * Most probably by now CPU has serviced that pending interrupt and
771          * it might not have done the ack_APIC_irq() because it thought,
772          * interrupt came from i8259 as ExtInt. LAPIC did not get EOI so it
773          * does not clear the ISR bit and cpu thinks it has already serivced
774          * the interrupt. Hence a vector might get locked. It was noticed
775          * for timer irq (vector 0x31). Issue an extra EOI to clear ISR.
776          */
777         for (i = APIC_ISR_NR - 1; i >= 0; i--) {
778                 value = apic_read(APIC_ISR + i*0x10);
779                 for (j = 31; j >= 0; j--) {
780                         if (value & (1<<j))
781                                 ack_APIC_irq();
782                 }
783         }
784
785         /*
786          * Now that we are all set up, enable the APIC
787          */
788         value = apic_read(APIC_SPIV);
789         value &= ~APIC_VECTOR_MASK;
790         /*
791          * Enable APIC
792          */
793         value |= APIC_SPIV_APIC_ENABLED;
794
795         /* We always use processor focus */
796
797         /*
798          * Set spurious IRQ vector
799          */
800         value |= SPURIOUS_APIC_VECTOR;
801         apic_write(APIC_SPIV, value);
802
803         /*
804          * Set up LVT0, LVT1:
805          *
806          * set up through-local-APIC on the BP's LINT0. This is not
807          * strictly necessary in pure symmetric-IO mode, but sometimes
808          * we delegate interrupts to the 8259A.
809          */
810         /*
811          * TODO: set up through-local-APIC from through-I/O-APIC? --macro
812          */
813         value = apic_read(APIC_LVT0) & APIC_LVT_MASKED;
814         if (!smp_processor_id() && !value) {
815                 value = APIC_DM_EXTINT;
816                 apic_printk(APIC_VERBOSE, "enabled ExtINT on CPU#%d\n",
817                             smp_processor_id());
818         } else {
819                 value = APIC_DM_EXTINT | APIC_LVT_MASKED;
820                 apic_printk(APIC_VERBOSE, "masked ExtINT on CPU#%d\n",
821                             smp_processor_id());
822         }
823         apic_write(APIC_LVT0, value);
824
825         /*
826          * only the BP should see the LINT1 NMI signal, obviously.
827          */
828         if (!smp_processor_id())
829                 value = APIC_DM_NMI;
830         else
831                 value = APIC_DM_NMI | APIC_LVT_MASKED;
832         apic_write(APIC_LVT1, value);
833 }
834
835 void __cpuinit lapic_setup_esr(void)
836 {
837         unsigned maxlvt = lapic_get_maxlvt();
838
839         apic_write(APIC_LVTERR, ERROR_APIC_VECTOR);
840         /*
841          * spec says clear errors after enabling vector.
842          */
843         if (maxlvt > 3)
844                 apic_write(APIC_ESR, 0);
845 }
846
847 void __cpuinit end_local_APIC_setup(void)
848 {
849         lapic_setup_esr();
850         nmi_watchdog_default();
851         setup_apic_nmi_watchdog(NULL);
852         apic_pm_activate();
853 }
854
855 /*
856  * Detect and enable local APICs on non-SMP boards.
857  * Original code written by Keir Fraser.
858  * On AMD64 we trust the BIOS - if it says no APIC it is likely
859  * not correctly set up (usually the APIC timer won't work etc.)
860  */
861 static int __init detect_init_APIC(void)
862 {
863         if (!cpu_has_apic) {
864                 printk(KERN_INFO "No local APIC present\n");
865                 return -1;
866         }
867
868         mp_lapic_addr = APIC_DEFAULT_PHYS_BASE;
869         boot_cpu_physical_apicid = 0;
870         return 0;
871 }
872
873 void __init early_init_lapic_mapping(void)
874 {
875         unsigned long apic_phys;
876
877         /*
878          * If no local APIC can be found then go out
879          * : it means there is no mpatable and MADT
880          */
881         if (!smp_found_config)
882                 return;
883
884         apic_phys = mp_lapic_addr;
885
886         set_fixmap_nocache(FIX_APIC_BASE, apic_phys);
887         apic_printk(APIC_VERBOSE, "mapped APIC to %16lx (%16lx)\n",
888                                  APIC_BASE, apic_phys);
889
890         /*
891          * Fetch the APIC ID of the BSP in case we have a
892          * default configuration (or the MP table is broken).
893          */
894         boot_cpu_physical_apicid = GET_APIC_ID(apic_read(APIC_ID));
895 }
896
897 /**
898  * init_apic_mappings - initialize APIC mappings
899  */
900 void __init init_apic_mappings(void)
901 {
902         /*
903          * If no local APIC can be found then set up a fake all
904          * zeroes page to simulate the local APIC and another
905          * one for the IO-APIC.
906          */
907         if (!smp_found_config && detect_init_APIC()) {
908                 apic_phys = (unsigned long) alloc_bootmem_pages(PAGE_SIZE);
909                 apic_phys = __pa(apic_phys);
910         } else
911                 apic_phys = mp_lapic_addr;
912
913         set_fixmap_nocache(FIX_APIC_BASE, apic_phys);
914         apic_printk(APIC_VERBOSE, "mapped APIC to %16lx (%16lx)\n",
915                                 APIC_BASE, apic_phys);
916
917         /*
918          * Fetch the APIC ID of the BSP in case we have a
919          * default configuration (or the MP table is broken).
920          */
921         boot_cpu_physical_apicid = GET_APIC_ID(apic_read(APIC_ID));
922 }
923
924 /*
925  * This initializes the IO-APIC and APIC hardware if this is
926  * a UP kernel.
927  */
928 int __init APIC_init_uniprocessor(void)
929 {
930         if (disable_apic) {
931                 printk(KERN_INFO "Apic disabled\n");
932                 return -1;
933         }
934         if (!cpu_has_apic) {
935                 disable_apic = 1;
936                 printk(KERN_INFO "Apic disabled by BIOS\n");
937                 return -1;
938         }
939
940         verify_local_APIC();
941
942         phys_cpu_present_map = physid_mask_of_physid(boot_cpu_physical_apicid);
943         apic_write(APIC_ID, SET_APIC_ID(boot_cpu_physical_apicid));
944
945         setup_local_APIC();
946
947         /*
948          * Now enable IO-APICs, actually call clear_IO_APIC
949          * We need clear_IO_APIC before enabling vector on BP
950          */
951         if (!skip_ioapic_setup && nr_ioapics)
952                 enable_IO_APIC();
953
954         end_local_APIC_setup();
955
956         if (smp_found_config && !skip_ioapic_setup && nr_ioapics)
957                 setup_IO_APIC();
958         else
959                 nr_ioapics = 0;
960         setup_boot_APIC_clock();
961         check_nmi_watchdog();
962         return 0;
963 }
964
965 /*
966  * Local APIC interrupts
967  */
968
969 /*
970  * This interrupt should _never_ happen with our APIC/SMP architecture
971  */
972 asmlinkage void smp_spurious_interrupt(void)
973 {
974         unsigned int v;
975         exit_idle();
976         irq_enter();
977         /*
978          * Check if this really is a spurious interrupt and ACK it
979          * if it is a vectored one.  Just in case...
980          * Spurious interrupts should not be ACKed.
981          */
982         v = apic_read(APIC_ISR + ((SPURIOUS_APIC_VECTOR & ~0x1f) >> 1));
983         if (v & (1 << (SPURIOUS_APIC_VECTOR & 0x1f)))
984                 ack_APIC_irq();
985
986         add_pda(irq_spurious_count, 1);
987         irq_exit();
988 }
989
990 /*
991  * This interrupt should never happen with our APIC/SMP architecture
992  */
993 asmlinkage void smp_error_interrupt(void)
994 {
995         unsigned int v, v1;
996
997         exit_idle();
998         irq_enter();
999         /* First tickle the hardware, only then report what went on. -- REW */
1000         v = apic_read(APIC_ESR);
1001         apic_write(APIC_ESR, 0);
1002         v1 = apic_read(APIC_ESR);
1003         ack_APIC_irq();
1004         atomic_inc(&irq_err_count);
1005
1006         /* Here is what the APIC error bits mean:
1007            0: Send CS error
1008            1: Receive CS error
1009            2: Send accept error
1010            3: Receive accept error
1011            4: Reserved
1012            5: Send illegal vector
1013            6: Received illegal vector
1014            7: Illegal register address
1015         */
1016         printk(KERN_DEBUG "APIC error on CPU%d: %02x(%02x)\n",
1017                 smp_processor_id(), v , v1);
1018         irq_exit();
1019 }
1020
1021 void disconnect_bsp_APIC(int virt_wire_setup)
1022 {
1023         /* Go back to Virtual Wire compatibility mode */
1024         unsigned long value;
1025
1026         /* For the spurious interrupt use vector F, and enable it */
1027         value = apic_read(APIC_SPIV);
1028         value &= ~APIC_VECTOR_MASK;
1029         value |= APIC_SPIV_APIC_ENABLED;
1030         value |= 0xf;
1031         apic_write(APIC_SPIV, value);
1032
1033         if (!virt_wire_setup) {
1034                 /*
1035                  * For LVT0 make it edge triggered, active high,
1036                  * external and enabled
1037                  */
1038                 value = apic_read(APIC_LVT0);
1039                 value &= ~(APIC_MODE_MASK | APIC_SEND_PENDING |
1040                         APIC_INPUT_POLARITY | APIC_LVT_REMOTE_IRR |
1041                         APIC_LVT_LEVEL_TRIGGER | APIC_LVT_MASKED);
1042                 value |= APIC_LVT_REMOTE_IRR | APIC_SEND_PENDING;
1043                 value = SET_APIC_DELIVERY_MODE(value, APIC_MODE_EXTINT);
1044                 apic_write(APIC_LVT0, value);
1045         } else {
1046                 /* Disable LVT0 */
1047                 apic_write(APIC_LVT0, APIC_LVT_MASKED);
1048         }
1049
1050         /* For LVT1 make it edge triggered, active high, nmi and enabled */
1051         value = apic_read(APIC_LVT1);
1052         value &= ~(APIC_MODE_MASK | APIC_SEND_PENDING |
1053                         APIC_INPUT_POLARITY | APIC_LVT_REMOTE_IRR |
1054                         APIC_LVT_LEVEL_TRIGGER | APIC_LVT_MASKED);
1055         value |= APIC_LVT_REMOTE_IRR | APIC_SEND_PENDING;
1056         value = SET_APIC_DELIVERY_MODE(value, APIC_MODE_NMI);
1057         apic_write(APIC_LVT1, value);
1058 }
1059
1060 /*
1061  * Power management
1062  */
1063 #ifdef CONFIG_PM
1064
1065 static struct {
1066         /* 'active' is true if the local APIC was enabled by us and
1067            not the BIOS; this signifies that we are also responsible
1068            for disabling it before entering apm/acpi suspend */
1069         int active;
1070         /* r/w apic fields */
1071         unsigned int apic_id;
1072         unsigned int apic_taskpri;
1073         unsigned int apic_ldr;
1074         unsigned int apic_dfr;
1075         unsigned int apic_spiv;
1076         unsigned int apic_lvtt;
1077         unsigned int apic_lvtpc;
1078         unsigned int apic_lvt0;
1079         unsigned int apic_lvt1;
1080         unsigned int apic_lvterr;
1081         unsigned int apic_tmict;
1082         unsigned int apic_tdcr;
1083         unsigned int apic_thmr;
1084 } apic_pm_state;
1085
1086 static int lapic_suspend(struct sys_device *dev, pm_message_t state)
1087 {
1088         unsigned long flags;
1089         int maxlvt;
1090
1091         if (!apic_pm_state.active)
1092                 return 0;
1093
1094         maxlvt = lapic_get_maxlvt();
1095
1096         apic_pm_state.apic_id = apic_read(APIC_ID);
1097         apic_pm_state.apic_taskpri = apic_read(APIC_TASKPRI);
1098         apic_pm_state.apic_ldr = apic_read(APIC_LDR);
1099         apic_pm_state.apic_dfr = apic_read(APIC_DFR);
1100         apic_pm_state.apic_spiv = apic_read(APIC_SPIV);
1101         apic_pm_state.apic_lvtt = apic_read(APIC_LVTT);
1102         if (maxlvt >= 4)
1103                 apic_pm_state.apic_lvtpc = apic_read(APIC_LVTPC);
1104         apic_pm_state.apic_lvt0 = apic_read(APIC_LVT0);
1105         apic_pm_state.apic_lvt1 = apic_read(APIC_LVT1);
1106         apic_pm_state.apic_lvterr = apic_read(APIC_LVTERR);
1107         apic_pm_state.apic_tmict = apic_read(APIC_TMICT);
1108         apic_pm_state.apic_tdcr = apic_read(APIC_TDCR);
1109 #ifdef CONFIG_X86_MCE_INTEL
1110         if (maxlvt >= 5)
1111                 apic_pm_state.apic_thmr = apic_read(APIC_LVTTHMR);
1112 #endif
1113         local_irq_save(flags);
1114         disable_local_APIC();
1115         local_irq_restore(flags);
1116         return 0;
1117 }
1118
1119 static int lapic_resume(struct sys_device *dev)
1120 {
1121         unsigned int l, h;
1122         unsigned long flags;
1123         int maxlvt;
1124
1125         if (!apic_pm_state.active)
1126                 return 0;
1127
1128         maxlvt = lapic_get_maxlvt();
1129
1130         local_irq_save(flags);
1131         rdmsr(MSR_IA32_APICBASE, l, h);
1132         l &= ~MSR_IA32_APICBASE_BASE;
1133         l |= MSR_IA32_APICBASE_ENABLE | mp_lapic_addr;
1134         wrmsr(MSR_IA32_APICBASE, l, h);
1135         apic_write(APIC_LVTERR, ERROR_APIC_VECTOR | APIC_LVT_MASKED);
1136         apic_write(APIC_ID, apic_pm_state.apic_id);
1137         apic_write(APIC_DFR, apic_pm_state.apic_dfr);
1138         apic_write(APIC_LDR, apic_pm_state.apic_ldr);
1139         apic_write(APIC_TASKPRI, apic_pm_state.apic_taskpri);
1140         apic_write(APIC_SPIV, apic_pm_state.apic_spiv);
1141         apic_write(APIC_LVT0, apic_pm_state.apic_lvt0);
1142         apic_write(APIC_LVT1, apic_pm_state.apic_lvt1);
1143 #ifdef CONFIG_X86_MCE_INTEL
1144         if (maxlvt >= 5)
1145                 apic_write(APIC_LVTTHMR, apic_pm_state.apic_thmr);
1146 #endif
1147         if (maxlvt >= 4)
1148                 apic_write(APIC_LVTPC, apic_pm_state.apic_lvtpc);
1149         apic_write(APIC_LVTT, apic_pm_state.apic_lvtt);
1150         apic_write(APIC_TDCR, apic_pm_state.apic_tdcr);
1151         apic_write(APIC_TMICT, apic_pm_state.apic_tmict);
1152         apic_write(APIC_ESR, 0);
1153         apic_read(APIC_ESR);
1154         apic_write(APIC_LVTERR, apic_pm_state.apic_lvterr);
1155         apic_write(APIC_ESR, 0);
1156         apic_read(APIC_ESR);
1157         local_irq_restore(flags);
1158         return 0;
1159 }
1160
1161 static struct sysdev_class lapic_sysclass = {
1162         .name           = "lapic",
1163         .resume         = lapic_resume,
1164         .suspend        = lapic_suspend,
1165 };
1166
1167 static struct sys_device device_lapic = {
1168         .id     = 0,
1169         .cls    = &lapic_sysclass,
1170 };
1171
1172 static void __cpuinit apic_pm_activate(void)
1173 {
1174         apic_pm_state.active = 1;
1175 }
1176
1177 static int __init init_lapic_sysfs(void)
1178 {
1179         int error;
1180
1181         if (!cpu_has_apic)
1182                 return 0;
1183         /* XXX: remove suspend/resume procs if !apic_pm_state.active? */
1184
1185         error = sysdev_class_register(&lapic_sysclass);
1186         if (!error)
1187                 error = sysdev_register(&device_lapic);
1188         return error;
1189 }
1190 device_initcall(init_lapic_sysfs);
1191
1192 #else   /* CONFIG_PM */
1193
1194 static void apic_pm_activate(void) { }
1195
1196 #endif  /* CONFIG_PM */
1197
1198 /*
1199  * apic_is_clustered_box() -- Check if we can expect good TSC
1200  *
1201  * Thus far, the major user of this is IBM's Summit2 series:
1202  *
1203  * Clustered boxes may have unsynced TSC problems if they are
1204  * multi-chassis. Use available data to take a good guess.
1205  * If in doubt, go HPET.
1206  */
1207 __cpuinit int apic_is_clustered_box(void)
1208 {
1209         int i, clusters, zeros;
1210         unsigned id;
1211         u16 *bios_cpu_apicid;
1212         DECLARE_BITMAP(clustermap, NUM_APIC_CLUSTERS);
1213
1214         /*
1215          * there is not this kind of box with AMD CPU yet.
1216          * Some AMD box with quadcore cpu and 8 sockets apicid
1217          * will be [4, 0x23] or [8, 0x27] could be thought to
1218          * vsmp box still need checking...
1219          */
1220         if ((boot_cpu_data.x86_vendor == X86_VENDOR_AMD) && !is_vsmp_box())
1221                 return 0;
1222
1223         bios_cpu_apicid = x86_bios_cpu_apicid_early_ptr;
1224         bitmap_zero(clustermap, NUM_APIC_CLUSTERS);
1225
1226         for (i = 0; i < NR_CPUS; i++) {
1227                 /* are we being called early in kernel startup? */
1228                 if (bios_cpu_apicid) {
1229                         id = bios_cpu_apicid[i];
1230                 }
1231                 else if (i < nr_cpu_ids) {
1232                         if (cpu_present(i))
1233                                 id = per_cpu(x86_bios_cpu_apicid, i);
1234                         else
1235                                 continue;
1236                 }
1237                 else
1238                         break;
1239
1240                 if (id != BAD_APICID)
1241                         __set_bit(APIC_CLUSTERID(id), clustermap);
1242         }
1243
1244         /* Problem:  Partially populated chassis may not have CPUs in some of
1245          * the APIC clusters they have been allocated.  Only present CPUs have
1246          * x86_bios_cpu_apicid entries, thus causing zeroes in the bitmap.
1247          * Since clusters are allocated sequentially, count zeros only if
1248          * they are bounded by ones.
1249          */
1250         clusters = 0;
1251         zeros = 0;
1252         for (i = 0; i < NUM_APIC_CLUSTERS; i++) {
1253                 if (test_bit(i, clustermap)) {
1254                         clusters += 1 + zeros;
1255                         zeros = 0;
1256                 } else
1257                         ++zeros;
1258         }
1259
1260         /* ScaleMP vSMPowered boxes have one cluster per board and TSCs are
1261          * not guaranteed to be synced between boards
1262          */
1263         if (is_vsmp_box() && clusters > 1)
1264                 return 1;
1265
1266         /*
1267          * If clusters > 2, then should be multi-chassis.
1268          * May have to revisit this when multi-core + hyperthreaded CPUs come
1269          * out, but AFAIK this will work even for them.
1270          */
1271         return (clusters > 2);
1272 }
1273
1274 /*
1275  * APIC command line parameters
1276  */
1277 static int __init apic_set_verbosity(char *str)
1278 {
1279         if (str == NULL)  {
1280                 skip_ioapic_setup = 0;
1281                 ioapic_force = 1;
1282                 return 0;
1283         }
1284         if (strcmp("debug", str) == 0)
1285                 apic_verbosity = APIC_DEBUG;
1286         else if (strcmp("verbose", str) == 0)
1287                 apic_verbosity = APIC_VERBOSE;
1288         else {
1289                 printk(KERN_WARNING "APIC Verbosity level %s not recognised"
1290                                 " use apic=verbose or apic=debug\n", str);
1291                 return -EINVAL;
1292         }
1293
1294         return 0;
1295 }
1296 early_param("apic", apic_set_verbosity);
1297
1298 static __init int setup_disableapic(char *str)
1299 {
1300         disable_apic = 1;
1301         clear_cpu_cap(&boot_cpu_data, X86_FEATURE_APIC);
1302         return 0;
1303 }
1304 early_param("disableapic", setup_disableapic);
1305
1306 /* same as disableapic, for compatibility */
1307 static __init int setup_nolapic(char *str)
1308 {
1309         return setup_disableapic(str);
1310 }
1311 early_param("nolapic", setup_nolapic);
1312
1313 static int __init parse_lapic_timer_c2_ok(char *arg)
1314 {
1315         local_apic_timer_c2_ok = 1;
1316         return 0;
1317 }
1318 early_param("lapic_timer_c2_ok", parse_lapic_timer_c2_ok);
1319
1320 static __init int setup_noapictimer(char *str)
1321 {
1322         if (str[0] != ' ' && str[0] != 0)
1323                 return 0;
1324         disable_apic_timer = 1;
1325         return 1;
1326 }
1327 __setup("noapictimer", setup_noapictimer);
1328
1329 static __init int setup_apicpmtimer(char *s)
1330 {
1331         apic_calibrate_pmtmr = 1;
1332         notsc_setup(NULL);
1333         return 0;
1334 }
1335 __setup("apicpmtimer", setup_apicpmtimer);
1336
1337 static int __init lapic_insert_resource(void)
1338 {
1339         if (!apic_phys)
1340                 return -1;
1341
1342         /* Put local APIC into the resource map. */
1343         lapic_resource.start = apic_phys;
1344         lapic_resource.end = lapic_resource.start + PAGE_SIZE - 1;
1345         insert_resource(&iomem_resource, &lapic_resource);
1346
1347         return 0;
1348 }
1349
1350 /*
1351  * need call insert after e820_reserve_resources()
1352  * that is using request_resource
1353  */
1354 late_initcall(lapic_insert_resource);