e8a21e8cb2ad55f7dff128ef24daab142b0f96ce
[safe/jmp/linux-2.6] / drivers / kvm / kvm.h
1 #ifndef __KVM_H
2 #define __KVM_H
3
4 /*
5  * This work is licensed under the terms of the GNU GPL, version 2.  See
6  * the COPYING file in the top-level directory.
7  */
8
9 #include <linux/types.h>
10 #include <linux/hardirq.h>
11 #include <linux/list.h>
12 #include <linux/mutex.h>
13 #include <linux/spinlock.h>
14 #include <linux/signal.h>
15 #include <linux/sched.h>
16 #include <linux/mm.h>
17 #include <linux/preempt.h>
18 #include <asm/signal.h>
19
20 #include <linux/kvm.h>
21 #include <linux/kvm_para.h>
22
23 #define CR3_PAE_RESERVED_BITS ((X86_CR3_PWT | X86_CR3_PCD) - 1)
24 #define CR3_NONPAE_RESERVED_BITS ((PAGE_SIZE-1) & ~(X86_CR3_PWT | X86_CR3_PCD))
25 #define CR3_L_MODE_RESERVED_BITS (CR3_NONPAE_RESERVED_BITS|0xFFFFFF0000000000ULL)
26
27 #define KVM_GUEST_CR0_MASK \
28         (X86_CR0_PG | X86_CR0_PE | X86_CR0_WP | X86_CR0_NE \
29          | X86_CR0_NW | X86_CR0_CD)
30 #define KVM_VM_CR0_ALWAYS_ON \
31         (X86_CR0_PG | X86_CR0_PE | X86_CR0_WP | X86_CR0_NE | X86_CR0_TS \
32          | X86_CR0_MP)
33 #define KVM_GUEST_CR4_MASK \
34         (X86_CR4_VME | X86_CR4_PSE | X86_CR4_PAE | X86_CR4_PGE | X86_CR4_VMXE)
35 #define KVM_PMODE_VM_CR4_ALWAYS_ON (X86_CR4_PAE | X86_CR4_VMXE)
36 #define KVM_RMODE_VM_CR4_ALWAYS_ON (X86_CR4_VME | X86_CR4_PAE | X86_CR4_VMXE)
37
38 #define INVALID_PAGE (~(hpa_t)0)
39 #define UNMAPPED_GVA (~(gpa_t)0)
40
41 #define KVM_MAX_VCPUS 4
42 #define KVM_ALIAS_SLOTS 4
43 #define KVM_MEMORY_SLOTS 8
44 #define KVM_PERMILLE_MMU_PAGES 20
45 #define KVM_MIN_ALLOC_MMU_PAGES 64
46 #define KVM_NUM_MMU_PAGES 1024
47 #define KVM_MIN_FREE_MMU_PAGES 5
48 #define KVM_REFILL_PAGES 25
49 #define KVM_MAX_CPUID_ENTRIES 40
50
51 #define DE_VECTOR 0
52 #define UD_VECTOR 6
53 #define NM_VECTOR 7
54 #define DF_VECTOR 8
55 #define TS_VECTOR 10
56 #define NP_VECTOR 11
57 #define SS_VECTOR 12
58 #define GP_VECTOR 13
59 #define PF_VECTOR 14
60
61 #define SELECTOR_TI_MASK (1 << 2)
62 #define SELECTOR_RPL_MASK 0x03
63
64 #define IOPL_SHIFT 12
65
66 #define KVM_PIO_PAGE_OFFSET 1
67
68 /*
69  * vcpu->requests bit members
70  */
71 #define KVM_REQ_TLB_FLUSH          0
72
73 /*
74  * Address types:
75  *
76  *  gva - guest virtual address
77  *  gpa - guest physical address
78  *  gfn - guest frame number
79  *  hva - host virtual address
80  *  hpa - host physical address
81  *  hfn - host frame number
82  */
83
84 typedef unsigned long  gva_t;
85 typedef u64            gpa_t;
86 typedef unsigned long  gfn_t;
87
88 typedef unsigned long  hva_t;
89 typedef u64            hpa_t;
90 typedef unsigned long  hfn_t;
91
92 #define NR_PTE_CHAIN_ENTRIES 5
93
94 struct kvm_pte_chain {
95         u64 *parent_ptes[NR_PTE_CHAIN_ENTRIES];
96         struct hlist_node link;
97 };
98
99 /*
100  * kvm_mmu_page_role, below, is defined as:
101  *
102  *   bits 0:3 - total guest paging levels (2-4, or zero for real mode)
103  *   bits 4:7 - page table level for this shadow (1-4)
104  *   bits 8:9 - page table quadrant for 2-level guests
105  *   bit   16 - "metaphysical" - gfn is not a real page (huge page/real mode)
106  *   bits 17:19 - "access" - the user, writable, and nx bits of a huge page pde
107  */
108 union kvm_mmu_page_role {
109         unsigned word;
110         struct {
111                 unsigned glevels : 4;
112                 unsigned level : 4;
113                 unsigned quadrant : 2;
114                 unsigned pad_for_nice_hex_output : 6;
115                 unsigned metaphysical : 1;
116                 unsigned hugepage_access : 3;
117         };
118 };
119
120 struct kvm_mmu_page {
121         struct list_head link;
122         struct hlist_node hash_link;
123
124         /*
125          * The following two entries are used to key the shadow page in the
126          * hash table.
127          */
128         gfn_t gfn;
129         union kvm_mmu_page_role role;
130
131         u64 *spt;
132         /* hold the gfn of each spte inside spt */
133         gfn_t *gfns;
134         unsigned long slot_bitmap; /* One bit set per slot which has memory
135                                     * in this shadow page.
136                                     */
137         int multimapped;         /* More than one parent_pte? */
138         int root_count;          /* Currently serving as active root */
139         union {
140                 u64 *parent_pte;               /* !multimapped */
141                 struct hlist_head parent_ptes; /* multimapped, kvm_pte_chain */
142         };
143 };
144
145 struct kvm_vcpu;
146 extern struct kmem_cache *kvm_vcpu_cache;
147
148 /*
149  * x86 supports 3 paging modes (4-level 64-bit, 3-level 64-bit, and 2-level
150  * 32-bit).  The kvm_mmu structure abstracts the details of the current mmu
151  * mode.
152  */
153 struct kvm_mmu {
154         void (*new_cr3)(struct kvm_vcpu *vcpu);
155         int (*page_fault)(struct kvm_vcpu *vcpu, gva_t gva, u32 err);
156         void (*free)(struct kvm_vcpu *vcpu);
157         gpa_t (*gva_to_gpa)(struct kvm_vcpu *vcpu, gva_t gva);
158         void (*prefetch_page)(struct kvm_vcpu *vcpu,
159                               struct kvm_mmu_page *page);
160         hpa_t root_hpa;
161         int root_level;
162         int shadow_root_level;
163
164         u64 *pae_root;
165 };
166
167 #define KVM_NR_MEM_OBJS 40
168
169 struct kvm_mmu_memory_cache {
170         int nobjs;
171         void *objects[KVM_NR_MEM_OBJS];
172 };
173
174 /*
175  * We don't want allocation failures within the mmu code, so we preallocate
176  * enough memory for a single page fault in a cache.
177  */
178 struct kvm_guest_debug {
179         int enabled;
180         unsigned long bp[4];
181         int singlestep;
182 };
183
184 enum {
185         VCPU_REGS_RAX = 0,
186         VCPU_REGS_RCX = 1,
187         VCPU_REGS_RDX = 2,
188         VCPU_REGS_RBX = 3,
189         VCPU_REGS_RSP = 4,
190         VCPU_REGS_RBP = 5,
191         VCPU_REGS_RSI = 6,
192         VCPU_REGS_RDI = 7,
193 #ifdef CONFIG_X86_64
194         VCPU_REGS_R8 = 8,
195         VCPU_REGS_R9 = 9,
196         VCPU_REGS_R10 = 10,
197         VCPU_REGS_R11 = 11,
198         VCPU_REGS_R12 = 12,
199         VCPU_REGS_R13 = 13,
200         VCPU_REGS_R14 = 14,
201         VCPU_REGS_R15 = 15,
202 #endif
203         NR_VCPU_REGS
204 };
205
206 enum {
207         VCPU_SREG_CS,
208         VCPU_SREG_DS,
209         VCPU_SREG_ES,
210         VCPU_SREG_FS,
211         VCPU_SREG_GS,
212         VCPU_SREG_SS,
213         VCPU_SREG_TR,
214         VCPU_SREG_LDTR,
215 };
216
217 #include "x86_emulate.h"
218
219 struct kvm_pio_request {
220         unsigned long count;
221         int cur_count;
222         struct page *guest_pages[2];
223         unsigned guest_page_offset;
224         int in;
225         int port;
226         int size;
227         int string;
228         int down;
229         int rep;
230 };
231
232 struct kvm_stat {
233         u32 pf_fixed;
234         u32 pf_guest;
235         u32 tlb_flush;
236         u32 invlpg;
237
238         u32 exits;
239         u32 io_exits;
240         u32 mmio_exits;
241         u32 signal_exits;
242         u32 irq_window_exits;
243         u32 halt_exits;
244         u32 halt_wakeup;
245         u32 request_irq_exits;
246         u32 irq_exits;
247         u32 light_exits;
248         u32 efer_reload;
249 };
250
251 struct kvm_io_device {
252         void (*read)(struct kvm_io_device *this,
253                      gpa_t addr,
254                      int len,
255                      void *val);
256         void (*write)(struct kvm_io_device *this,
257                       gpa_t addr,
258                       int len,
259                       const void *val);
260         int (*in_range)(struct kvm_io_device *this, gpa_t addr);
261         void (*destructor)(struct kvm_io_device *this);
262
263         void             *private;
264 };
265
266 static inline void kvm_iodevice_read(struct kvm_io_device *dev,
267                                      gpa_t addr,
268                                      int len,
269                                      void *val)
270 {
271         dev->read(dev, addr, len, val);
272 }
273
274 static inline void kvm_iodevice_write(struct kvm_io_device *dev,
275                                       gpa_t addr,
276                                       int len,
277                                       const void *val)
278 {
279         dev->write(dev, addr, len, val);
280 }
281
282 static inline int kvm_iodevice_inrange(struct kvm_io_device *dev, gpa_t addr)
283 {
284         return dev->in_range(dev, addr);
285 }
286
287 static inline void kvm_iodevice_destructor(struct kvm_io_device *dev)
288 {
289         if (dev->destructor)
290                 dev->destructor(dev);
291 }
292
293 /*
294  * It would be nice to use something smarter than a linear search, TBD...
295  * Thankfully we dont expect many devices to register (famous last words :),
296  * so until then it will suffice.  At least its abstracted so we can change
297  * in one place.
298  */
299 struct kvm_io_bus {
300         int                   dev_count;
301 #define NR_IOBUS_DEVS 6
302         struct kvm_io_device *devs[NR_IOBUS_DEVS];
303 };
304
305 void kvm_io_bus_init(struct kvm_io_bus *bus);
306 void kvm_io_bus_destroy(struct kvm_io_bus *bus);
307 struct kvm_io_device *kvm_io_bus_find_dev(struct kvm_io_bus *bus, gpa_t addr);
308 void kvm_io_bus_register_dev(struct kvm_io_bus *bus,
309                              struct kvm_io_device *dev);
310
311 struct kvm_vcpu {
312         struct kvm *kvm;
313         struct preempt_notifier preempt_notifier;
314         int vcpu_id;
315         struct mutex mutex;
316         int   cpu;
317         u64 host_tsc;
318         struct kvm_run *run;
319         int interrupt_window_open;
320         int guest_mode;
321         unsigned long requests;
322         unsigned long irq_summary; /* bit vector: 1 per word in irq_pending */
323         DECLARE_BITMAP(irq_pending, KVM_NR_INTERRUPTS);
324         unsigned long regs[NR_VCPU_REGS]; /* for rsp: vcpu_load_rsp_rip() */
325         unsigned long rip;      /* needs vcpu_load_rsp_rip() */
326
327         unsigned long cr0;
328         unsigned long cr2;
329         unsigned long cr3;
330         unsigned long cr4;
331         unsigned long cr8;
332         u64 pdptrs[4]; /* pae */
333         u64 shadow_efer;
334         u64 apic_base;
335         struct kvm_lapic *apic;    /* kernel irqchip context */
336 #define VCPU_MP_STATE_RUNNABLE          0
337 #define VCPU_MP_STATE_UNINITIALIZED     1
338 #define VCPU_MP_STATE_INIT_RECEIVED     2
339 #define VCPU_MP_STATE_SIPI_RECEIVED     3
340 #define VCPU_MP_STATE_HALTED            4
341         int mp_state;
342         int sipi_vector;
343         u64 ia32_misc_enable_msr;
344
345         struct kvm_mmu mmu;
346
347         struct kvm_mmu_memory_cache mmu_pte_chain_cache;
348         struct kvm_mmu_memory_cache mmu_rmap_desc_cache;
349         struct kvm_mmu_memory_cache mmu_page_cache;
350         struct kvm_mmu_memory_cache mmu_page_header_cache;
351
352         gfn_t last_pt_write_gfn;
353         int   last_pt_write_count;
354         u64  *last_pte_updated;
355
356         struct kvm_guest_debug guest_debug;
357
358         struct i387_fxsave_struct host_fx_image;
359         struct i387_fxsave_struct guest_fx_image;
360         int fpu_active;
361         int guest_fpu_loaded;
362
363         int mmio_needed;
364         int mmio_read_completed;
365         int mmio_is_write;
366         int mmio_size;
367         unsigned char mmio_data[8];
368         gpa_t mmio_phys_addr;
369         gva_t mmio_fault_cr2;
370         struct kvm_pio_request pio;
371         void *pio_data;
372         wait_queue_head_t wq;
373
374         int sigset_active;
375         sigset_t sigset;
376
377         struct kvm_stat stat;
378
379         struct {
380                 int active;
381                 u8 save_iopl;
382                 struct kvm_save_segment {
383                         u16 selector;
384                         unsigned long base;
385                         u32 limit;
386                         u32 ar;
387                 } tr, es, ds, fs, gs;
388         } rmode;
389         int halt_request; /* real mode on Intel only */
390
391         int cpuid_nent;
392         struct kvm_cpuid_entry cpuid_entries[KVM_MAX_CPUID_ENTRIES];
393
394         /* emulate context */
395
396         struct x86_emulate_ctxt emulate_ctxt;
397 };
398
399 struct kvm_mem_alias {
400         gfn_t base_gfn;
401         unsigned long npages;
402         gfn_t target_gfn;
403 };
404
405 struct kvm_memory_slot {
406         gfn_t base_gfn;
407         unsigned long npages;
408         unsigned long flags;
409         struct page **phys_mem;
410         unsigned long *rmap;
411         unsigned long *dirty_bitmap;
412         int user_alloc; /* user allocated memory */
413         unsigned long userspace_addr;
414 };
415
416 struct kvm {
417         struct mutex lock; /* protects everything except vcpus */
418         int naliases;
419         struct kvm_mem_alias aliases[KVM_ALIAS_SLOTS];
420         int nmemslots;
421         struct kvm_memory_slot memslots[KVM_MEMORY_SLOTS];
422         /*
423          * Hash table of struct kvm_mmu_page.
424          */
425         struct list_head active_mmu_pages;
426         unsigned int n_free_mmu_pages;
427         unsigned int n_requested_mmu_pages;
428         unsigned int n_alloc_mmu_pages;
429         struct hlist_head mmu_page_hash[KVM_NUM_MMU_PAGES];
430         struct kvm_vcpu *vcpus[KVM_MAX_VCPUS];
431         unsigned long rmap_overflow;
432         struct list_head vm_list;
433         struct file *filp;
434         struct kvm_io_bus mmio_bus;
435         struct kvm_io_bus pio_bus;
436         struct kvm_pic *vpic;
437         struct kvm_ioapic *vioapic;
438         int round_robin_prev_vcpu;
439 };
440
441 static inline struct kvm_pic *pic_irqchip(struct kvm *kvm)
442 {
443         return kvm->vpic;
444 }
445
446 static inline struct kvm_ioapic *ioapic_irqchip(struct kvm *kvm)
447 {
448         return kvm->vioapic;
449 }
450
451 static inline int irqchip_in_kernel(struct kvm *kvm)
452 {
453         return pic_irqchip(kvm) != 0;
454 }
455
456 struct descriptor_table {
457         u16 limit;
458         unsigned long base;
459 } __attribute__((packed));
460
461 struct kvm_x86_ops {
462         int (*cpu_has_kvm_support)(void);          /* __init */
463         int (*disabled_by_bios)(void);             /* __init */
464         void (*hardware_enable)(void *dummy);      /* __init */
465         void (*hardware_disable)(void *dummy);
466         void (*check_processor_compatibility)(void *rtn);
467         int (*hardware_setup)(void);               /* __init */
468         void (*hardware_unsetup)(void);            /* __exit */
469
470         /* Create, but do not attach this VCPU */
471         struct kvm_vcpu *(*vcpu_create)(struct kvm *kvm, unsigned id);
472         void (*vcpu_free)(struct kvm_vcpu *vcpu);
473         void (*vcpu_reset)(struct kvm_vcpu *vcpu);
474
475         void (*prepare_guest_switch)(struct kvm_vcpu *vcpu);
476         void (*vcpu_load)(struct kvm_vcpu *vcpu, int cpu);
477         void (*vcpu_put)(struct kvm_vcpu *vcpu);
478         void (*vcpu_decache)(struct kvm_vcpu *vcpu);
479
480         int (*set_guest_debug)(struct kvm_vcpu *vcpu,
481                                struct kvm_debug_guest *dbg);
482         void (*guest_debug_pre)(struct kvm_vcpu *vcpu);
483         int (*get_msr)(struct kvm_vcpu *vcpu, u32 msr_index, u64 *pdata);
484         int (*set_msr)(struct kvm_vcpu *vcpu, u32 msr_index, u64 data);
485         u64 (*get_segment_base)(struct kvm_vcpu *vcpu, int seg);
486         void (*get_segment)(struct kvm_vcpu *vcpu,
487                             struct kvm_segment *var, int seg);
488         void (*set_segment)(struct kvm_vcpu *vcpu,
489                             struct kvm_segment *var, int seg);
490         void (*get_cs_db_l_bits)(struct kvm_vcpu *vcpu, int *db, int *l);
491         void (*decache_cr4_guest_bits)(struct kvm_vcpu *vcpu);
492         void (*set_cr0)(struct kvm_vcpu *vcpu, unsigned long cr0);
493         void (*set_cr3)(struct kvm_vcpu *vcpu, unsigned long cr3);
494         void (*set_cr4)(struct kvm_vcpu *vcpu, unsigned long cr4);
495         void (*set_efer)(struct kvm_vcpu *vcpu, u64 efer);
496         void (*get_idt)(struct kvm_vcpu *vcpu, struct descriptor_table *dt);
497         void (*set_idt)(struct kvm_vcpu *vcpu, struct descriptor_table *dt);
498         void (*get_gdt)(struct kvm_vcpu *vcpu, struct descriptor_table *dt);
499         void (*set_gdt)(struct kvm_vcpu *vcpu, struct descriptor_table *dt);
500         unsigned long (*get_dr)(struct kvm_vcpu *vcpu, int dr);
501         void (*set_dr)(struct kvm_vcpu *vcpu, int dr, unsigned long value,
502                        int *exception);
503         void (*cache_regs)(struct kvm_vcpu *vcpu);
504         void (*decache_regs)(struct kvm_vcpu *vcpu);
505         unsigned long (*get_rflags)(struct kvm_vcpu *vcpu);
506         void (*set_rflags)(struct kvm_vcpu *vcpu, unsigned long rflags);
507
508         void (*tlb_flush)(struct kvm_vcpu *vcpu);
509         void (*inject_page_fault)(struct kvm_vcpu *vcpu,
510                                   unsigned long addr, u32 err_code);
511
512         void (*inject_gp)(struct kvm_vcpu *vcpu, unsigned err_code);
513
514         void (*run)(struct kvm_vcpu *vcpu, struct kvm_run *run);
515         int (*handle_exit)(struct kvm_run *run, struct kvm_vcpu *vcpu);
516         void (*skip_emulated_instruction)(struct kvm_vcpu *vcpu);
517         void (*patch_hypercall)(struct kvm_vcpu *vcpu,
518                                 unsigned char *hypercall_addr);
519         int (*get_irq)(struct kvm_vcpu *vcpu);
520         void (*set_irq)(struct kvm_vcpu *vcpu, int vec);
521         void (*inject_pending_irq)(struct kvm_vcpu *vcpu);
522         void (*inject_pending_vectors)(struct kvm_vcpu *vcpu,
523                                        struct kvm_run *run);
524 };
525
526 extern struct kvm_x86_ops *kvm_x86_ops;
527
528 /* The guest did something we don't support. */
529 #define pr_unimpl(vcpu, fmt, ...)                                       \
530  do {                                                                   \
531         if (printk_ratelimit())                                         \
532                 printk(KERN_ERR "kvm: %i: cpu%i " fmt,                  \
533                        current->tgid, (vcpu)->vcpu_id , ## __VA_ARGS__); \
534  } while (0)
535
536 #define kvm_printf(kvm, fmt ...) printk(KERN_DEBUG fmt)
537 #define vcpu_printf(vcpu, fmt...) kvm_printf(vcpu->kvm, fmt)
538
539 int kvm_vcpu_init(struct kvm_vcpu *vcpu, struct kvm *kvm, unsigned id);
540 void kvm_vcpu_uninit(struct kvm_vcpu *vcpu);
541
542 void vcpu_load(struct kvm_vcpu *vcpu);
543 void vcpu_put(struct kvm_vcpu *vcpu);
544
545
546 int kvm_init_x86(struct kvm_x86_ops *ops, unsigned int vcpu_size,
547                   struct module *module);
548 void kvm_exit_x86(void);
549
550 int kvm_mmu_module_init(void);
551 void kvm_mmu_module_exit(void);
552
553 void kvm_mmu_destroy(struct kvm_vcpu *vcpu);
554 int kvm_mmu_create(struct kvm_vcpu *vcpu);
555 int kvm_mmu_setup(struct kvm_vcpu *vcpu);
556 void kvm_mmu_set_nonpresent_ptes(u64 trap_pte, u64 notrap_pte);
557
558 int kvm_mmu_reset_context(struct kvm_vcpu *vcpu);
559 void kvm_mmu_slot_remove_write_access(struct kvm *kvm, int slot);
560 void kvm_mmu_zap_all(struct kvm *kvm);
561 void kvm_mmu_change_mmu_pages(struct kvm *kvm, unsigned int kvm_nr_mmu_pages);
562
563 hpa_t gpa_to_hpa(struct kvm *kvm, gpa_t gpa);
564 #define HPA_MSB ((sizeof(hpa_t) * 8) - 1)
565 #define HPA_ERR_MASK ((hpa_t)1 << HPA_MSB)
566 static inline int is_error_hpa(hpa_t hpa) { return hpa >> HPA_MSB; }
567 hpa_t gva_to_hpa(struct kvm_vcpu *vcpu, gva_t gva);
568 struct page *gva_to_page(struct kvm_vcpu *vcpu, gva_t gva);
569
570 extern struct page *bad_page;
571
572 int is_error_page(struct page *page);
573 gfn_t unalias_gfn(struct kvm *kvm, gfn_t gfn);
574 struct page *gfn_to_page(struct kvm *kvm, gfn_t gfn);
575 void kvm_release_page(struct page *page);
576 int kvm_read_guest_page(struct kvm *kvm, gfn_t gfn, void *data, int offset,
577                         int len);
578 int kvm_read_guest(struct kvm *kvm, gpa_t gpa, void *data, unsigned long len);
579 int kvm_write_guest_page(struct kvm *kvm, gfn_t gfn, const void *data,
580                          int offset, int len);
581 int kvm_write_guest(struct kvm *kvm, gpa_t gpa, const void *data,
582                     unsigned long len);
583 int kvm_clear_guest_page(struct kvm *kvm, gfn_t gfn, int offset, int len);
584 int kvm_clear_guest(struct kvm *kvm, gpa_t gpa, unsigned long len);
585 struct kvm_memory_slot *gfn_to_memslot(struct kvm *kvm, gfn_t gfn);
586 void mark_page_dirty(struct kvm *kvm, gfn_t gfn);
587
588 enum emulation_result {
589         EMULATE_DONE,       /* no further processing */
590         EMULATE_DO_MMIO,      /* kvm_run filled with mmio request */
591         EMULATE_FAIL,         /* can't emulate this instruction */
592 };
593
594 int emulate_instruction(struct kvm_vcpu *vcpu, struct kvm_run *run,
595                         unsigned long cr2, u16 error_code, int no_decode);
596 void kvm_report_emulation_failure(struct kvm_vcpu *cvpu, const char *context);
597 void realmode_lgdt(struct kvm_vcpu *vcpu, u16 size, unsigned long address);
598 void realmode_lidt(struct kvm_vcpu *vcpu, u16 size, unsigned long address);
599 void realmode_lmsw(struct kvm_vcpu *vcpu, unsigned long msw,
600                    unsigned long *rflags);
601
602 unsigned long realmode_get_cr(struct kvm_vcpu *vcpu, int cr);
603 void realmode_set_cr(struct kvm_vcpu *vcpu, int cr, unsigned long value,
604                      unsigned long *rflags);
605 int kvm_get_msr(struct kvm_vcpu *vcpu, u32 msr_index, u64 *data);
606 int kvm_set_msr(struct kvm_vcpu *vcpu, u32 msr_index, u64 data);
607
608 struct x86_emulate_ctxt;
609
610 int kvm_emulate_pio(struct kvm_vcpu *vcpu, struct kvm_run *run, int in,
611                      int size, unsigned port);
612 int kvm_emulate_pio_string(struct kvm_vcpu *vcpu, struct kvm_run *run, int in,
613                            int size, unsigned long count, int down,
614                             gva_t address, int rep, unsigned port);
615 void kvm_emulate_cpuid(struct kvm_vcpu *vcpu);
616 int kvm_emulate_halt(struct kvm_vcpu *vcpu);
617 int emulate_invlpg(struct kvm_vcpu *vcpu, gva_t address);
618 int emulate_clts(struct kvm_vcpu *vcpu);
619 int emulator_get_dr(struct x86_emulate_ctxt *ctxt, int dr,
620                     unsigned long *dest);
621 int emulator_set_dr(struct x86_emulate_ctxt *ctxt, int dr,
622                     unsigned long value);
623
624 void set_cr0(struct kvm_vcpu *vcpu, unsigned long cr0);
625 void set_cr3(struct kvm_vcpu *vcpu, unsigned long cr0);
626 void set_cr4(struct kvm_vcpu *vcpu, unsigned long cr0);
627 void set_cr8(struct kvm_vcpu *vcpu, unsigned long cr0);
628 unsigned long get_cr8(struct kvm_vcpu *vcpu);
629 void lmsw(struct kvm_vcpu *vcpu, unsigned long msw);
630 void kvm_get_cs_db_l_bits(struct kvm_vcpu *vcpu, int *db, int *l);
631
632 int kvm_get_msr_common(struct kvm_vcpu *vcpu, u32 msr, u64 *pdata);
633 int kvm_set_msr_common(struct kvm_vcpu *vcpu, u32 msr, u64 data);
634
635 void fx_init(struct kvm_vcpu *vcpu);
636
637 void kvm_resched(struct kvm_vcpu *vcpu);
638 void kvm_load_guest_fpu(struct kvm_vcpu *vcpu);
639 void kvm_put_guest_fpu(struct kvm_vcpu *vcpu);
640 void kvm_flush_remote_tlbs(struct kvm *kvm);
641
642 int emulator_read_std(unsigned long addr,
643                       void *val,
644                       unsigned int bytes,
645                       struct kvm_vcpu *vcpu);
646 int emulator_write_emulated(unsigned long addr,
647                             const void *val,
648                             unsigned int bytes,
649                             struct kvm_vcpu *vcpu);
650
651 unsigned long segment_base(u16 selector);
652
653 void kvm_mmu_pte_write(struct kvm_vcpu *vcpu, gpa_t gpa,
654                        const u8 *new, int bytes);
655 int kvm_mmu_unprotect_page_virt(struct kvm_vcpu *vcpu, gva_t gva);
656 void __kvm_mmu_free_some_pages(struct kvm_vcpu *vcpu);
657 int kvm_mmu_load(struct kvm_vcpu *vcpu);
658 void kvm_mmu_unload(struct kvm_vcpu *vcpu);
659
660 int kvm_emulate_hypercall(struct kvm_vcpu *vcpu);
661
662 int kvm_fix_hypercall(struct kvm_vcpu *vcpu);
663
664 long kvm_arch_dev_ioctl(struct file *filp,
665                         unsigned int ioctl, unsigned long arg);
666 long kvm_arch_vcpu_ioctl(struct file *filp,
667                          unsigned int ioctl, unsigned long arg);
668 void kvm_arch_vcpu_load(struct kvm_vcpu *vcpu, int cpu);
669 void kvm_arch_vcpu_put(struct kvm_vcpu *vcpu);
670
671 __init void kvm_arch_init(void);
672
673 static inline void kvm_guest_enter(void)
674 {
675         account_system_vtime(current);
676         current->flags |= PF_VCPU;
677 }
678
679 static inline void kvm_guest_exit(void)
680 {
681         account_system_vtime(current);
682         current->flags &= ~PF_VCPU;
683 }
684
685 static inline int kvm_mmu_page_fault(struct kvm_vcpu *vcpu, gva_t gva,
686                                      u32 error_code)
687 {
688         return vcpu->mmu.page_fault(vcpu, gva, error_code);
689 }
690
691 static inline void kvm_mmu_free_some_pages(struct kvm_vcpu *vcpu)
692 {
693         if (unlikely(vcpu->kvm->n_free_mmu_pages < KVM_MIN_FREE_MMU_PAGES))
694                 __kvm_mmu_free_some_pages(vcpu);
695 }
696
697 static inline int kvm_mmu_reload(struct kvm_vcpu *vcpu)
698 {
699         if (likely(vcpu->mmu.root_hpa != INVALID_PAGE))
700                 return 0;
701
702         return kvm_mmu_load(vcpu);
703 }
704
705 static inline int is_long_mode(struct kvm_vcpu *vcpu)
706 {
707 #ifdef CONFIG_X86_64
708         return vcpu->shadow_efer & EFER_LME;
709 #else
710         return 0;
711 #endif
712 }
713
714 static inline int is_pae(struct kvm_vcpu *vcpu)
715 {
716         return vcpu->cr4 & X86_CR4_PAE;
717 }
718
719 static inline int is_pse(struct kvm_vcpu *vcpu)
720 {
721         return vcpu->cr4 & X86_CR4_PSE;
722 }
723
724 static inline int is_paging(struct kvm_vcpu *vcpu)
725 {
726         return vcpu->cr0 & X86_CR0_PG;
727 }
728
729 static inline int memslot_id(struct kvm *kvm, struct kvm_memory_slot *slot)
730 {
731         return slot - kvm->memslots;
732 }
733
734 static inline struct kvm_mmu_page *page_header(hpa_t shadow_page)
735 {
736         struct page *page = pfn_to_page(shadow_page >> PAGE_SHIFT);
737
738         return (struct kvm_mmu_page *)page_private(page);
739 }
740
741 static inline u16 read_fs(void)
742 {
743         u16 seg;
744         asm("mov %%fs, %0" : "=g"(seg));
745         return seg;
746 }
747
748 static inline u16 read_gs(void)
749 {
750         u16 seg;
751         asm("mov %%gs, %0" : "=g"(seg));
752         return seg;
753 }
754
755 static inline u16 read_ldt(void)
756 {
757         u16 ldt;
758         asm("sldt %0" : "=g"(ldt));
759         return ldt;
760 }
761
762 static inline void load_fs(u16 sel)
763 {
764         asm("mov %0, %%fs" : : "rm"(sel));
765 }
766
767 static inline void load_gs(u16 sel)
768 {
769         asm("mov %0, %%gs" : : "rm"(sel));
770 }
771
772 #ifndef load_ldt
773 static inline void load_ldt(u16 sel)
774 {
775         asm("lldt %0" : : "rm"(sel));
776 }
777 #endif
778
779 static inline void get_idt(struct descriptor_table *table)
780 {
781         asm("sidt %0" : "=m"(*table));
782 }
783
784 static inline void get_gdt(struct descriptor_table *table)
785 {
786         asm("sgdt %0" : "=m"(*table));
787 }
788
789 static inline unsigned long read_tr_base(void)
790 {
791         u16 tr;
792         asm("str %0" : "=g"(tr));
793         return segment_base(tr);
794 }
795
796 #ifdef CONFIG_X86_64
797 static inline unsigned long read_msr(unsigned long msr)
798 {
799         u64 value;
800
801         rdmsrl(msr, value);
802         return value;
803 }
804 #endif
805
806 static inline void fx_save(struct i387_fxsave_struct *image)
807 {
808         asm("fxsave (%0)":: "r" (image));
809 }
810
811 static inline void fx_restore(struct i387_fxsave_struct *image)
812 {
813         asm("fxrstor (%0)":: "r" (image));
814 }
815
816 static inline void fpu_init(void)
817 {
818         asm("finit");
819 }
820
821 static inline u32 get_rdx_init_val(void)
822 {
823         return 0x600; /* P6 family */
824 }
825
826 #define ASM_VMX_VMCLEAR_RAX       ".byte 0x66, 0x0f, 0xc7, 0x30"
827 #define ASM_VMX_VMLAUNCH          ".byte 0x0f, 0x01, 0xc2"
828 #define ASM_VMX_VMRESUME          ".byte 0x0f, 0x01, 0xc3"
829 #define ASM_VMX_VMPTRLD_RAX       ".byte 0x0f, 0xc7, 0x30"
830 #define ASM_VMX_VMREAD_RDX_RAX    ".byte 0x0f, 0x78, 0xd0"
831 #define ASM_VMX_VMWRITE_RAX_RDX   ".byte 0x0f, 0x79, 0xd0"
832 #define ASM_VMX_VMWRITE_RSP_RDX   ".byte 0x0f, 0x79, 0xd4"
833 #define ASM_VMX_VMXOFF            ".byte 0x0f, 0x01, 0xc4"
834 #define ASM_VMX_VMXON_RAX         ".byte 0xf3, 0x0f, 0xc7, 0x30"
835
836 #define MSR_IA32_TIME_STAMP_COUNTER             0x010
837
838 #define TSS_IOPB_BASE_OFFSET 0x66
839 #define TSS_BASE_SIZE 0x68
840 #define TSS_IOPB_SIZE (65536 / 8)
841 #define TSS_REDIRECTION_SIZE (256 / 8)
842 #define RMODE_TSS_SIZE (TSS_BASE_SIZE + TSS_REDIRECTION_SIZE + TSS_IOPB_SIZE + 1)
843
844 #endif