time: ntp: refactor and clean up ntp_update_offset()
[safe/jmp/linux-2.6] / kernel / time / ntp.c
1 /*
2  * NTP state machine interfaces and logic.
3  *
4  * This code was mainly moved from kernel/timer.c and kernel/time.c
5  * Please see those files for relevant copyright info and historical
6  * changelogs.
7  */
8 #include <linux/capability.h>
9 #include <linux/clocksource.h>
10 #include <linux/workqueue.h>
11 #include <linux/hrtimer.h>
12 #include <linux/jiffies.h>
13 #include <linux/math64.h>
14 #include <linux/timex.h>
15 #include <linux/time.h>
16 #include <linux/mm.h>
17
18 /*
19  * NTP timekeeping variables:
20  */
21
22 /* USER_HZ period (usecs): */
23 unsigned long                   tick_usec = TICK_USEC;
24
25 /* ACTHZ period (nsecs): */
26 unsigned long                   tick_nsec;
27
28 u64                             tick_length;
29 static u64                      tick_length_base;
30
31 static struct hrtimer           leap_timer;
32
33 #define MAX_TICKADJ             500LL           /* usecs */
34 #define MAX_TICKADJ_SCALED \
35         (((MAX_TICKADJ * NSEC_PER_USEC) << NTP_SCALE_SHIFT) / NTP_INTERVAL_FREQ)
36
37 /*
38  * phase-lock loop variables
39  */
40
41 /*
42  * clock synchronization status
43  *
44  * (TIME_ERROR prevents overwriting the CMOS clock)
45  */
46 static int                      time_state = TIME_OK;
47
48 /* clock status bits:                                                   */
49 int                             time_status = STA_UNSYNC;
50
51 /* TAI offset (secs):                                                   */
52 static long                     time_tai;
53
54 /* time adjustment (nsecs):                                             */
55 static s64                      time_offset;
56
57 /* pll time constant:                                                   */
58 static long                     time_constant = 2;
59
60 /* maximum error (usecs):                                               */
61 long                            time_maxerror = NTP_PHASE_LIMIT;
62
63 /* estimated error (usecs):                                             */
64 long                            time_esterror = NTP_PHASE_LIMIT;
65
66 /* frequency offset (scaled nsecs/secs):                                */
67 static s64                      time_freq;
68
69 /* time at last adjustment (secs):                                      */
70 static long                     time_reftime;
71
72 long                            time_adjust;
73
74 static long                     ntp_tick_adj;
75
76 /*
77  * NTP methods:
78  */
79
80 /*
81  * Update (tick_length, tick_length_base, tick_nsec), based
82  * on (tick_usec, ntp_tick_adj, time_freq):
83  */
84 static void ntp_update_frequency(void)
85 {
86         u64 second_length;
87         u64 new_base;
88
89         second_length            = (u64)(tick_usec * NSEC_PER_USEC * USER_HZ)
90                                                 << NTP_SCALE_SHIFT;
91
92         second_length           += (s64)ntp_tick_adj << NTP_SCALE_SHIFT;
93         second_length           += time_freq;
94
95         tick_nsec                = div_u64(second_length, HZ) >> NTP_SCALE_SHIFT;
96         new_base                 = div_u64(second_length, NTP_INTERVAL_FREQ);
97
98         /*
99          * Don't wait for the next second_overflow, apply
100          * the change to the tick length immediately:
101          */
102         tick_length             += new_base - tick_length_base;
103         tick_length_base         = new_base;
104 }
105
106 static inline s64 ntp_update_offset_fll(s64 freq_adj, s64 offset64, long secs)
107 {
108         time_status &= ~STA_MODE;
109
110         if (secs < MINSEC)
111                 return freq_adj;
112
113         if (!(time_status & STA_FLL) && (secs <= MAXSEC))
114                 return freq_adj;
115
116         freq_adj += div_s64(offset64 << (NTP_SCALE_SHIFT - SHIFT_FLL), secs);
117         time_status |= STA_MODE;
118
119         return freq_adj;
120 }
121
122 static void ntp_update_offset(long offset)
123 {
124         s64 freq_adj;
125         s64 offset64;
126         long secs;
127
128         if (!(time_status & STA_PLL))
129                 return;
130
131         if (!(time_status & STA_NANO))
132                 offset *= NSEC_PER_USEC;
133
134         /*
135          * Scale the phase adjustment and
136          * clamp to the operating range.
137          */
138         offset = min(offset, MAXPHASE);
139         offset = max(offset, -MAXPHASE);
140
141         /*
142          * Select how the frequency is to be controlled
143          * and in which mode (PLL or FLL).
144          */
145         if (time_status & STA_FREQHOLD || time_reftime == 0)
146                 time_reftime = xtime.tv_sec;
147
148         secs = xtime.tv_sec - time_reftime;
149         time_reftime = xtime.tv_sec;
150
151         offset64    = offset;
152         freq_adj    = (offset64 * secs) <<
153                         (NTP_SCALE_SHIFT - 2 * (SHIFT_PLL + 2 + time_constant));
154
155         freq_adj    = ntp_update_offset_fll(freq_adj, offset64, secs);
156
157         freq_adj    = min(freq_adj + time_freq, MAXFREQ_SCALED);
158
159         time_freq   = max(freq_adj, -MAXFREQ_SCALED);
160
161         time_offset = div_s64(offset64 << NTP_SCALE_SHIFT, NTP_INTERVAL_FREQ);
162 }
163
164 /**
165  * ntp_clear - Clears the NTP state variables
166  *
167  * Must be called while holding a write on the xtime_lock
168  */
169 void ntp_clear(void)
170 {
171         time_adjust     = 0;            /* stop active adjtime() */
172         time_status     |= STA_UNSYNC;
173         time_maxerror   = NTP_PHASE_LIMIT;
174         time_esterror   = NTP_PHASE_LIMIT;
175
176         ntp_update_frequency();
177
178         tick_length     = tick_length_base;
179         time_offset     = 0;
180 }
181
182 /*
183  * Leap second processing. If in leap-insert state at the end of the
184  * day, the system clock is set back one second; if in leap-delete
185  * state, the system clock is set ahead one second.
186  */
187 static enum hrtimer_restart ntp_leap_second(struct hrtimer *timer)
188 {
189         enum hrtimer_restart res = HRTIMER_NORESTART;
190
191         write_seqlock(&xtime_lock);
192
193         switch (time_state) {
194         case TIME_OK:
195                 break;
196         case TIME_INS:
197                 xtime.tv_sec--;
198                 wall_to_monotonic.tv_sec++;
199                 time_state = TIME_OOP;
200                 printk(KERN_NOTICE
201                         "Clock: inserting leap second 23:59:60 UTC\n");
202                 hrtimer_add_expires_ns(&leap_timer, NSEC_PER_SEC);
203                 res = HRTIMER_RESTART;
204                 break;
205         case TIME_DEL:
206                 xtime.tv_sec++;
207                 time_tai--;
208                 wall_to_monotonic.tv_sec--;
209                 time_state = TIME_WAIT;
210                 printk(KERN_NOTICE
211                         "Clock: deleting leap second 23:59:59 UTC\n");
212                 break;
213         case TIME_OOP:
214                 time_tai++;
215                 time_state = TIME_WAIT;
216                 /* fall through */
217         case TIME_WAIT:
218                 if (!(time_status & (STA_INS | STA_DEL)))
219                         time_state = TIME_OK;
220                 break;
221         }
222         update_vsyscall(&xtime, clock);
223
224         write_sequnlock(&xtime_lock);
225
226         return res;
227 }
228
229 /*
230  * this routine handles the overflow of the microsecond field
231  *
232  * The tricky bits of code to handle the accurate clock support
233  * were provided by Dave Mills (Mills@UDEL.EDU) of NTP fame.
234  * They were originally developed for SUN and DEC kernels.
235  * All the kudos should go to Dave for this stuff.
236  */
237 void second_overflow(void)
238 {
239         s64 time_adj;
240
241         /* Bump the maxerror field */
242         time_maxerror += MAXFREQ / NSEC_PER_USEC;
243         if (time_maxerror > NTP_PHASE_LIMIT) {
244                 time_maxerror = NTP_PHASE_LIMIT;
245                 time_status |= STA_UNSYNC;
246         }
247
248         /*
249          * Compute the phase adjustment for the next second. The offset is
250          * reduced by a fixed factor times the time constant.
251          */
252         tick_length     = tick_length_base;
253         time_adj        = shift_right(time_offset, SHIFT_PLL + time_constant);
254         time_offset     -= time_adj;
255         tick_length     += time_adj;
256
257         if (!time_adjust)
258                 return;
259
260         if (time_adjust > MAX_TICKADJ) {
261                 time_adjust -= MAX_TICKADJ;
262                 tick_length += MAX_TICKADJ_SCALED;
263                 return;
264         }
265
266         if (time_adjust < -MAX_TICKADJ) {
267                 time_adjust += MAX_TICKADJ;
268                 tick_length -= MAX_TICKADJ_SCALED;
269                 return;
270         }
271
272         tick_length += (s64)(time_adjust * NSEC_PER_USEC / NTP_INTERVAL_FREQ)
273                                                          << NTP_SCALE_SHIFT;
274         time_adjust = 0;
275 }
276
277 #ifdef CONFIG_GENERIC_CMOS_UPDATE
278
279 /* Disable the cmos update - used by virtualization and embedded */
280 int no_sync_cmos_clock  __read_mostly;
281
282 static void sync_cmos_clock(struct work_struct *work);
283
284 static DECLARE_DELAYED_WORK(sync_cmos_work, sync_cmos_clock);
285
286 static void sync_cmos_clock(struct work_struct *work)
287 {
288         struct timespec now, next;
289         int fail = 1;
290
291         /*
292          * If we have an externally synchronized Linux clock, then update
293          * CMOS clock accordingly every ~11 minutes. Set_rtc_mmss() has to be
294          * called as close as possible to 500 ms before the new second starts.
295          * This code is run on a timer.  If the clock is set, that timer
296          * may not expire at the correct time.  Thus, we adjust...
297          */
298         if (!ntp_synced()) {
299                 /*
300                  * Not synced, exit, do not restart a timer (if one is
301                  * running, let it run out).
302                  */
303                 return;
304         }
305
306         getnstimeofday(&now);
307         if (abs(now.tv_nsec - (NSEC_PER_SEC / 2)) <= tick_nsec / 2)
308                 fail = update_persistent_clock(now);
309
310         next.tv_nsec = (NSEC_PER_SEC / 2) - now.tv_nsec - (TICK_NSEC / 2);
311         if (next.tv_nsec <= 0)
312                 next.tv_nsec += NSEC_PER_SEC;
313
314         if (!fail)
315                 next.tv_sec = 659;
316         else
317                 next.tv_sec = 0;
318
319         if (next.tv_nsec >= NSEC_PER_SEC) {
320                 next.tv_sec++;
321                 next.tv_nsec -= NSEC_PER_SEC;
322         }
323         schedule_delayed_work(&sync_cmos_work, timespec_to_jiffies(&next));
324 }
325
326 static void notify_cmos_timer(void)
327 {
328         if (!no_sync_cmos_clock)
329                 schedule_delayed_work(&sync_cmos_work, 0);
330 }
331
332 #else
333 static inline void notify_cmos_timer(void) { }
334 #endif
335
336 /*
337  * adjtimex mainly allows reading (and writing, if superuser) of
338  * kernel time-keeping variables. used by xntpd.
339  */
340 int do_adjtimex(struct timex *txc)
341 {
342         struct timespec ts;
343         int result;
344
345         /* Validate the data before disabling interrupts */
346         if (txc->modes & ADJ_ADJTIME) {
347                 /* singleshot must not be used with any other mode bits */
348                 if (!(txc->modes & ADJ_OFFSET_SINGLESHOT))
349                         return -EINVAL;
350                 if (!(txc->modes & ADJ_OFFSET_READONLY) &&
351                     !capable(CAP_SYS_TIME))
352                         return -EPERM;
353         } else {
354                 /* In order to modify anything, you gotta be super-user! */
355                  if (txc->modes && !capable(CAP_SYS_TIME))
356                         return -EPERM;
357
358                 /*
359                  * if the quartz is off by more than 10% then
360                  * something is VERY wrong!
361                  */
362                 if (txc->modes & ADJ_TICK &&
363                     (txc->tick <  900000/USER_HZ ||
364                      txc->tick > 1100000/USER_HZ))
365                                 return -EINVAL;
366
367                 if (txc->modes & ADJ_STATUS && time_state != TIME_OK)
368                         hrtimer_cancel(&leap_timer);
369         }
370
371         getnstimeofday(&ts);
372
373         write_seqlock_irq(&xtime_lock);
374
375         /* If there are input parameters, then process them */
376         if (txc->modes & ADJ_ADJTIME) {
377                 long save_adjust = time_adjust;
378
379                 if (!(txc->modes & ADJ_OFFSET_READONLY)) {
380                         /* adjtime() is independent from ntp_adjtime() */
381                         time_adjust = txc->offset;
382                         ntp_update_frequency();
383                 }
384                 txc->offset = save_adjust;
385                 goto adj_done;
386         }
387         if (txc->modes) {
388                 long sec;
389
390                 if (txc->modes & ADJ_STATUS) {
391                         if ((time_status & STA_PLL) &&
392                             !(txc->status & STA_PLL)) {
393                                 time_state = TIME_OK;
394                                 time_status = STA_UNSYNC;
395                         }
396                         /* only set allowed bits */
397                         time_status &= STA_RONLY;
398                         time_status |= txc->status & ~STA_RONLY;
399
400                         switch (time_state) {
401                         case TIME_OK:
402                         start_timer:
403                                 sec = ts.tv_sec;
404                                 if (time_status & STA_INS) {
405                                         time_state = TIME_INS;
406                                         sec += 86400 - sec % 86400;
407                                         hrtimer_start(&leap_timer, ktime_set(sec, 0), HRTIMER_MODE_ABS);
408                                 } else if (time_status & STA_DEL) {
409                                         time_state = TIME_DEL;
410                                         sec += 86400 - (sec + 1) % 86400;
411                                         hrtimer_start(&leap_timer, ktime_set(sec, 0), HRTIMER_MODE_ABS);
412                                 }
413                                 break;
414                         case TIME_INS:
415                         case TIME_DEL:
416                                 time_state = TIME_OK;
417                                 goto start_timer;
418                                 break;
419                         case TIME_WAIT:
420                                 if (!(time_status & (STA_INS | STA_DEL)))
421                                         time_state = TIME_OK;
422                                 break;
423                         case TIME_OOP:
424                                 hrtimer_restart(&leap_timer);
425                                 break;
426                         }
427                 }
428
429                 if (txc->modes & ADJ_NANO)
430                         time_status |= STA_NANO;
431                 if (txc->modes & ADJ_MICRO)
432                         time_status &= ~STA_NANO;
433
434                 if (txc->modes & ADJ_FREQUENCY) {
435                         time_freq = (s64)txc->freq * PPM_SCALE;
436                         time_freq = min(time_freq, MAXFREQ_SCALED);
437                         time_freq = max(time_freq, -MAXFREQ_SCALED);
438                 }
439
440                 if (txc->modes & ADJ_MAXERROR)
441                         time_maxerror = txc->maxerror;
442                 if (txc->modes & ADJ_ESTERROR)
443                         time_esterror = txc->esterror;
444
445                 if (txc->modes & ADJ_TIMECONST) {
446                         time_constant = txc->constant;
447                         if (!(time_status & STA_NANO))
448                                 time_constant += 4;
449                         time_constant = min(time_constant, (long)MAXTC);
450                         time_constant = max(time_constant, 0l);
451                 }
452
453                 if (txc->modes & ADJ_TAI && txc->constant > 0)
454                         time_tai = txc->constant;
455
456                 if (txc->modes & ADJ_OFFSET)
457                         ntp_update_offset(txc->offset);
458                 if (txc->modes & ADJ_TICK)
459                         tick_usec = txc->tick;
460
461                 if (txc->modes & (ADJ_TICK|ADJ_FREQUENCY|ADJ_OFFSET))
462                         ntp_update_frequency();
463         }
464
465         txc->offset = shift_right(time_offset * NTP_INTERVAL_FREQ,
466                                   NTP_SCALE_SHIFT);
467         if (!(time_status & STA_NANO))
468                 txc->offset /= NSEC_PER_USEC;
469
470 adj_done:
471         result = time_state;    /* mostly `TIME_OK' */
472         if (time_status & (STA_UNSYNC|STA_CLOCKERR))
473                 result = TIME_ERROR;
474
475         txc->freq          = shift_right((time_freq >> PPM_SCALE_INV_SHIFT) *
476                                          (s64)PPM_SCALE_INV, NTP_SCALE_SHIFT);
477         txc->maxerror      = time_maxerror;
478         txc->esterror      = time_esterror;
479         txc->status        = time_status;
480         txc->constant      = time_constant;
481         txc->precision     = 1;
482         txc->tolerance     = MAXFREQ_SCALED / PPM_SCALE;
483         txc->tick          = tick_usec;
484         txc->tai           = time_tai;
485
486         /* PPS is not implemented, so these are zero */
487         txc->ppsfreq       = 0;
488         txc->jitter        = 0;
489         txc->shift         = 0;
490         txc->stabil        = 0;
491         txc->jitcnt        = 0;
492         txc->calcnt        = 0;
493         txc->errcnt        = 0;
494         txc->stbcnt        = 0;
495         write_sequnlock_irq(&xtime_lock);
496
497         txc->time.tv_sec = ts.tv_sec;
498         txc->time.tv_usec = ts.tv_nsec;
499         if (!(time_status & STA_NANO))
500                 txc->time.tv_usec /= NSEC_PER_USEC;
501
502         notify_cmos_timer();
503
504         return result;
505 }
506
507 static int __init ntp_tick_adj_setup(char *str)
508 {
509         ntp_tick_adj = simple_strtol(str, NULL, 0);
510         return 1;
511 }
512
513 __setup("ntp_tick_adj=", ntp_tick_adj_setup);
514
515 void __init ntp_init(void)
516 {
517         ntp_clear();
518         hrtimer_init(&leap_timer, CLOCK_REALTIME, HRTIMER_MODE_ABS);
519         leap_timer.function = ntp_leap_second;
520 }