handle_stop_signal: unify partial/full stop handling
[safe/jmp/linux-2.6] / kernel / signal.c
1 /*
2  *  linux/kernel/signal.c
3  *
4  *  Copyright (C) 1991, 1992  Linus Torvalds
5  *
6  *  1997-11-02  Modified for POSIX.1b signals by Richard Henderson
7  *
8  *  2003-06-02  Jim Houston - Concurrent Computer Corp.
9  *              Changes to use preallocated sigqueue structures
10  *              to allow signals to be sent reliably.
11  */
12
13 #include <linux/slab.h>
14 #include <linux/module.h>
15 #include <linux/init.h>
16 #include <linux/sched.h>
17 #include <linux/fs.h>
18 #include <linux/tty.h>
19 #include <linux/binfmts.h>
20 #include <linux/security.h>
21 #include <linux/syscalls.h>
22 #include <linux/ptrace.h>
23 #include <linux/signal.h>
24 #include <linux/signalfd.h>
25 #include <linux/capability.h>
26 #include <linux/freezer.h>
27 #include <linux/pid_namespace.h>
28 #include <linux/nsproxy.h>
29
30 #include <asm/param.h>
31 #include <asm/uaccess.h>
32 #include <asm/unistd.h>
33 #include <asm/siginfo.h>
34 #include "audit.h"      /* audit_signal_info() */
35
36 /*
37  * SLAB caches for signal bits.
38  */
39
40 static struct kmem_cache *sigqueue_cachep;
41
42 static int __sig_ignored(struct task_struct *t, int sig)
43 {
44         void __user *handler;
45
46         /* Is it explicitly or implicitly ignored? */
47
48         handler = t->sighand->action[sig - 1].sa.sa_handler;
49         return handler == SIG_IGN ||
50                 (handler == SIG_DFL && sig_kernel_ignore(sig));
51 }
52
53 static int sig_ignored(struct task_struct *t, int sig)
54 {
55         /*
56          * Tracers always want to know about signals..
57          */
58         if (t->ptrace & PT_PTRACED)
59                 return 0;
60
61         /*
62          * Blocked signals are never ignored, since the
63          * signal handler may change by the time it is
64          * unblocked.
65          */
66         if (sigismember(&t->blocked, sig) || sigismember(&t->real_blocked, sig))
67                 return 0;
68
69         return __sig_ignored(t, sig);
70 }
71
72 /*
73  * Re-calculate pending state from the set of locally pending
74  * signals, globally pending signals, and blocked signals.
75  */
76 static inline int has_pending_signals(sigset_t *signal, sigset_t *blocked)
77 {
78         unsigned long ready;
79         long i;
80
81         switch (_NSIG_WORDS) {
82         default:
83                 for (i = _NSIG_WORDS, ready = 0; --i >= 0 ;)
84                         ready |= signal->sig[i] &~ blocked->sig[i];
85                 break;
86
87         case 4: ready  = signal->sig[3] &~ blocked->sig[3];
88                 ready |= signal->sig[2] &~ blocked->sig[2];
89                 ready |= signal->sig[1] &~ blocked->sig[1];
90                 ready |= signal->sig[0] &~ blocked->sig[0];
91                 break;
92
93         case 2: ready  = signal->sig[1] &~ blocked->sig[1];
94                 ready |= signal->sig[0] &~ blocked->sig[0];
95                 break;
96
97         case 1: ready  = signal->sig[0] &~ blocked->sig[0];
98         }
99         return ready != 0;
100 }
101
102 #define PENDING(p,b) has_pending_signals(&(p)->signal, (b))
103
104 static int recalc_sigpending_tsk(struct task_struct *t)
105 {
106         if (t->signal->group_stop_count > 0 ||
107             PENDING(&t->pending, &t->blocked) ||
108             PENDING(&t->signal->shared_pending, &t->blocked)) {
109                 set_tsk_thread_flag(t, TIF_SIGPENDING);
110                 return 1;
111         }
112         /*
113          * We must never clear the flag in another thread, or in current
114          * when it's possible the current syscall is returning -ERESTART*.
115          * So we don't clear it here, and only callers who know they should do.
116          */
117         return 0;
118 }
119
120 /*
121  * After recalculating TIF_SIGPENDING, we need to make sure the task wakes up.
122  * This is superfluous when called on current, the wakeup is a harmless no-op.
123  */
124 void recalc_sigpending_and_wake(struct task_struct *t)
125 {
126         if (recalc_sigpending_tsk(t))
127                 signal_wake_up(t, 0);
128 }
129
130 void recalc_sigpending(void)
131 {
132         if (!recalc_sigpending_tsk(current) && !freezing(current))
133                 clear_thread_flag(TIF_SIGPENDING);
134
135 }
136
137 /* Given the mask, find the first available signal that should be serviced. */
138
139 int next_signal(struct sigpending *pending, sigset_t *mask)
140 {
141         unsigned long i, *s, *m, x;
142         int sig = 0;
143         
144         s = pending->signal.sig;
145         m = mask->sig;
146         switch (_NSIG_WORDS) {
147         default:
148                 for (i = 0; i < _NSIG_WORDS; ++i, ++s, ++m)
149                         if ((x = *s &~ *m) != 0) {
150                                 sig = ffz(~x) + i*_NSIG_BPW + 1;
151                                 break;
152                         }
153                 break;
154
155         case 2: if ((x = s[0] &~ m[0]) != 0)
156                         sig = 1;
157                 else if ((x = s[1] &~ m[1]) != 0)
158                         sig = _NSIG_BPW + 1;
159                 else
160                         break;
161                 sig += ffz(~x);
162                 break;
163
164         case 1: if ((x = *s &~ *m) != 0)
165                         sig = ffz(~x) + 1;
166                 break;
167         }
168         
169         return sig;
170 }
171
172 static struct sigqueue *__sigqueue_alloc(struct task_struct *t, gfp_t flags,
173                                          int override_rlimit)
174 {
175         struct sigqueue *q = NULL;
176         struct user_struct *user;
177
178         /*
179          * In order to avoid problems with "switch_user()", we want to make
180          * sure that the compiler doesn't re-load "t->user"
181          */
182         user = t->user;
183         barrier();
184         atomic_inc(&user->sigpending);
185         if (override_rlimit ||
186             atomic_read(&user->sigpending) <=
187                         t->signal->rlim[RLIMIT_SIGPENDING].rlim_cur)
188                 q = kmem_cache_alloc(sigqueue_cachep, flags);
189         if (unlikely(q == NULL)) {
190                 atomic_dec(&user->sigpending);
191         } else {
192                 INIT_LIST_HEAD(&q->list);
193                 q->flags = 0;
194                 q->user = get_uid(user);
195         }
196         return(q);
197 }
198
199 static void __sigqueue_free(struct sigqueue *q)
200 {
201         if (q->flags & SIGQUEUE_PREALLOC)
202                 return;
203         atomic_dec(&q->user->sigpending);
204         free_uid(q->user);
205         kmem_cache_free(sigqueue_cachep, q);
206 }
207
208 void flush_sigqueue(struct sigpending *queue)
209 {
210         struct sigqueue *q;
211
212         sigemptyset(&queue->signal);
213         while (!list_empty(&queue->list)) {
214                 q = list_entry(queue->list.next, struct sigqueue , list);
215                 list_del_init(&q->list);
216                 __sigqueue_free(q);
217         }
218 }
219
220 /*
221  * Flush all pending signals for a task.
222  */
223 void flush_signals(struct task_struct *t)
224 {
225         unsigned long flags;
226
227         spin_lock_irqsave(&t->sighand->siglock, flags);
228         clear_tsk_thread_flag(t, TIF_SIGPENDING);
229         flush_sigqueue(&t->pending);
230         flush_sigqueue(&t->signal->shared_pending);
231         spin_unlock_irqrestore(&t->sighand->siglock, flags);
232 }
233
234 void ignore_signals(struct task_struct *t)
235 {
236         int i;
237
238         for (i = 0; i < _NSIG; ++i)
239                 t->sighand->action[i].sa.sa_handler = SIG_IGN;
240
241         flush_signals(t);
242 }
243
244 /*
245  * Flush all handlers for a task.
246  */
247
248 void
249 flush_signal_handlers(struct task_struct *t, int force_default)
250 {
251         int i;
252         struct k_sigaction *ka = &t->sighand->action[0];
253         for (i = _NSIG ; i != 0 ; i--) {
254                 if (force_default || ka->sa.sa_handler != SIG_IGN)
255                         ka->sa.sa_handler = SIG_DFL;
256                 ka->sa.sa_flags = 0;
257                 sigemptyset(&ka->sa.sa_mask);
258                 ka++;
259         }
260 }
261
262 int unhandled_signal(struct task_struct *tsk, int sig)
263 {
264         if (is_global_init(tsk))
265                 return 1;
266         if (tsk->ptrace & PT_PTRACED)
267                 return 0;
268         return (tsk->sighand->action[sig-1].sa.sa_handler == SIG_IGN) ||
269                 (tsk->sighand->action[sig-1].sa.sa_handler == SIG_DFL);
270 }
271
272
273 /* Notify the system that a driver wants to block all signals for this
274  * process, and wants to be notified if any signals at all were to be
275  * sent/acted upon.  If the notifier routine returns non-zero, then the
276  * signal will be acted upon after all.  If the notifier routine returns 0,
277  * then then signal will be blocked.  Only one block per process is
278  * allowed.  priv is a pointer to private data that the notifier routine
279  * can use to determine if the signal should be blocked or not.  */
280
281 void
282 block_all_signals(int (*notifier)(void *priv), void *priv, sigset_t *mask)
283 {
284         unsigned long flags;
285
286         spin_lock_irqsave(&current->sighand->siglock, flags);
287         current->notifier_mask = mask;
288         current->notifier_data = priv;
289         current->notifier = notifier;
290         spin_unlock_irqrestore(&current->sighand->siglock, flags);
291 }
292
293 /* Notify the system that blocking has ended. */
294
295 void
296 unblock_all_signals(void)
297 {
298         unsigned long flags;
299
300         spin_lock_irqsave(&current->sighand->siglock, flags);
301         current->notifier = NULL;
302         current->notifier_data = NULL;
303         recalc_sigpending();
304         spin_unlock_irqrestore(&current->sighand->siglock, flags);
305 }
306
307 static int collect_signal(int sig, struct sigpending *list, siginfo_t *info)
308 {
309         struct sigqueue *q, *first = NULL;
310         int still_pending = 0;
311
312         if (unlikely(!sigismember(&list->signal, sig)))
313                 return 0;
314
315         /*
316          * Collect the siginfo appropriate to this signal.  Check if
317          * there is another siginfo for the same signal.
318         */
319         list_for_each_entry(q, &list->list, list) {
320                 if (q->info.si_signo == sig) {
321                         if (first) {
322                                 still_pending = 1;
323                                 break;
324                         }
325                         first = q;
326                 }
327         }
328         if (first) {
329                 list_del_init(&first->list);
330                 copy_siginfo(info, &first->info);
331                 __sigqueue_free(first);
332                 if (!still_pending)
333                         sigdelset(&list->signal, sig);
334         } else {
335
336                 /* Ok, it wasn't in the queue.  This must be
337                    a fast-pathed signal or we must have been
338                    out of queue space.  So zero out the info.
339                  */
340                 sigdelset(&list->signal, sig);
341                 info->si_signo = sig;
342                 info->si_errno = 0;
343                 info->si_code = 0;
344                 info->si_pid = 0;
345                 info->si_uid = 0;
346         }
347         return 1;
348 }
349
350 static int __dequeue_signal(struct sigpending *pending, sigset_t *mask,
351                         siginfo_t *info)
352 {
353         int sig = next_signal(pending, mask);
354
355         if (sig) {
356                 if (current->notifier) {
357                         if (sigismember(current->notifier_mask, sig)) {
358                                 if (!(current->notifier)(current->notifier_data)) {
359                                         clear_thread_flag(TIF_SIGPENDING);
360                                         return 0;
361                                 }
362                         }
363                 }
364
365                 if (!collect_signal(sig, pending, info))
366                         sig = 0;
367         }
368
369         return sig;
370 }
371
372 /*
373  * Dequeue a signal and return the element to the caller, which is 
374  * expected to free it.
375  *
376  * All callers have to hold the siglock.
377  */
378 int dequeue_signal(struct task_struct *tsk, sigset_t *mask, siginfo_t *info)
379 {
380         int signr;
381
382         /* We only dequeue private signals from ourselves, we don't let
383          * signalfd steal them
384          */
385         signr = __dequeue_signal(&tsk->pending, mask, info);
386         if (!signr) {
387                 signr = __dequeue_signal(&tsk->signal->shared_pending,
388                                          mask, info);
389                 /*
390                  * itimer signal ?
391                  *
392                  * itimers are process shared and we restart periodic
393                  * itimers in the signal delivery path to prevent DoS
394                  * attacks in the high resolution timer case. This is
395                  * compliant with the old way of self restarting
396                  * itimers, as the SIGALRM is a legacy signal and only
397                  * queued once. Changing the restart behaviour to
398                  * restart the timer in the signal dequeue path is
399                  * reducing the timer noise on heavy loaded !highres
400                  * systems too.
401                  */
402                 if (unlikely(signr == SIGALRM)) {
403                         struct hrtimer *tmr = &tsk->signal->real_timer;
404
405                         if (!hrtimer_is_queued(tmr) &&
406                             tsk->signal->it_real_incr.tv64 != 0) {
407                                 hrtimer_forward(tmr, tmr->base->get_time(),
408                                                 tsk->signal->it_real_incr);
409                                 hrtimer_restart(tmr);
410                         }
411                 }
412         }
413
414         recalc_sigpending();
415         if (!signr)
416                 return 0;
417
418         if (unlikely(sig_kernel_stop(signr))) {
419                 /*
420                  * Set a marker that we have dequeued a stop signal.  Our
421                  * caller might release the siglock and then the pending
422                  * stop signal it is about to process is no longer in the
423                  * pending bitmasks, but must still be cleared by a SIGCONT
424                  * (and overruled by a SIGKILL).  So those cases clear this
425                  * shared flag after we've set it.  Note that this flag may
426                  * remain set after the signal we return is ignored or
427                  * handled.  That doesn't matter because its only purpose
428                  * is to alert stop-signal processing code when another
429                  * processor has come along and cleared the flag.
430                  */
431                 if (!(tsk->signal->flags & SIGNAL_GROUP_EXIT))
432                         tsk->signal->flags |= SIGNAL_STOP_DEQUEUED;
433         }
434         if ((info->si_code & __SI_MASK) == __SI_TIMER && info->si_sys_private) {
435                 /*
436                  * Release the siglock to ensure proper locking order
437                  * of timer locks outside of siglocks.  Note, we leave
438                  * irqs disabled here, since the posix-timers code is
439                  * about to disable them again anyway.
440                  */
441                 spin_unlock(&tsk->sighand->siglock);
442                 do_schedule_next_timer(info);
443                 spin_lock(&tsk->sighand->siglock);
444         }
445         return signr;
446 }
447
448 /*
449  * Tell a process that it has a new active signal..
450  *
451  * NOTE! we rely on the previous spin_lock to
452  * lock interrupts for us! We can only be called with
453  * "siglock" held, and the local interrupt must
454  * have been disabled when that got acquired!
455  *
456  * No need to set need_resched since signal event passing
457  * goes through ->blocked
458  */
459 void signal_wake_up(struct task_struct *t, int resume)
460 {
461         unsigned int mask;
462
463         set_tsk_thread_flag(t, TIF_SIGPENDING);
464
465         /*
466          * For SIGKILL, we want to wake it up in the stopped/traced/killable
467          * case. We don't check t->state here because there is a race with it
468          * executing another processor and just now entering stopped state.
469          * By using wake_up_state, we ensure the process will wake up and
470          * handle its death signal.
471          */
472         mask = TASK_INTERRUPTIBLE;
473         if (resume)
474                 mask |= TASK_WAKEKILL;
475         if (!wake_up_state(t, mask))
476                 kick_process(t);
477 }
478
479 /*
480  * Remove signals in mask from the pending set and queue.
481  * Returns 1 if any signals were found.
482  *
483  * All callers must be holding the siglock.
484  *
485  * This version takes a sigset mask and looks at all signals,
486  * not just those in the first mask word.
487  */
488 static int rm_from_queue_full(sigset_t *mask, struct sigpending *s)
489 {
490         struct sigqueue *q, *n;
491         sigset_t m;
492
493         sigandsets(&m, mask, &s->signal);
494         if (sigisemptyset(&m))
495                 return 0;
496
497         signandsets(&s->signal, &s->signal, mask);
498         list_for_each_entry_safe(q, n, &s->list, list) {
499                 if (sigismember(mask, q->info.si_signo)) {
500                         list_del_init(&q->list);
501                         __sigqueue_free(q);
502                 }
503         }
504         return 1;
505 }
506 /*
507  * Remove signals in mask from the pending set and queue.
508  * Returns 1 if any signals were found.
509  *
510  * All callers must be holding the siglock.
511  */
512 static int rm_from_queue(unsigned long mask, struct sigpending *s)
513 {
514         struct sigqueue *q, *n;
515
516         if (!sigtestsetmask(&s->signal, mask))
517                 return 0;
518
519         sigdelsetmask(&s->signal, mask);
520         list_for_each_entry_safe(q, n, &s->list, list) {
521                 if (q->info.si_signo < SIGRTMIN &&
522                     (mask & sigmask(q->info.si_signo))) {
523                         list_del_init(&q->list);
524                         __sigqueue_free(q);
525                 }
526         }
527         return 1;
528 }
529
530 /*
531  * Bad permissions for sending the signal
532  */
533 static int check_kill_permission(int sig, struct siginfo *info,
534                                  struct task_struct *t)
535 {
536         int error;
537
538         if (!valid_signal(sig))
539                 return -EINVAL;
540
541         if (info != SEND_SIG_NOINFO && (is_si_special(info) || SI_FROMKERNEL(info)))
542                 return 0;
543
544         error = audit_signal_info(sig, t); /* Let audit system see the signal */
545         if (error)
546                 return error;
547
548         if (((sig != SIGCONT) || (task_session_nr(current) != task_session_nr(t)))
549             && (current->euid ^ t->suid) && (current->euid ^ t->uid)
550             && (current->uid ^ t->suid) && (current->uid ^ t->uid)
551             && !capable(CAP_KILL))
552                 return -EPERM;
553
554         return security_task_kill(t, info, sig, 0);
555 }
556
557 /* forward decl */
558 static void do_notify_parent_cldstop(struct task_struct *tsk, int why);
559
560 /*
561  * Handle magic process-wide effects of stop/continue signals.
562  * Unlike the signal actions, these happen immediately at signal-generation
563  * time regardless of blocking, ignoring, or handling.  This does the
564  * actual continuing for SIGCONT, but not the actual stopping for stop
565  * signals.  The process stop is done as a signal action for SIG_DFL.
566  */
567 static void handle_stop_signal(int sig, struct task_struct *p)
568 {
569         struct task_struct *t;
570
571         if (p->signal->flags & SIGNAL_GROUP_EXIT)
572                 /*
573                  * The process is in the middle of dying already.
574                  */
575                 return;
576
577         if (sig_kernel_stop(sig)) {
578                 /*
579                  * This is a stop signal.  Remove SIGCONT from all queues.
580                  */
581                 rm_from_queue(sigmask(SIGCONT), &p->signal->shared_pending);
582                 t = p;
583                 do {
584                         rm_from_queue(sigmask(SIGCONT), &t->pending);
585                         t = next_thread(t);
586                 } while (t != p);
587         } else if (sig == SIGCONT) {
588                 unsigned int why;
589                 /*
590                  * Remove all stop signals from all queues,
591                  * and wake all threads.
592                  */
593                 rm_from_queue(SIG_KERNEL_STOP_MASK, &p->signal->shared_pending);
594                 t = p;
595                 do {
596                         unsigned int state;
597                         rm_from_queue(SIG_KERNEL_STOP_MASK, &t->pending);
598                         /*
599                          * If there is a handler for SIGCONT, we must make
600                          * sure that no thread returns to user mode before
601                          * we post the signal, in case it was the only
602                          * thread eligible to run the signal handler--then
603                          * it must not do anything between resuming and
604                          * running the handler.  With the TIF_SIGPENDING
605                          * flag set, the thread will pause and acquire the
606                          * siglock that we hold now and until we've queued
607                          * the pending signal.
608                          *
609                          * Wake up the stopped thread _after_ setting
610                          * TIF_SIGPENDING
611                          */
612                         state = __TASK_STOPPED;
613                         if (sig_user_defined(t, SIGCONT) && !sigismember(&t->blocked, SIGCONT)) {
614                                 set_tsk_thread_flag(t, TIF_SIGPENDING);
615                                 state |= TASK_INTERRUPTIBLE;
616                         }
617                         wake_up_state(t, state);
618
619                         t = next_thread(t);
620                 } while (t != p);
621
622                 /*
623                  * Notify the parent with CLD_CONTINUED if we were stopped.
624                  *
625                  * If we were in the middle of a group stop, we pretend it
626                  * was already finished, and then continued. Since SIGCHLD
627                  * doesn't queue we report only CLD_STOPPED, as if the next
628                  * CLD_CONTINUED was dropped.
629                  */
630                 why = 0;
631                 if (p->signal->flags & SIGNAL_STOP_STOPPED)
632                         why |= SIGNAL_CLD_CONTINUED;
633                 else if (p->signal->group_stop_count)
634                         why |= SIGNAL_CLD_STOPPED;
635
636                 if (why) {
637                         p->signal->flags = why | SIGNAL_STOP_CONTINUED;
638                         p->signal->group_stop_count = 0;
639                         p->signal->group_exit_code = 0;
640                 } else {
641                         /*
642                          * We are not stopped, but there could be a stop
643                          * signal in the middle of being processed after
644                          * being removed from the queue.  Clear that too.
645                          */
646                         p->signal->flags &= ~SIGNAL_STOP_DEQUEUED;
647                 }
648         } else if (sig == SIGKILL) {
649                 /*
650                  * Make sure that any pending stop signal already dequeued
651                  * is undone by the wakeup for SIGKILL.
652                  */
653                 p->signal->flags &= ~SIGNAL_STOP_DEQUEUED;
654         }
655 }
656
657 static inline int legacy_queue(struct sigpending *signals, int sig)
658 {
659         return (sig < SIGRTMIN) && sigismember(&signals->signal, sig);
660 }
661
662 static int send_signal(int sig, struct siginfo *info, struct task_struct *t,
663                         struct sigpending *signals)
664 {
665         struct sigqueue * q = NULL;
666
667         /*
668          * Short-circuit ignored signals and support queuing
669          * exactly one non-rt signal, so that we can get more
670          * detailed information about the cause of the signal.
671          */
672         if (sig_ignored(t, sig) || legacy_queue(signals, sig))
673                 return 0;
674
675         /*
676          * Deliver the signal to listening signalfds. This must be called
677          * with the sighand lock held.
678          */
679         signalfd_notify(t, sig);
680
681         /*
682          * fast-pathed signals for kernel-internal things like SIGSTOP
683          * or SIGKILL.
684          */
685         if (info == SEND_SIG_FORCED)
686                 goto out_set;
687
688         /* Real-time signals must be queued if sent by sigqueue, or
689            some other real-time mechanism.  It is implementation
690            defined whether kill() does so.  We attempt to do so, on
691            the principle of least surprise, but since kill is not
692            allowed to fail with EAGAIN when low on memory we just
693            make sure at least one signal gets delivered and don't
694            pass on the info struct.  */
695
696         q = __sigqueue_alloc(t, GFP_ATOMIC, (sig < SIGRTMIN &&
697                                              (is_si_special(info) ||
698                                               info->si_code >= 0)));
699         if (q) {
700                 list_add_tail(&q->list, &signals->list);
701                 switch ((unsigned long) info) {
702                 case (unsigned long) SEND_SIG_NOINFO:
703                         q->info.si_signo = sig;
704                         q->info.si_errno = 0;
705                         q->info.si_code = SI_USER;
706                         q->info.si_pid = task_pid_vnr(current);
707                         q->info.si_uid = current->uid;
708                         break;
709                 case (unsigned long) SEND_SIG_PRIV:
710                         q->info.si_signo = sig;
711                         q->info.si_errno = 0;
712                         q->info.si_code = SI_KERNEL;
713                         q->info.si_pid = 0;
714                         q->info.si_uid = 0;
715                         break;
716                 default:
717                         copy_siginfo(&q->info, info);
718                         break;
719                 }
720         } else if (!is_si_special(info)) {
721                 if (sig >= SIGRTMIN && info->si_code != SI_USER)
722                 /*
723                  * Queue overflow, abort.  We may abort if the signal was rt
724                  * and sent by user using something other than kill().
725                  */
726                         return -EAGAIN;
727         }
728
729 out_set:
730         sigaddset(&signals->signal, sig);
731         return 1;
732 }
733
734 int print_fatal_signals;
735
736 static void print_fatal_signal(struct pt_regs *regs, int signr)
737 {
738         printk("%s/%d: potentially unexpected fatal signal %d.\n",
739                 current->comm, task_pid_nr(current), signr);
740
741 #if defined(__i386__) && !defined(__arch_um__)
742         printk("code at %08lx: ", regs->ip);
743         {
744                 int i;
745                 for (i = 0; i < 16; i++) {
746                         unsigned char insn;
747
748                         __get_user(insn, (unsigned char *)(regs->ip + i));
749                         printk("%02x ", insn);
750                 }
751         }
752 #endif
753         printk("\n");
754         show_regs(regs);
755 }
756
757 static int __init setup_print_fatal_signals(char *str)
758 {
759         get_option (&str, &print_fatal_signals);
760
761         return 1;
762 }
763
764 __setup("print-fatal-signals=", setup_print_fatal_signals);
765
766 static int
767 specific_send_sig_info(int sig, struct siginfo *info, struct task_struct *t)
768 {
769         int ret;
770
771         BUG_ON(!irqs_disabled());
772         assert_spin_locked(&t->sighand->siglock);
773
774         ret = send_signal(sig, info, t, &t->pending);
775         if (ret <= 0)
776                 return ret;
777
778         if (!sigismember(&t->blocked, sig))
779                 signal_wake_up(t, sig == SIGKILL);
780         return 0;
781 }
782
783 /*
784  * Force a signal that the process can't ignore: if necessary
785  * we unblock the signal and change any SIG_IGN to SIG_DFL.
786  *
787  * Note: If we unblock the signal, we always reset it to SIG_DFL,
788  * since we do not want to have a signal handler that was blocked
789  * be invoked when user space had explicitly blocked it.
790  *
791  * We don't want to have recursive SIGSEGV's etc, for example.
792  */
793 int
794 force_sig_info(int sig, struct siginfo *info, struct task_struct *t)
795 {
796         unsigned long int flags;
797         int ret, blocked, ignored;
798         struct k_sigaction *action;
799
800         spin_lock_irqsave(&t->sighand->siglock, flags);
801         action = &t->sighand->action[sig-1];
802         ignored = action->sa.sa_handler == SIG_IGN;
803         blocked = sigismember(&t->blocked, sig);
804         if (blocked || ignored) {
805                 action->sa.sa_handler = SIG_DFL;
806                 if (blocked) {
807                         sigdelset(&t->blocked, sig);
808                         recalc_sigpending_and_wake(t);
809                 }
810         }
811         ret = specific_send_sig_info(sig, info, t);
812         spin_unlock_irqrestore(&t->sighand->siglock, flags);
813
814         return ret;
815 }
816
817 void
818 force_sig_specific(int sig, struct task_struct *t)
819 {
820         force_sig_info(sig, SEND_SIG_FORCED, t);
821 }
822
823 /*
824  * Test if P wants to take SIG.  After we've checked all threads with this,
825  * it's equivalent to finding no threads not blocking SIG.  Any threads not
826  * blocking SIG were ruled out because they are not running and already
827  * have pending signals.  Such threads will dequeue from the shared queue
828  * as soon as they're available, so putting the signal on the shared queue
829  * will be equivalent to sending it to one such thread.
830  */
831 static inline int wants_signal(int sig, struct task_struct *p)
832 {
833         if (sigismember(&p->blocked, sig))
834                 return 0;
835         if (p->flags & PF_EXITING)
836                 return 0;
837         if (sig == SIGKILL)
838                 return 1;
839         if (task_is_stopped_or_traced(p))
840                 return 0;
841         return task_curr(p) || !signal_pending(p);
842 }
843
844 static void
845 __group_complete_signal(int sig, struct task_struct *p)
846 {
847         struct task_struct *t;
848
849         /*
850          * Now find a thread we can wake up to take the signal off the queue.
851          *
852          * If the main thread wants the signal, it gets first crack.
853          * Probably the least surprising to the average bear.
854          */
855         if (wants_signal(sig, p))
856                 t = p;
857         else if (thread_group_empty(p))
858                 /*
859                  * There is just one thread and it does not need to be woken.
860                  * It will dequeue unblocked signals before it runs again.
861                  */
862                 return;
863         else {
864                 /*
865                  * Otherwise try to find a suitable thread.
866                  */
867                 t = p->signal->curr_target;
868                 if (t == NULL)
869                         /* restart balancing at this thread */
870                         t = p->signal->curr_target = p;
871
872                 while (!wants_signal(sig, t)) {
873                         t = next_thread(t);
874                         if (t == p->signal->curr_target)
875                                 /*
876                                  * No thread needs to be woken.
877                                  * Any eligible threads will see
878                                  * the signal in the queue soon.
879                                  */
880                                 return;
881                 }
882                 p->signal->curr_target = t;
883         }
884
885         /*
886          * Found a killable thread.  If the signal will be fatal,
887          * then start taking the whole group down immediately.
888          */
889         if (sig_fatal(p, sig) && !(p->signal->flags & SIGNAL_GROUP_EXIT) &&
890             !sigismember(&t->real_blocked, sig) &&
891             (sig == SIGKILL || !(t->ptrace & PT_PTRACED))) {
892                 /*
893                  * This signal will be fatal to the whole group.
894                  */
895                 if (!sig_kernel_coredump(sig)) {
896                         /*
897                          * Start a group exit and wake everybody up.
898                          * This way we don't have other threads
899                          * running and doing things after a slower
900                          * thread has the fatal signal pending.
901                          */
902                         p->signal->flags = SIGNAL_GROUP_EXIT;
903                         p->signal->group_exit_code = sig;
904                         p->signal->group_stop_count = 0;
905                         t = p;
906                         do {
907                                 sigaddset(&t->pending.signal, SIGKILL);
908                                 signal_wake_up(t, 1);
909                         } while_each_thread(p, t);
910                         return;
911                 }
912         }
913
914         /*
915          * The signal is already in the shared-pending queue.
916          * Tell the chosen thread to wake up and dequeue it.
917          */
918         signal_wake_up(t, sig == SIGKILL);
919         return;
920 }
921
922 int
923 __group_send_sig_info(int sig, struct siginfo *info, struct task_struct *p)
924 {
925         int ret;
926
927         assert_spin_locked(&p->sighand->siglock);
928         handle_stop_signal(sig, p);
929
930         /*
931          * Put this signal on the shared-pending queue, or fail with EAGAIN.
932          * We always use the shared queue for process-wide signals,
933          * to avoid several races.
934          */
935         ret = send_signal(sig, info, p, &p->signal->shared_pending);
936         if (ret <= 0)
937                 return ret;
938
939         __group_complete_signal(sig, p);
940         return 0;
941 }
942
943 /*
944  * Nuke all other threads in the group.
945  */
946 void zap_other_threads(struct task_struct *p)
947 {
948         struct task_struct *t;
949
950         p->signal->group_stop_count = 0;
951
952         for (t = next_thread(p); t != p; t = next_thread(t)) {
953                 /*
954                  * Don't bother with already dead threads
955                  */
956                 if (t->exit_state)
957                         continue;
958
959                 /* SIGKILL will be handled before any pending SIGSTOP */
960                 sigaddset(&t->pending.signal, SIGKILL);
961                 signal_wake_up(t, 1);
962         }
963 }
964
965 int __fatal_signal_pending(struct task_struct *tsk)
966 {
967         return sigismember(&tsk->pending.signal, SIGKILL);
968 }
969 EXPORT_SYMBOL(__fatal_signal_pending);
970
971 struct sighand_struct *lock_task_sighand(struct task_struct *tsk, unsigned long *flags)
972 {
973         struct sighand_struct *sighand;
974
975         rcu_read_lock();
976         for (;;) {
977                 sighand = rcu_dereference(tsk->sighand);
978                 if (unlikely(sighand == NULL))
979                         break;
980
981                 spin_lock_irqsave(&sighand->siglock, *flags);
982                 if (likely(sighand == tsk->sighand))
983                         break;
984                 spin_unlock_irqrestore(&sighand->siglock, *flags);
985         }
986         rcu_read_unlock();
987
988         return sighand;
989 }
990
991 int group_send_sig_info(int sig, struct siginfo *info, struct task_struct *p)
992 {
993         unsigned long flags;
994         int ret;
995
996         ret = check_kill_permission(sig, info, p);
997
998         if (!ret && sig) {
999                 ret = -ESRCH;
1000                 if (lock_task_sighand(p, &flags)) {
1001                         ret = __group_send_sig_info(sig, info, p);
1002                         unlock_task_sighand(p, &flags);
1003                 }
1004         }
1005
1006         return ret;
1007 }
1008
1009 /*
1010  * __kill_pgrp_info() sends a signal to a process group: this is what the tty
1011  * control characters do (^C, ^Z etc)
1012  */
1013
1014 int __kill_pgrp_info(int sig, struct siginfo *info, struct pid *pgrp)
1015 {
1016         struct task_struct *p = NULL;
1017         int retval, success;
1018
1019         success = 0;
1020         retval = -ESRCH;
1021         do_each_pid_task(pgrp, PIDTYPE_PGID, p) {
1022                 int err = group_send_sig_info(sig, info, p);
1023                 success |= !err;
1024                 retval = err;
1025         } while_each_pid_task(pgrp, PIDTYPE_PGID, p);
1026         return success ? 0 : retval;
1027 }
1028
1029 int kill_pid_info(int sig, struct siginfo *info, struct pid *pid)
1030 {
1031         int error = -ESRCH;
1032         struct task_struct *p;
1033
1034         rcu_read_lock();
1035 retry:
1036         p = pid_task(pid, PIDTYPE_PID);
1037         if (p) {
1038                 error = group_send_sig_info(sig, info, p);
1039                 if (unlikely(error == -ESRCH))
1040                         /*
1041                          * The task was unhashed in between, try again.
1042                          * If it is dead, pid_task() will return NULL,
1043                          * if we race with de_thread() it will find the
1044                          * new leader.
1045                          */
1046                         goto retry;
1047         }
1048         rcu_read_unlock();
1049
1050         return error;
1051 }
1052
1053 int
1054 kill_proc_info(int sig, struct siginfo *info, pid_t pid)
1055 {
1056         int error;
1057         rcu_read_lock();
1058         error = kill_pid_info(sig, info, find_vpid(pid));
1059         rcu_read_unlock();
1060         return error;
1061 }
1062
1063 /* like kill_pid_info(), but doesn't use uid/euid of "current" */
1064 int kill_pid_info_as_uid(int sig, struct siginfo *info, struct pid *pid,
1065                       uid_t uid, uid_t euid, u32 secid)
1066 {
1067         int ret = -EINVAL;
1068         struct task_struct *p;
1069
1070         if (!valid_signal(sig))
1071                 return ret;
1072
1073         read_lock(&tasklist_lock);
1074         p = pid_task(pid, PIDTYPE_PID);
1075         if (!p) {
1076                 ret = -ESRCH;
1077                 goto out_unlock;
1078         }
1079         if ((info == SEND_SIG_NOINFO || (!is_si_special(info) && SI_FROMUSER(info)))
1080             && (euid != p->suid) && (euid != p->uid)
1081             && (uid != p->suid) && (uid != p->uid)) {
1082                 ret = -EPERM;
1083                 goto out_unlock;
1084         }
1085         ret = security_task_kill(p, info, sig, secid);
1086         if (ret)
1087                 goto out_unlock;
1088         if (sig && p->sighand) {
1089                 unsigned long flags;
1090                 spin_lock_irqsave(&p->sighand->siglock, flags);
1091                 ret = __group_send_sig_info(sig, info, p);
1092                 spin_unlock_irqrestore(&p->sighand->siglock, flags);
1093         }
1094 out_unlock:
1095         read_unlock(&tasklist_lock);
1096         return ret;
1097 }
1098 EXPORT_SYMBOL_GPL(kill_pid_info_as_uid);
1099
1100 /*
1101  * kill_something_info() interprets pid in interesting ways just like kill(2).
1102  *
1103  * POSIX specifies that kill(-1,sig) is unspecified, but what we have
1104  * is probably wrong.  Should make it like BSD or SYSV.
1105  */
1106
1107 static int kill_something_info(int sig, struct siginfo *info, int pid)
1108 {
1109         int ret;
1110
1111         if (pid > 0) {
1112                 rcu_read_lock();
1113                 ret = kill_pid_info(sig, info, find_vpid(pid));
1114                 rcu_read_unlock();
1115                 return ret;
1116         }
1117
1118         read_lock(&tasklist_lock);
1119         if (pid != -1) {
1120                 ret = __kill_pgrp_info(sig, info,
1121                                 pid ? find_vpid(-pid) : task_pgrp(current));
1122         } else {
1123                 int retval = 0, count = 0;
1124                 struct task_struct * p;
1125
1126                 for_each_process(p) {
1127                         if (p->pid > 1 && !same_thread_group(p, current)) {
1128                                 int err = group_send_sig_info(sig, info, p);
1129                                 ++count;
1130                                 if (err != -EPERM)
1131                                         retval = err;
1132                         }
1133                 }
1134                 ret = count ? retval : -ESRCH;
1135         }
1136         read_unlock(&tasklist_lock);
1137
1138         return ret;
1139 }
1140
1141 /*
1142  * These are for backward compatibility with the rest of the kernel source.
1143  */
1144
1145 /*
1146  * These two are the most common entry points.  They send a signal
1147  * just to the specific thread.
1148  */
1149 int
1150 send_sig_info(int sig, struct siginfo *info, struct task_struct *p)
1151 {
1152         int ret;
1153         unsigned long flags;
1154
1155         /*
1156          * Make sure legacy kernel users don't send in bad values
1157          * (normal paths check this in check_kill_permission).
1158          */
1159         if (!valid_signal(sig))
1160                 return -EINVAL;
1161
1162         /*
1163          * We need the tasklist lock even for the specific
1164          * thread case (when we don't need to follow the group
1165          * lists) in order to avoid races with "p->sighand"
1166          * going away or changing from under us.
1167          */
1168         read_lock(&tasklist_lock);  
1169         spin_lock_irqsave(&p->sighand->siglock, flags);
1170         ret = specific_send_sig_info(sig, info, p);
1171         spin_unlock_irqrestore(&p->sighand->siglock, flags);
1172         read_unlock(&tasklist_lock);
1173         return ret;
1174 }
1175
1176 #define __si_special(priv) \
1177         ((priv) ? SEND_SIG_PRIV : SEND_SIG_NOINFO)
1178
1179 int
1180 send_sig(int sig, struct task_struct *p, int priv)
1181 {
1182         return send_sig_info(sig, __si_special(priv), p);
1183 }
1184
1185 void
1186 force_sig(int sig, struct task_struct *p)
1187 {
1188         force_sig_info(sig, SEND_SIG_PRIV, p);
1189 }
1190
1191 /*
1192  * When things go south during signal handling, we
1193  * will force a SIGSEGV. And if the signal that caused
1194  * the problem was already a SIGSEGV, we'll want to
1195  * make sure we don't even try to deliver the signal..
1196  */
1197 int
1198 force_sigsegv(int sig, struct task_struct *p)
1199 {
1200         if (sig == SIGSEGV) {
1201                 unsigned long flags;
1202                 spin_lock_irqsave(&p->sighand->siglock, flags);
1203                 p->sighand->action[sig - 1].sa.sa_handler = SIG_DFL;
1204                 spin_unlock_irqrestore(&p->sighand->siglock, flags);
1205         }
1206         force_sig(SIGSEGV, p);
1207         return 0;
1208 }
1209
1210 int kill_pgrp(struct pid *pid, int sig, int priv)
1211 {
1212         int ret;
1213
1214         read_lock(&tasklist_lock);
1215         ret = __kill_pgrp_info(sig, __si_special(priv), pid);
1216         read_unlock(&tasklist_lock);
1217
1218         return ret;
1219 }
1220 EXPORT_SYMBOL(kill_pgrp);
1221
1222 int kill_pid(struct pid *pid, int sig, int priv)
1223 {
1224         return kill_pid_info(sig, __si_special(priv), pid);
1225 }
1226 EXPORT_SYMBOL(kill_pid);
1227
1228 int
1229 kill_proc(pid_t pid, int sig, int priv)
1230 {
1231         int ret;
1232
1233         rcu_read_lock();
1234         ret = kill_pid_info(sig, __si_special(priv), find_pid(pid));
1235         rcu_read_unlock();
1236         return ret;
1237 }
1238
1239 /*
1240  * These functions support sending signals using preallocated sigqueue
1241  * structures.  This is needed "because realtime applications cannot
1242  * afford to lose notifications of asynchronous events, like timer
1243  * expirations or I/O completions".  In the case of Posix Timers 
1244  * we allocate the sigqueue structure from the timer_create.  If this
1245  * allocation fails we are able to report the failure to the application
1246  * with an EAGAIN error.
1247  */
1248  
1249 struct sigqueue *sigqueue_alloc(void)
1250 {
1251         struct sigqueue *q;
1252
1253         if ((q = __sigqueue_alloc(current, GFP_KERNEL, 0)))
1254                 q->flags |= SIGQUEUE_PREALLOC;
1255         return(q);
1256 }
1257
1258 void sigqueue_free(struct sigqueue *q)
1259 {
1260         unsigned long flags;
1261         spinlock_t *lock = &current->sighand->siglock;
1262
1263         BUG_ON(!(q->flags & SIGQUEUE_PREALLOC));
1264         /*
1265          * If the signal is still pending remove it from the
1266          * pending queue. We must hold ->siglock while testing
1267          * q->list to serialize with collect_signal().
1268          */
1269         spin_lock_irqsave(lock, flags);
1270         if (!list_empty(&q->list))
1271                 list_del_init(&q->list);
1272         spin_unlock_irqrestore(lock, flags);
1273
1274         q->flags &= ~SIGQUEUE_PREALLOC;
1275         __sigqueue_free(q);
1276 }
1277
1278 static int do_send_sigqueue(int sig, struct sigqueue *q, struct task_struct *t,
1279                 struct sigpending *pending)
1280 {
1281         if (unlikely(!list_empty(&q->list))) {
1282                 /*
1283                  * If an SI_TIMER entry is already queue just increment
1284                  * the overrun count.
1285                  */
1286
1287                 BUG_ON(q->info.si_code != SI_TIMER);
1288                 q->info.si_overrun++;
1289                 return 0;
1290         }
1291
1292         if (sig_ignored(t, sig))
1293                 return 1;
1294
1295         signalfd_notify(t, sig);
1296         list_add_tail(&q->list, &pending->list);
1297         sigaddset(&pending->signal, sig);
1298         return 0;
1299 }
1300
1301 int send_sigqueue(int sig, struct sigqueue *q, struct task_struct *p)
1302 {
1303         unsigned long flags;
1304         int ret = -1;
1305
1306         BUG_ON(!(q->flags & SIGQUEUE_PREALLOC));
1307
1308         /*
1309          * The rcu based delayed sighand destroy makes it possible to
1310          * run this without tasklist lock held. The task struct itself
1311          * cannot go away as create_timer did get_task_struct().
1312          *
1313          * We return -1, when the task is marked exiting, so
1314          * posix_timer_event can redirect it to the group leader
1315          */
1316         rcu_read_lock();
1317
1318         if (!likely(lock_task_sighand(p, &flags)))
1319                 goto out_err;
1320
1321         ret = do_send_sigqueue(sig, q, p, &p->pending);
1322
1323         if (!sigismember(&p->blocked, sig))
1324                 signal_wake_up(p, sig == SIGKILL);
1325
1326         unlock_task_sighand(p, &flags);
1327 out_err:
1328         rcu_read_unlock();
1329
1330         return ret;
1331 }
1332
1333 int
1334 send_group_sigqueue(int sig, struct sigqueue *q, struct task_struct *p)
1335 {
1336         unsigned long flags;
1337         int ret;
1338
1339         BUG_ON(!(q->flags & SIGQUEUE_PREALLOC));
1340
1341         read_lock(&tasklist_lock);
1342         /* Since it_lock is held, p->sighand cannot be NULL. */
1343         spin_lock_irqsave(&p->sighand->siglock, flags);
1344         handle_stop_signal(sig, p);
1345
1346         ret = do_send_sigqueue(sig, q, p, &p->signal->shared_pending);
1347
1348         __group_complete_signal(sig, p);
1349
1350         spin_unlock_irqrestore(&p->sighand->siglock, flags);
1351         read_unlock(&tasklist_lock);
1352         return ret;
1353 }
1354
1355 /*
1356  * Wake up any threads in the parent blocked in wait* syscalls.
1357  */
1358 static inline void __wake_up_parent(struct task_struct *p,
1359                                     struct task_struct *parent)
1360 {
1361         wake_up_interruptible_sync(&parent->signal->wait_chldexit);
1362 }
1363
1364 /*
1365  * Let a parent know about the death of a child.
1366  * For a stopped/continued status change, use do_notify_parent_cldstop instead.
1367  */
1368
1369 void do_notify_parent(struct task_struct *tsk, int sig)
1370 {
1371         struct siginfo info;
1372         unsigned long flags;
1373         struct sighand_struct *psig;
1374
1375         BUG_ON(sig == -1);
1376
1377         /* do_notify_parent_cldstop should have been called instead.  */
1378         BUG_ON(task_is_stopped_or_traced(tsk));
1379
1380         BUG_ON(!tsk->ptrace &&
1381                (tsk->group_leader != tsk || !thread_group_empty(tsk)));
1382
1383         info.si_signo = sig;
1384         info.si_errno = 0;
1385         /*
1386          * we are under tasklist_lock here so our parent is tied to
1387          * us and cannot exit and release its namespace.
1388          *
1389          * the only it can is to switch its nsproxy with sys_unshare,
1390          * bu uncharing pid namespaces is not allowed, so we'll always
1391          * see relevant namespace
1392          *
1393          * write_lock() currently calls preempt_disable() which is the
1394          * same as rcu_read_lock(), but according to Oleg, this is not
1395          * correct to rely on this
1396          */
1397         rcu_read_lock();
1398         info.si_pid = task_pid_nr_ns(tsk, tsk->parent->nsproxy->pid_ns);
1399         rcu_read_unlock();
1400
1401         info.si_uid = tsk->uid;
1402
1403         /* FIXME: find out whether or not this is supposed to be c*time. */
1404         info.si_utime = cputime_to_jiffies(cputime_add(tsk->utime,
1405                                                        tsk->signal->utime));
1406         info.si_stime = cputime_to_jiffies(cputime_add(tsk->stime,
1407                                                        tsk->signal->stime));
1408
1409         info.si_status = tsk->exit_code & 0x7f;
1410         if (tsk->exit_code & 0x80)
1411                 info.si_code = CLD_DUMPED;
1412         else if (tsk->exit_code & 0x7f)
1413                 info.si_code = CLD_KILLED;
1414         else {
1415                 info.si_code = CLD_EXITED;
1416                 info.si_status = tsk->exit_code >> 8;
1417         }
1418
1419         psig = tsk->parent->sighand;
1420         spin_lock_irqsave(&psig->siglock, flags);
1421         if (!tsk->ptrace && sig == SIGCHLD &&
1422             (psig->action[SIGCHLD-1].sa.sa_handler == SIG_IGN ||
1423              (psig->action[SIGCHLD-1].sa.sa_flags & SA_NOCLDWAIT))) {
1424                 /*
1425                  * We are exiting and our parent doesn't care.  POSIX.1
1426                  * defines special semantics for setting SIGCHLD to SIG_IGN
1427                  * or setting the SA_NOCLDWAIT flag: we should be reaped
1428                  * automatically and not left for our parent's wait4 call.
1429                  * Rather than having the parent do it as a magic kind of
1430                  * signal handler, we just set this to tell do_exit that we
1431                  * can be cleaned up without becoming a zombie.  Note that
1432                  * we still call __wake_up_parent in this case, because a
1433                  * blocked sys_wait4 might now return -ECHILD.
1434                  *
1435                  * Whether we send SIGCHLD or not for SA_NOCLDWAIT
1436                  * is implementation-defined: we do (if you don't want
1437                  * it, just use SIG_IGN instead).
1438                  */
1439                 tsk->exit_signal = -1;
1440                 if (psig->action[SIGCHLD-1].sa.sa_handler == SIG_IGN)
1441                         sig = 0;
1442         }
1443         if (valid_signal(sig) && sig > 0)
1444                 __group_send_sig_info(sig, &info, tsk->parent);
1445         __wake_up_parent(tsk, tsk->parent);
1446         spin_unlock_irqrestore(&psig->siglock, flags);
1447 }
1448
1449 static void do_notify_parent_cldstop(struct task_struct *tsk, int why)
1450 {
1451         struct siginfo info;
1452         unsigned long flags;
1453         struct task_struct *parent;
1454         struct sighand_struct *sighand;
1455
1456         if (tsk->ptrace & PT_PTRACED)
1457                 parent = tsk->parent;
1458         else {
1459                 tsk = tsk->group_leader;
1460                 parent = tsk->real_parent;
1461         }
1462
1463         info.si_signo = SIGCHLD;
1464         info.si_errno = 0;
1465         /*
1466          * see comment in do_notify_parent() abot the following 3 lines
1467          */
1468         rcu_read_lock();
1469         info.si_pid = task_pid_nr_ns(tsk, tsk->parent->nsproxy->pid_ns);
1470         rcu_read_unlock();
1471
1472         info.si_uid = tsk->uid;
1473
1474         /* FIXME: find out whether or not this is supposed to be c*time. */
1475         info.si_utime = cputime_to_jiffies(tsk->utime);
1476         info.si_stime = cputime_to_jiffies(tsk->stime);
1477
1478         info.si_code = why;
1479         switch (why) {
1480         case CLD_CONTINUED:
1481                 info.si_status = SIGCONT;
1482                 break;
1483         case CLD_STOPPED:
1484                 info.si_status = tsk->signal->group_exit_code & 0x7f;
1485                 break;
1486         case CLD_TRAPPED:
1487                 info.si_status = tsk->exit_code & 0x7f;
1488                 break;
1489         default:
1490                 BUG();
1491         }
1492
1493         sighand = parent->sighand;
1494         spin_lock_irqsave(&sighand->siglock, flags);
1495         if (sighand->action[SIGCHLD-1].sa.sa_handler != SIG_IGN &&
1496             !(sighand->action[SIGCHLD-1].sa.sa_flags & SA_NOCLDSTOP))
1497                 __group_send_sig_info(SIGCHLD, &info, parent);
1498         /*
1499          * Even if SIGCHLD is not generated, we must wake up wait4 calls.
1500          */
1501         __wake_up_parent(tsk, parent);
1502         spin_unlock_irqrestore(&sighand->siglock, flags);
1503 }
1504
1505 static inline int may_ptrace_stop(void)
1506 {
1507         if (!likely(current->ptrace & PT_PTRACED))
1508                 return 0;
1509         /*
1510          * Are we in the middle of do_coredump?
1511          * If so and our tracer is also part of the coredump stopping
1512          * is a deadlock situation, and pointless because our tracer
1513          * is dead so don't allow us to stop.
1514          * If SIGKILL was already sent before the caller unlocked
1515          * ->siglock we must see ->core_waiters != 0. Otherwise it
1516          * is safe to enter schedule().
1517          */
1518         if (unlikely(current->mm->core_waiters) &&
1519             unlikely(current->mm == current->parent->mm))
1520                 return 0;
1521
1522         return 1;
1523 }
1524
1525 /*
1526  * Return nonzero if there is a SIGKILL that should be waking us up.
1527  * Called with the siglock held.
1528  */
1529 static int sigkill_pending(struct task_struct *tsk)
1530 {
1531         return ((sigismember(&tsk->pending.signal, SIGKILL) ||
1532                  sigismember(&tsk->signal->shared_pending.signal, SIGKILL)) &&
1533                 !unlikely(sigismember(&tsk->blocked, SIGKILL)));
1534 }
1535
1536 /*
1537  * This must be called with current->sighand->siglock held.
1538  *
1539  * This should be the path for all ptrace stops.
1540  * We always set current->last_siginfo while stopped here.
1541  * That makes it a way to test a stopped process for
1542  * being ptrace-stopped vs being job-control-stopped.
1543  *
1544  * If we actually decide not to stop at all because the tracer
1545  * is gone, we keep current->exit_code unless clear_code.
1546  */
1547 static void ptrace_stop(int exit_code, int clear_code, siginfo_t *info)
1548 {
1549         int killed = 0;
1550
1551         if (arch_ptrace_stop_needed(exit_code, info)) {
1552                 /*
1553                  * The arch code has something special to do before a
1554                  * ptrace stop.  This is allowed to block, e.g. for faults
1555                  * on user stack pages.  We can't keep the siglock while
1556                  * calling arch_ptrace_stop, so we must release it now.
1557                  * To preserve proper semantics, we must do this before
1558                  * any signal bookkeeping like checking group_stop_count.
1559                  * Meanwhile, a SIGKILL could come in before we retake the
1560                  * siglock.  That must prevent us from sleeping in TASK_TRACED.
1561                  * So after regaining the lock, we must check for SIGKILL.
1562                  */
1563                 spin_unlock_irq(&current->sighand->siglock);
1564                 arch_ptrace_stop(exit_code, info);
1565                 spin_lock_irq(&current->sighand->siglock);
1566                 killed = sigkill_pending(current);
1567         }
1568
1569         /*
1570          * If there is a group stop in progress,
1571          * we must participate in the bookkeeping.
1572          */
1573         if (current->signal->group_stop_count > 0)
1574                 --current->signal->group_stop_count;
1575
1576         current->last_siginfo = info;
1577         current->exit_code = exit_code;
1578
1579         /* Let the debugger run.  */
1580         __set_current_state(TASK_TRACED);
1581         spin_unlock_irq(&current->sighand->siglock);
1582         read_lock(&tasklist_lock);
1583         if (!unlikely(killed) && may_ptrace_stop()) {
1584                 do_notify_parent_cldstop(current, CLD_TRAPPED);
1585                 read_unlock(&tasklist_lock);
1586                 schedule();
1587         } else {
1588                 /*
1589                  * By the time we got the lock, our tracer went away.
1590                  * Don't drop the lock yet, another tracer may come.
1591                  */
1592                 __set_current_state(TASK_RUNNING);
1593                 if (clear_code)
1594                         current->exit_code = 0;
1595                 read_unlock(&tasklist_lock);
1596         }
1597
1598         /*
1599          * While in TASK_TRACED, we were considered "frozen enough".
1600          * Now that we woke up, it's crucial if we're supposed to be
1601          * frozen that we freeze now before running anything substantial.
1602          */
1603         try_to_freeze();
1604
1605         /*
1606          * We are back.  Now reacquire the siglock before touching
1607          * last_siginfo, so that we are sure to have synchronized with
1608          * any signal-sending on another CPU that wants to examine it.
1609          */
1610         spin_lock_irq(&current->sighand->siglock);
1611         current->last_siginfo = NULL;
1612
1613         /*
1614          * Queued signals ignored us while we were stopped for tracing.
1615          * So check for any that we should take before resuming user mode.
1616          * This sets TIF_SIGPENDING, but never clears it.
1617          */
1618         recalc_sigpending_tsk(current);
1619 }
1620
1621 void ptrace_notify(int exit_code)
1622 {
1623         siginfo_t info;
1624
1625         BUG_ON((exit_code & (0x7f | ~0xffff)) != SIGTRAP);
1626
1627         memset(&info, 0, sizeof info);
1628         info.si_signo = SIGTRAP;
1629         info.si_code = exit_code;
1630         info.si_pid = task_pid_vnr(current);
1631         info.si_uid = current->uid;
1632
1633         /* Let the debugger run.  */
1634         spin_lock_irq(&current->sighand->siglock);
1635         ptrace_stop(exit_code, 1, &info);
1636         spin_unlock_irq(&current->sighand->siglock);
1637 }
1638
1639 static void
1640 finish_stop(int stop_count)
1641 {
1642         /*
1643          * If there are no other threads in the group, or if there is
1644          * a group stop in progress and we are the last to stop,
1645          * report to the parent.  When ptraced, every thread reports itself.
1646          */
1647         if (stop_count == 0 || (current->ptrace & PT_PTRACED)) {
1648                 read_lock(&tasklist_lock);
1649                 do_notify_parent_cldstop(current, CLD_STOPPED);
1650                 read_unlock(&tasklist_lock);
1651         }
1652
1653         do {
1654                 schedule();
1655         } while (try_to_freeze());
1656         /*
1657          * Now we don't run again until continued.
1658          */
1659         current->exit_code = 0;
1660 }
1661
1662 /*
1663  * This performs the stopping for SIGSTOP and other stop signals.
1664  * We have to stop all threads in the thread group.
1665  * Returns nonzero if we've actually stopped and released the siglock.
1666  * Returns zero if we didn't stop and still hold the siglock.
1667  */
1668 static int do_signal_stop(int signr)
1669 {
1670         struct signal_struct *sig = current->signal;
1671         int stop_count;
1672
1673         if (sig->group_stop_count > 0) {
1674                 /*
1675                  * There is a group stop in progress.  We don't need to
1676                  * start another one.
1677                  */
1678                 stop_count = --sig->group_stop_count;
1679         } else {
1680                 struct task_struct *t;
1681
1682                 if (!likely(sig->flags & SIGNAL_STOP_DEQUEUED) ||
1683                     unlikely(signal_group_exit(sig)))
1684                         return 0;
1685                 /*
1686                  * There is no group stop already in progress.
1687                  * We must initiate one now.
1688                  */
1689                 sig->group_exit_code = signr;
1690
1691                 stop_count = 0;
1692                 for (t = next_thread(current); t != current; t = next_thread(t))
1693                         /*
1694                          * Setting state to TASK_STOPPED for a group
1695                          * stop is always done with the siglock held,
1696                          * so this check has no races.
1697                          */
1698                         if (!(t->flags & PF_EXITING) &&
1699                             !task_is_stopped_or_traced(t)) {
1700                                 stop_count++;
1701                                 signal_wake_up(t, 0);
1702                         }
1703                 sig->group_stop_count = stop_count;
1704         }
1705
1706         if (stop_count == 0)
1707                 sig->flags = SIGNAL_STOP_STOPPED;
1708         current->exit_code = sig->group_exit_code;
1709         __set_current_state(TASK_STOPPED);
1710
1711         spin_unlock_irq(&current->sighand->siglock);
1712         finish_stop(stop_count);
1713         return 1;
1714 }
1715
1716 static int ptrace_signal(int signr, siginfo_t *info,
1717                          struct pt_regs *regs, void *cookie)
1718 {
1719         if (!(current->ptrace & PT_PTRACED))
1720                 return signr;
1721
1722         ptrace_signal_deliver(regs, cookie);
1723
1724         /* Let the debugger run.  */
1725         ptrace_stop(signr, 0, info);
1726
1727         /* We're back.  Did the debugger cancel the sig?  */
1728         signr = current->exit_code;
1729         if (signr == 0)
1730                 return signr;
1731
1732         current->exit_code = 0;
1733
1734         /* Update the siginfo structure if the signal has
1735            changed.  If the debugger wanted something
1736            specific in the siginfo structure then it should
1737            have updated *info via PTRACE_SETSIGINFO.  */
1738         if (signr != info->si_signo) {
1739                 info->si_signo = signr;
1740                 info->si_errno = 0;
1741                 info->si_code = SI_USER;
1742                 info->si_pid = task_pid_vnr(current->parent);
1743                 info->si_uid = current->parent->uid;
1744         }
1745
1746         /* If the (new) signal is now blocked, requeue it.  */
1747         if (sigismember(&current->blocked, signr)) {
1748                 specific_send_sig_info(signr, info, current);
1749                 signr = 0;
1750         }
1751
1752         return signr;
1753 }
1754
1755 int get_signal_to_deliver(siginfo_t *info, struct k_sigaction *return_ka,
1756                           struct pt_regs *regs, void *cookie)
1757 {
1758         sigset_t *mask = &current->blocked;
1759         int signr = 0;
1760
1761 relock:
1762         /*
1763          * We'll jump back here after any time we were stopped in TASK_STOPPED.
1764          * While in TASK_STOPPED, we were considered "frozen enough".
1765          * Now that we woke up, it's crucial if we're supposed to be
1766          * frozen that we freeze now before running anything substantial.
1767          */
1768         try_to_freeze();
1769
1770         spin_lock_irq(&current->sighand->siglock);
1771
1772         if (unlikely(current->signal->flags & SIGNAL_CLD_MASK)) {
1773                 int why = (current->signal->flags & SIGNAL_STOP_CONTINUED)
1774                                 ? CLD_CONTINUED : CLD_STOPPED;
1775                 current->signal->flags &= ~SIGNAL_CLD_MASK;
1776                 spin_unlock_irq(&current->sighand->siglock);
1777
1778                 read_lock(&tasklist_lock);
1779                 do_notify_parent_cldstop(current->group_leader, why);
1780                 read_unlock(&tasklist_lock);
1781                 goto relock;
1782         }
1783
1784         for (;;) {
1785                 struct k_sigaction *ka;
1786
1787                 if (unlikely(current->signal->group_stop_count > 0) &&
1788                     do_signal_stop(0))
1789                         goto relock;
1790
1791                 signr = dequeue_signal(current, mask, info);
1792
1793                 if (!signr)
1794                         break; /* will return 0 */
1795
1796                 if (signr != SIGKILL) {
1797                         signr = ptrace_signal(signr, info, regs, cookie);
1798                         if (!signr)
1799                                 continue;
1800                 }
1801
1802                 ka = &current->sighand->action[signr-1];
1803                 if (ka->sa.sa_handler == SIG_IGN) /* Do nothing.  */
1804                         continue;
1805                 if (ka->sa.sa_handler != SIG_DFL) {
1806                         /* Run the handler.  */
1807                         *return_ka = *ka;
1808
1809                         if (ka->sa.sa_flags & SA_ONESHOT)
1810                                 ka->sa.sa_handler = SIG_DFL;
1811
1812                         break; /* will return non-zero "signr" value */
1813                 }
1814
1815                 /*
1816                  * Now we are doing the default action for this signal.
1817                  */
1818                 if (sig_kernel_ignore(signr)) /* Default is nothing. */
1819                         continue;
1820
1821                 /*
1822                  * Global init gets no signals it doesn't want.
1823                  */
1824                 if (is_global_init(current))
1825                         continue;
1826
1827                 if (sig_kernel_stop(signr)) {
1828                         /*
1829                          * The default action is to stop all threads in
1830                          * the thread group.  The job control signals
1831                          * do nothing in an orphaned pgrp, but SIGSTOP
1832                          * always works.  Note that siglock needs to be
1833                          * dropped during the call to is_orphaned_pgrp()
1834                          * because of lock ordering with tasklist_lock.
1835                          * This allows an intervening SIGCONT to be posted.
1836                          * We need to check for that and bail out if necessary.
1837                          */
1838                         if (signr != SIGSTOP) {
1839                                 spin_unlock_irq(&current->sighand->siglock);
1840
1841                                 /* signals can be posted during this window */
1842
1843                                 if (is_current_pgrp_orphaned())
1844                                         goto relock;
1845
1846                                 spin_lock_irq(&current->sighand->siglock);
1847                         }
1848
1849                         if (likely(do_signal_stop(signr))) {
1850                                 /* It released the siglock.  */
1851                                 goto relock;
1852                         }
1853
1854                         /*
1855                          * We didn't actually stop, due to a race
1856                          * with SIGCONT or something like that.
1857                          */
1858                         continue;
1859                 }
1860
1861                 spin_unlock_irq(&current->sighand->siglock);
1862
1863                 /*
1864                  * Anything else is fatal, maybe with a core dump.
1865                  */
1866                 current->flags |= PF_SIGNALED;
1867                 if ((signr != SIGKILL) && print_fatal_signals)
1868                         print_fatal_signal(regs, signr);
1869                 if (sig_kernel_coredump(signr)) {
1870                         /*
1871                          * If it was able to dump core, this kills all
1872                          * other threads in the group and synchronizes with
1873                          * their demise.  If we lost the race with another
1874                          * thread getting here, it set group_exit_code
1875                          * first and our do_group_exit call below will use
1876                          * that value and ignore the one we pass it.
1877                          */
1878                         do_coredump((long)signr, signr, regs);
1879                 }
1880
1881                 /*
1882                  * Death signals, no core dump.
1883                  */
1884                 do_group_exit(signr);
1885                 /* NOTREACHED */
1886         }
1887         spin_unlock_irq(&current->sighand->siglock);
1888         return signr;
1889 }
1890
1891 void exit_signals(struct task_struct *tsk)
1892 {
1893         int group_stop = 0;
1894         struct task_struct *t;
1895
1896         if (thread_group_empty(tsk) || signal_group_exit(tsk->signal)) {
1897                 tsk->flags |= PF_EXITING;
1898                 return;
1899         }
1900
1901         spin_lock_irq(&tsk->sighand->siglock);
1902         /*
1903          * From now this task is not visible for group-wide signals,
1904          * see wants_signal(), do_signal_stop().
1905          */
1906         tsk->flags |= PF_EXITING;
1907         if (!signal_pending(tsk))
1908                 goto out;
1909
1910         /* It could be that __group_complete_signal() choose us to
1911          * notify about group-wide signal. Another thread should be
1912          * woken now to take the signal since we will not.
1913          */
1914         for (t = tsk; (t = next_thread(t)) != tsk; )
1915                 if (!signal_pending(t) && !(t->flags & PF_EXITING))
1916                         recalc_sigpending_and_wake(t);
1917
1918         if (unlikely(tsk->signal->group_stop_count) &&
1919                         !--tsk->signal->group_stop_count) {
1920                 tsk->signal->flags = SIGNAL_STOP_STOPPED;
1921                 group_stop = 1;
1922         }
1923 out:
1924         spin_unlock_irq(&tsk->sighand->siglock);
1925
1926         if (unlikely(group_stop)) {
1927                 read_lock(&tasklist_lock);
1928                 do_notify_parent_cldstop(tsk, CLD_STOPPED);
1929                 read_unlock(&tasklist_lock);
1930         }
1931 }
1932
1933 EXPORT_SYMBOL(recalc_sigpending);
1934 EXPORT_SYMBOL_GPL(dequeue_signal);
1935 EXPORT_SYMBOL(flush_signals);
1936 EXPORT_SYMBOL(force_sig);
1937 EXPORT_SYMBOL(kill_proc);
1938 EXPORT_SYMBOL(ptrace_notify);
1939 EXPORT_SYMBOL(send_sig);
1940 EXPORT_SYMBOL(send_sig_info);
1941 EXPORT_SYMBOL(sigprocmask);
1942 EXPORT_SYMBOL(block_all_signals);
1943 EXPORT_SYMBOL(unblock_all_signals);
1944
1945
1946 /*
1947  * System call entry points.
1948  */
1949
1950 asmlinkage long sys_restart_syscall(void)
1951 {
1952         struct restart_block *restart = &current_thread_info()->restart_block;
1953         return restart->fn(restart);
1954 }
1955
1956 long do_no_restart_syscall(struct restart_block *param)
1957 {
1958         return -EINTR;
1959 }
1960
1961 /*
1962  * We don't need to get the kernel lock - this is all local to this
1963  * particular thread.. (and that's good, because this is _heavily_
1964  * used by various programs)
1965  */
1966
1967 /*
1968  * This is also useful for kernel threads that want to temporarily
1969  * (or permanently) block certain signals.
1970  *
1971  * NOTE! Unlike the user-mode sys_sigprocmask(), the kernel
1972  * interface happily blocks "unblockable" signals like SIGKILL
1973  * and friends.
1974  */
1975 int sigprocmask(int how, sigset_t *set, sigset_t *oldset)
1976 {
1977         int error;
1978
1979         spin_lock_irq(&current->sighand->siglock);
1980         if (oldset)
1981                 *oldset = current->blocked;
1982
1983         error = 0;
1984         switch (how) {
1985         case SIG_BLOCK:
1986                 sigorsets(&current->blocked, &current->blocked, set);
1987                 break;
1988         case SIG_UNBLOCK:
1989                 signandsets(&current->blocked, &current->blocked, set);
1990                 break;
1991         case SIG_SETMASK:
1992                 current->blocked = *set;
1993                 break;
1994         default:
1995                 error = -EINVAL;
1996         }
1997         recalc_sigpending();
1998         spin_unlock_irq(&current->sighand->siglock);
1999
2000         return error;
2001 }
2002
2003 asmlinkage long
2004 sys_rt_sigprocmask(int how, sigset_t __user *set, sigset_t __user *oset, size_t sigsetsize)
2005 {
2006         int error = -EINVAL;
2007         sigset_t old_set, new_set;
2008
2009         /* XXX: Don't preclude handling different sized sigset_t's.  */
2010         if (sigsetsize != sizeof(sigset_t))
2011                 goto out;
2012
2013         if (set) {
2014                 error = -EFAULT;
2015                 if (copy_from_user(&new_set, set, sizeof(*set)))
2016                         goto out;
2017                 sigdelsetmask(&new_set, sigmask(SIGKILL)|sigmask(SIGSTOP));
2018
2019                 error = sigprocmask(how, &new_set, &old_set);
2020                 if (error)
2021                         goto out;
2022                 if (oset)
2023                         goto set_old;
2024         } else if (oset) {
2025                 spin_lock_irq(&current->sighand->siglock);
2026                 old_set = current->blocked;
2027                 spin_unlock_irq(&current->sighand->siglock);
2028
2029         set_old:
2030                 error = -EFAULT;
2031                 if (copy_to_user(oset, &old_set, sizeof(*oset)))
2032                         goto out;
2033         }
2034         error = 0;
2035 out:
2036         return error;
2037 }
2038
2039 long do_sigpending(void __user *set, unsigned long sigsetsize)
2040 {
2041         long error = -EINVAL;
2042         sigset_t pending;
2043
2044         if (sigsetsize > sizeof(sigset_t))
2045                 goto out;
2046
2047         spin_lock_irq(&current->sighand->siglock);
2048         sigorsets(&pending, &current->pending.signal,
2049                   &current->signal->shared_pending.signal);
2050         spin_unlock_irq(&current->sighand->siglock);
2051
2052         /* Outside the lock because only this thread touches it.  */
2053         sigandsets(&pending, &current->blocked, &pending);
2054
2055         error = -EFAULT;
2056         if (!copy_to_user(set, &pending, sigsetsize))
2057                 error = 0;
2058
2059 out:
2060         return error;
2061 }       
2062
2063 asmlinkage long
2064 sys_rt_sigpending(sigset_t __user *set, size_t sigsetsize)
2065 {
2066         return do_sigpending(set, sigsetsize);
2067 }
2068
2069 #ifndef HAVE_ARCH_COPY_SIGINFO_TO_USER
2070
2071 int copy_siginfo_to_user(siginfo_t __user *to, siginfo_t *from)
2072 {
2073         int err;
2074
2075         if (!access_ok (VERIFY_WRITE, to, sizeof(siginfo_t)))
2076                 return -EFAULT;
2077         if (from->si_code < 0)
2078                 return __copy_to_user(to, from, sizeof(siginfo_t))
2079                         ? -EFAULT : 0;
2080         /*
2081          * If you change siginfo_t structure, please be sure
2082          * this code is fixed accordingly.
2083          * Please remember to update the signalfd_copyinfo() function
2084          * inside fs/signalfd.c too, in case siginfo_t changes.
2085          * It should never copy any pad contained in the structure
2086          * to avoid security leaks, but must copy the generic
2087          * 3 ints plus the relevant union member.
2088          */
2089         err = __put_user(from->si_signo, &to->si_signo);
2090         err |= __put_user(from->si_errno, &to->si_errno);
2091         err |= __put_user((short)from->si_code, &to->si_code);
2092         switch (from->si_code & __SI_MASK) {
2093         case __SI_KILL:
2094                 err |= __put_user(from->si_pid, &to->si_pid);
2095                 err |= __put_user(from->si_uid, &to->si_uid);
2096                 break;
2097         case __SI_TIMER:
2098                  err |= __put_user(from->si_tid, &to->si_tid);
2099                  err |= __put_user(from->si_overrun, &to->si_overrun);
2100                  err |= __put_user(from->si_ptr, &to->si_ptr);
2101                 break;
2102         case __SI_POLL:
2103                 err |= __put_user(from->si_band, &to->si_band);
2104                 err |= __put_user(from->si_fd, &to->si_fd);
2105                 break;
2106         case __SI_FAULT:
2107                 err |= __put_user(from->si_addr, &to->si_addr);
2108 #ifdef __ARCH_SI_TRAPNO
2109                 err |= __put_user(from->si_trapno, &to->si_trapno);
2110 #endif
2111                 break;
2112         case __SI_CHLD:
2113                 err |= __put_user(from->si_pid, &to->si_pid);
2114                 err |= __put_user(from->si_uid, &to->si_uid);
2115                 err |= __put_user(from->si_status, &to->si_status);
2116                 err |= __put_user(from->si_utime, &to->si_utime);
2117                 err |= __put_user(from->si_stime, &to->si_stime);
2118                 break;
2119         case __SI_RT: /* This is not generated by the kernel as of now. */
2120         case __SI_MESGQ: /* But this is */
2121                 err |= __put_user(from->si_pid, &to->si_pid);
2122                 err |= __put_user(from->si_uid, &to->si_uid);
2123                 err |= __put_user(from->si_ptr, &to->si_ptr);
2124                 break;
2125         default: /* this is just in case for now ... */
2126                 err |= __put_user(from->si_pid, &to->si_pid);
2127                 err |= __put_user(from->si_uid, &to->si_uid);
2128                 break;
2129         }
2130         return err;
2131 }
2132
2133 #endif
2134
2135 asmlinkage long
2136 sys_rt_sigtimedwait(const sigset_t __user *uthese,
2137                     siginfo_t __user *uinfo,
2138                     const struct timespec __user *uts,
2139                     size_t sigsetsize)
2140 {
2141         int ret, sig;
2142         sigset_t these;
2143         struct timespec ts;
2144         siginfo_t info;
2145         long timeout = 0;
2146
2147         /* XXX: Don't preclude handling different sized sigset_t's.  */
2148         if (sigsetsize != sizeof(sigset_t))
2149                 return -EINVAL;
2150
2151         if (copy_from_user(&these, uthese, sizeof(these)))
2152                 return -EFAULT;
2153                 
2154         /*
2155          * Invert the set of allowed signals to get those we
2156          * want to block.
2157          */
2158         sigdelsetmask(&these, sigmask(SIGKILL)|sigmask(SIGSTOP));
2159         signotset(&these);
2160
2161         if (uts) {
2162                 if (copy_from_user(&ts, uts, sizeof(ts)))
2163                         return -EFAULT;
2164                 if (ts.tv_nsec >= 1000000000L || ts.tv_nsec < 0
2165                     || ts.tv_sec < 0)
2166                         return -EINVAL;
2167         }
2168
2169         spin_lock_irq(&current->sighand->siglock);
2170         sig = dequeue_signal(current, &these, &info);
2171         if (!sig) {
2172                 timeout = MAX_SCHEDULE_TIMEOUT;
2173                 if (uts)
2174                         timeout = (timespec_to_jiffies(&ts)
2175                                    + (ts.tv_sec || ts.tv_nsec));
2176
2177                 if (timeout) {
2178                         /* None ready -- temporarily unblock those we're
2179                          * interested while we are sleeping in so that we'll
2180                          * be awakened when they arrive.  */
2181                         current->real_blocked = current->blocked;
2182                         sigandsets(&current->blocked, &current->blocked, &these);
2183                         recalc_sigpending();
2184                         spin_unlock_irq(&current->sighand->siglock);
2185
2186                         timeout = schedule_timeout_interruptible(timeout);
2187
2188                         spin_lock_irq(&current->sighand->siglock);
2189                         sig = dequeue_signal(current, &these, &info);
2190                         current->blocked = current->real_blocked;
2191                         siginitset(&current->real_blocked, 0);
2192                         recalc_sigpending();
2193                 }
2194         }
2195         spin_unlock_irq(&current->sighand->siglock);
2196
2197         if (sig) {
2198                 ret = sig;
2199                 if (uinfo) {
2200                         if (copy_siginfo_to_user(uinfo, &info))
2201                                 ret = -EFAULT;
2202                 }
2203         } else {
2204                 ret = -EAGAIN;
2205                 if (timeout)
2206                         ret = -EINTR;
2207         }
2208
2209         return ret;
2210 }
2211
2212 asmlinkage long
2213 sys_kill(int pid, int sig)
2214 {
2215         struct siginfo info;
2216
2217         info.si_signo = sig;
2218         info.si_errno = 0;
2219         info.si_code = SI_USER;
2220         info.si_pid = task_tgid_vnr(current);
2221         info.si_uid = current->uid;
2222
2223         return kill_something_info(sig, &info, pid);
2224 }
2225
2226 static int do_tkill(int tgid, int pid, int sig)
2227 {
2228         int error;
2229         struct siginfo info;
2230         struct task_struct *p;
2231
2232         error = -ESRCH;
2233         info.si_signo = sig;
2234         info.si_errno = 0;
2235         info.si_code = SI_TKILL;
2236         info.si_pid = task_tgid_vnr(current);
2237         info.si_uid = current->uid;
2238
2239         read_lock(&tasklist_lock);
2240         p = find_task_by_vpid(pid);
2241         if (p && (tgid <= 0 || task_tgid_vnr(p) == tgid)) {
2242                 error = check_kill_permission(sig, &info, p);
2243                 /*
2244                  * The null signal is a permissions and process existence
2245                  * probe.  No signal is actually delivered.
2246                  */
2247                 if (!error && sig && p->sighand) {
2248                         spin_lock_irq(&p->sighand->siglock);
2249                         handle_stop_signal(sig, p);
2250                         error = specific_send_sig_info(sig, &info, p);
2251                         spin_unlock_irq(&p->sighand->siglock);
2252                 }
2253         }
2254         read_unlock(&tasklist_lock);
2255
2256         return error;
2257 }
2258
2259 /**
2260  *  sys_tgkill - send signal to one specific thread
2261  *  @tgid: the thread group ID of the thread
2262  *  @pid: the PID of the thread
2263  *  @sig: signal to be sent
2264  *
2265  *  This syscall also checks the @tgid and returns -ESRCH even if the PID
2266  *  exists but it's not belonging to the target process anymore. This
2267  *  method solves the problem of threads exiting and PIDs getting reused.
2268  */
2269 asmlinkage long sys_tgkill(int tgid, int pid, int sig)
2270 {
2271         /* This is only valid for single tasks */
2272         if (pid <= 0 || tgid <= 0)
2273                 return -EINVAL;
2274
2275         return do_tkill(tgid, pid, sig);
2276 }
2277
2278 /*
2279  *  Send a signal to only one task, even if it's a CLONE_THREAD task.
2280  */
2281 asmlinkage long
2282 sys_tkill(int pid, int sig)
2283 {
2284         /* This is only valid for single tasks */
2285         if (pid <= 0)
2286                 return -EINVAL;
2287
2288         return do_tkill(0, pid, sig);
2289 }
2290
2291 asmlinkage long
2292 sys_rt_sigqueueinfo(int pid, int sig, siginfo_t __user *uinfo)
2293 {
2294         siginfo_t info;
2295
2296         if (copy_from_user(&info, uinfo, sizeof(siginfo_t)))
2297                 return -EFAULT;
2298
2299         /* Not even root can pretend to send signals from the kernel.
2300            Nor can they impersonate a kill(), which adds source info.  */
2301         if (info.si_code >= 0)
2302                 return -EPERM;
2303         info.si_signo = sig;
2304
2305         /* POSIX.1b doesn't mention process groups.  */
2306         return kill_proc_info(sig, &info, pid);
2307 }
2308
2309 int do_sigaction(int sig, struct k_sigaction *act, struct k_sigaction *oact)
2310 {
2311         struct task_struct *t = current;
2312         struct k_sigaction *k;
2313         sigset_t mask;
2314
2315         if (!valid_signal(sig) || sig < 1 || (act && sig_kernel_only(sig)))
2316                 return -EINVAL;
2317
2318         k = &t->sighand->action[sig-1];
2319
2320         spin_lock_irq(&current->sighand->siglock);
2321         if (oact)
2322                 *oact = *k;
2323
2324         if (act) {
2325                 sigdelsetmask(&act->sa.sa_mask,
2326                               sigmask(SIGKILL) | sigmask(SIGSTOP));
2327                 *k = *act;
2328                 /*
2329                  * POSIX 3.3.1.3:
2330                  *  "Setting a signal action to SIG_IGN for a signal that is
2331                  *   pending shall cause the pending signal to be discarded,
2332                  *   whether or not it is blocked."
2333                  *
2334                  *  "Setting a signal action to SIG_DFL for a signal that is
2335                  *   pending and whose default action is to ignore the signal
2336                  *   (for example, SIGCHLD), shall cause the pending signal to
2337                  *   be discarded, whether or not it is blocked"
2338                  */
2339                 if (__sig_ignored(t, sig)) {
2340                         sigemptyset(&mask);
2341                         sigaddset(&mask, sig);
2342                         rm_from_queue_full(&mask, &t->signal->shared_pending);
2343                         do {
2344                                 rm_from_queue_full(&mask, &t->pending);
2345                                 t = next_thread(t);
2346                         } while (t != current);
2347                 }
2348         }
2349
2350         spin_unlock_irq(&current->sighand->siglock);
2351         return 0;
2352 }
2353
2354 int 
2355 do_sigaltstack (const stack_t __user *uss, stack_t __user *uoss, unsigned long sp)
2356 {
2357         stack_t oss;
2358         int error;
2359
2360         if (uoss) {
2361                 oss.ss_sp = (void __user *) current->sas_ss_sp;
2362                 oss.ss_size = current->sas_ss_size;
2363                 oss.ss_flags = sas_ss_flags(sp);
2364         }
2365
2366         if (uss) {
2367                 void __user *ss_sp;
2368                 size_t ss_size;
2369                 int ss_flags;
2370
2371                 error = -EFAULT;
2372                 if (!access_ok(VERIFY_READ, uss, sizeof(*uss))
2373                     || __get_user(ss_sp, &uss->ss_sp)
2374                     || __get_user(ss_flags, &uss->ss_flags)
2375                     || __get_user(ss_size, &uss->ss_size))
2376                         goto out;
2377
2378                 error = -EPERM;
2379                 if (on_sig_stack(sp))
2380                         goto out;
2381
2382                 error = -EINVAL;
2383                 /*
2384                  *
2385                  * Note - this code used to test ss_flags incorrectly
2386                  *        old code may have been written using ss_flags==0
2387                  *        to mean ss_flags==SS_ONSTACK (as this was the only
2388                  *        way that worked) - this fix preserves that older
2389                  *        mechanism
2390                  */
2391                 if (ss_flags != SS_DISABLE && ss_flags != SS_ONSTACK && ss_flags != 0)
2392                         goto out;
2393
2394                 if (ss_flags == SS_DISABLE) {
2395                         ss_size = 0;
2396                         ss_sp = NULL;
2397                 } else {
2398                         error = -ENOMEM;
2399                         if (ss_size < MINSIGSTKSZ)
2400                                 goto out;
2401                 }
2402
2403                 current->sas_ss_sp = (unsigned long) ss_sp;
2404                 current->sas_ss_size = ss_size;
2405         }
2406
2407         if (uoss) {
2408                 error = -EFAULT;
2409                 if (copy_to_user(uoss, &oss, sizeof(oss)))
2410                         goto out;
2411         }
2412
2413         error = 0;
2414 out:
2415         return error;
2416 }
2417
2418 #ifdef __ARCH_WANT_SYS_SIGPENDING
2419
2420 asmlinkage long
2421 sys_sigpending(old_sigset_t __user *set)
2422 {
2423         return do_sigpending(set, sizeof(*set));
2424 }
2425
2426 #endif
2427
2428 #ifdef __ARCH_WANT_SYS_SIGPROCMASK
2429 /* Some platforms have their own version with special arguments others
2430    support only sys_rt_sigprocmask.  */
2431
2432 asmlinkage long
2433 sys_sigprocmask(int how, old_sigset_t __user *set, old_sigset_t __user *oset)
2434 {
2435         int error;
2436         old_sigset_t old_set, new_set;
2437
2438         if (set) {
2439                 error = -EFAULT;
2440                 if (copy_from_user(&new_set, set, sizeof(*set)))
2441                         goto out;
2442                 new_set &= ~(sigmask(SIGKILL) | sigmask(SIGSTOP));
2443
2444                 spin_lock_irq(&current->sighand->siglock);
2445                 old_set = current->blocked.sig[0];
2446
2447                 error = 0;
2448                 switch (how) {
2449                 default:
2450                         error = -EINVAL;
2451                         break;
2452                 case SIG_BLOCK:
2453                         sigaddsetmask(&current->blocked, new_set);
2454                         break;
2455                 case SIG_UNBLOCK:
2456                         sigdelsetmask(&current->blocked, new_set);
2457                         break;
2458                 case SIG_SETMASK:
2459                         current->blocked.sig[0] = new_set;
2460                         break;
2461                 }
2462
2463                 recalc_sigpending();
2464                 spin_unlock_irq(&current->sighand->siglock);
2465                 if (error)
2466                         goto out;
2467                 if (oset)
2468                         goto set_old;
2469         } else if (oset) {
2470                 old_set = current->blocked.sig[0];
2471         set_old:
2472                 error = -EFAULT;
2473                 if (copy_to_user(oset, &old_set, sizeof(*oset)))
2474                         goto out;
2475         }
2476         error = 0;
2477 out:
2478         return error;
2479 }
2480 #endif /* __ARCH_WANT_SYS_SIGPROCMASK */
2481
2482 #ifdef __ARCH_WANT_SYS_RT_SIGACTION
2483 asmlinkage long
2484 sys_rt_sigaction(int sig,
2485                  const struct sigaction __user *act,
2486                  struct sigaction __user *oact,
2487                  size_t sigsetsize)
2488 {
2489         struct k_sigaction new_sa, old_sa;
2490         int ret = -EINVAL;
2491
2492         /* XXX: Don't preclude handling different sized sigset_t's.  */
2493         if (sigsetsize != sizeof(sigset_t))
2494                 goto out;
2495
2496         if (act) {
2497                 if (copy_from_user(&new_sa.sa, act, sizeof(new_sa.sa)))
2498                         return -EFAULT;
2499         }
2500
2501         ret = do_sigaction(sig, act ? &new_sa : NULL, oact ? &old_sa : NULL);
2502
2503         if (!ret && oact) {
2504                 if (copy_to_user(oact, &old_sa.sa, sizeof(old_sa.sa)))
2505                         return -EFAULT;
2506         }
2507 out:
2508         return ret;
2509 }
2510 #endif /* __ARCH_WANT_SYS_RT_SIGACTION */
2511
2512 #ifdef __ARCH_WANT_SYS_SGETMASK
2513
2514 /*
2515  * For backwards compatibility.  Functionality superseded by sigprocmask.
2516  */
2517 asmlinkage long
2518 sys_sgetmask(void)
2519 {
2520         /* SMP safe */
2521         return current->blocked.sig[0];
2522 }
2523
2524 asmlinkage long
2525 sys_ssetmask(int newmask)
2526 {
2527         int old;
2528
2529         spin_lock_irq(&current->sighand->siglock);
2530         old = current->blocked.sig[0];
2531
2532         siginitset(&current->blocked, newmask & ~(sigmask(SIGKILL)|
2533                                                   sigmask(SIGSTOP)));
2534         recalc_sigpending();
2535         spin_unlock_irq(&current->sighand->siglock);
2536
2537         return old;
2538 }
2539 #endif /* __ARCH_WANT_SGETMASK */
2540
2541 #ifdef __ARCH_WANT_SYS_SIGNAL
2542 /*
2543  * For backwards compatibility.  Functionality superseded by sigaction.
2544  */
2545 asmlinkage unsigned long
2546 sys_signal(int sig, __sighandler_t handler)
2547 {
2548         struct k_sigaction new_sa, old_sa;
2549         int ret;
2550
2551         new_sa.sa.sa_handler = handler;
2552         new_sa.sa.sa_flags = SA_ONESHOT | SA_NOMASK;
2553         sigemptyset(&new_sa.sa.sa_mask);
2554
2555         ret = do_sigaction(sig, &new_sa, &old_sa);
2556
2557         return ret ? ret : (unsigned long)old_sa.sa.sa_handler;
2558 }
2559 #endif /* __ARCH_WANT_SYS_SIGNAL */
2560
2561 #ifdef __ARCH_WANT_SYS_PAUSE
2562
2563 asmlinkage long
2564 sys_pause(void)
2565 {
2566         current->state = TASK_INTERRUPTIBLE;
2567         schedule();
2568         return -ERESTARTNOHAND;
2569 }
2570
2571 #endif
2572
2573 #ifdef __ARCH_WANT_SYS_RT_SIGSUSPEND
2574 asmlinkage long sys_rt_sigsuspend(sigset_t __user *unewset, size_t sigsetsize)
2575 {
2576         sigset_t newset;
2577
2578         /* XXX: Don't preclude handling different sized sigset_t's.  */
2579         if (sigsetsize != sizeof(sigset_t))
2580                 return -EINVAL;
2581
2582         if (copy_from_user(&newset, unewset, sizeof(newset)))
2583                 return -EFAULT;
2584         sigdelsetmask(&newset, sigmask(SIGKILL)|sigmask(SIGSTOP));
2585
2586         spin_lock_irq(&current->sighand->siglock);
2587         current->saved_sigmask = current->blocked;
2588         current->blocked = newset;
2589         recalc_sigpending();
2590         spin_unlock_irq(&current->sighand->siglock);
2591
2592         current->state = TASK_INTERRUPTIBLE;
2593         schedule();
2594         set_thread_flag(TIF_RESTORE_SIGMASK);
2595         return -ERESTARTNOHAND;
2596 }
2597 #endif /* __ARCH_WANT_SYS_RT_SIGSUSPEND */
2598
2599 __attribute__((weak)) const char *arch_vma_name(struct vm_area_struct *vma)
2600 {
2601         return NULL;
2602 }
2603
2604 void __init signals_init(void)
2605 {
2606         sigqueue_cachep = KMEM_CACHE(sigqueue, SLAB_PANIC);
2607 }