一进程的退出:
当一个进程运行完毕或者因为触发系统异常而退出时,最终会调用到内核中的函数do_exit(),在do_exit()函数中会清理一些进程使用的文件描述符,会释放掉进程用户态使用的相关的物理内存,清理页表,同时进程会调整其子进程的父子关系,会根据实际的情况向父进程发送SIG_CHLD信号。
下面是经过简化的内核代码,去掉了一些不用太关注的东西。

fastcall NORET_TYPE void do_exit(long code) 

 { 

struct task_struct *tsk = current; 

int group_dead; 



//设置进程的状态为pf_exiting 

tsk->flags |= PF_EXITING; 

//从定时器队列中删除该进程 

del_timer_sync(&tsk->real_timer); 

//当前进程需要被trace相应的exit,将该进程的exit事件通过信号 

//发送给父进程,也就是trace 进程 

if (unlikely(current->ptrace & PT_TRACE_EXIT)) { 

current->ptrace_message = code; 

ptrace_notify((PTRACE_EVENT_EXIT << 8) | SIGTRAP); 

} 



//下面的几个exit是将进程同各个描述符分离,主要有内存描述符,信号量,文件描述符,文件系统,命名空间,若相关描述符不再有任何进程使用,会释放掉,后面会分析一下__exit_mm()和__exit_files()函数 

__exit_mm(tsk); 

exit_sem(tsk); 

__exit_files(tsk); 

__exit_fs(tsk); 

exit_namespace(tsk); 

exit_thread(); 

exit_keys(tsk); 



if (group_dead && tsk->signal->leader) 

disassociate_ctty(1); 

//exit_code中存放进程的退出码 

tsk->exit_code = code; 

//调整进程子进程的父子关系,向相关进程发出SIG_CHLD信号 

exit_notify(tsk); 

//进程处于zombie或者dead状态,在此调用schedule,该进程就永远回不来了^O^ 

schedule(); 

for (;;) ; 

 } 



 static inline void __exit_mm(struct task_struct * tsk) 

 { 

struct mm_struct *mm = tsk->mm; 

//对于vfork来说,父进程会等待,直到子进程退出,在这里唤醒父进程 

mm_release(tsk, mm); 

if (!mm) 

return; 

/* more a memory barrier than a real lock */ 

task_lock(tsk); 

//将进程的内存描述符设为空 

tsk->mm = NULL; 

up_read(&mm->mmap_sem); 

//使当前的cpu进入懒惰tlb模式 

enter_lazy_tlb(mm, current); 

task_unlock(tsk); 

//在这里真正的去释放内存描述符及相关所属资源 

mmput(mm); 

 } 

 void mmput(struct mm_struct *mm) 

 { 

//在多线程的情况下,可能多个线程会共享同一个进程描述符,mm_users就是指明了有多少个线程正在使用该描述符 

if (atomic_dec_and_test(&mm->mm_users)) { 

exit_aio(mm); 

//没有进程使用该内存描述符了,应该可以释放掉该内存描述符所描述的一些进程用户态空间内存,并释放掉所有的vm_area_struct 

exit_mmap(mm); 

if (!list_empty(&mm->mmlist)) { 

spin_lock(&mmlist_lock); 

list_del(&mm->mmlist); 

spin_unlock(&mmlist_lock); 

} 

//释放掉交换标记 

put_swap_token(mm); 

//释放掉内存描述符和pgd表,释放掉内存描述符 

mmdrop(mm); 

} 

 } 



 static void exit_notify(struct task_struct *tsk) 

 { 

int state; 

struct task_struct *t; 

struct list_head ptrace_dead, *_p, *_n; 

write_lock_irq(&tasklist_lock); 



INIT_LIST_HEAD(&ptrace_dead); 

     //改变进程子进程的父子关系 

forget_original_parent(tsk, &ptrace_dead); 



  

t = tsk->real_parent; 

 

if ((process_group(t) != process_group(tsk)) && 

   (t->signal->session == tsk->signal->session) && 

   will_become_orphaned_pgrp(process_group(tsk), tsk) && 

   has_stopped_jobs(process_group(tsk))) { 

__kill_pg_info(SIGHUP, (void *)1, process_group(tsk)); 

__kill_pg_info(SIGCONT, (void *)1, process_group(tsk)); 

} 

if (tsk->exit_signal != SIGCHLD && tsk->exit_signal != -1 && 

   ( tsk->parent_exec_id != t->self_exec_id  || 

     tsk->self_exec_id != tsk->parent_exec_id) 

   && !capable(CAP_KILL)) 

tsk->exit_signal = SIGCHLD; 



//线程为组长线程且线程组已经空了,这个时候可以通知父进程sigchild消息了 

//exit_signal为-1只有在其为非组长线程的线程的情况下才发生 

if (tsk->exit_signal != -1 && thread_group_empty(tsk)) { 

int signal = tsk->parent == tsk->real_parent ? tsk->exit_signal : SIGCHLD; 

do_notify_parent(tsk, signal); 

} else if (tsk->ptrace) { 

do_notify_parent(tsk, SIGCHLD); 

} 



state = EXIT_ZOMBIE; 

//对于线程而言,线程若不为trace进程trace的话,可以直接 

//将exit_state置位exit_dead,对于单线程进程,exit_state为EXIT_DEAD 

if (tsk->exit_signal == -1 && tsk->ptrace == 0) 

state = EXIT_DEAD; 

tsk->exit_state = state; 



/* 

* Clear these here so that update_process_times() won't try to deliver 

* itimer, profile or rlimit signals to this task while it is in late exit. 

*/ 

tsk->it_virt_value = 0; 

tsk->it_prof_value = 0; 



write_unlock_irq(&tasklist_lock); 



list_for_each_safe(_p, _n, &ptrace_dead) { 

list_del_init(_p); 

t = list_entry(_p,struct task_struct,ptrace_list); 

release_task(t); 

} 



/* If the process is dead, release it - nobody will wait for it */ 

//对于非组长线程的线程,对其进行清理,对于组长 

//线程的清理则是在发送了sig_chld信号后,由其父进程 

//进行清理 

if (state == EXIT_DEAD) 

release_task(tsk); 



/* PF_DEAD causes final put_task_struct after we schedule. */ 

preempt_disable(); 

tsk->flags |= PF_DEAD; 

 }




从exit_notify代码中,我们可以看出发送SIG_CHLD信号的条件:
1对于单线程进程,当进程退出就发送sig_chld信号。
2对多线程进程,当线程组无其他线程时,才会发送sig_chld信号,发送sig_chld信号主要是为了让父进程处理回收组长进程,普通的非组长线程自己会把自己清理掉的。
  2.1组长线程退出且线程组无其他线程
  2.2非组长线程退出且线程组无其他线程
3进程被trace。
    线程组组长进程是最后一个被撤销处理掉的


二进程的撤销:
当进程终止运行后,一般会处于僵死状态,需要由父进程来执行wait操作来回收进程的进程描述符及内核栈所占内存,同时把僵死进程从进程相关的各个表上摘除下来。对应的处理函数是release_task(),该函数的处理过程是:
1递减进程拥有者进程的个数, atomic_dec(&p->user->processes);
2如果进程被跟踪,把它从调试程序的ptrace_children链表中删除。__ptrace_unlink(p);
3调用__exit_signal()删除所有的挂起信号并释放signal_struct描述符,若没有其它轻量级进程使用该signal_struct的话,会删除该数据结构: __exit_signal(p);
4调用__exit_sighand()删除信号处理函数: __exit_sighand(p);
5调用__unhash_process(),该函数依次执行下列操作:
 a变量nr_threads减1.
 b两次调用detach_pid(),分别从PIDTYPE_PID和PIDTYPE_TGID类型的PID散列表中删除进程描述符。
 c如果进程是线程组的领头进程,那么调用两次detach_pid()从PIDTYPE_PGID, PIDTYPE_SID类型的散列表中删除该进程描述符。
 d用RMOVE_LINKS从进程链表中删除该进程。
6如果进程不是线程组的领头进程,领头进程处于僵死状态,且该进程时线程组中的最后一个成员,该进程向领头进程的父进程发出一个信号,通知该进程已经死亡。
7调用sched_exit()函数来调整父进程的时间片。
8调用put_task_struct()递减进程描述符的引用计数,当计数器变为0时,则函数终止所有残留的对进程的引用.
  a递减进程所有者的user_struct 数据结构的使用计数,如果该引用计数变为0,释放该结构。
  b释放进程描述符以及thread_info描述符和内核态堆栈。