在介绍wait、waitpid和waitid函数之前,首先要介绍一下僵尸进程,因为,这三个函数的本质任务就是处理僵尸进程的问题。
进程会我们的生命体一样,也有消亡。进程在退出时,内核会清理进程几乎所有的资源。例如:内存资源、文件资源、信号量资源、共享内存资源或者引用数减一 又或释放共享内存资源。但还有少量的资源没有被内核清理,例如:进程控制块PCB task_struct、内核栈资源。这些资源没有被释放,是为了保留一些进程退出是的重要信息,例如:进程消耗的系统cpu时间、用户cpu时间;收到了多少信号等待这些信息,类似于“墓志铭”,总结了进程的一生。而wait、waitpid和waitid函数就是来释放这些“墓志铭”信息的。之后进程就脱离了僵尸进程的状态。
进程的僵尸进程的状态,是一种“刀枪不入的状态”,即使是用kill -9 也无法杀死。只能通过wait这些函数活着是通过init进程来“收尸”;
对于创建了很多的子进程的父进程,获取子进程的退出信息是非常有意义的。
wait函数 函数声明 include <sys/wait.h> pid_t wait(int *status); 返回值返回退出子进程的pid;
等待过程中,收到了信号。信号打断了系统调用,并且注册信号处理函数时没有设置SA_RESTAR标识位,系统调用不会被重启。wait函数返回-1,全局变量error=EINIR(表示函数被信号中断);
所有需要等待的子进程都已经退出,没有要等的子进程的。wait函数返回-1,全局变量error=ECHLD(表示调用进程时发现并没有子进程需要等待);
由上述返回值的含义,等待所有子进程的退出时,要注意不要丢掉对信号中断情况的考虑,代码如下:
pit_t my_wait(int *state) { int retval; while( (retval=wait(state))!=-1 && (error==EINIR) ); return retval; }
参数说明wait函数的参数和waitpid函数的参数是一个意思。但waitpid函数对wait函数的局限性做了扩展,所以,在介绍waitpid时,再来讲wait的参数。
wait函数的局限性不能等待特定的子进程
如果子进程不存在,就会阻塞
只能探知子进程的死亡,却不能探测子进程的暂停,也无法探知进程的苏醒
waitpid函数 waitpid函数的声明 #include<sys/wait.h> pid_t waitpid(pit_t pid,int *status,int options); 返回值返回值和wait函数一样。
参数说明 pid参数pid > 0:表示等待进程ID为pid的子进程;
pid = 0:表示等待与调用进程同一进程组的任意子进程;
pid = -1:表示等待任意子进程;
pid < -1:表示等待所有子进程中,进程组ID与pid绝对值相等的所有子进程;
pid参数的理解:
首先给父进程要等待的子进程分类。子进程分为:和父进程同一进程组的子进程,和父进程不同进程组的子进程。子进程可以设置自己的进程组,所以某些子进程不一定和父进程归属于同一个进程组;pid>0,很自然,代表要等待的子进程pid,这叫做“精准打击”;还有情况就是分类等待子进程。由上述分类可知,与父进程为同一进程组的子进程怎么表示,调用waitpid函数的父进程本来就知道自己的进程组pid,所以,不用设置参数pid的值,即给0就行;那与父进程不在同一进程组的子进程的话,就得设置参数pid的值了,但要和“精准打击”的方式区别开,所以给负值,但取绝对值;当然,等待任意子进程的需求还是有的,而现在也正好只剩下一个值“-1”,刚好给它用;综述,通过上面的分析才有了pid参数的使用方式。 内核实现简述内核之中,wait和waitpid函数调用的都是wait4函数。根据pid的值来给wait_ opts结构体变量wo中的wo_type复制,再以实参的形式传参给do_wait函数,do_wait函数来决定等待什么状态的子进程。
wait4中的部分代码:
struct wait_opts wo; . . //给type复制的过程 . wo.wo_type = type; wo.wo_pid = pid; . . . ret = do_wait(&wo);在do_ wait函数中,主要要完成两个人物,第一,父进程中的每个线程都会去遍历子进程,第二,筛选要等待的子进程;在内核中,task_struct成员中children变量是保存子进程链表的链表头,利用list_for_each_enpty函数来遍历。利用eligible_pid函数来筛选。