Linux進程理解與實踐(四)wait函數處理殭屍進程
Wait的背景
當子進程退出的時候,核心會向父進程發送SIGCHLD訊號,子進程的退出是個非同步事件(子進程可以在父進程啟動並執行任何時刻終止)
子進程退出時,核心將子進程置為殭屍狀態,這個進程稱為殭屍進程,它只保留最小的一些核心資料結構,以便父進程查詢子進程的退出狀態。
父進程查詢子進程的退出狀態可以用wait/waitpid函數
#include #include pid_t wait(int *status); pid_t waitpid(pid_t pid, int *status, int options);
Wait
進程一旦調用了wait,就立即阻塞自己,由wait自動分析是否當前進程的某個子進程已經退出,如果讓它找到了這樣一個已經變成殭屍的子進程,wait就會收集這個子進程的資訊,並把它徹底銷毀後返回;如果沒有找到這樣一個子進程,wait就會一直阻塞在這裡,直到有一個出現為止。
參數status用來儲存被收集進程退出時的一些狀態,它是一個指向int類型的指標。但如果我們對這個子進程是如何死掉的毫不在意,只想把這個殭屍進程消滅掉,(事實上絕大多數情況下,我們都會這樣想),我們就可以設定這個參數為NULL,就象下面這樣:
pid = wait(NULL);
如果成功,wait會返回被收集的子進程的進程ID,如果調用進程沒有子進程,調用就會失敗,此時wait返回-1,同時errno被置為ECHILD。
下面就讓我們用一個例子來實戰應用一下wait調用:
int main(){ pid_t pid=fork(); if(pid==-1) ERR_EXIT("fork error!"); else if(pid==0) { printf("This is the child process,ID=:%d\n",getpid()); sleep(5); exit(0); } else { int state,retID; retID= wait(&state); printf("This is the Parent process,returnID=%d,state=%d\n",retID,state); // exit(0); } return 0;}
可以明顯注意到,在第2行結果列印出來前有5 秒鐘的等待時間,這就是我們設定的讓子進程睡眠的時間,只有子進程從睡眠中蘇醒過來,它才能正常退出,也就才能被父進程捕捉到。其實這裡我們不管設定子進程睡眠的時間有多長,父進程都會一直等待下去。
參數status:
如果參數status的值不是NULL,wait就會把子進程退出時的狀態取出並存入其中,這是一個整數值(int),指出了子進程是正常退出還是被非正常結束的(一個進程也可以被其他進程用訊號結束,我們將在以後的文章中介紹),以及正常結束時的傳回值,或被哪一個訊號結束的等資訊。由於這些資訊被存放在一個整數的不同二進位位中,所以用常規的方法讀取會非常麻煩,人們就設計了一套專門的宏(macro)來完成這項工作,下面我們來學習一下其中最常用的兩個:
1,WIFEXITED(status) 這個宏用來指出子進程是否為正常退出的,如果是,它會返回一個非零值。
(請注意,雖然名字一樣,這裡的參數status並不同於wait唯一的參數--指向整數的指標status,而是那個指標所指向的整數,切記不要搞混了。)
2, WEXITSTATUS(status) 當WIFEXITED返回非零值時,我們可以用這個宏來提取子進程的傳回值,如果子進程調用exit(5)退出,WEXITSTATUS(status) 就會返回5;如果子進程調用exit(7),WEXITSTATUS(status)就會返回7。請注意,如果進程不是正常退出的,也就是說, WIFEXITED返回0,這個值就毫無意義。
int main(){ pid_t pid=fork(); if(pid<0) ERR_EXIT("fork error!"); else if(pid==0) { printf("This is the child process with pid of %d\n",getpid()); exit(3); } else { int state; pid_t retID=wait(&state); if(WIFEXITED(state)) { printf("The child process %d exit normally.\n",retID); printf("The return code is %d\n",WEXITSTATUS(state)); } else { printf("The child process %d exit abnormally.\n",retID); } } return 0; }
父進程準確捕捉到了子進程的傳回值3,並把它列印了出來。
Waitpid
本質上講,系統調用waitpid和wait的作用是完全相同的,但waitpid多出了兩個可由使用者控制的參數pid和options,從而為我們編程提供了另一種更靈活的方式。下面我們就來詳細介紹一下這兩個參數:
pid
從參數的名字pid和類型pid_t中就可以看出,這裡需要的是一個進程ID。但當pid取不同的值時,在這裡有不同的意義。
pid>0時,只等待進程ID等於pid的子進程,不管其它已經有多少子進程運行結束退出了,只要指定的子進程還沒有結束,waitpid就會一直等下去。
pid=-1時,等待任何一個子進程退出,沒有任何限制,此時waitpid和wait的作用一模一樣。
pid=0時,等待同一個進程組中的任何子進程,如果子進程已經加入了別的進程組,waitpid不會對它做任何理睬。
pid<-1時,等待一個指定進程組中的任何子進程,這個進程組的ID等於pid的絕對值。
wait和waitpid兩者的關係:
static inline pid_t wait(int * wait_stat){return waitpid(-1,wait_stat,0);}waitpid的傳回值比wait稍微複雜一些,一共有3種情況:
當正常返回的時候,waitpid返回收集到的子進程的進程ID;
如果設定了選項WNOHANG(第三個參數),而調用中waitpid發現沒有已退出的子進程可收集,則返回0;
如果調用中出錯,則返回-1,這時errno會被設定成相應的值以指示錯誤所在;
當pid所指示的子進程不存在,或此進程存在,但不是調用進程的子進程,waitpid就會出錯返回,這時errno被設定為ECHILD;
int main(){ pid_t retID; pid_t pid=fork(); if(pid<0) ERR_EXIT("fork error!"); else if(pid==0) { sleep(10); exit(0); } do{ retID=waitpid(pid,NULL,WNOHANG); if(retID==0) printf("No child exited\n"); sleep(1); }while(retID==0); if(retID==pid) printf("Successfully get child!\n"); else ERR_EXIT("some error occured\n"); return 0; }
父進程經過10次失敗的嘗試之後,終於收集到了退出的子進程。