什麼是殭屍進程
殭屍進程是指它的父進程已經退出(父進程沒有等待(調用wait/waitpid)它),而該進程dead之後沒有進程接受,就成為殭屍進程,也就是(zombie)進程。
殭屍進程是怎麼樣產生
一個進程在調用exit命令結束自己的生命的時候,其實它並沒有真正的被銷毀,而是留下一個稱為殭屍進程(Zombie)的資料結構(系統調用exit,它的作用是使進程退出,但也僅僅限於將一個正常的進程變成一個殭屍進程,並不能將其完全銷毀)。
在Linux進程的狀態中,殭屍進程是非常特殊的一種,它已經放棄了幾乎所有記憶體空間,沒有任何可執行代碼,也不能被調度,僅僅在進程列表中保留一個位置,記載該進程的退出狀態等資訊供其他進程收集,除此之外,殭屍進程不再佔有任何記憶體空間。它需要它的父進程來為它收屍。
如果他的父進程沒安裝SIGCHLD訊號處理函數調用wait或waitpid()等待子進程結束,又沒有顯式忽略該訊號,那麼它就一直保持殭屍狀態,如果這時父進程結束了,那麼init進程自動會接手這個子進程,為它收屍,它還是能被清除的。
但是如果父進程是一個迴圈,不會結束,那麼子進程就會一直保持殭屍狀態,這就是為什麼系統中有時會有很多的殭屍進程。系統所能使用的進程號是有限的,如果大量的產生僵死進程,將因為沒有可用的進程號而導致系統不能產生新的進程.
殭屍進程的避免
1、父進程通過wait和waitpid等函數等待子進程結束,這會導致父進程掛起
2、如果父進程很忙,那麼可以用signal函數為SIGCHLD安裝handler,因為子進程結束後,父進程會收到該訊號,可以在handler中調用wait回收
3、如果父進程不關心子進程什麼時候結束,那麼可以用signal(SIGCHLD, SIG_IGN) 通知核心,自己對子進程的結束不感興趣,那麼子進程結束後,核心會回收,並不再給父進程發送訊號
4、還有一些技巧,就是fork兩次,父進程fork一個子進程,然後繼續工作,子進程fork一個孫進程後退出,那麼孫進程被init接管,孫進程結束後,init會回收。不過子進程的回收還要自己做。
子進程結束後為什麼要進入殭屍狀態?
因為父進程可能要取得子進程的退出狀態等資訊。
殭屍狀態是每個子進程必經的狀態嗎?
任何一個子進程(init除外)在exit()之後,並非馬上就消失掉,而是留下一個稱為殭屍進程(Zombie)的資料結構(它佔用一點記憶體資源,也就是進程表裡還有一個記錄),等待父進程處理。這是每個子進程在結束時都要經過的階段。如果子進程在exit()之後,父進程沒有來得及處理,這時用ps命令就能看到子進程的狀態是“Z”。
如果父進程能及時處理,可能用ps命令就來不及看到子進程的殭屍狀態,但這並不等於子進程不經過殭屍狀態。
如果父進程在子進程結束之前退出,則子進程將由init接管。init將會以父進程的身份對殭屍狀態的子進程進行處理。
如何查看殭屍進程
在linux中,利用命令ps,可以看到有標記為Z的進程就是殭屍進程。
ps -ef|grep defunc可以找出殭屍進程.
可以用ps的-l選項,得到更詳細的進程資訊. F(Flag):一系列數位和,表示進程的目前狀態。這些數位含義為:
00:若單獨顯示,表示此進程已被終止。
01:進程是核心進程的一部分,常駐於系統主存。如:sched、 vhand 、bdflush 等。
02:Parent is tracing process.
04:Tracing parent’s signal has stopped the process; the parent is waiting ( ptrace(S)).
10:進程在優先順序低於或等於25時,進入休眠狀態,而且不能用訊號喚醒,例如在等待一個inode被建立時
20:進程被裝入主存(primary memory)
40:進程被鎖在主存,在事務完成前不能被置換
S(state of the process )
O:進程正在處理器運行
S:休眠狀態(sleeping)
R:等待運行(runable)
I:空閑狀態(idle)
Z:殭屍狀態(zombie)
T:跟蹤狀態(Traced)
B:進程正在等待更多的記憶體頁
C:cpu利用率的估算值(cpu usage)
殭屍進程清除的方法
1.改寫父進程,在子進程死後要為它收屍。具體做法是接管SIGCHLD訊號。子進程死後,會發送SIGCHLD訊號給父進程,父進程收到此訊號後,執行waitpid()函數為子進程收屍。這是基於這樣的原理:就算父進程沒有調用wait,核心也會向它發送SIGCHLD訊息,儘管對的預設處理是忽略,如果想響應這個訊息,可以設定一個處理函數。
SIGCHLD訊號:子進程結束時, 父進程會收到這個訊號。如果父進程沒有處理這個訊號,也沒有等待(wait)子進程,子進程雖然終止,但是還會在核心進程表中佔有表項,這時的子進程稱為殭屍進程。這種情況我們應該避免(父進程或者忽略SIGCHILD訊號,或者捕捉它,或者wait它派生的子進程,或者父進程先終止,這時子進程的終止自動由init進程來接管)。
2. kill -18 PPID (PPID是其父進程)
這個訊號是告訴父進程,該子進程已經死亡了,請收回分配給他的資源。
SIGCONT也是一個有意思的訊號。如前所述,當進程停止的時候,這個訊號用來告訴進程恢複運行。該訊號的有趣的地方在於:它不能被忽略或阻塞,但可以被捕獲。預設行為是丟棄該訊號。
3.終止父進程
如果方法2不能終止,可採用終止其父進程的方法(如果其父進程不需要的話)父進程死後,殭屍進程成為”孤兒進程”,過繼給1號進程init,init始終會負責清理殭屍進程.它產生的所有殭屍進程也跟著消失。
先看其父進程又無其他子進程,如果有,可能需要先kill其他子進程,也就是兄弟進程。方法是:
kill –15 PID1 PID2 (PID1,PID2是殭屍進程的父進程的其它子進程)。
然後再kill父進程:kill –15 PPID
這樣殭屍進程就可能被完全殺掉了。
原文出處: