由於職責的要求,你不得不費力地閱讀那些令你感到費解的晦澀的Linux應用程式的說明檔案。然後,你將運行指令和編輯設定檔案。一切都在正常運行,生活
真美好。但是,你知道,好時光不會永遠持續下去。當你遇到令人恐懼的“send the process a SIGHUP”提示時,好時光結束了。
什麼是“SIGHUP(啟動訊號)”,你如何發送它?它像是你送給你的戀人的一束花嗎?雖然你可以肯定這不是一個命令列指令,不過,你還是試著鍵入它。
當然,這沒有結果。然後,你檢查一下鍵盤。哦,沒有SIGHUP鍵。於是你又重新閱讀這個應用程式的參考指南,看到下面這段文字:
當收到一個hangup(進程結束)訊號時,sshd程式會重新閱讀設定檔。通過執行啟動程式時的命令及選項來發送SIGHUP訊號,如:/usr/sbin/sshd。
哦,原來是這樣。
程式員 VS 使用者
LINUX程式的線上參考指南作者一般都要既照顧到終端使用者的需求也要照顧到進階程式員的需求。因此,有些說明比較難懂。不過,不要擔心。現在我們就要揭開覆蓋在這些讓人迷惑的內容上面那神秘的面紗。
訊號與進程式控制制
這個問題主要屬於訊號和進程式控制制的範疇。對於我們系統管理員和普通使用者來說,我們主要關心的是啟動、停止和重新啟動服務、停止失控的進程和被掛起的進
程,並且儘可能不中斷系統運行。因為不同的作業系統和不同的命令外殼處理訊號的方式都不相同,我們這裡只介紹Linux作業系統和bash外殼。
訊號是用來與精靈和進程通訊的。任何活動任務都是一個進程,而精靈是等待對某些事件做出反應或者按照排程執行任務的後台服務。一個程式必須
有建在其中的訊號處理常式用於捕獲和應答訊號。在LINUX中的signal
參考指南解釋了各種不同訊號和這些訊號的用途。訊號是由“kill”命令發出的。kill -l命令可以顯示一個可用訊號列表及其編號。
所有的精靈和進程都有一個進程ID(PID),例如使用ps命名所顯示的內容:
$ ps aux
USER PID %CPU %MEM TTY STAT COMMAND
root 1 0.0 0.1 ? S init [2]
105 7783 0.0 0.2 ? Ss /usr/bin/dbus-daemon --system
hal 7796 0.0 0.7 ? Ss /usr/sbin/hald
postfix 7957 0.0 0.2 ? S qmgr -l -t fifo -u -c
nagios 8371 0.0 0.2 ? SNs /usr/sbin/nagios /etc/nagios/nagios.cfg
這個輸出是經過簡化的。你在系統中可以看到更多的行和欄目。如果某些進程消耗了你的全部CPU或者記憶體,你可以在這個輸出的%CPU和%MEM列中發現
它們。找到失控的進程的一種更快捷的方法是使用top命令,因為按照預設的設定,使用佔用CPU資源最多的進程在最上面顯示。我們可以使用一條“yes”
命令來測試一下:
$ yes carla is teh awesum
這個命令將以很高的速度反覆顯示“carla is teh awesum”,直到你停止它運行。這將使你的CPU使用率達到警戒線。
$ top
...
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
12144 carla 25 0 31592 17m 13m R 93.4 3.5 0:50.26 konsole
22236 carla 15 0 2860 468 400 S 4.3 0.1 0:00.97 yes
分析一下這個結果,你會發現一些有趣的事,你會發現,佔用CPU最多的程式是konsole虛擬終端程式,而不是“yes”命令,這是因為“yes”命
令是在konsole終端程式中啟動並執行。如果在一個“真正的”控制台(按Ctrl+alt+f2鍵)中運行同樣的命令序列,你將看到“yes”命令被排在
第一位。
有許多停止“yes”命令啟動並執行方式。如果你要回到運行它的shell中,按CTRL+c鍵就可以了。或者你可以在另一個shell中用“kill”命令停止“yes”命令的運行,Kill命令後面跟PID或者命令名稱,如下如示:
$ kill 22236
或者
$ killall yes
按CTRL+c鍵發出一個SIGINT(訊號2),這個訊號是鍵盤要求取得控制權的中斷訊號。kill和killall這兩個命令按照預設的設定都發出
一個SIGTERM訊號(編號15)。程式中可以設定對SIGTERM訊號(15)是捕捉或者忽略,或者以不同的方式解釋。因此,如果你的程式對於
KILL命令的反應與你預期不同,很可能是被KILL的目標程式的問題。
終止一個父進程通常也終止了它的子進程。不過,情況並不總是如此。你知道子進程是什麼嗎?使用ps命令加上-f選項就可以看到,如下所示:
$ ps axf
22371 ? R 2:35 _ konsole [kdeinit]
22372 pts/3 Ss 0:00 | _ /bin/bash
24322 pts/3 S+ 0:00 | | _ yes carla is teh awesum
22381 pts/4 Rs 0:00 | _ /bin/bash
24323 pts/4 R+ 0:00 | | _ ps axf
現在,回到SIGHUP的話題
SIGHUP的發音是“sig-hup”,是signal hangup的縮寫,含義是“中止訊號”。你如何發送一個SIGHUP訊號呢?這裡有幾種方式:
# kill -HUP [pid]
# killall -HUP [process-name]
# kill -1 [pid]
# killall -1 [process-name]
因此,你可以使用PID或者名稱,訊號名稱或者號碼。那麼為什麼要這樣做而不使用/etc/init.d/foo命令重新啟動呢?使用它們自己的
init(初始化)檔案來控制服務是優先選擇的方式,因為這些檔案通常包含健全和錯誤檢查以及額外的功能。使用“kill”命令和訊號的主要原因是儘可能
明確地終止掛起和失控的進程,而不必重新啟動或者登出。
終止進程
正如你在關於訊號的man page中所看到的,有十幾種控制進程的方法。下面是一些常用的方法:
kill -STOP [pid]
發送SIGSTOP (17,19,23)停止一個進程,而並不消滅這個進程。
kill -CONT [pid]
發送SIGCONT (19,18,25)重新開始一個停止的進程。
kill -KILL [pid]
發送SIGKILL (9)強迫進程立即停止,並且不實施清理操作。
kill -9 -1
終止你擁有的全部進程。
SIGKILL和SIGSTOP訊號不能被捕捉、封鎖或者忽略,但是,其它的訊號可以。所以這是你的終極武器。
Bash shell的Kil命令l
Bash外殼包含一個內建的kill命令,當執行下面命令:
$ type -all kill
kill is a shell built-in
kill is /bin/kill
命令的結果表明有兩個kill命令,一個是BASH的內建命令,另一個是/bin/kill可執行程式。一般來說這兩個命令不太可能遇到衝突的情況,不過,如果你確實遇到了kill命令列為異常時,你可以明確的指定/bin/kill命令。
你一定要進一步查閱下面的資源中列出的參考資源來瞭解Linux中kill的妙用,因為這是你進入維護Linux系統領域的門票。這些知識能夠讓你像做外科手術一樣對系統進行維護,而不用在遇到問題時每一次都重新啟動系統,就像我們知道的某些蹩腳的作業系統那樣。
資源
Linux Cookbook一書的第七章“開始和終止Linux”
bash (1) - GNU Bourne-Again Shell
yes (1) - 在被終止前反覆列印字元
signal (7) - 可用訊號列表
ps (1) - 報告當前進程的快照
kill (1) - 向一個進程發出訊號
killall (1) - 按名字消滅進程
pkill (1) - 根據名字和其它屬性查看或者發出進程訊號
skill (1) - 發送一個訊號或者報告進程狀態
xkill (1) - 按照X資源消滅一個客戶程式