來源: LUPA開源社區
發布時間: 2007-05-27 04:30
Linux下的網路編程分為兩部分:伺服器編程和客戶機編程。一般伺服器程式在接收客戶機串連請求之前,都要建立一個守護進程。守護進程是linux/Unix編程中一個非常重要的概念,因為在建立一個守護進程的時候,我們要接觸到子進程、進程組、會晤期、訊號機制以及檔案、目錄、控制終端等多個概念,因此詳細地討論一下守護進程,對初學者學習進程間關係是非常有協助的。
首先看一段將普通進程轉換為守護進程的代碼:
---------------------------
/****************************************************************
function: daemonize
description: detach the server process from the current context, creating a pristine, predictable environment in which it will execute.
arguments: servfd file descriptor in use by server.
return value: none.
calls: none.
globals: none.
****************************************************************/
void daemonize (servfd)
int servfd;
{
int childpid, fd, fdtablesize;
/* ignore terminal I/O, stop signals */
signal(SIGTTOU,SIG_IGN);
signal(SIGTTIN,SIG_IGN);
signal(SIGTSTP,SIG_IGN);
/* fork to put us in the background (whether or not the user
specified '&' on the command line */
if ((childpid = fork()) < 0) {
fputs("failed to fork first childrn",stderr);
exit(1);
}
else if (childpid > 0)
exit(0); /* terminate parent, continue in child */
/* dissociate from process group */
if (setpgrp(0,getpid())<0) {
fputs("failed to become process group leaderrn",stderr);
exit(1);
}
/* lose controlling terminal */
if ((fd = open("/dev/tty",O_RDWR)) >= 0) {
ioctl(fd,TIOCNOTTY,NULL);
close(fd);
}
/* close any open file descriptors */
for (fd = 0, fdtablesize = getdtablesize(); fd < fdtablesize; fd++)
if (fd != servfd)
close(fd);
/* set working directory to allow filesystems to be unmounted */
chdir("/");
/* clear the inherited umask */
umask(0);
/* setup zombie prevention */
signal(SIGCLD,(Sigfunc *)reap_status);
}
---------------------------
在linux系統中,如果要將一個普通進程轉換為守護進程,需要執行的步驟如下:
1、調用fork()函數建立子進程,然後中止父進程,保留子進程繼續運行。因為,當一個進程是以前台進程的方式由shell啟動時,如果中止了父進程,子進程就會自動轉為後台進程。另外,在下一步時,我們需要建立一個新的會晤期,這就要求建立會晤期的進程不是一個進程組的組長進程。當父進程中止,子進程繼續運行時,就保證了進程組的組ID與子進程的進程ID不會相等。
fork()函數的定義為:
----------------------
#include <sys/types.h>
#include <unistd.h>
pid_t fork(void);
----------------------
fork()函數被調用一次,會返回兩次值。這兩次返回的值分別是子進程的傳回值和父進程的傳回值,子進程的傳回值為“0”,父進程的傳回值為子進程的進程ID。如果出錯返回“-1”。
1、保證進程不會獲得任何控制終端。這是為了避免在關閉某些終端時會顯示有程式正在運行而無法關閉的情況。這一步通常的做法是:調用函數setsid()建立一個新的會晤期。
setsid()函數的定義為:
----------------------
#include <sys/types.h>
#include <unistd.h>
pid_t setsid(void);
----------------------
在第一步裡我們已經保證了調用此函數的進程不是進程組的組長,那麼調用此函數將建立一個新的會晤。其結果是:首先,此進程編程該會晤期的首進程(session leader,系統預設會晤期的首進程是建立該會晤期的進程)。而且,此進程是該會晤期中的唯一進程。然後,此進程將成為一個新的進程組的組長,新進程組的組ID就是該進程的進程ID。最後,保證此進程沒有控制終端,即使在調用setsid()之前此進程擁有控制終端,在建立會晤期後這種聯絡也將被解除。如果調用該函數的進程是一個進程組的組長,那麼函數將返回出錯資訊“-1”。
還有一個方法可以讓進程無法獲得控制終端,如下:
----------------------
if((fd = fopen("/dev/tty",0_RDWR)) >= 0){
ioctl(fd,TIOCNOTTY,NULL);
close(fd);
}
----------------------
其中/dev/tty是一個流裝置,也是我們的終端映射。調用close()函數將終端關閉。
3、訊號處理。一般要忽略掉某些訊號。訊號相當於軟體中斷,Linux/Unix下的訊號機制提供了一種處理非同步事件的方法,終端使用者鍵入引發中斷的鍵,或是系統發出訊號,這都會通過訊號處理機制終止一個或多個程式的運行。
不同情況下引發的訊號不同,所有的訊號都有自己的名字,這些名字都是以“SIG”開頭的,只是後面有所不同。我們可以通過這些名字瞭解到系統中到底發生了什麼事。當訊號出現時,我們可以要求系統進行一下三種操作:
a、忽略訊號。大多數訊號都採用這種處理方法,但是對SIGKILL和SIGSTOP訊號不能做忽略處理。
b、捕捉訊號。這是一種最為靈活的操作方式。這種處理方式的意思就是:當某種訊號發生時,我們可以調用一個函數對這種情況進行響應的處理。最常見的情況是:如果捕捉到SIGCHID訊號,則表示子進程已經終止,然後可作此訊號的捕捉函數中調用waitpid()函數取得該子進程的進程ID已經他的終止狀態。如果進程建立了臨時檔案,那麼就要為進程終止訊號SIGTERM編寫一個訊號捕捉函數來清除這些臨時檔案。
c、執行系統的預設動作。對絕大多數訊號而言,系統的預設動作都是終止該進程。
在Linux下,訊號有很多種,我在這裡就不一一介紹了,如果想詳細地對這些訊號進行瞭解,可以查看標頭檔<sigal.h>,這些訊號都被定義為正整數,也就是它們的訊號編號。在對訊號進行處理時,必須要用到函數signal(),此函數的詳細描述為:
-----------------------------------------------------------------
#include <signal.h>
void (*signal (int signo, void (*func)(int)))(int);
-----------------------------------------------------------------
其中參數signo為訊號名,參數func的值根據我們的需要可以是以下幾種情況:(1)常數SIG_DFL,表示執行系統的預設動作。(2)常數SIG_IGN,表示忽略訊號。(3)收到訊號後需要調用的處理函數的地址,此訊號捕捉程式應該有一個整型參數但是沒有傳回值。signal()函數返回一個函數指標,而該指標指向的函數應該無傳回值(void),這個指標其實指向以前的訊號捕捉程式。
下面 回到我們的daemonize()函數上來。這個函數在建立守護進程時忽略了三個訊號:
signal(SIGTTOU,SIG_IGN);
signal(SIGTTIN,SIG_IGN);
signal(SIGTSTP,SIG_IGN);
這三個訊號的含義分別是:SIGTTOU表示後台進程寫控制終端,SIGTTIN表示後台進程讀控制終端,SIGTSTP表示終端掛起。
4.關閉不再需要的檔案描述符,並為標準輸入、標準輸出和標準錯誤輸出開啟新的檔案描述符(也可以繼承父進程的標準輸入、標準輸出和標準錯誤輸出檔案描述符,這個操作是可選的)。在我們這段常式中,因為是Proxy 伺服器程式,而且是在執行了listen()函數之後執行這個daemonize()的,所以要保留已經轉換成功的傾聽通訊端,所以我們可以見到這樣的語句:
if (fd != servfd)
close(fd);
5.調用函數chdir("/")將當前工作目錄更改為根目錄。這是為了保證我們的進程不使用任何目錄。否則我們的守護進程將一直佔用某個目錄,這可能會造成超級使用者不能卸載一個檔案系統。
6.調用函數umask(0)將檔案方式建立屏蔽字設定為"0"。這是因為由繼承得來的檔案建立方式屏蔽字可能會禁止某些許可權。例如我們的守護進程需要建立一組可讀可寫的檔案,而此守護進程從父進程那裡繼承來的檔案建立方式屏蔽字卻有可能屏蔽掉了這兩種許可權,則新建立的一組檔案其讀或寫操作就不能生效。因此要將檔案方式建立屏蔽字設定為"0"。
在daemonize()函數的最後,我們可以看到這樣的訊號捕捉處理語句:
signal(SIGCLD,(Sigfunc *)reap_status);
這不是建立守護進程過程中必須的一步,它的作用是調用我們自訂的reap_status()函數來處理僵死進程。reap_status()在常式中的定義為:
-----------------------------------------------------------------
/****************************************************************
function: reap_status
description: handle a SIGCLD signal by reaping the exit status of the perished child, and discarding it.
arguments: none.
return value: none.
calls: none.
globals: none.
****************************************************************/
void reap_status()
{
int pid;
union wait status;
while ((pid = wait3(&status,WNOHANG,NULL)) > 0)
; /* loop while there are more dead children */
}
-----------------------------------------------------------------
上面訊號捕捉語句的原文為:
signal(SIGCLD, reap_status);
我們剛才說過,signal()函數的第二個參數一定要有有一個整型參數但是沒有傳回值。而reap_status()是沒有參數的,所以原來的語句在編譯時間無法通過。所以我在先行編譯部分加入了對Sigfunc()的類型定義,在這裡用做對reap_status進行強制類型轉換。而且在BSD系統中通常都使用SIGCHLD訊號來處理子進程終止的有關資訊,SIGCLD是System V中定義的一個訊號名,如果將SIGCLD訊號的處理方式設定為捕捉,那麼核心將馬上檢查系統中是否存在已經終止等待處理的子進程,如果有,則立即調用訊號捕捉處理常式。
一般在訊號捕捉處理常式中都要調用wait()、waitpid()、wait3()或是wait4()來返回子進程的終止狀態。這些"等待"函數的區別是,當要求函數"等待"的子進程還沒有終止時,wait()將使其調用者阻塞;而在waitpid()的參數中可以設定使調用者不發生阻塞,wait()函數不被設定為等待哪個具體的子進程,它等待調用者所有子進程中首先終止的那個,而在調用waitpid()時卻必須在參數中設定被等待的子進程ID。而wait3()和wait4()的參數分別比wait()和waitpid()還要多一個"rusage"。常式中的reap_status()就調用了函數wait3(),這個函數是BSD系統支援的,我們把它和wait4()的定義一起列出來:
-----------------------------------------------------------------
#include <sys/types.h>
#include <sys/wait.h>
#include <sys/time.h>
#include <sys/resource.h>
pid_t wait3(int *statloc, int options, struct rusage *rusage);
pid_t wait4(pid_t pid, int *statloc, int options, struct rusage *rusage);
-----------------------------------------------------------------
其中指標statloc如果不為"NULL",那麼它將指向返回的子進程終止狀態。參數pid是我們指定的被等待的子進程的進程ID。參數options是我們的控制選擇項,一般為WNOHANG或是WUNTRACED。常式中使用了選項WNOHANG,意即如果不能立即返回子進程的終止狀態(譬如由於子進程還未結束),那麼等待函數不阻塞,此時返回"0"。 WUNTRACED選項的意思是如果系統支援作業控制,如果要等待的子進程的狀態已經暫停,而且其狀態自從暫停以來還從未報告過,則返回其狀態。參數rusage如果不為"NULL",則它將指向核心返回的由終止進程及其所有子進程使用的資源摘要,該摘要包括使用者CPU時間總量、缺頁次數、接收到訊號的次數等。
聲明:LUPA開源社區刊登此文只為傳遞資訊,並不表示贊同或者反對。