Linux進程線程學習筆記:運行新程式
周銀輝
在上一篇中我們說到,當啟動一個新進程以後,新進程會複製父進程的大部份上下文並接著運行父進程中的代碼,如果我們使新進程不運行原父進程的代碼,轉而運行另外一個程式集中的代碼,這就相當於啟動了一個新程式。這裡的代碼我們可以理解成一個可執行程式。
所以,要運行一個新程式,需要最基本的兩步:
1,建立一個可運行程式的環境,也就是進程。
2,將環境中的內容替換成你所希望的,也就是用你希望啟動並執行可執行檔去覆蓋新進程中的原有映像,並從該可執行檔的起始處開始執行。
要做到第一點,非常簡單,fork函數就可以(參考上一篇) ,要做到第二點,則可以利用exec函數族。
exec是一族函數的簡稱,包含在<unistd.h>中它們作用都一樣,用一個可執行檔覆蓋進程的現有映像,並轉到該可執行檔的起始處開始執行。
原型如下:
int execl(const char *path, const char *arg0, ... /*, (char *)0 */);
int execlp(const char *file, const char *arg0, ... /*, (char *)0 */);
int execle(const char *path, const char *arg0, ... /*, (char *)0, char *const envp[]*/);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execve(const char *path, char *const argv[], char *const envp[]);
我們先以最簡單的execl函數為例,其他的大同小異,其第一個參數path是可執行檔的路徑,是絕對路徑;從arg0參數開始及後面所有的是你要傳遞給可執行檔的命令列參數,值得注意的是,arg0是可執行檔本身(還記得C語言中老師講main函數參數列表時所說的麼),當然,不傳程式本身或傳一些亂七八糟的值並不代表不能通過編譯或不能運行,只不過,如果可執行檔要用到arg0時會產生一些迷惑;最後有一個注釋/*, (char*)0 */是提醒我們最後一個參數應該傳Null 字元串。如何函數運行成功,則不會有任何傳回值,否則返回-1,而具體的錯誤號碼會被設定在errno,errno是一個全域變數,用於程式設定錯誤號碼,跟win32的getLastError函數類似。
看下面的例子:
#include <stdio.h>
#include <unistd.h>
int main ()
{
printf("app start...\n");
execl("/bin/ls", "/bin/ls", "-l",NULL);
printf("app end\n");
return 0;
}
我們運行了bin目錄下的ls程式,參數arg0時ls程式本身路徑,arg1為-l,使得其以列表的形式列舉目前的目錄,在我的電腦上程式輸出如下:
app start...
total 12
-rw-r--r-- 1 zhouyh zhouyh 273 2010-09-06 11:09 temp.c
-rwxr-xr-x 1 zhouyh zhouyh 7175 2010-09-06 11:09 temp.exe
ls程式運行成功了。但注意到了嗎?沒有輸出“app end”這個字串,原因很簡單,我們沒有新起進程,而是直接用ls程式覆蓋了main函數所在的進程。
那我們接下來,試著用fork吧,以免影響原進程。
#include <stdio.h>
#include <unistd.h>
int main ()
{
printf("app start...\n");
if(fork() == 0)
{
execl("/bin/ls", "/bin/ls", "-l", NULL);
}
printf("app end\n");
return 0;
}
我們用fork建立了一個新進程,當其成功建立後(傳回值為0),我們用execl來載入ls程式並運行之。
程式的輸出如下:
app start...
app end
zhouyh@ubuntu:~/Documents$ total 12
-rw-r--r-- 1 zhouyh zhouyh 229 2010-09-06 15:59 temp.c
-rwxr-xr-x 1 zhouyh zhouyh 7211 2010-09-06 16:00 temp.exe
程式的所有輸出都OK了,但有一點可能和我們想象的不一樣,那就是“app end”這個字串很早就輸出了而不是在最後,其實這並沒有錯,“app end” 是main函數所在的程式(temp.exe)即將結束時輸出的,而列舉檔案目錄的ls卻完全在另外一個進程中,兩個非同步執行的進程,他們沒有誰先誰後結束可言。
如果我們希望所有工作完成之後,即ls也執行玩以後,才輸出“app end”,那麼可以使用wait 以及waitpid函數,這裡簡單說一下wait,具體的會在“Linux進程線程學習筆記:進程式控制制”中講。
pid_t wait (int * status); //包含在 <sys/wait.h> 中
wait函數講當前進程休眠,直到該進程的某個子進程結束或者有特定的訊號來喚醒。如果子進程正常結束,則講子進程的進程id(pid)作為傳回值,發生錯誤則返回-1,而status參數講傳出子進程的結束狀態值。
針對剛才的例子,可以參考下面的代碼:
#include <stdio.h> //for printf(const char)
#include <unistd.h> //for fork()
#include <sys/wait.h> //for wait(int* status)
int main ()
{
printf("app start...\n");
if(fork() == 0)
{
execl("/bin/ls", "/bin/ls", "-l", NULL);
}
int status;
wait(&status);
printf("app end\n");
return 0;
}
程式輸出如下:
app start...
total 12
-rw-r--r-- 1 zhouyh zhouyh 337 2010-09-06 16:22 temp.c
-rwxr-xr-x 1 zhouyh zhouyh 7247 2010-09-06 16:22 temp.exe
app end
好了,現在回過頭來看除execl外的其他幾個函數 :
int execlp(const char *file, const char *arg0, ... /*, (char *)0 */);
execlp和execl差不多,但區別在於前者會去系統內容變數尋找file所指的程式的位置,所以如果通過環境變數能找到可執行檔,則file可以不是絕對路徑了,比如 execlp("ls", "ls", "-l", NULL);
int execle(const char *path, const char *arg0, ... /*, (char *)0, char *const envp[]*/);
與execlp不同的是,其最後一個參數作為你自訂的環境變數參數傳進去,而不是尋找系統內容變數
char *env[] = { "HOME=/usr/home", "LOGNAME=home",(char *)0 };
execle("/bin/ls", "ls", "-l", NULL, env);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execve(const char *path, char *const argv[], char *const envp[]);
這三個函數和前面的三個類似,函數名由尾碼l變成了v,其表達的含義是參數不再用參數列表傳遞而是用一個參數數組argv[],當然,數組最後一個元素也必須是char* 0
名字這麼相近的函數,感覺好容易混淆,那麼就從l,v,p,e 這樣的尾碼來區分吧:
l:參數為一個逗號分隔的參數列表,並以char* 0作為列表結尾
v: 參數為字串數組,數組的最後一個元素為char* 0
p: 可以通過系統內容變數尋找檔案位置
e:調用者顯示傳入環境變數