Linux進程基礎

來源:互聯網
上載者:User

作者:Vamei 出處:http://www.cnblogs.com/vamei 歡迎轉載,也請保留這段聲明。謝謝!

 

電腦實際上可以做的事情實質上非常簡單,比如計算兩個數的和,再比如在記憶體中尋找到某個地址等等。這些最基礎的電腦動作被稱為指令 (instruction)。所謂的程式(program),就是這樣一系列指令的所構成的集合。通過程式,我們可以讓電腦完成複雜的操作。程式大多數時候被儲存為可執行檔檔案。這樣一個可執行檔就像是一個菜譜,電腦可以按照菜譜作出可口的飯菜。

那麼,程式和進程(process)的區別又是什麼呢?

進程是程式的一個具體實現。只有食譜沒什麼用,我們總要按照食譜的指點真正一步步實行,才能做出菜肴。進程是執行程式的過程,類似於按照食譜,真正去做菜的過程。同一個程式可以執行多次,每次都可以在記憶體中開闢獨立的空間來裝載,從而產生多個進程。不同的進程還可以擁有各自獨立的IO介面。

作業系統的一個重要功能就是為進程提供方便,比如說為進程分配記憶體空間,管理進程的相關資訊等等,就好像是為我們準備好了一個精美的廚房。

 

1. 看一眼進程

首先,我們可以使用$ps命令來查詢正在啟動並執行進程,比如$ps -eo pid,comm,cmd,為執行結果:

(-e表示列出全部進程,-o pid,comm,cmd表示我們需要PID,COMMAND,CMD資訊)

 

每一行代表了一個進程。每一行又分為三列。第一列PID(process IDentity)是一個整數,每一個進程都有一個唯一的PID來代表自己的身份,進程也可以根據PID來識別其他的進程。第二列COMMAND是這個進程的簡稱。第三列CMD是進程所對應的程式以及運行時所帶的參數。

(第三列有一些由中括弧[]括起來的。它們是kernel的一部分功能,被打扮成進程的樣子以方便作業系統管理。我們不必考慮它們。)

 

我們看第一行,PID為1,名字為init。這個進程是執行/bin/init這一檔案(程式)產生的。當Linux啟動的時候,init是系統建立的第一個進程,這一進程會一直存在,直到我們關閉電腦。這一進程有特殊的重要性,我們會不斷提到它。

 

2. 如何建立一個進程

實際上,當電腦開機的時候,核心(kernel)只建立了一個init進程。Linux kernel並不提供直接建立新進程的系統調用。剩下的所有進程都是init進程通過fork機制建立的。新的進程要通過老的進程複製自身得到,這就是fork。fork是一個系統調用。進程存活於記憶體中。每個進程都在記憶體中分配有屬於自己的一片空間 (address space)。當進程fork的時候,Linux在記憶體中開闢出一片新的記憶體空間給新的進程,並將老的進程空間中的內容複寫到新的空間中,此後兩個進程同時運行。

老進程成為新進程的父進程(parent process),而相應的,新進程就是老的進程的子進程(child process)。一個進程除了有一個PID之外,還會有一個PPID(parent PID)來儲存的父進程PID。如果我們循著PPID不斷向上追溯的話,總會發現其源頭是init進程。所以說,所有的進程也構成一個以init為根的樹狀結構。

如下,我們查詢當前shell下的進程:

 

root@vamei:~# ps -o pid,ppid,cmd  PID  PPID CMD16935  3101 sudo -i16939 16935 -bash23774 16939 ps -o pid,ppid,cmd

我們可以看到,第二個進程bash是第一個進程sudo的子進程,而第三個進程ps是第二個進程的子進程。

 

還可以用$pstree命令來顯示整個進程樹:

init─┬─NetworkManager─┬─dhclient     │                └─2*[{NetworkManager}]     ├─accounts-daemon───{accounts-daemon}     ├─acpid     ├─apache2─┬─apache2     │         └─2*[apache2───26*[{apache2}]]     ├─at-spi-bus-laun───2*[{at-spi-bus-laun}]     ├─atd     ├─avahi-daemon───avahi-daemon     ├─bluetoothd     ├─colord───2*[{colord}]     ├─console-kit-dae───64*[{console-kit-dae}]     ├─cron     ├─cupsd───2*[dbus]     ├─2*[dbus-daemon]     ├─dbus-launch     ├─dconf-service───2*[{dconf-service}]     ├─dropbox───15*[{dropbox}]     ├─firefox───27*[{firefox}]     ├─gconfd-2     ├─geoclue-master     ├─6*[getty]     ├─gnome-keyring-d───7*[{gnome-keyring-d}]     ├─gnome-terminal─┬─bash     │                ├─bash───pstree     │                ├─gnome-pty-helpe     │                ├─sh───R───{R}     │                └─3*[{gnome-terminal}]

 

fork通常作為一個函數被調用。這個函數會有兩次返回,將子進程的PID返回給父進程,0返回給子進程。實際上,子進程總可以查詢自己的PPID來知道自己的父進程是誰,這樣,一對父進程和子進程就可以隨時查詢對方。

通常在調用fork函數之後,程式會設計一個if選擇結構。當PID等於0時,說明該進程為子進程,那麼讓它執行某些指令,比如說使用exec庫函數(library function)讀取另一個程式檔案,並在當前的進程空間執行 (這實際上是我們使用fork的一大目的: 為某一程式建立進程);而當PID為一個正整數時,說明為父進程,則執行另外一些指令。由此,就可以在子進程建立之後,讓它執行與父進程不同的功能。

 

3.子進程的終結(termination)

當子進程終結時,它會通知父進程,並清空自己所佔據的記憶體,並在kernel裡留下自己的退出資訊(exit code,如果順利運行,為0;如果有錯誤或異常狀況,為>0的整數)。在這個資訊裡,會解釋該進程為什麼退出。父進程在得知子進程終結時,有責任對該子進程使用wait系統調用。這個wait函數能從kernel中取出子進程的退出資訊,並清空該資訊在kernel中所佔據的空間。但是,如果父進程早於子進程終結,子進程就會成為一個孤兒(orphand)進程。孤兒進程會被過繼給init進程,init進程也就成了該進程的父進程。init進程負責該子進程終結時調用wait函數。

當然,一個糟糕的程式也完全可能造成子進程的退出資訊滯留在kernel中的狀況(父進程不對子進程調用wait函數),這樣的情況下,子進程成為殭屍(zombie)進程。當大量殭屍進程積累時,記憶體空間會被擠占。

 

4.進程與線程(thread)

儘管在UNIX中,進程與線程是有聯絡但不同的兩個東西,但在Linux中,線程只是一種特殊的進程。多個線程之間可以共用記憶體空間和IO介面。所以,進程是Linux程式的唯一的實現方式。

 

總結:

程式,進程,PID,記憶體空間

子進程,父進程,PPID,fork, wait

 

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.