線程建立
1.1 線程與進程
相對進程而言,線程是一個更加接近於執行體的概念,它可以與同進程中的其他線程共用資料,但擁有自己的棧空間,擁有獨立的執行序列。在串列程式基礎上引入線程和進程是為了提高程式的並發度,從而提高程式運行效率和回應時間。
線程和進程在使用上各有優缺點:線程執行開銷小,但不利於資源的管理和保護;而進程正相反。同時,線程適合於在SMP機器上運行,而進程則可以跨機器遷移。
1.2 建立線程
POSIX通過pthread_create()函數建立線程,API定義如下:
int pthread_create(pthread_t * thread, pthread_attr_t * attr, void * (*start_routine)(void *), void * arg) |
與fork()調用建立一個進程的方法不同,pthread_create()建立的線程並不具備與主線程(即調用pthread_create()的線程)同樣的執行序列,而是使其運行start_routine(arg)函數。thread返回建立的線程ID,而attr是建立線程時設定的線程屬性(見下)。pthread_create()的傳回值表示線程建立是否成功。儘管arg是void *類型的變數,但它同樣可以作為任意類型的參數傳給start_routine()函數;同時,start_routine()可以返回一個void *類型的傳回值,而這個傳回值也可以是其他類型,並由pthread_join()擷取。
1.3 線程建立屬性
pthread_create()中的attr參數是一個結構指標,結構中的元素分別對應著新線程的運行屬性,主要包括以下幾項:
__detachstate,表示新線程是否與進程中其他線程脫離同步,如果置位則新線程不能用pthread_join()來同步,且在退出時自行釋放所佔用的資源。預設為PTHREAD_CREATE_JOINABLE狀態。這個屬性也可以線上程建立並運行以後用pthread_detach()來設定,而一旦設定為PTHREAD_CREATE_DETACH狀態(不論是建立時設定還是運行時設定)則不能再恢複到PTHREAD_CREATE_JOINABLE狀態。
__schedpolicy,表示新線程的調度策略,主要包括SCHED_OTHER(正常、非即時)、SCHED_RR(即時、輪轉法)和SCHED_FIFO(即時、先入先出)三種,預設為SCHED_OTHER,後兩種調度策略僅對超級使用者有效。運行時可以用過pthread_setschedparam()來改變。
__schedparam,一個struct sched_param結構,目前僅有一個sched_priority整型變數表示線程的運行優先順序。這個參數僅當調度策略為即時(即SCHED_RR或SCHED_FIFO)時才有效,並可以在運行時通過pthread_setschedparam()函數來改變,預設為0。
__inheritsched,有兩種值可供選擇:PTHREAD_EXPLICIT_SCHED和PTHREAD_INHERIT_SCHED,前者表示新線程使用顯式指定調度策略和調度參數(即attr中的值),而後者表示繼承調用者線程的值。預設為PTHREAD_EXPLICIT_SCHED。
__scope,表示線程間競爭CPU的範圍,也就是說線程優先順序的有效範圍。POSIX的標準中定義了兩個值:PTHREAD_SCOPE_SYSTEM和PTHREAD_SCOPE_PROCESS,前者表示與系統中所有線程一起競爭CPU時間,後者表示僅與同進程中的線程競爭CPU。目前LinuxThreads僅實現了PTHREAD_SCOPE_SYSTEM一值。
pthread_attr_t結構中還有一些值,但不使用pthread_create()來設定。
為了設定這些屬性,POSIX定義了一系列屬性設定函數,包括pthread_attr_init()、pthread_attr_destroy()和與各個屬性相關的pthread_attr_get---/pthread_attr_set---函數。
1.4 線程建立的Linux實現
我們知道,Linux的線程實現是在核外進行的,核內提供的是建立進程的介面do_fork()。核心提供了兩個系統調用__clone()和fork(),最終都用不同的參數調用do_fork()核內API。當然,要想實現線程,沒有核心對多進程(其實是輕量級進程)共用資料區段的支援是不行的,因此,do_fork()提供了很多參數,包括CLONE_VM(共用記憶體空間)、CLONE_FS(共用檔案系統資訊)、CLONE_FILES(共用檔案描述符表)、CLONE_SIGHAND(共用訊號控制代碼表)和CLONE_PID(共用進程ID,僅對核內進程,即0號進程有效)。當使用fork系統調用時,核心調用do_fork()不使用任何共用屬性,進程擁有獨立的運行環境,而使用pthread_create()來建立線程時,則最終設定了所有這些屬性來調用__clone(),而這些參數又全部傳給核內的do_fork(),從而建立的"進程"擁有共用的運行環境,只有棧是獨立的,由__clone()傳入。
Linux線程在核內是以輕量級進程的形式存在的,擁有獨立的進程表項,而所有的建立、同步、刪除等操作都在核外pthread庫中進行。pthread庫使用一個管理線程(__pthread_manager(),每個進程獨立且唯一)來管理線程的建立和終止,為線程分配線程ID,發送線程相關的訊號(比如Cancel),而主線程(pthread_create())的調用者則通過管道將請求資訊傳給管理線程。
回頁首
線程取消
2.1 線程取消的定義
一般情況下,線程在其主體函數退出的時候會自動終止,但同時也可以因為接收到另一個線程發來的終止(取消)請求而強制終止。
2.2 線程取消的語義
線程取消的方法是向目標線程發Cancel訊號,但如何處理Cancel訊號則由目標線程自己決定,或者忽略、或者立即終止、或者繼續運行至Cancelation-point(取消點),由不同的Cancelation狀態決定。
線程接收到CANCEL訊號的預設處理(即pthread_create()建立線程的預設狀態)是繼續運行至取消點,也就是說設定一個CANCELED狀態,線程繼續運行,只有運行至Cancelation-point的時候才會退出。
2.3 取消點
根據POSIX標準,pthread_join()、pthread_testcancel()、pthread_cond_wait()、pthread_cond_timedwait()、sem_wait()、sigwait()等函數以及read()、write()等會引起阻塞的系統調用都是Cancelation-point,而其他pthread函數都不會引起Cancelation動作。但是pthread_cancel的手冊頁聲稱,由於LinuxThread庫與C庫結合得不好,因而目前C庫函數都不是Cancelation-point;但CANCEL訊號會使線程從阻塞的系統調用中退出,共置EINTR錯誤碼,因此可以在需要作為Cancelation-point的系統調用前後調用pthread_testcancel(),從而達到POSIX標準所要求的目標,即如下程式碼片段:
pthread_testcancel(); retcode = read(fd, buffer, length); pthread_testcancel(); |
2.4 程式設計方面的考慮
如果線程處於無限迴圈中,且迴圈體內沒有執行至取消點的必然路徑,則線程無法由外部其他線程的取消請求而終止。因此在這樣的迴圈體的必經路徑上應該加入pthread_testcancel()調用。
2.5 與線程取消相關的pthread函數
int pthread_cancel(pthread_t thread)
發送終止訊號給thread線程,如果成功則返回0,否則為非0值。發送成功並不意味著thread會終止。
int pthread_setcancelstate(int state, int *oldstate)
設定本線程對Cancel訊號的反應,state有兩種值:PTHREAD_CANCEL_ENABLE(預設)和PTHREAD_CANCEL_DISABLE,分別表示收到訊號後設為CANCLED狀態和忽略CANCEL訊號繼續運行;old_state如果不為NULL則存入原來的Cancel狀態以便恢複。
int pthread_setcanceltype(int type, int *oldtype)
設定本線程取消動作的執行時機,type由兩種取值:PTHREAD_CANCEL_DEFFERED和PTHREAD_CANCEL_ASYCHRONOUS,僅當Cancel狀態為Enable時有效,分別表示收到訊號後繼續運行至下一個取消點再退出和立即執行取消動作(退出);oldtype如果不為NULL則存入運來的取消動作類型值。
void pthread_testcancel(void)
檢查本線程是否處於Canceld狀態,如果是,則進行取消動作,否則直接返回。