Linux多線程與同步

來源:互聯網
上載者:User

作者:Vamei 出處:http://www.cnblogs.com/vamei 歡迎轉載,也請保留這段聲明。謝謝!

 

典型的UNIX系統都支援一個進程建立多個線程(thread)。在Linux進程基礎中提到,Linux以進程為單位組織操作,Linux中的線程也都基於進程。儘管實現方式有異於其它的UNIX系統,但Linux的多線程在邏輯和使用上與真正的多線程並沒有差別。

 

1. 多線程

我們先來看一下什麼是多線程。在Linux從程式到進程中,我們看到了一個程式在記憶體中的表示。這個程式的整個運行過程中,只有一個控制權的存在。當函數被調用的時候,該函數獲得控制權,成為啟用(active)函數,然後運行該函數中的指令。與此同時,其它的函數處於離場狀態,並不運行。如所示:

Linux從程式到進程

 

我們看到,各個方塊之間由箭頭串連。各個函數就像是連在一根線上一樣,電腦像一條流水線一樣執行各個函數中定義的操作。這樣的一個程式叫做單線程程式。

多線程就是允許一個進程記憶體在多個控制權,以便讓多個函數同時處於啟用狀態,從而讓多個函數的操作同時運行。即使是單CPU的電腦,也可以通過不停地在不同線程的指令間切換,從而造成多線程同時啟動並執行效果。如所示,就是一個多線程的流程:

main()到func3()再到main()構成一個線程,此外func1()和func2()構成另外兩個線程。作業系統一般都有一些系統調用來讓你將一個函數運行成為一個新的線程。

 

回憶我們在Linux從程式到進程中提到的stack的功能和用途。由於stack中只有最下方的stack frame可以被讀取,所以我們只能有該frame對應的單一函數處於啟用狀態。為了實現多線程,我們必須繞開stack帶給我們的限制。為此,當我們建立一個新的線程的時候,我們為這個線程建立一個新的stack。當該stack執行到全部彈出的時候,該線程完成任務並結束。所以,多線程的進程在記憶體中會有多個stack,相互之間以一定的空白地區隔開,以備stack的增長。每個線程隨時可以使用自己stack中最下方的stack frame中的參數和變數,並與其它線程共用記憶體中的Text,heap和global data地區。在上面的例子中,我們將在進程空間中有三個stack。

(要注意的是,對於多線程來說,由於同一個進程空間中存在多個stack,任何一個空白地區被填滿都會導致stack overflow的問題。)

 

2. 並發

多線程相當於一個並發(concunrrency)系統。並發系統一般同時執行多個任務。如果多個任務可以共用資源,特別是同時寫入某個變數的時候,就需要解決同步的問題。比如說,我們有一個多線程火車售票系統,用全域變數i儲存剩餘的票數。多個線程不斷地賣票(i = i - 1),直到剩餘票數為0。所以每個都需要執行如下操作:

/*mu is a global mutex*/

while (1) {    /*infinite loop*/ if (i != 0) i = i -1 else { printf("no more tickets"); exit(); }}

如果只有一個線程執行上面的程式的時候(相當於一個視窗售票),則沒有問題。但如果多個線程都執行上面的程式(相當於多個視窗售票), 我們就會出現問題。我們會看到,其根本原因在於同時發生的各個線程都可以對i讀取和寫入。

我們這裡的if結構會給CPU兩個指令, 一個是判斷是否有剩餘的票(i != 0), 一個是賣票 (i = i -1)。某個線程會先判斷是否有票(比如說此時i為1),但兩個指令之間存在一個時間視窗,其它線程可能在此時間視窗內執行賣票操作(i = i -1),導致該線程賣票的條件不再成立。但該線程由於已經執行過了判斷指令,所以無從知道i發生了變化,所以繼續執行賣票指令,以至於賣出不存在的票 (i成為負數)。對於一個真實的售票系統來說,這將成為一個嚴重的錯誤 (售出了過多的票,火車爆滿)。

在並發情況下,指令執行的先後順序由核心決定。同一個線程內部,指令按照先後順序執行,但不同線程之間的指令很難說清除哪一個會先執行。如果啟動並執行結果依賴於不同線程執行的先後的話,那麼就會造成競爭條件(race condition),在這樣的狀況下,電腦的結果很難預知。我們應該盡量避免競爭條件的形成。最常見的解決競爭條件的方法是將原先分離的兩個指令構成不可分隔的一個原子操作(atomic operation),而其它任務不能插入到原子操作中。

 

3. 多線程同步(synchronization)

對於多線程程式來說,同步是指在一定的時間內只允許某一個線程訪問某個資源 。而在此時間內,不允許其它的線程訪問該資源。我們可以通過互斥鎖(mutex),條件變數(condition variable)和讀寫鎖(reader-writer lock)來同步資源。

 

1) mutex

mutex是一個特殊的變數,它有鎖上(lock)和開啟(unlock)兩個狀態。mutex一般被設定成全域變數。開啟的mutex可以由某個線程獲得。一旦獲得,這個mutex會鎖上,此後只有該線程有權開啟。其它想要獲得mutex的線程,會等待直到mutex再次開啟的時候。我們可以將mutex想像成為一個只能容納一個人的洗手間,當某個人進入洗手間的時候,可以從裡面將洗手間鎖上。其它人只能在mutex外面等待那個人出來,才能進去。在外面等候的人並沒有排隊,誰先看到洗手間空了,就可以首先衝進去。

上面的問題很容易使用mutex的問題解決,每個線程的程式可以改為:

/*mu is a global mutex*/

while (1) { /*infinite loop*/ mutex_lock(mu);       /*aquire mutex and lock it, if cannot, wait until mutex is unblocked*/ if (i != 0) i = i - 1; else { printf("no more tickets"); exit(); } mutex_unlock(mu);     /*release mutex, make it unblocked*/}

第一個執行mutex_lock()的線程會先獲得mu。其它想要獲得mu的線程必須等待,直到第一個線程執行到mutex_unlock()釋放mu,才可以獲得mu,並繼續執行線程。所以線程在mutex_lock()和mutex_unlock()之間的操作時,不會被其它線程影響,就構成了一個原子操作。

需要注意的時候,如果存在某個線程依然使用原先的程式 (即不嘗試獲得mu,而直接修改i),mutex不能阻止該程式修改i,mutex就失去了保護資源的意義。所以,mutex機制需要程式員自己來寫出完善的程式來實現mutex的功能。我們下面講的其它機制也是如此。

 

2) condition variable

condition variable是另一種常用的變數。它也常常被儲存為全域變數,並和mutex合作。

 

假設我們有這樣一個狀況: 我們有100個工人,每人負責裝修一個房間。當有10個房間裝修完成的時候,我們就通知相應的十個工人一起去喝啤酒。我們如何?呢?我們可以讓工人在裝修好房間之後,去檢查已經裝修好的房間數。但多線程條件下,會有競爭條件的危險(其他工人會在該工人裝修好房子和檢查之間完成工作)。

/*mu: global mutex, cond: global codition variable, num: global int*/
mutex_lock(mu)num = num + 1; /*worker build the room*/if (num <= 10) { /*worker is within the first 10 to finish*/ cond_wait(mu, cond);     /*wait*/ printf("drink beer");}else if (num = 11) { /*workder is the 11th to finish*/ cond_broadcast(mu, cond);        /*inform the other 9 to wake up*/}mutex_unlock(mu);

通常, condition variable除了要和mutex配合之外,還需要和另一個全域變數配合(這裡的num, 也就是裝修好的房間數)。這個全域變數用來構成各個條件。

我們讓工人在裝修好房間(num = num + 1)之後,去檢查已經裝修好的房間數( num < 10 )。由於mu被鎖上,所以不會有其他工人在此期間裝修房間(改變num的值)。如果該工人是前十個完成的人,那麼我們就調用cond_wait()函數。
cond_wait()做兩件事情,一個是釋放mu,從而讓別的工人可以建房。另一個是等待,直到cond的通知。這樣的話,合格線程就開始等待。當有通知(第十個房間已經修建好)到達的時候,condwait()會再次鎖上mu,並恢複線程的運行,我們會執行下一句prinft("drink beer") (我們以此來代表喝啤酒)。此後直到mutex_unlock()就構成了另一個mutex結構。

那麼如何讓前面十個調用cond_wait()的線程得到通知呢?我們注意到if還有另一種可能,也就是修建好第11個房間的人負責調用cond_broadcast()。它會給所有調用cond_wait()的線程放送通知,以便讓那些線程恢複運行。

 

Condition variable特別適用於多個線程等待某個條件的發生。如果不使用Condition variable,那麼每個線程就需要不斷嘗試獲得mutex並檢查條件是否發生,這樣大大浪費了系統的資源。

 

3) reader-writer lock

Reader-writer lock與mutex非常相似。r、RW lock有三種狀態: 共用讀取鎖(shared-read), 互斥寫入鎖(exclusive-write lock), 開啟(unlock)。後兩種狀態與之前的mutex兩種狀態完全相同。

一個unlock的RW lock可以被某個線程擷取R鎖或者W鎖。

如果被一個線程獲得R鎖,RW lock可以被其它線程繼續獲得R鎖,而不必等待該線程釋放R鎖。但是,如果此時有其它線程想要獲得W鎖,它必須等到所有持有共用讀取鎖的線程釋放掉各自的R鎖。

如果一個鎖被一個線程獲得W鎖,那麼其它線程,無論是想要擷取R鎖還是W鎖,都必須等待該線程釋放W鎖。

這樣,多個線程就可以同時讀取共用資源。而具有危險性的寫入操作則得到了互斥鎖的保護。

 

我們需要同步並發系統,這為程式員編程帶來了難度。但是多線程系統可以很好的解決許多IO瓶頸的問題。比如我們監聽網路連接埠。如果我們只有一個線程,那麼我們必須監聽,接收請求,處理,回複,再監聽。如果我們使用多線程系統,則可以讓多個線程監聽。當我們的某個線程進行處理的時候,我們還可以有其他的線程繼續監聽,這樣,就大大提高了系統的利用率。在資料越來越大,伺服器讀寫操作越來越多的今天,這具有相當的意義。多線程還可以更有效地利用多CPU的環境。

(就像做飯一樣,不斷切換去處理不同的菜。)

 

本文中所使用的程式採用偽C的寫法。不同的語言有不同的函數名(比如mutex_lock)。這裡關注的是邏輯上的概念,而不是具體的實現和語言規範。

 

總結:

multiple threads, multiple stacks

race condition

mutex, condition variable, RW lock

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.