這是一個建立於 的文章,其中的資訊可能已經有所發展或是發生改變。
go語言的並發機制以及它所使用的CSP並行存取模型
- CSP並行存取模型
CSP模型是上個世紀七十年代提出的,用於描述兩個獨立的並發實體通過共用的通訊 channel(管道)進行通訊的並行存取模型。 CSP中channel是第一類對象,它不關注發送訊息的實體,而關注與發送訊息時使用的channel。
- Golang CSP
Golang 就是借用CSP模型的一些概念為之實現並發進行理論支援,其實從實際上出發,go語言並沒有,完全實現了CSP模型的所有理論, 僅僅是借用了 process和channel這兩個概念。process是在go語言上的表現就是 goroutine 是實際並發執行的實體,每個實體之間是通過channel通訊來實現資料共用。
- Channel
Golang中使用 CSP中 channel 這個概念。channel 是被單獨建立並且可以在進程之間傳遞,它的通訊模式類似於 boss-worker 模式的,一個實體通過將訊息發送到channel 中,然後又監聽這個 channel 的實體處理,兩個實體之間是匿名的,這個就實現實體中間的解耦,其中 channel 是同步的一個訊息被發送到 channel 中,最終是一定要被另外的實體消費掉的,在實現原理上其實是一個阻塞的訊息佇列。
- Goroutine
Goroutine 是實際並發執行的實體,它底層是使用協程(coroutine)實現並發,coroutine是一種運行在使用者態的使用者線程,類似於 greenthread,go底層選擇使用coroutine的出發點是因為,它具有以下特點:
使用者空間 避免了核心態和使用者態的切換導致的成本
可以由語言和架構層進行調度
更小的棧空間允許建立大量的執行個體
可以看到第二條 使用者空間線程的調度不是由作業系統來完成的,像在java 1.3中使用的greenthread的是由JVM統一調度的(後java已經改為核心線程),還有在ruby中的fiber(半協程) 是需要在重新中自己進行調度的,而goroutine是在golang層面提供了調度器,並且對網路IO庫進行了封裝,屏蔽了複雜的細節,對外提供統一的文法關鍵字支援,簡化了並發程式編寫的成本。
Goroutine 調度器
上節已經說了,golang使用goroutine做為最小的執行單位,但是這個執行單位還是在使用者空間,實際上最後被處理器執行的還是核心中的線程,使用者線程和核心線程的調度方法有:
N:1 多個使用者線程對應一個核心線程
1:1 一個使用者線程對應一個核心線程
M:N 使用者線程和核心線程是多對多的對應關係
golang 通過為goroutine提供語言層面的調度器,來實現了高效率的M:N線程對應關係
調度示意
圖中
M:是核心線程
P : 是調度協調,用於協調M和G的執行,核心線程只有拿到了 P才能對goroutine繼續調度執行,一般都是通過限定P的個數來控制golang的並發度
G : 是待執行的goroutine,包含這個goroutine的棧空間
Gn : 灰色背景的Gn 是已經掛起的goroutine,它們被添加到了執行隊列中,然後需要等待網路IO的goroutine,當P通過 epoll查詢到特定的fd的時候,會重新調度起對應的,正在掛起的goroutine。
Golang為了調度的公平性,在調度器加入了steal working 演算法 ,在一個P自己的執行隊列,處理完之後,它會先到全域的執行隊列中偷G進行處理,如果沒有的話,再會到其他P的執行隊列中搶G來進行處理。
總結
Golang實現了 CSP 並行存取模型做為並發基礎,底層使用goroutine做為並發實體,goroutine非常輕量級可以建立幾十萬個實體。實體間通過 channel 繼續匿名訊息傳遞使之解耦,在語言層面實現了自動調度,這樣屏蔽了很多內部細節,對外提供簡單的文法關鍵字,大大簡化了並發編程的思維轉換和管理線程的複雜性。