目錄
- 一、前言
- 二、ConcurrentBag類
- 三、 ConcurrentBag安全執行緒實現原理
- 1. ConcurrentBag的私人欄位
- 2. 用於資料存放區的TrehadLocalList類
- 3. ConcurrentBag實現新增元素
- 4. ConcurrentBag 如何?迭代器模式
- 四、總結
- 筆者水平有限,如果錯誤歡迎各位批評指正!
一、前言
筆者最近在做一個項目,項目中為了提升輸送量,使用了訊息佇列,中間實現了生產消費模式,在生產消費者模式中需要有一個集合,來儲存生產者所生產的物品,筆者使用了最常見的List<T>
集合類型。
由於生產者線程有很多個,消費者線程也有很多個,所以不可避免的就產生了線程同步的問題。開始筆者是使用lock
關鍵字,進行線程同步,但是效能並不是特別理想,然後有網友說可以使用SynchronizedList<T>
來代替使用List<T>
達到安全執行緒的目的。於是筆者就替換成了SynchronizedList<T>
,但是發現效能依舊糟糕,於是查看了SynchronizedList<T>
的原始碼,發現它就是簡單的在List<T>
提供的API的基礎上加了lock
,所以效能基本與筆者實現方式相差無幾。
最後筆者找到瞭解決的方案,使用ConcurrentBag<T>
類來實現,效能有很大的改觀,於是筆者查看了ConcurrentBag<T>
的原始碼,實現非常精妙,特此在這記錄一下。
二、ConcurrentBag類
ConcurrentBag<T>
實現了IProducerConsumerCollection<T>
介面,該介面主要用於生產者消費者模式下,可見該類基本就是為生產消費者模式定製的。然後還實現了常規的IReadOnlyCollection<T>
類,實現了該類就需要實現IEnumerable<T>、IEnumerable、 ICollection
類。
ConcurrentBag<T>
對外提供的方法沒有List<T>
那麼多,但是同樣有Enumerable
實現的擴充方法。類本身提供的方法如下所示。
名稱 |
說明 |
Add |
將對象添加到 ConcurrentBag 中。 |
CopyTo |
從指定數組索引開始,將 ConcurrentBag 元素複製到現有的一維 Array 中。 |
Equals(Object) |
確定指定的 Object 是否等於當前的 Object。 (繼承自 Object。) |
Finalize |
允許對象在“記憶體回收”回收之前嘗試釋放資源並執行其他清理操作。 (繼承自 Object。) |
GetEnumerator |
返回逐一查看 ConcurrentBag 的列舉程式。 |
GetHashCode |
用作特定類型的雜湊函數。 (繼承自 Object。) |
GetType |
擷取當前執行個體的 Type。 (繼承自 Object。) |
MemberwiseClone |
建立當前 Object 的淺表副本。 (繼承自 Object。) |
ToArray |
將 ConcurrentBag 元素複製到新數組。 |
ToString |
返回表示當前對象的字串。 (繼承自 Object。) |
TryPeek |
嘗試從 ConcurrentBag 返回一個對象但不移除該對象。 |
TryTake |
嘗試從 ConcurrentBag 中移除並返回對象。 |
三、 ConcurrentBag安全執行緒實現原理1. ConcurrentBag的私人欄位
ConcurrentBag
安全執行緒實現主要是通過它的資料存放區的結構和細顆粒度的鎖。
public class ConcurrentBag<T> : IProducerConsumerCollection<T>, IReadOnlyCollection<T> { // ThreadLocalList對象包含每個線程的資料 ThreadLocal<ThreadLocalList> m_locals; // 這個頭指標和尾指標指向中的第一個和最後一個本地列表,這些本地列表分散在不同線程中 // 允許線上程局部對象上枚舉 volatile ThreadLocalList m_headList, m_tailList; // 這個標誌是告知操作線程必須同步操作 // 在GlobalListsLock 鎖中 設定 bool m_needSync;}
首選我們來看它聲明的私人欄位,其中需要注意的是集合的資料是存放在ThreadLocal
執行緒區域儲存中的。也就是說訪問它的每個線程會維護一個自己的集合資料列表,一個集合中的資料可能會存放在不同線程的本機存放區空間中,所以如果線程訪問自己本機存放區的對象,那麼是沒有問題的,這就是實現安全執行緒的第一層,使用執行緒區域儲存資料。
然後可以看到ThreadLocalList m_headList, m_tailList;
這個是存放著本地列表對象的頭指標和尾指標,通過這兩個指標,我們就可以通過遍曆的方式來訪問所有本地列表。它使用volatile
修飾,不允許線程進行本機快取,每個線程的讀寫都是直接操作在共用記憶體上,這就保證了變數始終具有一致性。任何線程在任何時間進行讀寫操作均是最新值。對於volatile
修飾符,感謝我是攻城獅指出描述錯誤。
最後又定義了一個標誌,這個標誌告知操作線程必須進行同步操作,這是實現了一個細顆粒度的鎖,因為只有在幾個條件滿足的情況下才需要進行線程同步。
2. 用於資料存放區的TrehadLocalList類
接下來我們來看一下ThreadLocalList
類的構造,該類就是實際儲存了資料的位置。實際上它是使用雙向鏈表這種結構進行資料存放區。
[Serializable]// 構造了雙向鏈表的節點internal class Node{ public Node(T value) { m_value = value; } public readonly T m_value; public Node m_next; public Node m_prev;}/// <summary>/// 集合操作類型/// </summary>internal enum ListOperation{ None, Add, Take};/// <summary>/// 線程鎖定的類/// </summary>internal class ThreadLocalList{ // 雙向鏈表的頭結點 如果為null那麼表示鏈表為空白 internal volatile Node m_head; // 雙向鏈表的尾節點 private volatile Node m_tail; // 定義當前對List進行操作的種類 // 與前面的 ListOperation 相對應 internal volatile int m_currentOp; // 這個列表元素的計數 private int m_count; // The stealing count // 這個不是特別理解 好像是在本地列表中 刪除某個Node 以後的計數 internal int m_stealCount; // 下一個列表 可能會在其它線程中 internal volatile ThreadLocalList m_nextList; // 設定鎖定是否已進行 internal bool m_lockTaken; // The owner thread for this list internal Thread m_ownerThread; // 列表的版本,只有當列表從空變為非空統計是底層 internal volatile int m_version; /// <summary> /// ThreadLocalList 構造器 /// </summary> /// <param name="ownerThread">擁有這個集合的線程</param> internal ThreadLocalList(Thread ownerThread) { m_ownerThread = ownerThread; } /// <summary> /// 添加一個新的item到鏈表首部 /// </summary> /// <param name="item">The item to add.</param> /// <param name="updateCount">是否更新計數.</param> internal void Add(T item, bool updateCount) { checked { m_count++; } Node node = new Node(item); if (m_head == null) { Debug.Assert(m_tail == null); m_head = node; m_tail = node; m_version++; // 因為進行初始化了,所以將空狀態改為非空狀態 } else { // 使用頭插法 將新的元素插入鏈表 node.m_next = m_head; m_head.m_prev = node; m_head = node; } if (updateCount) // 更新計數以避免此添加同步時溢出 { m_count = m_count - m_stealCount; m_stealCount = 0; } } /// <summary> /// 從列表的頭部刪除一個item /// </summary> /// <param name="result">The removed item</param> internal void Remove(out T result) { // 雙向鏈表刪除頭結點資料的流程 Debug.Assert(m_head != null); Node head = m_head; m_head = m_head.m_next; if (m_head != null) { m_head.m_prev = null; } else { m_tail = null; } m_count--; result = head.m_value; } /// <summary> /// 返回列表頭部的元素 /// </summary> /// <param name="result">the peeked item</param> /// <returns>True if succeeded, false otherwise</returns> internal bool Peek(out T result) { Node head = m_head; if (head != null) { result = head.m_value; return true; } result = default(T); return false; } /// <summary> /// 從列表的尾部擷取一個item /// </summary> /// <param name="result">the removed item</param> /// <param name="remove">remove or peek flag</param> internal void Steal(out T result, bool remove) { Node tail = m_tail; Debug.Assert(tail != null); if (remove) // Take operation { m_tail = m_tail.m_prev; if (m_tail != null) { m_tail.m_next = null; } else { m_head = null; } // Increment the steal count m_stealCount++; } result = tail.m_value; } /// <summary> /// 擷取總計列表計數, 它不是安全執行緒的, 如果同時調用它, 則可能提供不正確的計數 /// </summary> internal int Count { get { return m_count - m_stealCount; } }}
從上面的代碼中我們可以更加驗證之前的觀點,就是ConcurentBag<T>
在一個線程中儲存資料時,使用的是雙向鏈表,ThreadLocalList
實現了一組對鏈表增刪改查的方法。
3. ConcurrentBag實現新增元素
接下來我們看一看ConcurentBag<T>
是如何新增元素的。
/// <summary>/// 嘗試擷取無主列表,無主列表是指線程已經被暫停或者終止,但是集合中的部分資料還儲存在那裡/// 這是避免記憶體流失的方法/// </summary>/// <returns></returns>private ThreadLocalList GetUnownedList(){ //此時必須持有全域鎖 Contract.Assert(Monitor.IsEntered(GlobalListsLock)); // 從頭線程列表開始枚舉 找到那些已經被關閉的線程 // 將它所在的列表對象 返回 ThreadLocalList currentList = m_headList; while (currentList != null) { if (currentList.m_ownerThread.ThreadState == System.Threading.ThreadState.Stopped) { currentList.m_ownerThread = Thread.CurrentThread; // the caller should acquire a lock to make this line thread safe return currentList; } currentList = currentList.m_nextList; } return null;}/// <summary>/// 本地協助方法,通過線程對象檢索線程執行緒區域列表/// </summary>/// <param name="forceCreate">如果列表不存在,那麼建立新列表</param>/// <returns>The local list object</returns>private ThreadLocalList GetThreadList(bool forceCreate){ ThreadLocalList list = m_locals.Value; if (list != null) { return list; } else if (forceCreate) { // 擷取用於更新操作的 m_tailList 鎖 lock (GlobalListsLock) { // 如果頭列表等於空,那麼說明集合中還沒有元素 // 直接建立一個新的 if (m_headList == null) { list = new ThreadLocalList(Thread.CurrentThread); m_headList = list; m_tailList = list; } else { // ConcurrentBag內的資料是以雙向鏈表的形式分散儲存在各個線程的本地地區中 // 通過下面這個方法 可以找到那些儲存有資料 但是已經被停止的線程 // 然後將已停止線程的資料 移交到當前線程管理 list = GetUnownedList(); // 如果沒有 那麼就建立一個列表 然後更新尾指標的位置 if (list == null) { list = new ThreadLocalList(Thread.CurrentThread); m_tailList.m_nextList = list; m_tailList = list; } } m_locals.Value = list; } } else { return null; } Debug.Assert(list != null); return list;}/// <summary>/// Adds an object to the <see cref="ConcurrentBag{T}"/>./// </summary>/// <param name="item">The object to be added to the/// <see cref="ConcurrentBag{T}"/>. The value can be a null reference/// (Nothing in Visual Basic) for reference types.</param>public void Add(T item){ // 擷取該線程的本地列表, 如果此線程不存在, 則建立一個新列表 (第一次調用 add) ThreadLocalList list = GetThreadList(true); // 實際的資料添加操作 在AddInternal中執行 AddInternal(list, item);}/// <summary>/// </summary>/// <param name="list"></param>/// <param name="item"></param>private void AddInternal(ThreadLocalList list, T item){ bool lockTaken = false; try { #pragma warning disable 0420 Interlocked.Exchange(ref list.m_currentOp, (int)ListOperation.Add); #pragma warning restore 0420 // 同步案例: // 如果列表計數小於兩個, 因為是雙向鏈表的關係 為了避免與任何竊取線程發生衝突 必須擷取鎖 // 如果設定了 m_needSync, 這意味著有一個線程需要凍結包 也必須擷取鎖 if (list.Count < 2 || m_needSync) { // 將其重設為None 以避免與竊取線程的死結 list.m_currentOp = (int)ListOperation.None; // 鎖定當前對象 Monitor.Enter(list, ref lockTaken); } // 調用 ThreadLocalList.Add方法 將資料添加到雙向鏈表中 // 如果已經鎖定 那麼說明安全執行緒 可以更新Count 計數 list.Add(item, lockTaken); } finally { list.m_currentOp = (int)ListOperation.None; if (lockTaken) { Monitor.Exit(list); } }}
從上面代碼中,我們可以很清楚的知道Add()
方法是如何啟動並執行,其中的關鍵就是GetThreadList()
方法,通過該方法可以擷取當前線程的資料存放區列表對象,假如不存在資料存放區列表,它會自動建立或者通過GetUnownedList()
方法來尋找那些被停止但是還儲存有資料列表的線程,然後將資料列表返回給當前線程中,防止了記憶體流失。
在資料添加的過程中,實現了細顆粒度的lock
同步鎖,所以效能會很高。刪除和其它操作與新增類似,本文不再贅述。
4. ConcurrentBag 如何?迭代器模式
看完上面的代碼後,我很好奇ConcurrentBag<T>
是如何?IEnumerator
來實現迭代訪問的,因為ConcurrentBag<T>
是通過分散在不同線程中的ThreadLocalList
來儲存資料的,那麼在實現迭代器模式時,過程會比較複雜。
後面再查看了源碼之後,發現ConcurrentBag<T>
為了實現迭代器模式,將分在不同線程中的資料全都存到一個List<T>
集合中,然後返回了該副本的迭代器。所以每次訪問迭代器,它都會建立一個List<T>
的副本,這樣雖然浪費了一定的儲存空間,但是邏輯上更加簡單了。
/// <summary>/// 本地協助器方法釋放所有本地列表鎖/// </summary>private void ReleaseAllLocks(){ // 該方法用於在執行線程同步以後 釋放掉所有本地鎖 // 通過遍曆每個線程中儲存的 ThreadLocalList對象 釋放所佔用的鎖 ThreadLocalList currentList = m_headList; while (currentList != null) { if (currentList.m_lockTaken) { currentList.m_lockTaken = false; Monitor.Exit(currentList); } currentList = currentList.m_nextList; }}/// <summary>/// 從凍結狀態解凍包的本地協助器方法/// </summary>/// <param name="lockTaken">The lock taken result from the Freeze method</param>private void UnfreezeBag(bool lockTaken){ // 首先釋放掉 每個線程中 本地變數的鎖 // 然後釋放全域鎖 ReleaseAllLocks(); m_needSync = false; if (lockTaken) { Monitor.Exit(GlobalListsLock); }}/// <summary>/// 本地協助器函數等待所有未同步的操作/// </summary>private void WaitAllOperations(){ Contract.Assert(Monitor.IsEntered(GlobalListsLock)); ThreadLocalList currentList = m_headList; // 自旋等待 等待其它操作完成 while (currentList != null) { if (currentList.m_currentOp != (int)ListOperation.None) { SpinWait spinner = new SpinWait(); // 有其它線程進行操作時,會將cuurentOp 設定成 正在操作的枚舉 while (currentList.m_currentOp != (int)ListOperation.None) { spinner.SpinOnce(); } } currentList = currentList.m_nextList; }}/// <summary>/// 本地協助器方法擷取所有本地列表鎖/// </summary>private void AcquireAllLocks(){ Contract.Assert(Monitor.IsEntered(GlobalListsLock)); bool lockTaken = false; ThreadLocalList currentList = m_headList; // 遍曆每個線程的ThreadLocalList 然後擷取對應ThreadLocalList的鎖 while (currentList != null) { // 嘗試/最後 bllock 以避免在擷取鎖和設定所採取的標誌之間的線程港口 try { Monitor.Enter(currentList, ref lockTaken); } finally { if (lockTaken) { currentList.m_lockTaken = true; lockTaken = false; } } currentList = currentList.m_nextList; }}/// <summary>/// Local helper method to freeze all bag operations, it/// 1- Acquire the global lock to prevent any other thread to freeze the bag, and also new new thread can be added/// to the dictionary/// 2- Then Acquire all local lists locks to prevent steal and synchronized operations/// 3- Wait for all un-synchronized operations to be done/// </summary>/// <param name="lockTaken">Retrieve the lock taken result for the global lock, to be passed to Unfreeze method</param>private void FreezeBag(ref bool lockTaken){ Contract.Assert(!Monitor.IsEntered(GlobalListsLock)); // 全域鎖定可安全地防止多線程調用計數和損壞 m_needSync Monitor.Enter(GlobalListsLock, ref lockTaken); // 這將強制同步任何將來的添加/執行操作 m_needSync = true; // 擷取所有列表的鎖 AcquireAllLocks(); // 等待所有操作完成 WaitAllOperations();}/// <summary>/// 本地協助器函數返回列表中的包項, 這主要由 CopyTo 和 ToArray 使用。/// 這不是安全執行緒, 應該被稱為凍結/解凍袋塊/// 本方法是私人的 只有使用 Freeze/UnFreeze之後才是安全的 /// </summary>/// <returns>List the contains the bag items</returns>private List<T> ToList(){ Contract.Assert(Monitor.IsEntered(GlobalListsLock)); // 建立一個新的List List<T> list = new List<T>(); ThreadLocalList currentList = m_headList; // 遍曆每個線程中的ThreadLocalList 將裡面的Node的資料 添加到list中 while (currentList != null) { Node currentNode = currentList.m_head; while (currentNode != null) { list.Add(currentNode.m_value); currentNode = currentNode.m_next; } currentList = currentList.m_nextList; } return list;}/// <summary>/// Returns an enumerator that iterates through the <see/// cref="ConcurrentBag{T}"/>./// </summary>/// <returns>An enumerator for the contents of the <see/// cref="ConcurrentBag{T}"/>.</returns>/// <remarks>/// The enumeration represents a moment-in-time snapshot of the contents/// of the bag. It does not reflect any updates to the collection after /// <see cref="GetEnumerator"/> was called. The enumerator is safe to use/// concurrently with reads from and writes to the bag./// </remarks>public IEnumerator<T> GetEnumerator(){ // Short path if the bag is empty if (m_headList == null) return new List<T>().GetEnumerator(); // empty list bool lockTaken = false; try { // 首先凍結整個 ConcurrentBag集合 FreezeBag(ref lockTaken); // 然後ToList 再拿到 List的 IEnumerator return ToList().GetEnumerator(); } finally { UnfreezeBag(lockTaken); }}
由上面的代碼可知道,為了擷取迭代器對象,總共進行了三步主要的操作。
- 使用
FreezeBag()
方法,凍結整個ConcurrentBag<T>
集合。因為需要產生集合的List<T>
副本,產生副本期間不能有其它線程更改損壞資料。
- 將
ConcurrrentBag<T>
產生List<T>
副本。因為ConcurrentBag<T>
儲存資料的方式比較特殊,直接實現迭代器模式困難,考慮到安全執行緒和邏輯,最佳的辦法是產生一個副本。
- 完成以上操作以後,就可以使用
UnfreezeBag()
方法解凍整個集合。
那麼FreezeBag()
方法是如何來凍結整個集合的呢?也是分為三步走。
- 首先擷取全域鎖,通過
Monitor.Enter(GlobalListsLock, ref lockTaken);
這樣一條語句,這樣其它線程就不能凍結集合。
- 然後擷取所有線程中
ThreadLocalList
的鎖,通過`AcquireAllLocks()方法來遍曆擷取。這樣其它線程就不能對它進行操作損壞資料。
- 等待已經進入了操作流程線程結束,通過
WaitAllOperations()
方法來實現,該方法會遍曆每一個ThreadLocalList
對象的m_currentOp
屬性,確保全部處於None
操作。
完成以上流程後,那麼就是真正的凍結了整個ConcurrentBag<T>
集合,要解凍的話也類似。在此不再贅述。
四、總結
下面給出一張圖,描述了ConcurrentBag<T>
是如何儲存資料的。通過每個線程中的ThreadLocal
來實現執行緒區域儲存,每個線程中都有這樣的結構,互不干擾。然後每個線程中的m_headList
總是指向ConcurrentBag<T>
的第一個列表,m_tailList
指向最後一個列表。列表與列表之間通過m_locals
下的 m_nextList
相連,構成一個單鏈表。
資料存放區在每個線程的m_locals
中,通過Node
類構成一個雙向鏈表。
PS: 要注意m_tailList
和m_headList
並不是儲存在ThreadLocal
中,而是所有的線程共用一份。
以上就是有關ConcurrentBag<T>
類的實現,筆者的一些記錄和解析。
筆者水平有限,如果錯誤歡迎各位批評指正!
附上ConcurrentBag<T>
源碼地址:戳一戳