解剖Go語言map底層實現
來源:互聯網
上載者:User
``map``是Go語言中基礎的資料結構,在日常的使用中經常被用到。但是它底層是如何?的呢?# ``map``的整體結構圖Golang中``map``的底層實現是一個散列表,因此實現``map``的過程實際上就是實現散表的過程。在這個散列表中,主要出現的結構體有兩個,一個叫``hmap``(``a header for a go map``),一個叫``bucket``。這兩種結構的樣子分別如下所示: hmap:![hmap.png](https://static.studygolang.com/180826/09d0c94fc2946bba795ecc2ae0c97ac2.png)圖中有很多欄位,但是便於理解``map``的架構,你只需要關心的只有一個,就是標紅的欄位:buckets數組。Golang的map中用於儲存的結構是bucket數組。而bucket(即``bmap``)的結構是怎樣的呢?bucket:![bmap.png](https://static.studygolang.com/180826/0b9839a2b09116a7f257dc46ae8fb23e.png)相比於``hmap``,bucket的結構顯得簡單一些,標紅的欄位依然是“核心”,我們使用的``map``中的key和value就儲存在這裡。“高位雜湊值”數組記錄的是當前bucket中key相關的“索引”,稍後會詳細敘述。還有一個欄位是一個指向擴容後的bucket的指標,使得bucket會形成一個鏈表結構。例如:![bmap_chain.png](https://static.studygolang.com/180826/28eb2a049e7e261951795af367f01500.png)由此看出``hmap``和``bucket``的關係是這樣的:![hmap_bmap.png](https://static.studygolang.com/180826/0743574cda5e2853f82a2c6abce4c2cb.png)而bucket又是一個鏈表,所以,整體的結構應該是這樣的:![whole.png](https://static.studygolang.com/180826/73c611ff75e39b50cabc3649bad9cdb7.png)雜湊表的特點是會有一個雜湊函數,對你傳來的key進行雜湊運算,得到唯一的值,一般情況下都是一個數值。Golang的``map``中也有這麼一個雜湊函數,也會算出唯一的值,對於這個值的使用,Golang也是很有意思。Golang把求得的值按照用途一分為二:高位和低位。![num.png](https://static.studygolang.com/180826/f78e6681a0c9baf8aa677290443b4b7d.png),藍色為高位,紅色為低位。然後低位用於尋找當前key屬於``hmap``中的哪個bucket,而高位用於尋找bucket中的哪個key。上文中提到:bucket中有個屬性欄位是“高位雜湊值”數組,這裡存的就是藍色的高位值,用來聲明當前bucket中有哪些“key”,便於搜尋尋找。需要特別指出的一點是:我們``map``中的key/value值都是存到同一個數組中的。數組中的順序是這樣的:![hmap_bmap.png](https://static.studygolang.com/180826/0743574cda5e2853f82a2c6abce4c2cb.png)並不是key0/value0/key1/value1的形式,這樣做的好處是:在key和value的長度不同的時候,可以消除padding帶來的空間浪費。現在,我們可以得到Go語言``map``的整個的結構圖了:![all_elem.png](https://static.studygolang.com/180826/7d806b2a30f30d85e3ee65fb25929263.png)以上,就是Go語言map的整體結構了。# ``map``的擴容當以上的雜湊表增長的時候,Go語言會將bucket數組的數量擴充一倍,產生一個新的bucket數組,並將舊數組的資料移轉至新數組。## 載入因子判斷擴充的條件,就是雜湊表中的``載入因子``(即loadFactor)。``載入因子``是一個閾值,一般表示為:散列包含的元素數 除以 位置總數。是一種“產生衝突機會”和“空間使用”的平衡與折中:``載入因子``越小,說明空間空置率高,空間使用率小,但是``載入因子``越大,說明空間利用率上去了,但是“產生衝突機會”高了。每種雜湊表的都會有一個``載入因子``,數值超過``載入因子``就會為雜湊表擴容。Golang的``map``的``載入因子``的公式是:```map長度 / 2^B``` 閾值是``6.5``。其中``B``可以理解為已擴容的次數。當Go的``map``長度增長到大於``載入因子``所需的``map``長度時,Go語言就會將產生一個新的bucket數組,然後把舊的bucket數組移到一個屬性欄位``oldbucket``中。注意:並不是立刻把舊的數組中的元素轉義到新的bucket當中,而是,只有當訪問到具體的某個bucket的時候,會把bucket中的資料轉移到新的bucket中。如所示:當擴容的時候,Go的``map``結構體中,會儲存舊的資料,和新產生的數組![extends.png](https://static.studygolang.com/180901/9b979e46ffdf78ef4a00da027a331b68.png)上面部分代表舊的有資料的bucket,下面部分代表新產生的新的bucket。藍色代表存有資料的bucket,橘黃色代表空的bucket。擴容時``map``並不會立即把新資料做遷移,而是當訪問原來舊bucket的資料的時候,才把舊資料做遷移,如:![move_bucket.png](https://static.studygolang.com/180901/95ee9e055ea351792d28193aff57ed9f.png)注意:這裡並不會直接刪除舊的bucket,而是把原來的引用去掉,利用GC清除記憶體。# ``map``中資料的刪除如果理解了``map``的整體結構,那麼尋找、更新、刪除的基本步驟應該都很清楚了。這裡不再贅述。值得注意的是,找到了``map``中的資料之後,針對key和value分別做如下操作:```1、如果``key``是一個指標類型的,則直接將其置為空白,等待GC清除;2、如果是實值型別的,則清除相關記憶體。3、同理,對``value``做相同的操作。4、最後把key對應的高位值對應的數組index置為空白。```170 次點擊