雲端儲存的那些事(2)——資料分布演算法CRUSH

來源:互聯網
上載者:User

標籤:src   alt   合數   分布   map   雲端儲存   體系   方便   映射   

在分布式系統中,資料最終還是要儲存到物理裝置上的,ceph的底層裝置抽象角色是OSD,那麼資料是如何被決定放在哪塊OSD上的,答案就是CRUSH演算法。

關鍵字:CRUSH、一致性hash、ceph資料分布

總體來說,資料存放區分為2個階段

  1,首先根據一般的hash演算法,對資料x的hash數值進行PG數模數運算

    PG是ceph中由OSD再進一步抽象出來的資源集區pool中的虛擬儲存單元

    為什麼要抽象出這一層呢,其實可以類比LVM的作用,即為了讓一切資源都能夠變得“不那麼硬“,

    方便在故障發生時,系統擴容時,可以迅速的調整,並且對整體系統影響最小

    PG的存在讓節點的增加和減少變為了邏輯層面的調整,對物理層的OSD起到了封裝的作用

  2,確定了PG後,再根據monitor節點中的全域拓撲cluster map,結合資料規則(副本數),再次映射到具體的OSD節點上

    此時需要注意選擇的OSD節點可能是多個,演算法會保證不在同一個故障域

    故障域的大小可以是(從小到大層級):host-rack-row-root

 

下面照例總結一張圖:

 

 

雲端儲存的那些事(2)——資料分布演算法CRUSH

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.