大資料讀書筆記(2)-流式計算

來源:互聯網
上載者:User

標籤:

早期和當前的"流式計算"系統分別稱為"連續查詢處理類"和"可擴充資料流平台類"計算系統。

 

流式計算系統的特點:

1)低延遲 2)極佳的系統容錯性 3)極強的系統擴充能力 4)靈活強大的應用邏輯表達能力

 

目前典型的流式計算系統:

S4,storm,millwheel,samza,d-stream,hadoop online,mupd8等。

其中storm和millwheel是各方面比較突出的。

 

流式計算系統架構:

常見的流式計算系統架構分為兩種:主從模式和p2p模式。

主從模式storm、millwheel和samza

p2p模式s4

samza是利用訊息系統kafka和hadoop2.0的資源管理系統Yarn綜合而成的,架構比較獨特,但本質上遵循主從架構。

 

送達保證

三種可能:至少送達一次(at_least once delivery),至多送達一次(at_most once delivery),恰好送達一次(Exeact-once delivery)。

storm在系統中提供"恰好送達一次"語義是通過送達保證機制和事務拓撲聯合來完成的。

samza依靠kafka的訊息持久化聯合broker緩衝機制,保證"恰好送達一次"語義。

 

大資料讀書筆記(2)-流式計算

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.