Kafka實現細節（上）

最後更新：2018-12-04 來源：互聯網

上載者：User

創建阿里雲帳戶，並獲得超過 40 款產品的免費試用版；而企業帳戶則可以享有總值 $1200 的免費試用版。立即註冊！

如果你第一次看kafka的文章，請先看《分布式訊息系統kafka初步》

之前有人問kafka和一般的MQ之間的區別，這個問題挺難回答，我覺得不如從kafka的實現原理來分析更為透徹，這篇將依據官網上給出的design來詳細的分析，kafka是如何?其高效能、高吞吐的。這一段應該會挺長的我想分兩篇來寫。今天這一篇主要從宏觀上說kafka實現的細節，下一篇，在從具體的技術上去分析。

我們先看kafka的設計項目：

1. 通常來說，kafka的使用是為了訊息的持久化（persistent messages）

2. 輸送量是kafka設計的主要目標

3. 關於消費的狀態被記錄為consumer的一部分，而不是server。這點稍微解釋下，這裡的server還是只broker，誰消費了多少資料都記錄在消費者自己手中，不存在broker中。按理說，消費記錄也是一個日誌，可以放在broker中，至於為什麼要這麼設計，我們寫下去了再說。

4. Kafka的分布式可以表現在producer、broker、consumer都可以分布在多台機器上。

在講實現原理之前，我們還得瞭解幾個術語：

l Topic：其實官網上沒有單獨提這個詞，但topic其實才是理解的關鍵，在kafka中，不同的資料可以按照不同的topic儲存。

l Message：訊息是kafka處理的對象，在kafka中，訊息是被發布到broker的topic中。而consumer也是從相應的topic中拿資料。也就是說，message是按topic儲存的。

l Consumer Group：雖然上面的設計項目第四條，我們說三者都可以部署到多台機器上，三者分別並作為一個邏輯的group，但對於consumer來說這樣的部署需要特殊的支援。Consumer
Group就是讓多個（相關的）進程（機器）在邏輯上扮演一個consumer。這個group的定義其實是為了去支援topic這樣的語義。在JMS中，大家最熟悉的是隊列，我們將所有的consumer放到一個group中，這樣就是隊列。而topic則是將consumer放置到與它相關的topic中去。所以無論一個topic存在於多少個consumer中， a
message is stored only a single time。你可能會有疑問，備份怎麼辦，接著看下去。

接下來，我們來看kafka的實現究竟依賴了哪些東西。

1. 硬體上，kafka選用了硬碟直接讀寫，當然這裡也有策略。一個67200rpm STAT RAID5的陣列，線性讀寫速度是300MB/sec，如果是隨機讀寫，速度則是50K/sec。差距很明顯，所以kafka選的策略就是利用線性儲存，至於怎麼存，我們在儲存中會說到。

2. 關於緩衝，kafka沒有使用記憶體作為緩衝。作業系統用個特性，如果不用direct I/O，那些閑置的memory會去做disk
caching，如果 a process maintains an in-process cache of the data，這樣的情況下可能會產生雙份的pagecache，會儲存兩遍。另外Kafka跑在JVM上，本身JVM記憶體回收、建立對象都非常的耗記憶體，所以不再依賴於記憶體做緩衝。All
data is immediately written to a persistent log on the filesystem without any call to flush the data. 當然核心自己的flush不算了。溫泉做一次32G的記憶體緩衝，需要大概10多分鐘。

3. Liner writer/reader：這樣做的雖然沒有B樹那樣多樣的變化，但卻有O（1）的操作，而且讀寫不會相互影響。同時，線性讀寫也解耦了資料規模的問題。用廉價的儲存就可以達到很高的性價比。

4. Zero-copy：將資料從硬碟寫到socket一般需要經過…你可以自己算一下，這是作業系統裡的知識，答案在文章末尾，具體也可以看這裡：http://my.oschina.net/ielts0909/blog/85147。一句話，Zero-copy減少了IO的操作步驟。

5. GZIP and Snappy compression：考慮到傳輸最大的瓶頸就在於網路上，kafka提供了對資料壓縮的各種協議。

6. 事務機制：雖然kafka對事務的處理比較薄弱，但是在message的分發上還是做了一定的策略來保證資料遞送的準確性：

At most once—this handles the first case described. Messages are immediately marked as consumed, so they can't be given out twice, but many failure scenarios may lead to losing messages.

At least once—this is the second case where we guarantee each message will be delivered at least once, but in failure cases may be delivered twice.

Exactly once—this is what people actually want, each message is delivered once and only once.

上述就是關於kafka的實現細節，主要寫了關於kafka採用到的技術和使用技術的原因，在後面一篇中，我將主要講述producer、broker、consumer之間的配合以及kafka的儲存問題。

--------------------------------------------------------------------------------

To understand the impact of sendfile, it is important to understand the common data path for transfer of data from file to socket:

The operating system reads data from the disk into pagecache in kernel space
The application reads the data from kernel space into a user-space buffer
The application writes the data back into kernel space into a socket buffer
The operating system copies the data from the socket buffer to the NIC buffer where it is sent over the network

其實zero-copy這個技術我們已經在使用了，在NIO中的FileChannel中的transferTo就是採用這樣的原理的。

from: http://my.oschina.net/ielts0909/blog/94153

本文章原先以中文撰寫並發佈於 aliyun.com，亦設英文版本，僅作資訊用途。本網站不對文章的準確性，完整性或可靠性或其任何翻譯作出任何明示或暗示的陳述或保證。如對該文章有任何疑慮或投訴，請傳送電郵至 info-contact@alibabacloud.com 並提供相關疑慮或投訴的詳細說明。職員會於 5 個工作天內與您聯絡，一經驗證之後，即會刪除該侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

Get Started for Free

Sales Support

1 on 1 presale consultation

Chat Contact Sales
After-Sales Support

24/7 Technical Support 6 Free Tickets per Quarter Faster Response

Open a Ticket
Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.

Learn More

Kafka實現細節（上）

聯繫我們

A Free Trial That Lets You Build Big!

Sales Support

After-Sales Support