Redis是運用比較廣泛的NoSQL產品之一,目前的穩定版本是2.6.10,包括Github、Instagram、Blizzard、新浪微博等都在產品中大量使用了Redis。其代碼基於BSD協議開源,整個項目代碼量只有2萬多行(2.2版本),大家可以通過閱讀代碼在相對短的時間內學習到作者的設計理念和Redis的實現方式,做到知其然知其所以然。
日前黃健宏(huangz)發布了開來源文件《Redis設計與實現》,這是一份從閱讀原始碼入手來學習Redis的筆記合集,對於寫這份文檔的目的,作者如是說:
本書的目標是以簡明易懂的方式講解 Redis 的內部運行機制, 通過閱讀本書, 你可以瞭解到 Redis 從資料結構到伺服器構造在內的幾乎所有知識。
《Redis設計與實現》主要從高抽象層次在如下的5個方面對Redis的實現進行闡述:
- 內部資料結構
- 記憶體映射資料結構
- Redis資料類型
- 功能的實現
- 部分運作機制
同時作者為了滿足大家深入學習的需求,還對Redis 2.6的原始碼進行了詳細注釋。
《Redis設計與實現》的作者黃健宏(huangz)是一位90後,喜歡函數式編程,由於對資料庫產生了興趣才開始閱讀Redis原始碼,他這樣看待整個閱讀過程:
閱讀 Redis 源碼對我來說是一次全新的學習體驗。當我剛開始看 Redis 源碼的時候,我只會一些基本的資料結構和演算法,沒有任何網路編程、資料庫或者系統編程方面的經驗,基本是一邊看源碼,一邊補充基礎知識,然後才慢慢理解的。
在問到閱讀開源項目原始碼時應該參照怎樣的路線,他分享了自己的一些方法:
自底向上:從耦合關係最小的模組開始讀,然後逐漸過度到關係緊密的模組。就好像寫程式的測試一樣,先從單元測試開始,然後才到功能測試。我在剛開始讀 Redis 源碼的時候,使用的就是這種方法:先從單獨的資料結構模組開始,然後再過渡到高層的功能模組。
從功能入手:通過檔案名稱(模組名)和函數名,快速定位到一個功能的具體實現,然後追蹤整個實現的運作流程,從而瞭解該功能的實現方式。我在讀阻塞列表、資料庫這種流程和功能都比較複雜,和其他檔案耦合也比較多的模組時,使用的就是這樣的方法。
自頂向下:從程式的 main() 函數,或者某個特別大的調用者函數為入口,以深度優先或者廣度優先的方式閱讀它的源碼。我在閱讀 redis.c/serverCron() 、 redis.c/main() 和 ae.c/aeMain() 這種有明顯調用者性質的函數時,使用的就是這樣的方法。
然後他強調:
這三種方法並不互相衝突:在某些函數/模組要用某種方法,而某些函數/模組要使用另一種方法,有時候又需要混合使用多種方法。
值得一提的是本書已經以“保留所有權利”的方式開源,大家可以在github上查看內容的創作過程,同時這種開源的協作方式能讓更多人蔘與內容最佳化中來。
原文地址:http://www.infoq.com/cn/news/2013/03/redis-book