標籤:
轉載一篇部落格,裡面有很多的知識和思想值得我們去思考。
——————————————————————————————————————————————————————————————————————
在大型互連網應用中,隨著使用者數的增加,為了提高應用的效能,我們經常需要對資料庫進行分庫分表操作。在單表時代,我們可以完全依賴於資料庫的自增ID來唯一標識一個使用者或資料對象。但是當我們對資料庫進行了分庫分表後,就不能依賴於每個表的自增ID來全域唯一標識這些資料了。因此,我們需要提供一個全域唯一的ID號建置原則來支援分庫分表的環境。下面來介紹兩種非常優秀的解決方案:
1. 資料庫自增ID——來自Flicker的解決方案
因為MySQL本身支援auto_increment操作,很自然地,我們會想到藉助這個特性來實現這個功能。Flicker在解決全域ID產生方案裡就採用了MySQL自增長ID的機制(auto_increment + replace into + MyISAM)。一個產生64位ID方案具體就是這樣的:
先建立單獨的資料庫(eg:ticket),然後建立一個表:
CREATE TABLE Tickets64 ( id bigint(20) unsigned NOT NULL auto_increment, stub char(1) NOT NULL default ‘‘, PRIMARY KEY (id), UNIQUE KEY stub (stub) ) ENGINE=MyISAM
當我們插入記錄後,執行SELECT * from Tickets64,查詢結果就是這樣的:
+-------------------+------+| id | stub |+-------------------+------+| 72157623227190423 | a |+-------------------+------+
在我們的應用端需要做下面這兩個操作,在一個事務會話裡提交:
REPLACE INTO Tickets64 (stub) VALUES (‘a‘);SELECT LAST_INSERT_ID();
這樣我們就能拿到不斷增長且不重複的ID了。
到上面為止,我們只是在單台資料庫上產生ID,從高可用角度考慮,接下來就要解決單點故障問題:Flicker啟用了兩台資料庫伺服器來產生ID,通過區分auto_increment的起始值和步長來產生奇偶數的ID。
TicketServer1:auto-increment-increment = 2auto-increment-offset = 1TicketServer2:auto-increment-increment = 2auto-increment-offset = 2
最後,在用戶端只需要通過輪詢方式取ID就可以了。
- 優點:充分藉助資料庫的自增ID機制,提供高可靠性,產生的ID有序。
- 缺點:佔用兩個獨立的MySQL執行個體,有些浪費資源,成本較高。
參考:http://code.flickr.net/2010/02/08/ticket-servers-distributed-unique-primary-keys-on-the-cheap/
2. 獨立的應用程式——來自Twitter的解決方案
Twitter在把儲存系統從MySQL遷移到Cassandra的過程中由於Cassandra沒有順序ID產生機制,於是自己開發了一套全域唯一ID產生服務:Snowflake。GitHub地址:https://github.com/twitter/snowflake。根據twitter的業務需求,snowflake系統產生64位的ID。由3部分組成:
41位的時間序列(精確到毫秒,41位的長度可以使用69年)10位的機器標識(10位的長度最多支援部署1024個節點)12位的計數順序號(12位的計數順序號支援每個節點每毫秒產生4096個ID序號)
最高位是符號位,始終為0。
- 優點:高效能,低延遲;獨立的應用;按時間有序。
- 缺點:需要獨立的開發和部署。
【轉】MySQL分庫分表環境下全域ID產生方案