標籤:
一致性雜湊演算法是分布式系統中常用的演算法。比如,一個分布式的儲存系統,要將資料存放區到具體的節點上,如果採用普通的hash方法,將資料對應到具體的節點上,如key%N,key是資料的key,N是機器節點數,如果有一個機器加入或退出這個叢集,則所有的資料對應都無效了,如果是持久化儲存則要做資料移轉,如果是分布式緩衝,則其他緩衝就失效了。
因此,引入了一致性雜湊演算法:
把資料用hash函數(如MD5),映射到一個很大的空間裡,。資料的儲存時,先得到一個hash值,對應到這個環中的每個位置,如k1對應到了圖中所示的位置,然後沿順時針找到一個機器節點B,將k1儲存到B這個節點中。
如果B節點宕機了,則B上的資料就會落到C節點上,如所示:
這樣,只會影響C節點,對其他的節點A,D的資料不會造成影響。然而,這又會造成一個“雪崩”的情況,即C節點由於承擔了B節點的資料,所以C節點的負載會變高,C節點很容易也宕機,這樣依次下去,這樣造成整個叢集都掛了。
為此,引入了“虛擬節點”的概念:即把想象在這個環上有很多“虛擬節點”,資料的儲存是沿著環的順時針方向找一個虛擬節點,每個虛擬節點都會關聯到一個真實節點,如所使用:
圖中的A1、A2、B1、B2、C1、C2、D1、D2都是虛擬節點,機器A負載儲存A1、A2的資料,機器B負載儲存B1、B2的資料,機器C負載儲存C1、C2的資料。由於這些虛擬節點數量很多,均勻分布,因此不會造成“雪崩”現象。
Java實現:
[java] view plaincopyprint?
- public class Shard<S> { // S類封裝了機器節點的資訊 ,如name、password、ip、port等
-
- private TreeMap<Long, S> nodes; // 虛擬節點
- private List<S> shards; // 真實機器節點
- private final int NODE_NUM = 100; // 每個機器節點關聯的虛擬節點個數
-
- public Shard(List<S> shards) {
- super();
- this.shards = shards;
- init();
- }
-
- private void init() { // 初始化一致性hash環
- nodes = new TreeMap<Long, S>();
- for (int i = 0; i != shards.size(); ++i) { // 每個真實機器節點都需要關聯虛擬節點
- final S shardInfo = shards.get(i);
-
- for (int n = 0; n < NODE_NUM; n++)
- // 一個真實機器節點關聯NODE_NUM個虛擬節點
- nodes.put(hash("SHARD-" + i + "-NODE-" + n), shardInfo);
-
- }
- }
-
- public S getShardInfo(String key) {
- SortedMap<Long, S> tail = nodes.tailMap(hash(key)); // 沿環的順時針找到一個虛擬節點
- if (tail.size() == 0) {
- return nodes.get(nodes.firstKey());
- }
- return tail.get(tail.firstKey()); // 返回該虛擬節點對應的真實機器節點的資訊
- }
-
- /**
- * MurMurHash演算法,是非加密HASH演算法,效能很高,
- * 比傳統的CRC32,MD5,SHA-1(這兩個演算法都是加密HASH演算法,複雜度本身就很高,帶來的效能上的損害也不可避免)
- * 等HASH演算法要快很多,而且據說這個演算法的碰撞率很低.
- * http://murmurhash.googlepages.com/
- */
- private Long hash(String key) {
-
- ByteBuffer buf = ByteBuffer.wrap(key.getBytes());
- int seed = 0x1234ABCD;
-
- ByteOrder byteOrder = buf.order();
- buf.order(ByteOrder.LITTLE_ENDIAN);
-
- long m = 0xc6a4a7935bd1e995L;
- int r = 47;
-
- long h = seed ^ (buf.remaining() * m);
-
- long k;
- while (buf.remaining() >= 8) {
- k = buf.getLong();
-
- k *= m;
- k ^= k >>> r;
- k *= m;
-
- h ^= k;
- h *= m;
- }
-
- if (buf.remaining() > 0) {
- ByteBuffer finish = ByteBuffer.allocate(8).order(
- ByteOrder.LITTLE_ENDIAN);
- // for big-endian version, do this first:
- // finish.position(8-buf.remaining());
- finish.put(buf).rewind();
- h ^= finish.getLong();
- h *= m;
- }
-
- h ^= h >>> r;
- h *= m;
- h ^= h >>> r;
-
- buf.order(byteOrder);
- return h;
- }
-
- }
一致性雜湊演算法與Java實現