一致性hash演算法程式碼實現
阿新 • • 發佈:2018-11-26
什麼是一致性hash
一致性雜湊演算法(Consistent Hashing Algorithm)是一種分散式演算法,常用於負載均衡。Memcached client也選擇這種演算法,解決將key-value均勻分配到眾多Memcached server上的問題。它可以取代傳統的取模操作,解決了取模操作無法應對增刪Memcached Server的問題(增刪server會導致同一個key,在get操作時分配不到資料真正儲存的server,命中率會急劇下降)
一致性雜湊將整個雜湊值空間組織成一個虛擬的圓環,如假設某雜湊函式H的值空間為0-2^32-1(即雜湊值是一個32位無符號整形)
整個空間按順時針方向組織,0和232-1在零點中方向重合。
一致性hash有什麼用
一致性hash演算法常用於分散式快取服務,把所有的服務節點進行hash,得到hash環上的位置
新增進服務的資料用同樣的演算法進行hash,然後從hash環上取得大於該hash值的第一個節點,如果沒有大於該值的節點,那麼就取整個環的第一個節點
存在問題
在節點太少的情況,有可能存在hash偏移。就是節點負載不均衡,大量資料落在其中一個節點上面
解決辦法是,在環上面虛擬出足夠多的節點,虛擬的節點和實際節點做對應
java程式碼實現
package com.hj.lock.alg;
import java.security.MessageDigest;
import java.security.NoSuchAlgorithmException;
import java.util.*;
public class ConsistentHash<T> {
/**
* Hash計算物件,用於自定義hash演算法
*/
HashFunc hashFunc;
/**
* 複製的節點個數
*/
private final int numberOfReplicas;
/**
* 一致性Hash環
*/
private final TreeMap<Long, T> hashCircle = new TreeMap<>();
/**
* 構造,使用Java預設的Hash演算法
*
* @param numberOfReplicas 複製的節點個數,增加每個節點的複製節點有利於負載均衡
* @param nodes 節點物件
*/
public ConsistentHash(int numberOfReplicas, Collection<T> nodes) {
this.numberOfReplicas = numberOfReplicas;
this.hashFunc = ConsistentHash::md5HashingAlg;
//初始化節點
nodes.forEach(node -> add(node));
}
/**
* 增加節點<br>
* 每增加一個節點,就會在閉環上增加給定複製節點數<br>
* 例如複製節點數是2,則每呼叫此方法一次,增加兩個虛擬節點,這兩個節點指向同一Node
* 由於hash演算法會呼叫node的toString方法,故按照toString去重
*
* @param node 節點物件
*/
public void add(T node) {
for (int i = 0; i < numberOfReplicas; i++) {
hashCircle.put(hashFunc.hash(node.toString() + i), node);
}
}
/**
* 移除節點的同時移除相應的虛擬節點
*
* @param node 節點物件
*/
public void remove(T node) {
for (int i = 0; i < numberOfReplicas; i++) {
hashCircle.remove(hashFunc.hash(node.toString() + i));
}
}
/**
* 獲得一個最近的順時針節點
*
* @param key 為給定鍵取Hash,取得順時針方向上最近的一個虛擬節點對應的實際節點
* @return 節點物件
*/
public T get(Object key) {
if (hashCircle.isEmpty()) {
return null;
}
long hash = hashFunc.hash(key);
hash = nextHash(hash);
//正好命中
return hashCircle.get(hash);
}
public Long nextHash(Long hash) {
if (!hashCircle.containsKey(hash)) {
Long next = hashCircle.higherKey(hash + 1);//返回下一個hash值
hash = next == null ? hashCircle.firstKey() : next;
}
return hash;
}
/**
* 使用MD5演算法
*
* @param key
* @return
*/
private static long md5HashingAlg(Object key) {
MessageDigest md5 = null;
try {
md5 = MessageDigest.getInstance("MD5");
md5.reset();
String str = key.toString();
md5.update(str.getBytes());
byte[] bKey = md5.digest();
long res = ((long) (bKey[3] & 0xFF) << 24) | ((long) (bKey[2] & 0xFF) << 16) | ((long) (bKey[1] & 0xFF) << 8) | (long) (bKey[0] & 0xFF);
return res;
} catch (NoSuchAlgorithmException e) {
e.printStackTrace();
}
return 0l;
}
/**
* 使用FNV1hash演算法
*
* @param key
* @return
*/
private static long fnv1HashingAlg(Object key) {
final int p = 16777619;
int hash = (int) 2166136261L;
String str = key.toString();
for (int i = 0; i < str.length(); i++) {
hash = (hash ^ str.charAt(i)) * p;
}
hash += hash << 13;
hash ^= hash >> 7;
hash += hash << 3;
hash ^= hash >> 17;
hash += hash << 5;
return hash;
}
/**
* Hash演算法物件,用於自定義hash演算法
*/
public interface HashFunc {
public Long hash(Object key);
}
public static void main(String[] args) {
List<String> nodes = new ArrayList<>();
System.out.println("--新增節點 ABC");
nodes.add("A");
nodes.add("B");
nodes.add("C");
ConsistentHash<String> chash = new ConsistentHash(1, nodes);
System.out.println(chash.get("test1"));
System.out.println(chash.get("aest2"));
System.out.println(chash.get("dest3"));
System.out.println("--新增節點 D");
chash.add("D");
System.out.println(chash.get("test1"));
System.out.println(chash.get("aest2"));
System.out.println(chash.get("dest3"));
for (Iterator<Map.Entry<Long, String>> it = chash.hashCircle.entrySet().iterator(); it.hasNext(); ) {
Map.Entry<Long, String> entry = it.next();
Long k = entry.getKey();
System.out.println(k + ":" + entry.getValue());
System.out.println(Math.abs(chash.nextHash(k + 1) - k));
}
}
}
以上程式碼輸出值:
--新增節點 ABC
C
C
A
--新增節點 D
D
C
A
748451404:B
1081611916
1830063320:A
1542566198
3372629518:D
491985806
3864615324:C
3116163920