Consistent Hashing 一致性hash演算法

阿新 • • 發佈：2019-01-12

在做伺服器負載均衡時候可供選擇的負載均衡的演算法有很多，包括：輪循演算法（Round Robin）、雜湊演算法（HASH）、最少連線演算法（Least Connection）、響應速度演算法（Response Time）、加權法（Weighted ）等。其中雜湊演算法是最為常用的演算法.

典型的應用場景是：有N臺伺服器提供快取服務，需要對伺服器進行負載均衡，將請求平均分發到每臺伺服器上，每臺機器負責1/N的服務。

常用的演算法是對hash結果取餘數 (hash() mod N)：對機器編號從0到N-1，按照自定義的 hash()演算法，對每個請求的hash()值按N取模，得到餘數i，然後將請求分發到編號為i的機器。但這樣的演算法方法存在致命問題，如果某一臺機器宕機，那麼應該落在該機器的請求就無法得到正確的處理，這時需要將當掉的伺服器從演算法從去除，此時候會有(N-1)/N的伺服器的快取資料需要重新進行計算；如果新增一臺機器，會有N /(N+1)的伺服器的快取資料需要進行重新計算。對於系統而言，這通常是不可接受的顛簸（因為這意味著大量快取的失效或者資料需要轉移）。那麼，如何設計一個負載均衡策略，使得受到影響的請求儘可能的少呢？
在Memcached、

Key-Value Store、Bittorrent DHT、LVS中都採用了Consistent Hashing演算法，可以說Consistent Hashing 是分散式系統負載均衡的首選演算法。

1、Consistent Hashing演算法描述

下面以Memcached中的Consisten Hashing演算法為例說明（參考memcached的分散式演算法）。

由於hash演算法結果一般為unsigned int型，因此對於hash函式的結果應該均勻分佈在[0,2³²-1]間，如果我們把一個圓環用2³²

個點來進行均勻切割，首先按照hash(key)函式算出伺服器（節點）的雜湊值，並將其分佈到0～2³²的圓上。

用同樣的hash(key)函式求出需要儲存資料的鍵的雜湊值，並對映到圓上。然後從資料對映到的位置開始順時針查詢，將資料儲存到找到的第一個伺服器（節點）上。

Consistent Hashing原理示意圖

新增一個節點的時候，只有在圓環上新增節點逆時針方向的第一個節點的資料會受到影響。刪除一個節點的時候，只有在圓環上原來刪除節點順時針方向的第一個節點的資料會受到影響，因此通過Consistent Hashing很好地解決了負載均衡中由於新增節點、刪除節點引起的hash值顛簸問題。

Consistent Hashing新增伺服器示意圖

虛擬節點（virtual nodes）：之所以要引進虛擬節點是因為在伺服器（節點）數較少的情況下（例如只有3臺伺服器），通過hash(key)算出節點的雜湊值在圓環上並不是均勻分佈的（稀疏的），仍然會出現各節點負載不均衡的問題。虛擬節點可以認為是實際節點的複製品（replicas），本質上與實際節點實際上是一樣的（key並不相同）。引入虛擬節點後，通過將每個實際的伺服器（節點）數按照一定的比例(例如200倍)擴大後並計算其hash(key)值以均勻分佈到圓環上。在進行負載均衡時候，落到虛擬節點的雜湊值實際就落到了實際的節點上。由於所有的實際節點是按照相同的比例複製成虛擬節點的，因此解決了節點數較少的情況下雜湊值在圓環上均勻分佈的問題。

虛擬節點對Consistent Hashing結果的影響

從上圖可以看出，在節點數為10個的情況下，每個實際節點的虛擬節點數為實際節點的100-200倍的時候，結果還是很均衡的。

2、Consistent Hashing演算法實現：

文章Consistent Hashing中描述了Consistent Hashing的Java實現，很簡潔。

import java.util.Collection;
import java.util.SortedMap;
import java.util.TreeMap;

public class ConsistentHash<T> {

 private final HashFunction hashFunction;
 private final int numberOfReplicas;
 private final SortedMap<Integer, T> circle = new TreeMap<Integer, T>();

 public ConsistentHash(HashFunction hashFunction, int numberOfReplicas,
     Collection<T> nodes) {
   this.hashFunction = hashFunction;
   this.numberOfReplicas = numberOfReplicas;

   for (T node : nodes) {
     add(node);
   }
 }

 public void add(T node) {
   for (int i = 0; i < numberOfReplicas; i++) {
     circle.put(hashFunction.hash(node.toString() + i), node);
   }
 }

 public void remove(T node) {
   for (int i = 0; i < numberOfReplicas; i++) {
     circle.remove(hashFunction.hash(node.toString() + i));
   }
 }

 public T get(Object key) {
   if (circle.isEmpty()) {
     return null;
   }
   int hash = hashFunction.hash(key);
   if (!circle.containsKey(hash)) {
     SortedMap<Integer, T> tailMap = circle.tailMap(hash);
     hash = tailMap.isEmpty() ? circle.firstKey() : tailMap.firstKey();
   }
   return circle.get(hash);
 }

}

文章Consistent hashing implemented simply in Python描述了Consistent Hashing演算法的python 實現

3、參考文件

http://weblogs.java.net/blog/2007/11/27/consistent-hashing

http://michaelnielsen.org/blog/consistent-hashing/

http://www.spiteful.com/2008/03/17/programmers-toolbox-part-3-consistent-hashing/

http://tech.idv2.com/2008/07/24/memcached-004/

http://amix.dk/blog/viewEntry/19367

http://amix.dk/blog/viewEntry/19369

http://www.javaworld.com/javaworld/jw-10-2008/jw-10-load-balancing-1.html

轉自：http://www.yeeach.com/2009/10/02/consistent-hashing%E7%AE%97%E6%B3%95/

Consistent Hashing 一致性hash演算法

在做伺服器負載均衡時候可供選擇的負載均衡的演算法有很多，包括：輪循演算法（Round Robin）、雜湊演算法（HASH）、最少連線演算法（Least Connection）、響應速度演算法（Response Time）、加權法（Weighted ）等。其中雜湊演算法是最為常用的演算法

一致性 hash 演算法（ consistent hashing ）

1 基本場景比如你有 N 個 cache 伺服器（後面簡稱 cache ），那麼如何將一個物件 object 對映到 N 個 cache 上呢，你很可能會採用類似下面的通用方法計算 object 的 hash 值，然後均勻的對映到到 N 個 cache hash(obj

hash環/consistent hashing一致性哈希算法

集群不能 gravity 這一 tex 引入通過後綴結果一致性哈希算法在1997年由麻省理工學院提出的一種分布式哈希（DHT）實現算法，設計目標是為了解決因特網中的熱點(Hot spot)問題，初衷和CARP十分類似。一致性哈希修正了CARP使用的簡

Consistent Hashing 一致性雜湊演算法

按照我的理解方式就是將所有的cache伺服器的標識分別hash到的值分佈到0-pow(2,32)中. 然後將你要取的key的hash值進行比較。取第一個大於key的hash值的伺服器。如果從0-pow(2,32)也沒有找到，那麼則取最小hash值的伺服器。例如上圖中，伺服器 a 的hash值為 1,

Consistent Hashing一致性雜湊演算法

一、簡單介紹一致性雜湊演算法分散式儲存中，常常涉及到負載均衡問題，由於有多個數據儲存伺服器。因此當一個物件被儲存時候，它究竟應該存放到哪個資料儲存伺服器上面呢？這就是負載均問題。又例如：現在假設有一個網站，最近發現隨著流量增加，伺服器壓力越來越大，之前直接

關於什麼是一致性hash演算法

當需要分散式快取的時候，通過key的hash值分散資料儲存hash(n)%快取伺服器臺數，同時也可以快速查詢資料而不用遍歷所有的伺服器。如下圖：但是這樣，當業務拓展想要增加一臺伺服器的話，要麼快取伺服器資料全部需要重新計算儲存 -----hash(n)%5 。要麼需要遍歷所有快取伺服器。不夠靈活。

一致性Hash演算法的深入理解

總結： 1、使用一致性Hash演算法，儘管增強了系統的伸縮性，但是也有可能導致負載分佈不均勻，解決辦法就是使用虛擬節點代替真實節點， 2、Hash演算法的選擇上，首先我們考慮簡單的String.HashCode()方法，這個演算法的缺點是，相似的字串如N1(10.0.

memcache客戶端實現叢集之一致性hash演算法

一致性雜湊的演算法把取餘演算法的等於號來選擇mem伺服器變成了大於號來選擇mem伺服器，這應該是才是關鍵，可以使一個鍵的mem伺服器落點變成是動態選擇（一個伺服器down掉然後選擇crc32(key)後大於這個伺服器的落點....）新增虛擬節點，虛擬節點其實還是原來那幾臺伺服器，每個虛擬節

分散式演算法(一致性Hash演算法)

一、分散式演算法在做伺服器負載均衡時候可供選擇的負載均衡的演算法有很多，包括：輪循演算法(Round Robin)、雜湊演算法(HASH)、最少連線演算法(Least Connection)、響應速度演算法(Response Time)、加權法

一致性hash演算法程式碼實現

什麼是一致性hash 一致性雜湊演算法(Consistent Hashing Algorithm)是一種分散式演算法，常用於負載均衡。Memcached client也選擇這種演算法，解決將key-value均勻分配到眾多Memcached server上的問題。它可以取代傳統的取模操作

Java架構/一致性Hash演算法在資料庫分表中的實踐

最近有一個專案，其中某個功能單表資料在可預估的未來達到了億級，初步估算在90億左右。與同事詳細討論後，決定採用一致性Hash演算法來完成資料庫的自動擴容和資料遷移。整個程式細節由我同事完成，我只是將其理解併成文，供有相同問題的同行參考。參看此文的兄弟，預設各位已經熟悉一致性hash

一致性Hash演算法在資料庫分表中的實踐

最近有一個專案，其中某個功能單表資料在可預估的未來達到了億級，初步估算在90億左右。與同事詳細討論後，決定採用一致性Hash演算法來完成資料庫的自動擴容和資料遷移。整個程式細節由我同事完成，我只是將其理解併成文，供有相同問題的同行參考。參看此文的兄弟，預設各位已經熟悉一致性hash演算法了。此文僅僅闡述程式

一致性Hash演算法，Java程式碼實現

一致性Hash演算法關於一致性Hash演算法，在我之前的博文中已經有多次提到了，MemCache超詳細解讀一文中"一致性Hash演算法"部分，對於為什麼要使用一致性Hash演算法、一致性Hash演算法的演算法原理做了詳細的解讀。演算法的具體原理這裡再次貼上：先構造

分散式一致性hash演算法

寫在前面在學習Redis的叢集內容時，看到這麼一句話：Redis並沒有使用一致性hash演算法，而是引入雜湊槽的概念。而分散式快取Memcached則是使用分散式一致性hash演算法來實現分散式儲存。所以就專門學習了一下什麼是分散式？什麼是一致性？什麼是雜湊？ 1

什麼是一致性Hash演算法？

最近有小夥伴跑過來問什麼是Hash一致性演算法，說面試的時候被問到了，因為不瞭解，所以就沒有回答上，問我有沒有相應的學習資料推薦，當時上班，沒時間回覆，晚上回去了就忘了這件事，今天突然看到這個，加班為大家整理一下什麼是Hash一致性演算法，希望對大家有幫助！文末送書，長按抽獎助手小程式即可參與，祝君好運！

twemproxy0.4原理分析-一致性hash演算法實現ketama分析

概述本文是一致性hash演算法的一種開原始碼的實現：ketama的原始碼分析。本文是我多年前的一篇文章整理而來，以前的那篇文章的連結可以在這裡檢視。簡介若我們在後臺使用NoSQL叢集，必然會涉及到key的分配問題，叢集中某臺機器宕機時如何key又該如何分配的問題。

一致性 Hash 演算法（分散式或均衡演算法）

簡介：一致性雜湊演算法在1997年由麻省理工學院提出的一種分散式雜湊（DHT）實現演算法，設計目標是為了解決因特網中的熱點(Hot spot)問題，初衷和CARP十分類似。一致性雜湊修正了CARP使用的簡單雜湊演算法帶來的問題，使得分散式雜湊（DHT）可以在P

一致性 Hash 演算法學習（分散式或均衡演算法）

簡介：一致性雜湊演算法在1997年由麻省理工學院提出的一種分散式雜湊（DHT）實現演算法，設計目標是為了解決因特網中的熱點(Hot spot)問題，初衷和CARP十分類似。一致性雜湊修正了CARP使用的簡單雜湊演算法帶來的問題，使得分散式雜湊（DHT）可以在P2P環境中真

資料結構和算法系列 - 一致性hash演算法

1 基本場景比如你有 N 個 cache 伺服器（後面簡稱 cache ），那麼如何將一個物件 object 對映到 N 個 cache 上呢，你很可能會採用類似下面的通用方法計算 object 的 hash 值，然後均勻的對映到到 N 個 cache ； hash(object)%N

深入解讀快取（二）——一致性Hash演算法

上一篇文章中，我們已經介紹了，分散式快取的叢集，與應用伺服器的叢集策略有所不同。分散式快取叢集，每一個節點上快取的資料各不相同。快取策略常見的策略有求留餘數法和一致性Hash演算法。快取的本質是一個記憶體Hash表，網站應用中，資料快取以一對Key、Value的形式

Consistent Hashing 一致性hash演算法

1、Consistent Hashing演算法描述

2、Consistent Hashing演算法實現：

3、參考文件

相關推薦