一致性Hash演算法實現

阿新 • • 發佈：2020-12-30

在做快取叢集時，為了緩解伺服器的壓力，會部署多臺快取伺服器，把資料資源均勻的分配到每個伺服器上，分散式資料庫首先要解決把整個資料集按照分割槽規則對映到多個節點的問題，即把資料集劃分到多個節點上，每個節點負責整體資料的一個子集。
一致性雜湊的目的就是為了在節點數目發生改變時儘可能少的遷移資料，將所有的儲存節點排列在收尾相接的Hash環上，每個key在計算Hash 後會順時針找到臨接的儲存節點存放。而當有節點加入或退時，僅影響該節點在Hash環上順時針相鄰的後續節點。
常用一致性Hash演算法：CRC32_HASH、FNV1_32_HASH、KETAMA_HASH

等。其中 KETAMA_HASH 是 MemeCache 推薦的一致性Hash演算法

Java程式碼實現：

import org.springframework.util.StringUtils;

import java.util.*;

/**
 * 一致性hash演算法
 * Hash演算法選擇：hashCode(),不夠雜湊(捨棄),選擇其他Hash演算法，如 CRC32_HASH、FNV1_32_HASH、KETAMA_HASH 等
 * 其中 KETAMA_HASH 是MemeCache推薦的一致性Hash演算法
 */
public class ConsistencyHash { 

    // 儲存伺服器節點資訊
    private static final List<String> SERVER_NODES = new ArrayList<>();
    // 每個節點生成虛擬節點個數
    private static final Integer VIRTUAL_NODE_NUM = 100;
    // 虛擬節點與伺服器對應關係：以虛擬節點為key，伺服器為value，通過虛擬節點快速定位到伺服器位置
    private static final TreeMap<Integer, String> VIRTUAL_SERVER_RELATION = 
 new TreeMap<>();

    /**
     * 新增伺服器節點
     * 1.將伺服器新增到 SERVER_NODES
     * 2.為伺服器分配虛擬節點，並設定對應關係
     * @param node
     */
    public synchronized void addServer(String node) {
        if (StringUtils.isEmpty(node)) {// 節點為空不新增
            return;
        } else if (SERVER_NODES.contains(node)) {// 節點以及存在不新增
            return;
        }
        int count = 1;
        // 1.將伺服器新增到 SERVER_NODES
        SERVER_NODES.add(node);
        // 2.分配虛擬節點，並設定對應關係
        while (count <= VIRTUAL_NODE_NUM) {
            int virtualHashValue = FNV1_32_HASH.getHash(node + "_virtual_node_" + count);
            if (VIRTUAL_SERVER_RELATION.containsKey(virtualHashValue)) {// 如果已經該虛擬節點已經存在，則重新生成
                continue;
            }
            VIRTUAL_SERVER_RELATION.put(virtualHashValue, node);
            count++;
        }
    }

    /**
     * 移除服務節點
     * 1.從 SERVER_NODES 移除伺服器
     * 2.移除所有虛擬節點
     * @param node
     */
    public synchronized void removeServer(String node) {
        // 1.從 SERVER_NODES 移除伺服器
        if (SERVER_NODES.remove(node)) {
            // 2.移除所有虛擬節點
            Iterator<Map.Entry<Integer, String>> iterator = VIRTUAL_SERVER_RELATION.entrySet().iterator();
            while (iterator.hasNext()) {
                if (node.equals(iterator.next().getValue())){
                    iterator.remove();
                }
            }
        }
    }

    /**
     * 根據key獲取所處伺服器節點
     * @param key
     * @return
     */
    public String getServer(String key) {
        int hashValue = FNV1_32_HASH.getHash(key);
        Map.Entry<Integer, String> virtualNode = VIRTUAL_SERVER_RELATION.ceilingEntry(hashValue);
        if (virtualNode == null) {// 如果為空，則為第一個虛擬節點
            return VIRTUAL_SERVER_RELATION.firstEntry().getValue();
        }
        return virtualNode.getValue();
    }

    private ConsistencyHash() {
    }

    /**
     * IoDH 單例模式
     */
    private static class IoDHSingleton {
        private static final ConsistencyHash instance = new ConsistencyHash();
    }

    public static ConsistencyHash getInstance() {
        return IoDHSingleton.instance;
    }

    /**
     * 測試
     * @param args
     */
    public static void main(String[] args) {
        ConsistencyHash consistencyHash = ConsistencyHash.getInstance();
        // 初始化六個伺服器
        List<String> servers = new ArrayList<>();
        servers.add("10.11.12.1");
        servers.add("10.11.12.2");
        servers.add("10.11.12.3");
        servers.add("10.11.12.4");
        servers.add("10.11.12.5");
        servers.add("10.11.12.6");
        for (int i = 0, size = servers.size(); i < size; i++) {
            consistencyHash.addServer(servers.get(i));
        }
        // 生成 10000 條資料，並存儲當前資料所在節點
        int valNum = 10000;
        Map<String, String> vals = new HashMap<>();
        String val;
        String server;
        // 記錄伺服器節點個數
        Map<String, Integer> countServerVal = new HashMap<>();
        for (int i = 1; i <= valNum; i++) {
            val = "node-" + i;
            server = consistencyHash.getServer(val);
            vals.put(val, server);
            countServerVal.computeIfAbsent(server, k -> 0);
            countServerVal.computeIfPresent(server, (k, v) -> v + 1);
        }
        System.out.println("當前伺服器分配資料情況：" + countServerVal);
        // 計算新增一個節點後，資料匹配率：以此判斷當前資料所在節點和通過一致性hash演算法獲取伺服器節點對比
        consistencyHash.addServer("10.11.12.7");
        Iterator<Map.Entry<String, String>> iterator = vals.entrySet().iterator();
        Map.Entry<String, String> entry;
        // 記錄伺服器節點匹配個數
        Integer countEquals = 0;
        while (iterator.hasNext()) {
            entry = iterator.next();
            if (entry.getValue().equals(consistencyHash.getServer(entry.getKey()))) {
                countEquals++;
            }
        }
        System.out.println("當前伺服器資料匹配率：" + countEquals / Double.valueOf(valNum));
        // TODO 刪除一個節點資料匹配率
    }
}

執行結果：
在這裡插入圖片描述
採用一致性Hash演算法虛擬分割槽方式，當加入一臺伺服器後，資料匹配度大約為為 n / (n + 1)，當刪除一臺伺服器後，資料匹配度大約為為( n - 1) / n。

一致性Hash演算法實現

技術標籤：Java進階知識在做快取叢集時，為了緩解伺服器的壓力，會部署多臺快取伺服器，把資料資源均勻的分配到每個伺服器上，分散式資料庫首先要解決把整個資料集按照分割槽規則對映到多個節點的問題，即把資

一致性hash演算法及java實現

一致性hash演算法是分散式中一個常用且好用的分片演算法、或者資料庫分庫分表演算法。現在的網際網路服務架構中，為避免單點故障、提升處理效率、橫向擴充套件等原因，分散式系統已經成為了居家旅行必備的部署模

java實現一致性hash演算法例項程式碼

一致性hash演算法java版本簡單實現 package com.java4all.grouth.consistent; import java.util.LinkedList;

演算法基礎提升——隨機池結構問題、布隆過濾器、一致性Hash演算法、島問題、並查集實現

package com.zuoshen.jichutisheng.class01; import java.util.HashMap; import java.util.List; import java.util.Stack;

一致性Hash演算法原理（通俗易懂）

一致性Hash演算法應用場景請求的負載均衡：比如Nginx的ip_hash策略，通過對IP的Hash值來額定將請求轉發到哪臺Tomcat

一致性Hash演算法/分散式快取相關

一致性Hash演算法背景　　一致性雜湊演算法在1997年由麻省理工學院的Karger等人在解決分散式Cache中提出的，設計目標是為了解決因特網中的熱點(Hot spot)問題，初衷和CARP十分類似。一致性雜湊修正了CARP使用的簡單

十四、一致性Hash演算法

一致性雜湊演算法（Consistent Hashing）最早在論文《Consistent Hashing and Random Trees: DistributedCaching Protocols for Relieving Hot Spots on the World Wide Web》中被提出。簡單來說，一致性雜湊將整個

有趣的演算法（四）——一致性Hash演算法模擬redis叢集

有趣的演算法（四）——一致性Hash演算法模擬redis叢集（原創內容，轉載請註明來源，謝謝）

美麗的一致性Hash演演算法

如果在大型高併發系統需要資料的分散式儲存希望資料均勻分佈可擴充套件性強那麼一致性hash演演算法就可以完美解決這個問題

面試又被問到一致性 Hash 演演算法？這樣回答秒殺面試官！

程式設計改變世界資料分片 ✔︎ 先讓我們看一個例子吧我們經常會用 Redis 做快取，把一些資料放在上面，以減少資料的壓力。

一致性Hash原理與實現

前言網際網路公司中，絕大部分都沒有馬爸爸系列的公司那樣財大氣粗，他們即沒有強勁的伺服器、也沒有錢去購買昂貴的海量資料庫。那他們是怎麼應對大資料量高併發的業務場景的呢？

一致性Hash(基於google Guava實現)

背景一般我們使用的hash就是md5 sha 之類的工具類，在負載均衡會要求類似同一個ip在增加節點時還是定位到之前的節點，這時就要用到一致性hash。具體實現程式碼參考(基於google Guava)：

一文搞懂一致性hash的原理和實現

在 go-zero 的分散式快取系統分享裡，Kevin 重點講到過一致性hash的原理和分散式快取中的實踐。本文來詳細講講一致性hash的原理和在 go-zero 中的實現。

一致性Hash的原理與實現

應用場景在瞭解一致性Hash之前，我們先了解一下一致性Hash適用於什麼場景，能解決什麼問題？這裡先放一下我自己認為適用的場景。一致性Hash適用於伺服器動態擴充套件且需要負載均衡的場景

DPOS共識演演算法實現(Golang版)

DPOS原理 DPOS全稱Delegated proof of Stake，中文是委託權益證明。可以理解為整個區塊鏈網路有許多節點，我們需要選出一些節點作為代表來維護整個區塊鏈網路，這些代表需要保證區塊鏈的安全和效能，不需要通過PO

dubbo-一致性hash

首先，我們要明白，我們需要的是什麼資料？key和value。那具體是什麼呢？key是哪個資料？value是哪個伺服器節點？

iOS彙編教程（七）ARM Exclusive - 互斥鎖與讀寫一致性的底層實現原理

系列文章 iOS彙編入門教程（一）ARM64彙編基礎 iOS彙編入門教程（二）在Xcode工程中嵌入彙編程式碼

N皇后問題暴力解和回溯解問題分析和演演算法實現-leetcode困難難度

n皇后問題是經典的回溯解題的案例，回溯一般用在有多個解的演演算法中，回溯的核心是窮舉，一般通過必要的減枝提高效率(減少重複計算等)，得到一個解後，把當前解進行儲存，然後將當前解標記為未解決，繼續嘗試下一個

關於一致性hash,這可能是全網最形象生動最容易理解的檔案,想做架構師的你來瞭解一下

問題提出一致性hash是什麼?假設有4臺快取伺服器N0,N1,N2,N3,現在有資料OBJECT1,OBJECT2,OBJECT3,OBJECT4,OBJECT5,OBJECT7,OBJECT8,我們需要將這些資料快取到這4臺伺服器上，相應的問題是

C++貪心演算法實現活動安排問題(例項程式碼)

貪心演算法貪心演算法（又稱貪婪演算法）是指，在對問題求解時，總是做出在當前看來是最好的選擇。也就是說，不從整體最優上加以考慮，他所做出的是在某種意義上的區域性最優解。

一致性Hash演算法實現

相關推薦