Elasticsearch shard、replica與routing機制
本文講述,如何理解Elasticsearch的分片、副本和路由策略。
1、預備知識
1)分片(shard)
Elasticsearch集群允許系統存儲的數據量超過單機容量,實現這一目標引入分片策略shard。在一個索引index中,數據(document)被分片處理(sharding)到多個分片上。Elasticsearch屏蔽了管理分片的復雜性,使得多個分片呈現出一個大索引的樣子。
2)副本(replica)
為了提升訪問壓力過大是單機無法處理所有請求的問題,Elasticsearch集群引入了副本策略replica。副本策略對index中的每個分片創建冗余的副本,處理查詢時可以把這些副本當做主分片來對待(primary shard),此外副本策略提供了高可用和數據安全的保障,當分片所在的機器宕機,Elasticsearch可以使用其副本進行恢復,從而避免數據丟失。
3)路由(routing)
當向Elasticsearch存放數據時,根據文檔標識符_id將文檔分配到多個分片上,負載均衡算法只需要實現平均即可。當取用數據時,查詢所有的分片然後匯總結果,而並不必須知道數據到底存在哪個分片上。帶來的問題是,在查詢時,要查詢所有的分片然後匯總結果,造成性能的損耗,在不樂觀的情況下,有些分片的查詢可能失敗(failed),造成結果不準確。為了避免這個問題,引入了路由功能(routing),在存入時通過路由鍵將數據存入指定分片,在查詢的時候可以通過相同的路由鍵指明在哪個分片將數據查出來。
默認情況下,索引數據的分片算法如下
shard_num = hash(_routing) % num_primary_shards
routing字段的取值,默認是_id字段或者是_parent字段,這樣的取值在hash之後再與有多少個shard的數量取模,最終得到這條數據應該在被分配在那個一個shard上,也就是說默認是基於hash的分片,保證在每個shard上數據量都近似平均,這樣就不會出現負載不均衡的情況,然後在檢索的時候,es默認會搜索所有shard上的數據,最後在master節點上匯聚在處理後,返回最終數據。
2、分片(shard)與副本(replica)的數量
ElasticSearch在創建索引數據時,最好指定相關的shards數量和replicas,否則會使用服務器中的默認配置參數shards=5,replicas=1。
index.number_of_shards: 5
index.number_of_replicas: 1
對於一個索引來說,number_of_shards只能設置一次,而number_of_replicas可以使用索引更新設置API在任何時候被增加或者減少。
那麽如何確定分片和副本的數量呢?
依照經驗,最理想的分片數量應該依賴於節點的數量。假設索引index配置了10個分片,1個副本,那麽總共的分片數應該是20個,10 *(1+1),那麽最大的Elasticsearch節點數應該就是20。
節點最大數 = 分片數 * (副本數 + 1)
3、路由功能
1)安裝Paramedic插件
Elasticsearch提供了很多插件化功能,Paramedic可以直觀的查看Elasticsearch對數據的分片和副本。
[[email protected] es2.1.1]$ ./bin/plugin install karmi/elasticsearch-paramedic -> Installing karmi/elasticsearch-paramedic... Trying https://github.com/karmi/elasticsearch-paramedic/archive/master.zip ... Downloading ............................................................................................................................................................................................................................................DONE Verifying https://github.com/karmi/elasticsearch-paramedic/archive/master.zip checksums if available ... NOTE: Unable to verify checksum for downloaded plugin (unable to find .sha1 or .md5 file to verify) Installed paramedic into /home/bigdata-dw/es2.1.1/plugins/paramedic
2)創建索引documents
創建ducuments索引,包含3個分片,1個副本。
[[email protected] es2.1.1]$ curl -XPUT http://10.93.21.21:8049/documents -d ‘{ > settings: { > number_of_replicas: 1, > number_of_shards: 3 > } > }‘ {"acknowledged":true}
3)在索引數據的過程中使用路由
我們創建3個Document
id=1
curl -XPUT http://10.93.21.21:8049/documents/doc/1?routing=A -d ‘{"title": "Document"}‘ {"_index":"documents","_type":"doc","_id":"1","_version":1,"_shards":{"total":2,"successful":2,"failed":0},"created":true}
id=2
curl -XPUT http://10.93.21.21:8049/documents/doc/2?routing=A -d ‘{"title": "Document"}‘ {"_index":"documents","_type":"doc","_id":"2","_version":1,"_shards":{"total":2,"successful":2,"failed":0},"created":true}
id=3
curl -XPUT http://10.93.21.21:8049/documents/doc/3?routing=A -d ‘{ "title": "Document"}‘ {"_index":"documents","_type":"doc","_id":"3","_version":1,"_shards":{"total":2,"successful":2,"failed":0},"created":true}
查詢一下,可以看到document中是帶有_routing鍵的。
curl -XGET ‘http://10.93.21.21:8049/documents/_search?pretty‘ { "took" : 51, "timed_out" : false, "_shards" : { "total" : 3, "successful" : 3, "failed" : 0 }, "hits" : { "total" : 3, "max_score" : 1.0, "hits" : [ { "_index" : "documents", "_type" : "doc", "_id" : "1", "_score" : 1.0, "_routing" : "A", "_source":{ "title": "Document"} }, { "_index" : "documents", "_type" : "doc", "_id" : "2", "_score" : 1.0, "_routing" : "A", "_source":{ "title": "Document"} }, { "_index" : "documents", "_type" : "doc", "_id" : "3", "_score" : 1.0, "_routing" : "A", "_source":{ "title": "Document"} } ] } }
在Paramedic中查看
4)在查詢中使用路由
使用路由鍵“A”進行查詢,可以看到_shards.total=1,便可知只查詢了一個分片,這個分片便是路由鍵“A”算出的分片,在這個分片中可以查出我們以路由鍵“A”存入的數據
curl -XGET ‘http://10.93.21.21:8049/documents/_search?pretty&q=*:*&routing=A‘ { "took" : 17, "timed_out" : false, "_shards" : { "total" : 1, "successful" : 1, "failed" : 0 }, "hits" : { "total" : 3, "max_score" : 1.0, "hits" : [ { "_index" : "documents", "_type" : "doc", "_id" : "1", "_score" : 1.0, "_routing" : "A", "_source":{ "title": "Document"} }, { "_index" : "documents", "_type" : "doc", "_id" : "2", "_score" : 1.0, "_routing" : "A", "_source":{ "title": "Document"} }, { "_index" : "documents", "_type" : "doc", "_id" : "3", "_score" : 1.0, "_routing" : "A", "_source":{ "title": "Document"} } ] } }
使用路由鍵“B”,可以看到_shards.total=1,也是只查詢由路由鍵“B”指定的分片,在這個分片中不能查出我們以路由鍵“A”存入的數據
curl -XGET ‘http://10.93.21.21:8049/documents/_search?pretty&q=*:*&routing=B‘ { "took" : 14, "timed_out" : false, "_shards" : { "total" : 1, "successful" : 1, "failed" : 0 }, "hits" : { "total" : 0, "max_score" : null, "hits" : [ ] } }
總結一下路由的優點
1)只查詢一個shard,避免在其他shard無用的查詢與master上的合並,提升了查詢效率。
2)在nodes與shards較多的大規模集群中,在多個shards上查詢出現failed的可能性較大,在master上合並後,對數據完整性並不能很好的確定,使用routing可以有效避免。例如在total=64個shards的索引上查詢,successful=60,failed=4,這時候對合並的數據,我們不能保證其是完整的。
Elasticsearch shard、replica與routing機制