1. 程式人生 > >Elasticsearch簡單使用系列--詳細介紹ES的核心概念

Elasticsearch簡單使用系列--詳細介紹ES的核心概念

Elasticsearch的核心概念:
1,NRT(near real time):es是一個近實時搜尋平臺;

2,cluster:叢集是一個或多個node節點,儲存所有資料,並提供跨node間搜尋和索引的能力.叢集是根據名字區分的,預設為”elasticsearch”;

3,Node:是一個server,可以儲存資料,參與叢集的索引和搜尋.node的名字在啟動時使用UUID隨機生成的,可以自己定義.

4,Index:索引是儲存相似特徵的文件的集合,索引通過名字標識,名字必須小寫,類比資料庫;

5,Type:型別是索引中的一個邏輯分類或分割槽,因此一個索引中可以定義一個或多個type,每一個type通常儲存相同的field的文件,類比資料表;

6,Document:文件是儲存在索引中的基本資訊單元,使用JSON格式表示,文件真正的儲存到type中,類比記錄;

7,Shards & Replicas:
1)索引分割為多個小片就是分片,分片可以在建立索引時指定,預設是5個.
分片原因:
1.水平分割或擴充套件容量
2.分散式和並行操作多分片多節點,提升效能和吞吐量
3.分片就是Lucene index,最大儲存Integer.MAX_VALUE-128個文件,可以使用_cat/shards檢視
4.分片劃分機制以及搜尋聚合文件是es管理的,對使用者是透明的;
2)在網路或雲環境下,失敗隨時發生,es可以將索引的分片拷貝一份或多份,這就是副本,預設是1份.
副本原因:
1.因為分片或節點失敗,提高可靠性
2.擴充套件搜尋容量,並行執行提升吞吐量
3.副本可以在建立索引時指定,也可以在索引建立後指定.