深入淺出spring-data-elasticsearch之ElasticSearch架構初探(一).md

阿新 • • 發佈：2018-12-12

Elasticsearch基本術語

1. 文件（Document）、索引（Index）、型別（Type）文件三要素

文件（Document）：文件，在面向物件觀念就是一個物件。在 ES 裡面，是一個大 JSON 物件，是指定了唯一 ID 的最底層或者根物件。文件的位置由 _index、_type 和 _id 唯一標識。

索引（Index）：索引，用於區分文件成組，即分到一組的文件集合。索引，用於儲存文件和使文件可被搜尋。比如專案存索引 project 裡面，交易存索引 sales 等。

型別（Type）：型別，用於區分索引中的文件，即在索引中對資料邏輯分割槽。比如索引 project 的專案資料，根據專案型別 ui 專案、插畫專案等進行區分。

和關係型資料庫 MySQL 做個類比：

Document 類似於 Record
Type 類似於 Table
Index 類似於 Database

1. 叢集（Cluster）、節點（Node）、分片（Shard）分散式三要素

叢集（Cluster）：多個 ElasticSearch 執行例項（節點）組合的組合體是 ElasticSearch 叢集。ElasticSearch 是天然的分散式，通過水平擴容為叢集新增更多節點。叢集是去中心化的，有一個主節點（Master）。主節點是動態選舉，因此不會出現單點故障。

節點（Node）：一個ElasticSearch執行例項就是節點。順著叢集來，任何節點都可以被選舉成為主節點。主節點負責叢集內所以變更，比如索引的增加、刪除等。所以叢集不會因為主節點流量的增大成為瓶頸。因為任何節點都會成為主節點。

分片（Shard）：分片，是ES節點中最小的工作單元。分片僅僅儲存全部資料的一部分，分片的集合是ES的索引。分片包括主分片和副分片，主分片是副分片的拷貝。主分片和副分片的工作基本沒有大的區別。在索引中全文搜尋，然後會查詢到每個分片，將每個分配的結果進行全域性地收集處理，並返回。

Elasticsearch 工作原理

1. 文件儲存的路由

當索引到一個文件（如：報價系統），具體的文件資料（如：報價資料）會儲存到一個分片。具體文件資料會被切分，並分別儲存在分片 1 或者分片 2 … 那麼如何確定存在哪個分片呢?

儲存路由過程由下面地公式決定：

shard = hash(routing) % number_of_primary_shards

routing 是可變值，支援自定義，預設文件 _id。
hash 函式生成數字，經過取餘演算法得到餘數，那麼這個餘數就是分片的位置。

1. 如何健康檢查：叢集名，叢集的健康狀態

GET http://127.0.0.1:9200/_cluster/stats
{
"cluster_name": "elasticsearch",
"status": "green",
"timed_out": false,
"number_of_nodes": 1,
"number_of_data_nodes": 1,
"active_primary_shards": 0,
"active_shards": 0,
"relocating_shards": 0,
"initializing_shards": 0,
"unassigned_shards": 0
}

active_primary_shards 叢集中的主分片數量
active_shards 所有分片的彙總值
relocating_shards 顯示當前正在從一個節點遷往其他節點的分片的數量。通常來說應該是 0，不過在 Elasticsearch 發現叢集不太均衡時，該值會上漲。比如說：添加了一個新節點，或者下線了一個節點。
initializing_shards 剛剛建立的分片的個數。
unassigned_shards 已經在叢集狀態中存在的分片。

status 欄位是需要我們關心的。狀態可能是下列三個值之一：

green
所有的主分片和副本分片都已分配。你的叢集是 100% 可用的。
yellow
所有的主分片已經分片了，但至少還有一個副本是缺失的。不會有資料丟失，所以搜尋結果依然是完整的。高可用會弱化把 yellow 想象成一個需要及時調查的警告。
red
至少一個主分片（以及它的全部副本）都在缺失中。這意味著你在缺少資料：搜尋只能返回部分資料，而分配到這個分片上的寫入請求會返回一個異常。

1. 如何水平擴容

主分片在索引建立已經確定。讀操作可以同時被主分片和副分片處理。因此，更多的分片，會擁有更高的吞吐量。自然，需要增加更多的硬體資源支援吞吐量。說明，這裡無法提高效能，因為每個分片獲得的資源會變少。動態調整副本分片數，按需伸縮叢集，比如把副本數預設值為 1 增加到 2：

PUT /blogs/_settings
{
"number_of_replicas" : 2
}

深入淺出spring-data-elasticsearch之ElasticSearch架構初探(一).md

Elasticsearch基本術語文件（Document）、索引（Index）、型別（Type）文件三要素文件（Document）：文件，在面向物件觀念就是一個物件。在 ES

spring-data-examples之elasticsearch嘗試

spring-data系列嚐鮮，在嘗試elasticsearch時，遇到一些問題，記錄如下： 1.專案實體類採用lombok 形式註解，如果用IDE編譯，需要install lombok 外掛； 2.

深入淺出spring-data-elasticsearch系列 – 概述及入門(二).md

spring-data-elasticsearch 是什麼？ Spring Data：Spring Data 基於 Spring 為資料訪問提供一種相似且一致性的程式設計模型，並儲存底層資料

Spring Data JPA 之分頁查詢

JPA的分頁查詢確實使用起來確實很簡單，但理解起來有點困難，此處只是實現JPA分頁的程式碼塊。定義實體類： @Entity @Table(name = "t_pub_info") @Cache(usage = CacheConcurrencyStrategy.NONSTRICT_REA

Spring Data JPA 之 for update

for update問題的由來是由於高併發，且使用負載均衡時使用的。在公司有一個專案的場景，場景並不複雜:學生選課。現在有三張表，1.t_pub_student（學生資訊表），2.t_pub_course（課程資訊表），3.t_pub_course_detail（學生選課詳情）。這三張表的定義分

spring原始碼學習之路---IOC初探（一）

首先把spring原始碼匯入，怎麼匯入百度下。首先我們來說一下IOC，IOC是spring最核心的理念，包括AOP也要屈居第二，那麼IOC到底是什麼呢，四個字，控制反轉。網上有不少是這麼解釋IOC的，說IOC是將物件的建立和依賴關係交給容器，這句話我相信不少人都知道，在我個人的理解

SpringBoot學習筆記10——spring-data-jpa之分頁查詢

今天我們來學習一下spring-data-jpa的分頁查詢的實現在上次初探JPA之後我們接下來學習分頁查詢，本篇部落格是接上一篇的，如果有需要了解jpa配置的話可以看上一篇部落格https://blog.csdn.net/lp840312696/article/details/83549937

Spring data redis 之 spring 系統整合

第一步：新增依賴（以maven為例）  <dependency> &

spring data jpa之資料增刪改查程式碼優化

Spring data jpa為減少查詢資料庫次數,先將符合條件的資料查出來，返回的是一個list集合，遍歷集合將資料裝入map中，根據需要設定key,value,然後判斷map是否包含某個key或者value以此判斷資料是否在資料庫中已經存在。這樣減少了訪問資料庫的次數，減小了伺服器壓力，將大部分

Spring Data JPA之自動轉化下劃線

在專案中遇到資料庫表沒有下劃線如SysUser，POJO類名也是SysUser，springboot下的預設jpa會在建立拼接sql語句時自動將SysUser轉為Sys_User從而報錯。解決方法：在application.yml中配置如下 jpa: hibernate:

spring data mongodb之mongodbTemplate查詢總結

常用的列表查詢（篩選條件，查詢欄位，排序及分頁），相當於關係型資料庫的： select fields from tableName where coditions order by field skip limit; DBObject cond = new

spring-data-mongodb之MongoTemplate 新增資料

首先建立一個實體類，我們這邊用文章來做實體類，定義如下欄位:注意實體類要建在之前配置轉換目錄的包下面，上篇文章applicationContent.xml裡的配置，base-package路徑對了框架才會將實體類與mongodb中的集合對應起來。<!-- 自動掃描以下包的有Doucment註解的類 --

Spring Boot Actuator 之監控架構實戰使用

本 Chat 作為 Logging 的姊妹篇，來和大家一起整體認識一下 Spring Boot Actuator 及其在實際工作的使用。有整體到區域性，有原理到實戰，一起來學習一下 Actuator 的正確使用姿勢。通過此篇 Chat 我們可以瞭解到如下內容： Spri

Elasticsearch 之 Elasticsearch面試總結

一、Elasticsearch監控的常用工具我大概用過如下的監控外掛（注意此處外掛的版本，不同es的版本，監控工具的安裝方式可能不一樣） 1. bigdesk 統計分析和圖表化elasticsearch的叢集資訊狀態

【系統學習SpringBoot】再遇Spring Data JPA之JPA應用詳解（自定義查詢及複雜查詢）

在此，對Spring Data Jpa做詳細的筆記（使用層面的，原理層日後再說哈哈。）一、Spring Data JPA設定建立方式：建立方式一共分為四種： #配置資料庫，使用SpringJPA spring: datasource:

Spring Data JPA之動態查詢

在日常工作中，Spring Data JPA的使用給我們帶來了極大的方便，但是實際業務中很多場景需要支援動態查詢。比如前端查詢功能提供了很多查詢條件，使用者可以根據一部分條件進行查詢，那麼後端就需要支援可配置的查詢服務。在使用mybatis等時，可以用動態查詢的方式輕鬆搞定，

Spring Data JPA 之 JpaRepository

JpaRepository是Spring提供的非常強大的基本介面。 1 JpaRepository 1.1 JpaRepository介面定義 JpaRepository介面的官方定義如下： public interface JpaRepos

Spring-data-jpa 之Specification in的用法

//根據競買人客戶名稱進行查詢 In<Long> in = cb.in(root.get(BailPay_.customerId)); if(customerName != null &am

Spring-Data-Redis之RedisTemplate的使用

上篇部落格是Spring-Data-Redis的例項，接著上篇的內容，這篇部落格介紹一下RedisTemplate的詳細方法。功能介紹大部分的使用者都喜歡用RedisTemplate，它相應的包是org.springframework

ORM框架 Mybatis、Hibernate、Spring Data JPA之到底該用誰，誰更牛*

在持久層框架中無可厚非的就是mybatis了，但是也會經常被人問到為啥要用mybatis，為啥不用hibernate，jpa。很多人各級都是地鐵爺爺看手機的表情，似乎從來沒想過這個問題。“公司叫用我就用了唄” 如果期望有好的發展我覺得我們應該學會知其然&知其所以然，這樣才會有自

深入淺出spring-data-elasticsearch之ElasticSearch架構初探(一).md

相關推薦