《elasticsearch》之讀寫資料

阿新 • • 發佈：2020-12-14

es 寫資料過程

1）客戶端選擇一個 node 傳送請求過去，這個 node 就是coordinating node（協調節點）。

2）coordinating node對 document 進行路由，將請求轉發給對應的 node（有 primary shard）。

3）node 上的主分片（primary shard）處理請求，然後將資料同步到複製分片（replica node)。

4）node報告成功到協調節點，協調節點再報告給客戶端。

es 讀資料過程

可以通過doc id來查詢，會根據doc id進行 hash，判斷出來當時把doc id分配到了哪個 shard 上面去，從那個 shard 去查詢。

1）客戶端傳送請求到任意一個 node，成為coordinate node。

2）coordinate node對doc id進行雜湊路由，將請求轉發到對應的 node，此時會使用round-robin隨機輪詢演算法，在primary shard以及其所有 replica 中隨機選擇一個，讓讀請求負載均衡。

3）接收請求的 node 返回 document 給coordinate node。

4）coordinate node返回 document 給客戶端。

es 搜尋資料過程

1）客戶端傳送請求到一個coordinate node。

2）協調節點將搜尋請求轉發到所有的 shard 對應的primary shard或replica shard，都可以。

3）query phase：每個 shard 將自己的搜尋結果（其實就是一些doc id）返回給協調節點，由協調節點進行資料的合併、排序、分頁等操作，產出最終結果。

4）fetch phase：接著由協調節點根據doc id去各個節點上拉取實際的document資料，最終返回給客戶端。

查詢階段：

（1）客戶端傳送一個 search（搜尋）請求給協調節點，協調節點建立了一個長度為 from+size 的空優先順序佇列。

（2）協調節點轉發這個搜尋請求到索引中每個分片的原本或副本。每個分片在本地執行這個查詢並且結果將結果到一個大小為 from+size 的有序本地優先佇列裡去。

（3）每個分片返回document的ID和它優先佇列裡的所有document的排序值給協調節點。協調節點把這些值合併到自己的優先佇列裡產生全域性排序結果。

取回階段：

（1）協調節點辨別出哪個document需要取回，並且向相關分片發出 GET 請求。

（2）每個分片載入document並且根據需要豐富（enrich）它們，然後再將document返回協調節點。

（3）一旦所有的document都被取回，協調節點會將結果返回給客戶端。

《elasticsearch》之讀寫資料

　　　　 es 寫資料過程 1）客戶端選擇一個 node 傳送請求過去，這個 node 就是coordinating node（協調節點）。

初識spark 之讀寫MySql資料

需求 1、使用spark讀取MySql庫資料； 2、使用spark讀取MySql庫資料，並寫入另一張表。

併發讀寫資料一致性保證（二）-MySQL

業務開發過程，其實就是使用者業務資料的處理過程，因而開發的核心任務就是維護資料一致不出錯。現實場景中，多個使用者會併發讀寫同一份資料（如秒殺），不加控制會翻車、加了控制則降低併發度，影響效能和使用者體

併發讀寫資料一致性保證（一）Java併發容器

淺談Python中的異常和JSON讀寫資料的實現

異常可以防止出現一些不友好的資訊返回給使用者，有助於提升程式的可用性，在java中通過try ... catch ... finally來處理異常，在Python中通過try ... except ... else來處理異常

使用FileStream讀寫資料

這節講一下使用FileStream讀寫資料，這是一個比較基礎的流。 FileStream類只能處理原始位元組，所以它可以處理任何型別的檔案。

spark-mongo(1 讀寫資料)

參考連結 MongoDB Connector for Spark官方文件 Mongo Spark 原始碼原文：https://www.jianshu.com/p/dbac491317cc

gorm CRUD:讀寫資料

操作的引數傳入基本都是結構體的指標，同時完成CURD後，指標指向的結構體資料也將隨著更新

基於Python的介面自動化實戰-基礎篇之讀寫配置檔案

引言在編寫介面自動化測試指令碼時，有時我們需要在程式碼中定義變數並給變數固定的賦值。為了統一管理和操作這些固定的變數，咱們一般會將這些固定的變數以一定規則配置到指定的配置檔案中，後續需要用到這些變數和

pyspark 針對Elasticsearch的讀寫操作

1.建立spark與Elasticsearch的連線為了對Elasticsearch進行讀寫操作，需要新增Elasticsearch的依賴包，其中，新增依賴包（org.elasticsearch_elasticsearch-spark-20_2.11-6.8.7.jar）有下面的三種方式：

原始碼分析：ReentrantReadWriteLock之讀寫鎖

簡介 ReentrantReadWriteLock 從字面意思可以看出，是和重入、讀寫有關係的鎖，實際上 ReentrantReadWriteLock 確實也是支援可重入的讀寫鎖，並且支援公平和非公平獲取鎖兩種模式。

python讀寫資料讀寫csv檔案(pandas用法)

python中資料處理是比較方便的，經常用的就是讀寫檔案，提取資料等，本部落格主要介紹其中的一些用法。Pandas是一個強大的分析結構化資料的工具集;它的使用基礎是Numpy(提供高效能的矩陣運算);用於資料探勘和資料分析

Sharding-JDBC之讀寫分離

技術標籤：Sharding-JDBCSharding-JDBC讀寫分離spring-bootmybatismycat 讀寫分離本文介紹SpringBoot使用Sharding-JDBC進行讀寫分離，廢話不多說，直接寫程式碼。

JUC之讀寫鎖：ReadWriteLock

技術標籤：java併發程式設計juclock 為什麼會存在讀寫鎖呢？ 1、因為synchronized粒度太大了，並不適合我們，可重入鎖的粒度相較於讀鎖（共享鎖）也較大，我們需要粒度小的鎖。 2、大部分場景下，讀不需要加鎖，

Spark開發-SparkSQL讀寫資料

SparkSQL資料讀寫 DataFrameReader DataFrameWriter DataFrameReader 對應的元件 SCHEMAOPTIONFORMAT

關於.net環境下跨程序、高頻率讀寫資料的問題

一、需求背景 1、最近專案要求高頻次地讀寫資料，資料量也不是很大，多表總共加起來在百萬條上下。

多執行緒之讀寫鎖

前言在java中，鎖lock是多執行緒程式設計的一個重要元件，可以說凡是涉及到多執行緒程式設計，執行緒安全這一塊就無法避開lock，進一步說就是所有的執行緒安全都是基於鎖實現的，只是從形式上分為隱式鎖和顯式鎖，

Java JUC併發之讀寫鎖

九、讀寫鎖 ReadWriteLock Read Lock 讀鎖（共享鎖）=> 允許多個執行緒一起讀讀的時候不允許寫操作

HDFS讀寫資料流程

HDFS寫資料流程資料寫入流程客戶端向namenode請求上傳檔案，namenode檢查目標檔案是否已存在，父目錄是否存在。

kafka 為什麼能那麼快？高效讀寫資料，原來是這樣做到的

1. 利用 Partition 實現並行處理　　我們都知道 Kafka 是一個 Pub-Sub 的訊息系統，無論是釋出還是訂閱，都要指定 Topic。

《elasticsearch》之讀寫資料

相關推薦