ElasticSearch優化方式

阿新 • • 發佈：2019-10-03

ES每個分片是一個Lucence例項，所以分片數量不應過多。但是分片數一旦設定好就不能修改，如果設定過少等資料量上去後不能擴容，這時可以考慮增加索引庫的方式來增加分片數。比如一個索引庫設定20個分片，增加一個索引庫就等於增加了20個分片。應用程式如何知道增加了索引庫呢？這時需要用到ES的別名功能，將一個別名對映到多個實際的索引庫，而應用程式使用別名即可，別名對映的實際索引庫可以動態修改而對應用程式透明。
可以從這幾個方面來觀測ES的效能指標：
- cpu消耗
- 記憶體消耗
- 磁碟io和網路io
- jvm的gc情況
- es的各個執行緒池和佇列的負荷
Elasticsearch 需要使用大量的堆記憶體, 而 Lucene 則需要消耗大量非堆記憶體 (off-heap)。推薦給 ES 設定本機記憶體的一半, 如32G 記憶體的機器上, 設定 -Xmx16g -Xms16g ，剩下的記憶體給 Lucene 。
如果不需要對分詞字串做聚合計算（例如，不需要 fielddata ）可以考慮降低堆記憶體。堆記憶體越小，Elasticsearch（更快的 GC）和 Lucene（更多的記憶體用於快取）的效能越好。
針對io高的優化方式：
- 儘量保證一個分片只落在一個硬碟上面，這樣不用跨磁碟讀寫
- 檢查mapping，es預設會將所有欄位寫入_all欄位，如果實際業務不需要可以關閉，減少儲存空間
- 同樣的，如果不需要儲存原始資料，可以關閉_source，或者只設置某些必要欄位的store屬性 store:true
- 查詢時只返回必要的資料
- 採用_doc排序可以依賴lucence內部id排序，提高排序速度

注意防止腦裂：

discovery.zen.minimum_master_nodes > = ( master 候選節點個數 / 2) + 1

如果有節點掛掉，不要急於恢復叢集導致分片資料的大量複製和傳輸，應儘量等節點自己恢復：

gateway.recover_after_nodes: 8 # 等待叢集至少存在 8 個節點 後才能進行資料恢復
gateway.expected_nodes: 10
gateway.recover_after_time: 5m # 等待 5 分鐘，或者 10 個節點上線後，才進行資料恢復，這取決於哪個條件先達到

升級的過程因為需要關閉節點再重啟，這時也要防止es自動恢復的操作：
- 可能的話，停止索引新的資料
- 禁止分片分配，這樣es不會自動平衡缺失的分片：
  - ```
  PUT /_cluster/settings
      {
          "transient" : {
              "cluster.routing.allocation.enable" : "none"
          }
      }
```
- 這時關閉節點，升級好後再加入叢集，然後重啟分片分配即可：
  - "cluster.routing.allocation.enable" : "all"
可以考慮在ES前面加一個kafka之類的訊息快取，防止資料量的瞬間暴增對es

ElasticSearch優化方式

ES每個分片是一個Lucence例項，所以分片數量不應過多。但是分片數一旦設

elasticsearch索引資料寫入效能優化方式

1、用bulk批量寫入你如果要往es裡面灌入資料的話，那麼根據你的業務場景來，如果你的業務場景可以支援讓你將一批資料聚合起來，一次性寫入es，那麼就儘量採用bulk的方式，每次批量寫個幾百條這樣子。 bulk批量寫入的效能比你一條一條寫入大量的document的效能要好很多。但是如果要知道一個

mysql數據優化方式

mysql 數據優化 1、選取最適用的字段屬性MySQL可以很好的支持大數據量的存取，但是一般說來，數據庫中的表越小，在它上面執行的查詢也就會越快。因此，在創建表的時候，為了獲得更好的性能，我們可以將表中字段的寬度設得盡可能小。例如，在定義郵政編碼這個字段時，如果將其設置為CHAR(255),顯然給數

冒泡排序--兩種優化方式

元素下標 [0 void 臨時變量 [] cnblogs 數組下標 blog 原始版本 void bubble_sort(int arr[],int n){ int tmp; for (int i = 0; i < n; ++i)

007-elasticsearch【一】概述、Elasticsearch 訪問方式、Elasticsearch 面向文檔、常用概念

rep ati -- 結構化沒有 class 標識副本 concepts 一、概述　　Elasticsearch 是一個開源的搜索引擎，建立在一個全文搜索引擎庫 Apache Lucene™ 基礎之上。　　Elasticsearch 也是使用 Jav

elasticsearch優化

arc delet url ces pre code acc ice 8.0 [toc] 1、刪除歷史索引導出所有的索引 curl -u USER:PASSWORD http://IP:9200/_cat/indices?v > indices.2014

Cookie常用的優化方式

coo mil use 常用速度 key-value path serve 靜態資源　　我們知道，對於每一個http請求，無論是動態的網頁aspx，還是jsp，還是/user/add這種MVC模式的URL，還是CSS或者JS文件，每一個http請求都會帶著在硬盤上存有的

elasticsearch優化總結

一、硬體環境選擇：如果有條件，儘可能使用SSD硬碟，不錯的CPU。ES的厲害之處在於ES本身的分散式架構以及lucene的特性。IO的提升，會極大改進ES的速度和效能。二、系統拓樸設計： ES叢集在架構拓樸時，一般都會採用Hot-Warm的架

Elasticsearch 優化

Elasticsearch是一個基於Lucene的搜尋伺服器，其搜尋的核心原理是倒排索引，今天談下在日常專案中使用它遇到的一些問題及優化解決辦法。一. 搜尋的深度分頁問題在日常專案中，經常會有分頁搜尋並支援跳頁的需求，類似百度、Google搜尋那樣，使用ES進行這類需求的搜尋時一般採用from/siz

elasticsearch優化系列-不能亂改的配置-官網原文

在 Elasticsearch 中有一些熱點，人們可能不可避免的會碰到。我們理解的，所有的調整就是為了優化，但是這些調整，你真的不需要理會它。因為它們經常會被亂用，從而造成系統的不穩定或者糟糕的效能，甚至兩者都有可能。

hivesql 優化方式

在sql查詢中為了提高查詢效率，我們常常會採取一些措施對查詢語句進行sql優化，下面總結的一些方法，有需要的可以參考參考。 1.對查詢進行優化，應儘量避免全表掃描，首先應考慮在 where 及 order by 涉及的列上建立索引。 2.應儘量避免在 where 子句中對欄位進行 null

一個優秀的java程式設計師，你需要知道的10個程式碼優化方式！

程式碼優化不息以來都是一個軌範員經常要掛在嘴邊的一個詞,特別是對付如今軌範員越來越普及,網上教程一大把的時代,良多軌範員寫出的程式碼都是為了了局而寫程式碼,從來不去考慮程式碼的優化問題,如許的程式碼拿去應聘也是非常虧損的,程式碼的優化可以直接浮現出來一個軌範員的根基功以及可塑性. 而程式碼

MapReduce的資料傾斜及其優化方式

@Author : Spinach | GHB @Link : http://blog.csdn.net/bocai8058 MapReduce的資料傾斜和解決方式資料傾斜根據MapReduce的執行流程以發現，在map端是不會產生資料傾斜的，

hibernate級聯查詢執行n+1次sqlt語句問題（內含解決辦法，優化方式）

如果當SQL資料庫中select語句數目過多，就會影響資料庫的效能，如果需要查詢n個Customer物件，那麼必須執行n+1次select查詢語句，下文就將為您講解這個n+1次select查詢問題。在Session的快取中存放的是相互關聯的物件圖。預設情況下，

MNIST手寫數字識別（二）幾種模型優化方式介紹

本篇的主要內容有：動態衰減法設定可變學習率為損失函式新增正則項滑動平均模型介紹為了讓MNIST數字識別模型更準確，學習幾種常用的模型優化手段：學習率的優化學習率的設定一定程度上也會影響模型的訓練，如果學習率過小，那麼將會經過很長時間才會收斂到想要

常見sql語句效率優化方式

首先介紹幾條優化原則：儘量避免where中包含子查詢； where條件中，過濾量最大的條件放在where子句最後；採用繫結變數有助於提高效率；在索引列上使用計算、改變索引列的型別、在索引列上使用!=將放棄索引；

處理瀏覽器端長時間執行JavaScript指令碼的兩種優化方式：定時器和worker

第一種：定時器方式，把長時間的任務進行分割成一個數組，間隔一定的時間執行。 function timeProcessArray(items, process, callBack) { let todo = items.concat() setTimeout(function () {

氣泡排序及兩種優化方式

定義：每一趟依次比較相鄰的兩個數，將小數放在前面，大數放在後面，直到一趟只剩下一個元素。時間複雜度:O（n^2）。氣泡排序是最常用的小型資料排序方式，下面是用C語言實現的，及其兩種優化方式。第一種優化方式是設定一個標記位來標記是否發生了交換，如果沒有發生交換就提前結

Oracle優化器的優化方式和優化模式

Oracle在執行一個SQL之前,首先要分析一下語句的執行計劃,然後再按執行計劃去執行。分析語句的執行計劃的工作是由優化器(Optimizer) 來完成的。不同的情況,一條SQL可能有多種執行計劃,但在某一時點,一定只有一種執行計劃是最優的,花費時間是最少的。相信你一定會用Pl/sql Developer、T

spark 向elasticsearch 優化寫入資料

一、前言近期有個專案用spark向es(版本5.x)寫入資料，該專案是離線任務，每天建立一個index存資料，隨著資料量的增大(2億+，峰值有5億+)。效能出現問題：寫入時間過長，es響應不過來等二、調整策列 1.由於該專案是離線任務，並不是需要實時

ElasticSearch優化方式

相關推薦