ES踩過的兩個坑

阿新 • • 發佈：2021-10-17

ElasticSearch偶爾查詢不到資料

現象：每次insert之後，立刻查詢es的資料是有可能查不到的，因為es從記憶體寫到磁碟需要時間

原因：es預設每1s執行一次refresh，因此文件實時性被提高到1s，這也是es被稱為近實時的原因

解決方法：寫的時候指定資料重新整理策略，request().setRefreshPolicy(RefreshPolicy.IMMEDIATE);

　　列舉org.elasticsearch.action.support.WriteRequest.RefreshPolicy定義了三種策略：

/**
 * Don't refresh after this request. The default.
  
*/
NONE,
/**
 * Force a refresh as part of this request. This refresh policy does not scale for high indexing or search throughput but is useful
 * to present a consistent view to for indices with very low traffic. And it is wonderful for tests!
 */
IMMEDIATE,
/**
 * Leave this request open until a refresh has made the contents of this request visible to search. This refresh policy is
 * compatible with high indexing and search throughput but it causes the request to wait to reply until a refresh occurs.
  
*/
WAIT_UNTIL;

每次查詢最大10000條

通過資料的查閱,發現預設值是10000,如果要查詢大於10000條,我們就需要修改es的max_result_window預設值

解決方法：我們在建立索引的時候設定："index.max_result_window": "10000", 這個值預設一萬，我們可以改成自己想要的值

也可以使用ES的Scroll滾動查詢

ES效能優化

1. 因為ES不能改變分片數量，所以建立索引的時候要指定好分片數量

ES 預設為一個索引建立 5 個主分片, 並分別為每個分片建立一個副本分片。

解決辦法：合理的分片數量可以提高寫入效能和穩定性。

　　分片數可以理解為MySQL中的分庫分表

　　ES查詢主要分為兩類：單ID查詢以及分頁查詢。

　　分片數越大，叢集橫向擴容規模也更大，根據分片路由的單ID查詢吞吐量也能大大提升，但聚合的分頁查詢效能則將降低；

　　分片數越小，叢集橫向擴容規模也更小，單ID的查詢效能也會下降，但分頁查詢的效能將會提升。

2、避免深分頁查詢ES叢集的分頁查詢支援from和size引數，

　　查詢的時候，每個分片必須構造一個長度為from+size的優先佇列，

　　然後回傳到閘道器節點，閘道器節點再對這些優先佇列進行排序找到正確的size個文件。

　　假設在一個有6個主分片的索引中，from為10000，size為10，每個分片必須產生10010個結果，

　　在閘道器節點中匯聚合併60060個結果，最終找到符合要求的10個文件。

　　由此可見，當from足夠大的時候，就算不發生OOM，也會影響到CPU和頻寬等，從而影響到整個叢集的效能。

　　所以應該避免深分頁查詢，儘量不去使用。

解決辦法：也可以使用ES的Scroll滾動查詢

ES踩過的兩個坑

ElasticSearch偶爾查詢不到資料現象：每次insert之後，立刻查詢es的資料是有可能查不到的，因為es從記憶體寫到磁碟需要時間

Java日常開發的21個坑，你踩過幾個？

前言最近看了極客時間的《Java業務開發常見錯誤100例》，再結合平時踩的一些程式碼坑，寫寫總結，希望對大家有幫助，感謝閱讀~

顛覆認知——Redis會遇到的15個「坑」，你踩過幾個？

大家好，我是 Kaito。這篇文章，我想和你聊一聊在使用 Redis 時，可能會踩到的「坑」。

那些年，我們踩過的 Java 坑

那些年，我們踩過的 Java 坑 1.物件比較方法 JDK1.7提供的Objects.equals方法，非常方便地實現了物件的比較，有效地避免了繁瑣的空指標檢查。

JMeter分散式測試中踩過的那些坑

最近因為專案需要，研究了效能測試的相關內容，並且最終選用了jmeter這一輕量級開源工具。因為一直使用jmeter的GUI模式進行指令碼設計，到測試執行階段工具本身對資源的過量消耗給效能測試帶來了瓶頸，一般

淺談Java list.remove( )方法需要注意的兩個坑

list.remove 最近做專案的過程中，需要用到list.remove()方法，結果發現兩個有趣的坑，經過分析後找到原因，記錄一下跟大家分享一下。

談談使用Iterator操作集合的時候踩的幾個坑

目錄ConcurrentModificationExceptionUnsupportedOperationException移除指定數值 ConcurrentModificationException

Python 多程序踩過的一些坑

spawn fork 和 forkserver fork 最快但是fork處理檔案的時候有一些問題，如果需要利用mp.Manager().Queue()交換資料的情況，可能會發生死鎖，死鎖機制未找到To Do.

linux centos6 踩過的巨坑成功安裝python3.7

技術標籤：python django從入坑到爬出來pythonlinuxcentos 一、下載對應版本下載連結：https://www.python.org/ftp/python/ 官網太慢，含淚2天下載下來（Python-3.7.3.tgz 官網不知道怎麼不讓傳這個資源了，下載

springboot 單元測試使用 @value讀取不到值, yml的兩個坑

技術標籤：springbootspring bootjava yml兩個坑 yml 和 properties都可以作為配置檔案在springboot專案中使用

微信小程式開發之你可能沒有踩過的神坑總結

目錄getApp()在頁面入口檔案頂部定義變數你不知道的 wx.createSelectorQuery() and wx.createIntersectionObserver();總結getApp()

MySql 5.7安裝（隨機密碼，修改預設密碼）兩個坑

MySql 5.7安裝（隨機密碼，修改預設密碼）兩個坑 MySql 5.7安裝下載了MySql 5.7，安裝的過程中，發現了很多新特性

httpx的兩個坑(httpx.ReadTimeout; SSL: CERTIFICATE_VERIFY_FAILED)

關於python非同步網路請求庫httpx的兩個坑其一：httpx.ReadTimeout 實測發現，網路不穩定的情況下，極其容易出現該錯誤。

彙總PyTorch踩過的10個坑

技術標籤：深度學習 Pytorch中的交叉熵 Pytorch的交叉熵nn.CrossEntropyLoss在訓練階段，裡面是內建了softmax操作的，因此只需要喂入原始的資料結果即可，不需要在之前再新增softmax層。這個和tensorflow的tf.so

flask + selenium啟動時每次都開啟兩個瀏覽器的原因及解決辦法，踩坑日記~~~

剛開始我的flask是這樣的，每次啟動flask時都會開啟兩個瀏覽器，但是隻用一個瀏覽器，很奇怪

我用kafka兩年踩過的一些非比尋常的坑

前言我的部落格我的上家公司是做餐飲系統的，每天中午和晚上用餐高峰期，系統的併發量不容小覷。為了保險起見，公司規定各部門都要在吃飯的時間輪流值班，防止出現線上問題時能夠及時處理。

8種經常被忽視的SQL錯誤用法，你有沒有踩過坑？

1、LIMIT 語句分頁查詢是最常用的場景之一，但也通常也是最容易出問題的地方。比如對於下面簡單的語句，一般 DBA 想到的辦法是在 type,name,create_time 欄位上加組合索引。這樣條件排序都能有效的利用到索引，效能

pyinstaller打包程式exe踩過的坑

基礎環境 python 2.7.17 pyinstaller 3.5 安裝pyinstaller pip install pyinstaller 坑，大坑，深坑

微信分享invalid signature簽名錯誤踩過的坑

前一段時間做了一個微信分享的東西，而且前端框架用的是VUE，被這個東西快折磨瘋了，一個列表頁，一個詳情頁，分享詳情頁的時候，會報錯invalid signature簽名錯誤。

詳解springboot整合ueditor踩過的坑

有一天老闆突然找我讓我改富文字（一臉懵逼，不過也不能推啊默默地接下了），大家都知道現在的富文字視訊功能都是隻有上傳連結的沒有從本地上傳這一說（就連現在的csdn的也是）於是我找了好多個，最終發現百度的uedi

ES踩過的兩個坑

ElasticSearch偶爾查詢不到資料

每次查詢最大10000條

ES效能優化

相關推薦