【ElasticSearch】線上索引重建

阿新 • • 發佈：2021-06-10

專案背景：

　　1.由於專案中存在舊索引設定不合理情況，需要進行索引重建

　　2.線上的ElasticSearch由1臺擴容到3臺，原有的索引需要分片

　　例如：

　　舊索引 index_user 設定主分片為1，副分片為0，資料沒有高可用

GET index_user/_search

{
  "took" : 121,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  }

實現步驟：

　　1.新建索引，index_user_v2設定我們所需要的主分片和副分片數量

PUT index_user_v2
{
  "settings": {
    "number_of_replicas": 1,
    "number_of_shards": 5
  }
}

　　2.設定索引資料結構,因為新索引和舊索引mapping結構一致，索引可以直接copy舊索引的資料結構；

PUT index_user_v2/t_user/_mappings
{
  "properties": {
    "age": {
      "type": "integer"
    },
    "ageScope": {
      "type": "keyword"
    },
     
"birthday": {
      "type": "long"
    },
    "cityId": {
      "type": "integer"
    },
    "cityName": {
      "type": "keyword"
    },
    "countryCode": {
      "type": "integer"
    },
    "countyId": {
      "type": "integer"
    },
    "create_time": {
      "type": "long"
    },
    "dbId": {
       
"type": "long"
    },
    "email": {
      "type": "keyword"
    },
    "gameIds": {
      "type": "text",
      "analyzer": "ik_max_word"
    },
    "isCreateServer": {
      "type": "integer"
    },
    "isDelete": {
      "type": "boolean"
    },
    "nickName": {
      "type": "text",
      "analyzer": "ik_smart"
    },
    "nickNamePingYin": {
      "type": "text",
      "analyzer": "pinyin"
    },
    "nnNumber": {
      "type": "long"
    },
    "provinceId": {
      "type": "integer"
    },
    "provinceName": {
      "type": "keyword"
    },
    "sex": {
      "type": "keyword"
    },
    "signature": {
      "type": "keyword"
    },
    "status": {
      "type": "keyword"
    },
    "telNum": {
      "type": "keyword"
    },
    "updae_time": {
      "type": "long"
    },
    "userId": {
      "type": "long"
    },
    "userType": {
      "type": "keyword"
    },
    "userUrl": {
      "type": "keyword"
    },
    "userUrlNn": {
      "type": "keyword"
    },
    "user_id": {
      "type": "long"
    }
  }
}

　　3. 執行完步驟1和步驟2之後，在Kibana->Monitoring->Node裡面可以看到索引index_user_v2已經被自動分片到三個節點，如圖

　　這裡，正式開始索引重建之前，可以將index_user_v2的副分片數量設定為0，減少副分片寫入帶來的時間損耗

　　PUT index_user_v2/_settings
　　{
  　　"settings": {
   　　 "number_of_replicas": 0
  　　}
　　}

　　　4.執行索引遷移，將index_user上的資料複製到index_user_v2, 同時設定wait_for_completion=false 表示索引遷移的請求會在後臺執行

# 索引遷移
POST /_reindex?wait_for_completion=false
{
  "source": {
    "index": "index_user"
  },
  "dest": {
    "index":"index_user_v2"
  }
}

　　執行後，會生成一個taskId ：例如：Mroifc1NSJq2s7mf38XxmA:1679363718，後續我們可以使用這個taskId去查詢這個遷移任務的狀態，耗時，以及執行的進度等等

GET _tasks/Mroifc1NSJq2s7mf38XxmA:1679363718

{
  "completed" : true,
  "task" : {
    "node" : "Mroifc1NSJq2s7mf38XxmA",
    "id" : 1679363718,
    "type" : "transport",
    "action" : "indices:data/write/reindex",
    "status" : {
      "total" : 15480531,
      "updated" : 0,
      "created" : 15480531,
      "deleted" : 0,
      "batches" : 15481,
      "version_conflicts" : 0,
      "noops" : 0,
      "retries" : {
        "bulk" : 0,
        "search" : 0
      },
      "throttled_millis" : 0,
      "requests_per_second" : -1.0,
      "throttled_until_millis" : 0
    },
    "description" : "reindex from [index_user] to [index_user_v2]",
    "start_time_in_millis" : 1623316057822,
    "running_time_in_nanos" : 594661905143,
    "cancellable" : true,
    "headers" : { }
  },
  "response" : {
    "took" : 594661,
    "timed_out" : false,
    "total" : 15480531,
    "updated" : 0,
    "created" : 15480531,
    "deleted" : 0,
    "batches" : 15481,
    "version_conflicts" : 0,
    "noops" : 0,
    "retries" : {
      "bulk" : 0,
      "search" : 0
    },
    "throttled" : "0s",
    "throttled_millis" : 0,
    "requests_per_second" : -1.0,
    "throttled_until" : "0s",
    "throttled_until_millis" : 0,
    "failures" : [ ]
  }
}

　　　　5.任務完成後　　

　　　　將舊索引index_user的別名index_user_latest 移除

　　　　新索引index_user_v2新增別名index_user_latest

　　　　至此完成全部的索引重建任務

# 別名替換
POST _aliases
{
  "actions": [
    {
      "add": {
        "index": "index_user_v2",
        "alias": "index_user_latest"
      }
    },
    {
      "remove": {
        "index": "index_user",
        "alias": "index_user_latest"
      }
    }
  ]
}

事後思考：

　　1.執行_reindex索引遷移時，會讀取當前index_user舊索引的數量15480602條資料，將這批資料複製到新索引index_user_v2中

　　但是實際生產會持續寫資料到舊索引index_user中，導致reindex複製的資料，會略小於實際的資料量

　　處理方式：該索引的資料是StreamSet實時同步MySQL的資料到ElasticSearch中，這裡可以將StreamSet停止，記錄複製開始的時間，待複製完成後進行資料的增量同步；

　　2.這裡有個點可以優化，_reindex複製後，wait_for_completion=false 會生成任務，可以將任務Id寫入定時任務中，輪訓該任務的狀態，任務結束後，可以及時通知；

【ElasticSearch】線上索引重建

專案背景：　　1.由於專案中存在舊索引設定不合理情況，需要進行索引重建

【ElasticSearch】win10 安裝elasticSearch 6.6.1

一、安裝ElasticSearch 前提：安裝相應的java環境 1、下載ElasticSearch6.6.1版本　　https://www.elastic.co/cn/downloads/elasticsearch#ga-release

【ElasticSearch】安裝

【ElasticSearch】安裝 ===================================================== 1、許可證 xpack 2、配置 ElasticSearch

【 React】線上預覽word,pdf,docx格式的檔案

業務需求：h5連結展示一個檢查專案的知情同意書，第三方介面返回是一個docx檔案連結，需要以彈框的形式展示在手機上，

【Elasticsearch】elasticsearch 磁碟相關常用配置

“cluster.routing.allocation.disk.threshold_enabled” : false cluster.routing.allocation.disk.watermark.low：控制磁碟使用的低水位。預設為85%，意味著如果節點磁碟使用超過85%，則ES不允許在分配新

【Elasticsearch】之中文分詞器ik

技術標籤：Elasticsearch 應用筆記elasticsearcheselk 安裝分詞外掛ik mkdir plugins/ik cp elasticsearch-analysis-ik-6.5.4.zip plugins/ik

【Elasticsearch】之基本使用（二）

技術標籤：Elasticsearch 應用筆記elasticsearchelk 全文搜尋兩個最重要的方面是：相關性（Relevance）它是評價查詢與其結果間的相關程度，並根據這種相關程度對結果排名的一種能力，這種計算方式可以是 TF/ID

【elasticsearch】——用ILM策略自動完成冷熱資料分離【轉】

原文連結：https://blog.csdn.net/weixin_40449300/article/details/106034912 一、前言從Elastic Stack 迎來 6.6 版本後，就增加了ILM生命週期管理的功能。下面我們從以下幾個方面來分析：

【ElasticSearch】（三、常見方法總結）

前言：演示版本為7.6.1 一、SpringBoot整合ElasticSearch 1. 新增檔案ElasticSearchConfig package com.tm.es.config;

【ElasticSearch】service啟動流程

技術標籤：大資料相關elasticsearch 目錄 Es啟動流程mainexecuteinit Es啟動流程 main 啟動方法是org.elasticsearch.bootstrap.Elasticsearch.main，程式碼如下：

Windows環境下搭建【ElasticSearch】

ElasticSearch，簡稱ES，是一個基於Lucene的分散式全文搜尋伺服器，和SQL Server的全文索引（Fulltext Index）有點類似，都是基於分詞和分段的全文搜尋引擎，具有分詞，同義詞，詞幹查詢的功能，但是ES天生具有分散

【Elasticsearch】Query DSL

技術標籤：程式園 Elasticsearch提供了基於JSON的完整查詢DSL（特定於域的語言）來定義查詢。將查詢DSL視為查詢的AST（抽象語法樹），它由兩種子句組成：

【ElasticSearch】給ElasticSearch資料庫配置慢查詢日誌

給ElasticSearch引擎配置慢查詢日誌，可以實時監控搜尋過慢的日誌。雖然ElasticSearch以快速搜尋而出名，但隨著資料量的進一步增大或是伺服器的一些效能問題，會有可能出現慢查詢的情況。慢查詢日誌可以幫助你快速定

【轉】mysql索引型別

原文：https://www.cnblogs.com/luyucheng/p/6289714.html ------------------------------------- 一、簡介

【ElasticSearch】叢集搭建

叢集名稱：YCXESClusterName主節點名稱：YCXESNodeMaster 192.168.1.35從節點名稱：YCXESNodeSlave192.168.1.36

【ElasticSearch】指令碼欄位script

【ElasticSearch】指令碼欄位script https://www.elastic.co/guide/en/elasticsearch/reference/7.14/modules-scripting.html

【INDEX】Postgresql索引介紹

索引訪問方法介紹支援的索引 mydb=# select * from pg_am; oid | amname | amhandler | amtype

【ElasticSearch】踩坑對terms的buckets進行bucket_sort排序

【ElasticSearch】踩坑對terms的buckets進行bucket_sort排序 1.需求和實現選出可用性最高的前15個數據展示：

【ElasticSearch】踩坑關於bulk操作報錯

【ElasticSearch】踩坑關於bulk操作報錯 1.問題想要執行批量插入操作 POST /customer/external/_bulk

【ElasticSearch】script中進行比較，date型別轉為long型

1.需求選出前5條當前響應時間最大的url資料 2.實現用key_id分組url，在內部選出最大taskFinishTime那條資料，根據其responseTime進行排序。

【ElasticSearch】線上索引重建

相關推薦