Elasticsearch使用MultiGet批量獲取文件與使用Bulk批量操作

阿新 • • 發佈：2019-02-10

Multi Get 批量獲取

Multi Get API可以通過索引名、型別名、文件id一次得到一個文件集合，文件可以來自同一個索引庫，也可以來自不同的索引庫。

GET /_mget
{
  "docs":[
     {
        "_index": "lib",
        "_type": "user",
        "_id": "1"
     },
     {
        "_index": "lib",
        "_type": "user",
        "_id": "2"
     },
     {
        "_index": "lib" 
,
        "_type": "user",
        "_id": "3"
     }
  ]
}

//可以指定具體的欄位
GET /_mget
{
  "docs":[
     {
        "_index": "lib",
        "_type": "user",
        "_id": "1",
        "_source": "interests"
     },
     {
        "_index": "lib",
        "_type": "user",
        "_id": "2",
        "_source" 
: {"age","interests"}
     }
  ]
}

//獲取同索引同類型下的不同文件
GET /lib/user/_mget
{
  "docs":[
     {
        "_id": "1"
     },
     {
        "_type": "user", //若是指定索引和型別必須和請求頭上的保持一致，否者將會報錯。
        "_id": "2"
     }
  ]
}
//也可以使用下面這種更為簡化的寫法
GET /lib/user/_mget
{
  "ids":["1","2"]
}

Bulk 批量操作

bulk的格式：
{action:{metadata}}\n
{requstbody}\n (請求體)

action：(行為)，包含create（文件不存在時建立）、update（更新文件）、index（建立新文件或替換已用文件）、delete（刪除一個文件）。
create和index的區別：如果資料存在，使用create操作失敗，會提示文件已存在，使用index則可以成功執行。
metadata：(行為操作的具體索引資訊)，需要指明資料的_index、_type、_id。

示例：

{"delete":{"_index":"lib","_type":"user","_id":"1"}}

批量新增

POST /lib2/books/_bulk
{"index":{"_id":1}}  \\行為：索引資訊
{"title":"Java","price","55"} \\請求體
{"index":{"_id":2}}
{"title":"Html5","price","45"}
{"index":{"_id":3}}
{"title":"Php","price","35"}`
{"index":{"_id":4}}
{"title":"Python","price","50"}

//返回結果
{
  "took": 60,
  "error": false //請求是否出錯，返回false、具體的錯誤
  "items": [
     //操作過的文件的具體資訊
     {
        "index":{
           "_index": "lib",
           "_type": "user",
           "_id": "1",
           "_version": 1,
           "result": "created", //返回請求結果
           "_shards": {
              "total": 1,
              "successful": 1,
              "failed": 0
           },
           "_seq_no": 0,
           "_primary_trem": 1
           "status": 200
        }
    }, 
    ... 
  ]
}

批量刪除
刪除的批量操作不需要請求體

POST /lib/books/_bulk
{"delete":{"_index":"lib","_type":"books","_id":"4"}} //刪除的批量操作不需要請求體
{"create":{"_index":"tt","_type":"ttt","_id":"100"}}
{"name":"lisi"} //請求體
{"index":{"_index":"tt","_type":"ttt"}} //沒有指定_id，elasticsearch將會自動生成_id
{"name":"zhaosi"} //請求體
{"update":{"_index":"lib","_type":"books","_id":"4"}} //更新動作不能缺失_id，文件不存在更新將會失敗
{"doc":{"price":58}} //請求體

bluk一次最大處理多少資料量
bulk會將要處理的資料載入記憶體中，所以資料量是有限的，最佳的資料兩不是一個確定的資料，它取決於你的硬體，你的文件大小以及複雜性，你的索引以及搜尋的負載。

一般建議是1000-5000個文件，大小建議是5-15MB，預設不能超過100M，可以在es的配置檔案（即$ES_HOME下的config下的elasticsearch.yml）中，bulk的執行緒池配置是核心數+1。

bulk批量操作的json格式解析
bulk的格式：
{action:{metadata}}\n
{requstbody}\n (請求體)

不用將其轉換為json物件，直接按照換行符切割json，記憶體中不需要json文字的拷貝。
對每兩個一組的json，讀取meta，進行document路由。
直接將對應的json傳送到node上。

為什麼不使用如下格式：

[{"action":{},"data":{}}]

這種方式可讀性好，但是內部處理就麻煩；耗費更多記憶體，增加java虛擬機器開銷：

將json陣列解析為JSONArray物件，在記憶體中就需要有一份json文字的拷貝，寧外好友一個JSONArray物件。
解析json數組裡的每個json，對每個請求中的document進行路由。
為路由到同一個shard上的多個請求，建立一個請求陣列。
將這個請求陣列序列化。

Elasticsearch使用MultiGet批量獲取文件與使用Bulk批量操作

Multi Get 批量獲取 Multi Get API可以通過索引名、型別名、文件id一次得到一個文件集合，文件可以來自同一個索引庫，也可以來自不同的索引庫。 GET /_mget { "docs":[ { "_index

Elasticsearch批量獲取文件

elasticsearch批量獲取文件使用es提供的Multi Get API實現獲取指定的一系列id的文件列表 #獲取指定的一系列id的文件列表 GET /_mget { "docs":[ { "_index":"lib",

Linux 按時間批量刪除文件（刪除N天前文件）

die shel 條件天前 fin dicom sort 目錄下的文件 -exec 需要根據時間刪除這個目錄下的文件，/home/lifeccp/dicom/studies，清理掉20天之前的無效數據。可以使用下面一條命令去完成： find /home/life

java多線程批量讀取文件(七)

object pack execute st3 mem cut eureka rgs ring 新公司入職一個多月了，至今沒有事情可以做，十來個新同事都一樣抓狂，所以大家都自己學習一些新東西，我最近在看zookeeper，感覺蠻不錯的，和微服務的zuul以及eureka功能

android makefile文件批量拷貝文件的方法

-m 批量 mod font ring div 復制 -s packages 該方法是shell 和makefile組合使用 wallpapers := $(shell ls packages/apps/hyst_apps/NewBingoLauncher_C/defa

Python超簡單批量改文件後綴

radio 路徑 tdi for rename python blog 當前 dir 1 import os 2 3 files = os.listdir("D:\QTDownloadRadio\QTDownloadRadio - 副本")#列出當前目錄下所有的文

關於linux系統下批量修改文件名和後綴

linux 字符串總會遇到遇到處理文件的問題，比如文件後綴修改，以前都是寫shell，後來發現有個更簡單的方法rename1，在centos 下是用c 寫的 rename用法: a.txt 修改為 a.cc rename txt cc *.txt

批量讀文件為一個String（一個文件夾下的大量xml文件）

net family lin port title enc window blank bst String folder = "/nasapp/datamerger/xmls/ " ; File file = new File(folder);

Linux下批量修改文件名（rename）

批量修改 rename1.rename命令批量修改文件名, 其實Linux下可以使用別的辦法來批量修改文件名, 不過rename實在太方便了比如把所有的表為cdb1_* 修改為cdb_*的在本目錄下只需要# rename ‘cdb1‘ ‘cdb‘ *以前都是寫個for循環來做...想想多傻啊, 呵呵ren

shell遍歷多個文件夾並進行批量修改文件名

多個 hang img style 問題 abc 修改文件 jpg 圖片問題：將圖片名中的ing_變為0。當前目錄下：$ ls pic，change_name.sh pic/ |__kk1/ |__img_001.jpg

python 多線程批量傳文件

close utf pen 1.3 ems pan time target main #!/usr/bin/env python #_*_ coding:utf-8 -*-#autho:leiyong#time:2017-06-05#version: 1.3 impor

BAT-批量改文件後綴名

ont strong gen 打不開雙擊 txt 現象 mil 問題處理問題現象：在處理一個目錄時，發現JPG文件都是以TMP文件命名的。雙擊打不開。要手動改一個為JPG。問題處理： 1.新建一個TXT文件，內容寫如下： ren *.tmp *.jpg 2.把

批量更改文件名

shell需求：找到/123目錄下所有後綴名為.txt的文件批量修改.txt為.txt.bak把所有.bak文件打包壓縮為123.tar.gz批量還原文件的名字，即把增加的.bak再刪除參考答案#!/bin/bash##查找txt文件find /123 -type f -name “*.txt” > /

shell腳本批量替換文件名和文件的內容

sed rename 方法1：這兩天在做ｃａｍｅｒａ　ｂｒｉｎｇｕｐ的時候,需要添加ｃｈｒｏｍａｔｉｃ文件，由於有需要太多的文件裏面的內容進行替換,手工一個個改文件配置有點不太實際,所以google了一下,找到批量替換文件內容的好方法,命令結構如下:grep "被替換的字符串" * -R | awk

用python批量修改文件名

tdi pan names 工廠 name list 格式工廠獲取文件 out 從youtube上當下來百來首mv，每個都需要去掉視頻，這還挺好弄得，格式工廠一弄就完了，但是文件名，都帶有亂七八糟的*啥的巴拉巴拉的，咋修改啊，幾百首總不可能一個一個rename吧 1

Linux下批量替換文件內容和文件名（轉）

lan 其中 xargs ava 提取 pat 內容文件內容 nbsp 1、批量替換指定多個文件的文件內容在指定目錄/your/path裏，查找包含old_string字符串的所有文件，並用new_string字符串替換old_string字符串。 sed -i

Python3 寫的遠程批量修改文件內容的腳本

tde sts readline imp 主機 ati strip 遠程調用一、說明： 1、利用Python的paramiko模塊，調用遠程的shell命令去修改相應文件。 2、有一個專用配置文件，列出服務器清單。 3、Python循環讀取配置文件的服務器IP去連接它，

python小練習02 批量修改文件名

... 練習 inf replace bubuko 修改文件名文件名 listdir blog 在學到修改文件名的時候想到自己下載的小說名字有點長，在手機上看時只顯示前面的世紀百強...看著不怎麽舒服，所以就想學以致用把名字改短一點。下面這樣圖就修改前的樣子

Quartus II管腳批量分配文件（.tcl）格式

pin 分享圖片 div 格式 location 分享 http package oca 1 package require ::quartus::project 2 3 set_location_assignment PIN_E1 -to clk 4 set

shell腳本批量修改文件名後綴的腳本

don 新的什麽操作原因 code 修改修改文件 chmod 實驗素材：[root@sv7 test]# ls //此目錄下包含全是 .txt結尾的文件，要求全部換成 .doc結尾1.txt 2.txt 3.txt 4.txt 5.txt 編寫腳本[r

Elasticsearch使用MultiGet批量獲取文件與使用Bulk批量操作

Multi Get 批量獲取

Bulk 批量操作

相關推薦