Elasticsearch筆記——文件管理

阿新 • • 發佈：2018-12-18

一、新建文件

1、put: http://localhost:9200/<index>/<Type>/<Id>，傳的JSON是一條記錄Document

2、post：http://localhost:9200/<index>/<Type>，傳的JSON是一條記錄Document

二、獲取文件

get http://localhost:9200/<index>/<Type>/<Id>?pretty=true

pretty=表示返回的易讀的格式資料

如果Id不正確，就查不到資料，found欄位就是false，found欄位就是true表示查到了資料

根據id一次獲取多個文件
get http://localhost:9200/_mget
{
	"docs": [
		{
			"_index": "<index>",
			"_type": "<type>",
			"_id": "<id>"
		},
		{
			"_index": "<index1>",
			"_type": "<type2>",
			"_id": "<id2>"
		}
	]
}

如果index是同一個：
get http://localhost:9200/<index>/_mget
{
	"docs": [
		{
			"_type": "<type>",
			"_id": "<id>"
		},
		{
			"_type": "<type2>",
			"_id": "<id2>"
		}
	]
}

如果index和type都是同一個：
get http://localhost:9200/<index>/<type>/_mget
{
	"docs": [
		{
			"_id": "<id>"
		},
		{
			"_id": "<id2>"
		}
	]
}
或
get http://localhost:9200/<index>/<type>/_mget
{
	"ids": ["id1", "id2"]
}

三、更新文件

put: http://localhost:9200/<index>/<Type>/<Id>，傳的JSON是一條記錄Document

查詢更新（對 title 中包含 git 關鍵字的文件增加一個 category 欄位）：
post http://localhost:9200/<index>/_update_by_query
{
    "script": {
        "inline": "ctx._source.category = params.category",
        "lang": "painless",
        "params": {"category" : "git"}
    },
    "query": {
        "term": {"title": "git"}
    }
}

給指定的文件新增一個欄位：
post http://localhost:9200/<index>/<type>/<id>/_update
{
    "script": {
        "inline": "ctx._source.new_field = \"value_of_new_field\""
    }
}

給指定的文件移除一個欄位：
post http://localhost:9200/<index>/<type>/<id>/_update
{
    "script": {
        "inline": "ctx._source.remove(\"new_field\")
    }
}

四、刪除文件

delete http://localhost:9200/<index>/<Type>/<Id>

如果在索引文件時指定了路由，刪除時也可以新增路由引數，delete http://localhost:9200/<index>/<Type>/<Id>?routing=user123

注意：如果執行刪除操作時路由值不正確，會導致文件刪除失敗；當對映的_routing被設定為required且沒有指定路由值時，執行刪除操作會丟擲路由缺失異常並拒絕該請求。

查詢刪除
刪除文件的 title 欄位中包含 hibernate 的所有文件：
post http://localhost:9200/<index>/_delete_by_query
{
    "query": {
        "term": {
            "title": "hibernate"
        }
    }
}

刪除一個type下所有文件：
post http://localhost:9200/<index>/<type>/_delete_by_query
{
    "query": {
        "match_all": {}
    }
}

五、批量操作

1、建立一個JSON檔案
2、檔案中寫入多個請求操作，請求格式如下：
    action_and_meta_data\n
    optional_source\n
    ......
    action_and_meta_data\n
    optional_source\n
3、執行操作
    post http://localhost:9200/<index>/<type>/_bulk

說明：
請求資料的每一行的結尾處都必須有換行字元“\n”,最後一行也必須有。
action_and_meta_data 行指定將要在哪個文件中執行什麼操作，其中 action 必須是 index、create、update、或 delete, mete_data 需要指明被操作文件的 _index、_type 和 _id。

建立文件：
{ "index" : { "_index" : "<index>", "_type" : "<type>", "_id" : "<id>"}}
{ }
或
{ "create" : { "_index" : "<index>", "_type" : "<type>", "_id" : "<id>"}}
{ }
區別：如果文件已經錯在，使用create操作會失敗，但是index操作不會。

刪除文件：
{ "delete" : { "_index" : "<index>", "_type" : "<type>", "_id" : "<id>"}}

更新文件：
{ "update" : { "_index" : "<index>", "_type" : "<type>", "_id" : "<id>"}}
{ }

使用 Bulk 操作需要注意一次提交請求檔案的大小，整個批量請求需要被載入到接受請求節點的記憶體中，所以請求越大，留給其他請求的可用記憶體就會越小。

六、版本控制

Elasticsearch 更新文件的過程如下：首先，讀取源文件，對源文件進行更新操作，然後重新索引整個文件。所以，當多個執行緒同時修改一個文件時，就會發生衝突。

Elasticsearch 更新文件是可以通過控制 _version 欄位來避免上述衝突。

Elasticsearch 的文件版本控制機制主要有內部版本控制和外部版本控制，內部版本控制機制要求每次操作請求，只有當版本號相等時才可以操作成功，外部版本控制機制要求外部文件版本比內部文件版本高時才可以更新成功。

所以，我們每次進行更新操作時，只需要新增上要更新文件的版本號就可以避免多個執行緒同時操作文件引發的衝突。

put http://localhost:9200/<index>/<Type>/<Id>?version=_version

七、路由機制

Elasticsearch 的路由機制是通過雜湊演算法，將具有相同雜湊值的文件放到同一個主分片中。

shard = hash(routing) % number_of_primary_shards
routing 是一個任意字串，可以自定義，Elasticsearch 預設將文件的id值作為routing值。

Elasticsearch 在叢集中執行一次查詢的過程如下：

1、查詢請求首先被叢集中的一個節點接收；

2、接收到這個請求的節點，將這個查詢廣播到這個索引的每一個分片上；

3、每個分片執行完搜尋查詢並返回結果；

4、結果在通道節點上合併、排序並返回給使用者。

所以預設情況下，每次請求Elasticsearch不知道文件在哪個主分片上，需要將這個請求廣播到所有主分片上。如果採用自定義的路由模式，可以使查詢更具有目的性，可以提高查詢效率。

Elasticsearch 的index、get、delete等文件的API都可以接受一個 routing 引數，以索引文件為例，執行 index 操作時給文件設定一個 routing 引數，具有相同 routing 的文件會被分配到同一個分片上。

put http://localhost:9200/<index>/<Type>/<Id>?routing=<routing>

當需要查詢查詢文件時，可以指定routing引數，避免向所有分片傳送查詢求情，大大減少系統的資源。

get http://localhost:9200/<index>/<Type>/_search?routing=<routing>

查詢時可以指定多個路由值，路由值之間使用逗號隔開。

Elasticsearch筆記——文件管理

一、新建文件 1、put: http://localhost:9200/<index>/<Type>/<Id>，傳的JSON是一條記錄Document 2、post：http://localhost:9200/<index>

菜鳥的linux成長筆記--文件管理2

sta 命名筆記 directory 出錯 source nts 強制執行一. 文件管理(cp, mv, rm) cp: 文件復制命令 SRC DEST SRC是文件: 如果目標不存在則會新建DEST, 並將SRC中的內容填充至DEST中

Linux學習筆記——目錄、文件管理命令及常用選項

linux 目錄文件管理 linux目錄文件管理命令目錄管理命令:ls 、 cd 、 pwd 、mkdir、 rmdir 、tree文件管理命令：touch、 stat 、file、 rm 、cp、 mv 、nan目錄管理#ls 列出列表格式ls [OPTION]... [FILE]...

第三章文件管理學習筆記

學習筆記筆記整理起始時間：2018年3月31日16:16:55 本章內容文件系統結構元素創建和查看文佳復制、轉移和刪除文件使用Nautilus來管理文件軟和硬鏈接文件系統文件和目錄被組織成一個單根倒置樹結構文件系統從根木蘭路下開始，用"/"表示根文件系統：rootfs，root file

linux初級學習筆記四：Linux文件管理類命令詳解！(視頻序號：03_1)

單詞 linux初級 linux文件管理查看 stat 顯示行數 swd 字符處理行數本節學習的命令：cat(tac)，more，less，head，tail，cut，sort，uniq，wc，tr 本節學習的技能：目錄管理　　　　　　　　文件管理　　　　　　　　

10.19文件管理課程筆記

u盤重新 oracl ignore 相對主機 cmp 顯示行數 per /bin：bin是Binary的縮寫，該目錄下存放的是最常用的命令。 ? /boot：該目錄下存放的是啟動Linux時使用的一些核心文件，包括一些連接文件以及鏡像文件。 ? /dev：dev

文件管理後續筆記

tick 設置我們幫助權限後綴名壓縮包取消文件管理 chattr 隱藏權限增加 - 減少 = 設定+i 增加該屬性後，表示文件不能刪除、重命名、設定鏈接、寫入以及新增數據-i 取消i權限+a 增加該屬性後，表示只能追加不能刪除，非root用戶不能設定該屬性

《從點子到產品》讀書筆記之文件管理和需求管理

elasticsearch官方文件學習筆記----Getting Started

Getting Started 基本概念 1）準實時：ES搜尋是一個接近實時的搜尋平臺。這意味著從您索引一個文件的時間到它可搜尋的時間，有一個輕微的延遲（通常是一秒）。 2）叢集：ES是一個叢集，一個叢集由一個惟一的名稱標識id，預設情況下是“elasticsearch

elasticsearch官方文件學習筆記----ElasticSearch引數配置

配置ElasticSearch 主要介紹了ES啟動前重要的基本配置重要的系統基本配置設定JVM引數此檔案的預設位置是config/jvm.options（從tar或zip發行版/etc/elasticsearch/jvm.options安裝時）和（從Debi

【bzoj3289】Mato的文件管理離散化+莫隊算法+樹狀數組

逆序對 sample 單位 oid 逆序 cmp family += efi 原文地址：http://www.cnblogs.com/GXZlegend/p/6805224.html 題目描述 Mato同學從各路神犇以各種方式（你們懂的）收集了許多資料，這些資料一共有n份

Linux 中最常用的目錄及文件管理命令

得到 bzip2 文件夾操作管理命令內容 fig find work 一、查看文件的命令　對於一個文本文件，在linux中有多種查看方式來獲知文件內容，如直接顯示整個文本內容、分頁查看內容、或者只查看文件開頭或末尾的部分內容。在linux可以用不同的命令來實現。　

php簡單文件管理器——php經典實例

false tro eth put head 遍歷目錄 == border iconv <html> <head> <title>文件管理</title> <meta cha

elasticsearch配置文件詳解

配置文件文件夾 master 記錄 elasticsearch的config文件夾裏面有兩個配置文件：elasticsearch.yml和logging.yml，第一個是es的基本配置文件，第二個是日誌配置文件，es也是使用log4j來記錄日誌的，所以logging.yml裏的設置按普通

JDFS:一款分布式文件管理實用程序第一篇(線程池、epoll、上傳、下載)

cpu nload tree 程序 fun 是的發的 fop let 一前言　　截止目前，筆者在博客園上面已經發表了3篇關於網絡下載的文章，這三篇博客實現了基於socket的http多線程遠程斷點下載實用程序。筆者打算在此基礎上開發出一款分布式文件管理實用程序，截止目

disconf實踐（三）基於XML的分布式配置文件管理，自動reload

blog exce conf redis 信息 exceptio res pan ram 上一篇介紹了基於xml的非自動reload的分布式配置文件管理，這一篇介紹自動reload的方式（基於disconf實踐二）。 1. 修改RedisConfig.java 1 pa

python筆記--文件處理

python、文件處理文件處理1.open函數（1）語法：文件句柄 = open(‘文件路徑‘, ‘模式‘)打開文件時，需要指定文件路徑和以何等方式打開文件，打開後，即可獲取該文件句柄，之後通過此文件句柄對該文件進行操作。操作文件時，一般需要經歷三個步驟：打開文件、操作文件、關閉文件，例如：>>&

文件管理器

intent bmp todo lower 事件 and toast rep size 主類 public class main extends ListActivity/*繼承這個類就可以直接進入安卓文件目錄*/{ private static final String

Moodle 中文 API 之文件管理API

reverse string bit /dev/ empty cte extra 回調函數安全 File API 文件管理文件夾 1. 概述 2. 文件域 2.1 命名文件域 3. 提供文件給用戶 4. 從用戶那獲取文件 5. 樣例

修改後的小米文件管理器(去掉遠程管理)

detail ext watermark bsp http font profile 修改 avi 最近項目要用到文件管理,就找來小米的開源文件管理代碼,刪掉了遠程管理代碼,只有文件管理. 效果圖如下: 源碼下載地址:http://download.csdn.ne

Elasticsearch筆記——文件管理

相關推薦