解析ES的document核心元資料：_index，_type，_id，_source

阿新 • • 發佈：2018-12-01

解析ES的document核心元資料：_index，_type，_id，_source

2018.04.05 20:24 字數 1099 閱讀 324評論 0喜歡 3

進入Kibana的DevTools執行下面操作：

#新增一條document
PUT /test_index/test_type/1
{
  "test_content":"test test"
}

#查詢
GET /test_index/test_type/1
#返回
{
  "_index": "test_index",
  "_type": "test_type",
  "_id": "1",
  "_version": 1,
  "found": true,
  "_source": {
    "test_content": "test test"
  }
}

1、 _index元資料解析

代表這個document存放在哪個index中
類似的資料放在一個索引，非類似的資料放不同索引。例如：product index（包含了所有的商品），sales index（包含了所有的商品銷售資料），inventory index（包含了所有庫存相關的資料）。如果你把比如product，sales，human resource（employee），全都放在一個大的index裡面，比如說company index，不合適的。
index中包含了很多類似的document：類似是什麼意思，其實指的就是說，這些document的fields很大一部分是相同的，你說你放了3個document，每個document的fields都完全不一樣，這就不是類似了，就不太適合放到一個index裡面去了。

索引名稱必須是小寫的，不能用下劃線開頭，不能包含逗號：product，website，blog

為什麼類似的資料放在一個索引，非類似的資料放不同索引

2、 _type元資料解析

代表document屬於index中的哪個類別（type）
一個索引通常會劃分為多個type，邏輯上對index中有些許不同的幾類資料進行分類：因為一批相同的資料，可能有很多相同的fields，但是還是可能會有一些輕微的不同，可能會有少數fields是不一樣的，舉個例子，就比如說，商品，可能劃分為電子商品，生鮮商品，日化商品，等等。
type名稱可以是大寫或者小寫，但是同時不能用下劃線開頭，不能包含逗號

3、 _id元資料解析

代表document的唯一標識，id與index和type一起，可以唯一標識和定位一個document
我們可以手動指定document的id（put /index/type/id），也可以不指定，由es自動為我們建立一個id

4、document id的手動指定與自動生成兩種方式解析

1. 手動指定document id
（1）根據應用情況來說，是否滿足手動指定document id的前提：

一般來說，是從某些其他的系統中，匯入一些資料到es時，會採取這種方式，就是使用系統中已有資料的唯一標識，作為es中document的id。

舉個例子，比如說，我們現在在開發一個電商網站，做搜尋功能，或者是OA系統，做員工檢索功能。這個時候，資料首先會在網站系統或者IT系統內部的資料庫中，會先有一份，此時就肯定會有一個數據庫的primary key（自增長，UUID，或者是業務編號）。如果將資料匯入到es中，此時就比較適合採用資料在資料庫中已有的primary key。

如果說，我們是在做一個系統，這個系統主要的資料儲存就是es一種，也就是說，資料產生出來以後，可能就沒有id，直接就放es一個儲存，那麼這個時候，可能就不太適合說手動指定document id的形式了，因為你也不知道id應該是什麼，此時可以採取下面要講解的讓es自動生成id的方式。

#語法：
put /index/type/id
#手動生成id
PUT /test_index/test_type/2
{
  "test_content": "my test"
}

2. 自動生成document id

#語法：
post /index/type
#自動生成id
POST /test_index/test_type
{
  "test_content": "my test"
}
#返回
{
  "_index": "test_index",
  "_type": "test_type",
  "_id": "AWKVr3MWWhuqAs-7Mpj5",
  "_version": 1,
  "result": "created",
  "_shards": {
    "total": 2,
    "successful": 1,
    "failed": 0
  },
  "created": true
}

自動生成的id，長度為20個字元，URL安全，base64編碼，GUID，分散式系統並行生成時不可能會發生衝突

GUID：GUID演算法，可保證在分散式的環境下，不同節點同一時間建立的 _id 一定是不衝突的。

GUID不衝突解釋

4、_source元資料以及定製返回結果解析

_source元資料

#新增資料
put /test_index/test_type/1
{
  "test_field1": "test field1",
  "test_field2": "test field2"
}

#獲取
get /test_index/test_type/1
#返回
{
  "_index": "test_index",
  "_type": "test_type",
  "_id": "1",
  "_version": 2,
  "found": true,
  "_source": {
    "test_field1": "test field1",
    "test_field2": "test field2"
  }
}

_source元資料：就是說，我們在建立一個document的時候，使用的那個放在request body中的json串（所有的field），預設情況下，在get的時候，會原封不動的給我們返回回來。

定製返回結果

定製返回的結果，指定_source中，返回哪些field

#語法：
GET /test_index/test_type/1?_source=test_field2
#返回
{
  "_index": "test_index",
  "_type": "test_type",
  "_id": "1",
  "_version": 2,
  "found": true,
  "_source": {
    "test_field2": "test field2"
  }
}

#也可返回多個field使用都好分割
GET /test_index/test_type/1?_source=test_field2,test_field1

解析ES的document核心元資料：_index，_type，_id，_source

解析ES的document核心元資料：_index，_type，_id，_source WinnXUDONG 關注 2018.04.05 20:24 字數 1099 閱讀 324評論 0喜歡 3 進入Kibana的DevTools執行下面操作：

Excel 一行對多行的解析方法，核心程式碼如下：

List<xxxxx> exprot = new xxxx<>(); InputStream inputStream = ClassLoader.getSystemResourceAsStream("xxxx.xls");

效能比較：lxml庫,正則表示式，BeautifulSoup ，用資料證明lxml解析器速度快

Beautiful Soup支援的解析器解析器使用方法優勢劣勢 Python標準庫 BeautifulSoup(markup, "html.parse

陸奇：人工智慧核心需要資料中國遠遠多於任何國家 | Gartner預測：2025年，人工智慧將創造200萬個新增就業機會

每一個企業級的人都置頂了中國軟體網中國軟體網為你帶來最新鮮的行業乾貨小編點評人

《深入理解Spark：核心思想與原始碼分析》——SparkContext的初始化（伯篇）——執行環境與元資料清理器

《深入理解Spark：核心思想與原始碼分析》一書第一章的內容請看連結《第1章環境準備》《深入理解Spark：核心思想與原始碼分析》一書第二章的內容請看連結《第2章 SPARK設計理念與基本架構》由於本書的第3章內容較多，所以打算分別開闢四篇隨筆分別展現。本文展現第3章第一部分的內容：第3章

智能解析：白條怎麽套現，自己京東白條怎麽套現出來

智能家具寂寞不可市場階段物聯技術分享但是智能家居過去人們出門，要帶“身手鑰錢”，即身份證、手機、鑰匙和錢包。而現在，身份證和錢包的功能被放進了手機，那麽接下來鑰匙會有哪些變化？西安慧晶智能科技有限公司董事長張寶強說，2018年將會是智能鎖具爆發的元年，以

Python 基本類型：元組，列表，字典，字符串，集合梳理總結

負數 true HR 產生字符 for循環 bsp temp 不同一、元組(tuple) 1.特性：不可更改的數據序列。【理解：一旦創建元組，則這個元組就不能被修改，即不能對元組進行更新、增加、刪除操作】 2.創建：一對圓括號“（）”和其包含的元素（若沒有元素

轉載：C#關閉檔案重定向，實現操作System32資料夾

我們已經知道：　　　　①：本機模式64位程式執行在純模式下，並且訪問鍵和儲存在以下注冊表子鍵中的值：HKEY_LOCAL_MACHINE \ Software 　　　　②：32位程式執行在WOW64模式下，並且訪問鍵和值儲存在以下注冊表子項中：HKEY_LOCAL_MACHINE \ So

Python核心知識點：深入瞭解字串的拆分，連線及拼接教程

生活中總有幾樣註定的事：死亡、稅單以及需要處理字串的程式設計師。字串可以有多種形式。它們可以是非結構化的文字，使用者名稱，產品描述，資料庫列表名，或者其它任何我們使用語言描述的內容。既然字串資料幾乎無處不在，那麼掌握所使用的工具如何進行字串處理是非常重要的。幸運的是，與其它語言甚至舊版本的Python

最全iOS資料儲存方法介紹：FMDB，SQLite3 ，Core Data，Plist，Preference偏好設定，NSKeyedArchiver歸檔，Realm

專案準備運用的Core Data進行本地資料儲存，本來打算只寫一下Core Data的，不過既然說到了資料儲存，乾脆來個資料儲存基礎大總結！本文將對以下幾個模組進行敘述。沙盒 Plist Preference偏好設定 NSKeyedArchiver

大資料之scala（二） --- 對映，元組，簡單類，內部類，物件Object，Idea中安裝scala外掛，trait特質[介面]，包和包的匯入

一、對映<Map> ----------------------------------------------------- 1.建立一個不可變的對映Map<k,v> ==> Map(k -> v) scala> val map

大資料（十八）：Hive元資料配置、常見屬性配置、資料型別與資料轉換

一、Hive元資料配置到MySQL當中為什麼要把Hive的元資料配置到MySql中？我們可以使用多個客戶端連線linux系統並且都嘗試啟動Hive，可以發現在啟動第二個Hive客戶端的時候發生報錯了。

作業系統，核心定時器：使用“訊號”建立一種使用者空間機制來測量一個多執行緒程式的執行時間。

核心是一個作業系統的核心。它負責管理系統的程序、記憶體、裝置驅動程式、檔案和網路系統，決定著系統的效能和穩定性。定時器是Linux提供的一種定時服務的機制，它在某個特定的時間喚醒某個程序來進行工作。核心在時鐘中斷髮生後檢測各定時器是否到期，在li

MATLAB：如何在指定路徑下，讀取單個（多個）資料夾中所有影象

0. 選擇資料夾路徑： [filename filepath]=uigetfile('*.*','請選擇檔案');%filename為檔名，filepath為檔案路徑 image = imread(strcat(file_path,image_name));%讀取圖片檔案 1，

《compass-reference》翻譯計劃之：第9章. 通用元資料

第9章. 通用元資料 9.1 介紹 Compass Core中的通用元資料，提供了OSEM檔案中使用的元資料名和別名的定義——特別是你的應用中通過多個OSEM檔案定了一個非常大的領域模型時，它顯得非常有用。這個機制的另一個優勢是，它可以增加額外的元資料資訊

向磁碟寫入資料提示：No spac left on device通過df -h檢視磁碟空間，發現沒滿，解決方法

初步判斷應該有兩種情況：一種是block滿了，另一種情況就是inode耗盡了。首先df -i 檢視一下是否耗盡inode/block數量。虛擬一塊磁碟並格式化： dd if=/dev/zero of=/opt/sdb1 bs=4096 count=100 mkfs -t ext4 /opt/sdb

原始碼解析關於java阻塞容器：ArrayBlockingQueue，LinkedBlockingQueue等

Java的阻塞容器介紹JDK18 一ArrayBlockingQueue 類的定義重要的成員變數初始化一些重要的非公開的方法

rsync資料同步時報錯：rsync: mkstemp 或rsync: delete，Permission denied

場景：用jekines自動構建java專案時，用到一個命令rsync -arqz --delete $WORKSPACE/target/yonghe-console/* [email protected]::yonghe-console --exclude-from=

手機大資料：窮人愛買iPhone，華為使用者多有車有房

近日，知名調研機構MobData研究院公佈了中國2018年第三季的智慧手機市場調研報告。報告顯示，蘋果在手機市場佔有率依舊穩坐頭把交椅，高達21.6%，而華為小米OV等則緊隨其後。有意思的是，MobData還詳盡地對各大手機品牌的使用者群體畫像進行刻畫分析。

python的學習筆記01_4基礎資料型別列表元組字典集合其他其他（for，enumerate，range)

列表定義：[]內以逗號分隔，按照索引，存放各種資料型別，每個位置代表一個元素　　特性：　　　　1.可存放多個值　　　　2.可修改指定索引位置對應的值，可變　　　　3.按照從左到右的順序定義列表元素，下標從0開始順序訪問，有序、建立列表只要把逗號分隔的不同資料項，使用方括號[],括起來即可，

解析ES的document核心元資料：_index，_type，_id，_source

解析ES的document核心元資料：_index，_type，_id，_source

1、 _index元資料解析

2、 _type元資料解析

3、 _id元資料解析

4、document id的手動指定與自動生成兩種方式解析

4、_source元資料以及定製返回結果解析

相關推薦