ElasticSearch寫入和查詢測試

阿新 • • 發佈：2019-02-16

1，ES的儲存結構瞭解

在ES中，儲存結構主要有四種，與傳統的關係型資料庫對比如下：
index（Indices）相當於一個database
type相當於一個table
document相當於一個row
properties（Fields）相當於一個column

Relational DB -> Databases -> Tables -> Rows -> Columns
Elasticsearch -> Indices -> Types -> Documents -> Fields

2，ES寫入測試

寫入一個文件（一條資料）

PUT http://192.168.1.32:9200/twitter/tweet/377827236
{
"tweet_id": "555555555555555555555666",
"user_screen_name": "kanazawa_mj",
"tweet": "blog3444444",
"user_id": "377827236",
"id": 214019
}

我們看到path:/twitter/tweet/377827236包含三部分資訊：

名字	說明
twitter	索引名
tweet	型別名
377827236	這個員工的ID

3，ES查詢測試

查詢一個文件，包含love，返回50條資料，採用展開的json格式

GET http://192.168.1.32:9200/twitter/tweet/_search?q=tweet:love&size=50&pretty=true
{
  "took" : 20,
  "timed_out" : false,
  "_shards" : {
    "total" : 5,
    "successful" : 5,
    "failed" : 0
  },
  "hits" : {
    "total" : 11639,
    "max_score" 
 : 8.448289,
    "hits" : [
      {
        "_index" : "twitter",
        "_type" : "tweet",
        "_id" : "AV0fnFOX6PBTXc6mRjpL",
        "_score" : 8.448289,
        "_source" : {
          "tweet_id" : "843105177913757697",
          "user_screen_name" : "jessicapalapal",
          "tweet" : "Love, love, love ",
          "user_id" : "740434015",
          "id" : 474551
        }
      },
      {
        "_index" : "twitter",
        "_type" : "tweet",
        "_id" : "AV0fni__6PBTXc6mSeyR",
        "_score" : 8.436986,
        "_source" : {
          "tweet_id" : "695096306763583488",
          "user_screen_name" : "SampsonMariel",
          "tweet" : "Love love love^_^ #ALDUB29thWeeksary",
          "user_id" : "2483556636",
          "id" : 723297
        }
      },
      {
        "_index" : "twitter",
        "_type" : "tweet",
        "_id" : "AV0fmxvV6PBTXc6mQ8Mb",
        "_score" : 8.425938,
        "_source" : {
          "tweet_id" : "835676311637086209",
          "user_screen_name" : "thedaveywavey",
          "tweet" : "Love is love is love is love. ",
          "user_id" : "17191297",
          "id" : 311967
        }
      }
    ]
  }
}

4，ES批量寫入測試

寫入程式，編寫Python指令碼，生產者和消費者模式，從Mysql資料庫讀取資料，1000條資料寫入一次ES
本機環境，Windows，記憶體佔用100M，CPU佔用15%
ES服務，Ubuntu14.04，CPU佔用5%，記憶體較少
單程序，5個寫入執行緒，100萬行資料，500秒
單程序，20個寫入執行緒，100萬行資料，500秒
補充：據說，修改ES配置，先關閉資料索引，可以提高資料寫入速度，尚未測試

5，下一步計劃

ES資料分片機制、搜尋引數配置（mapping、filter）等，尚需要根據專案需求，深入學習和測試。
ES支援的額外功能，例如時間範圍搜尋、中文簡繁體、拼音搜尋、GIS位置搜尋、英文時態支援等。

6，參考資料

7，附件（Python寫入ES程式碼）

# coding=utf-8
from elasticsearch import Elasticsearch
from elasticsearch.helpers import bulk
import time
import argparse
import sys
reload(sys)
sys.setdefaultencoding('utf-8')

# ES索引和Type名稱
INDEX_NAME = "twitter"
TYPE_NAME = "tweet"

# ES操作工具類
class es_tool():
    # 類初始化函式
    def __init__(self, hosts, timeout):
        self.es = Elasticsearch(hosts, timeout=5000)
        pass

    # 將資料儲存到es中
    def set_data(self, fields_data=[], index_name=INDEX_NAME, doc_type_name=TYPE_NAME):
        # 建立ACTIONS
        ACTIONS = []
        # print "es set_data length",len(fields_data)
        for fields in fields_data:
            # print "fields", fields
            # print fields[1]
            action = {
                "_index": index_name,
                "_type": doc_type_name,
                "_source": {
                    "id": fields[0],
                    "tweet_id": fields[1],
                    "user_id": fields[2],
                    "user_screen_name": fields[3],
                    "tweet": fields[4]
                }
            }
            ACTIONS.append(action)

        # print "len ACTIONS", len(ACTIONS)
        # 批量處理
        success, _ = bulk(self.es, ACTIONS, index=index_name, raise_on_error=True)
        print('Performed %d actions' % success)

# 讀取引數
def read_args():
    parser = argparse.ArgumentParser(description="Search Elastic Engine")
    parser.add_argument("-i", dest="input_file", action="store", help="input file1", required=False, default="./data.txt")
    # parser.add_argument("-o", dest="output_file", action="store", help="output file", required=True)
    return parser.parse_args()

# 初始化es，設定mapping
def init_es(hosts=[], timeout=5000, index_name=INDEX_NAME, doc_type_name=TYPE_NAME):
    es = Elasticsearch(hosts, timeout=5000)
    my_mapping = {
        TYPE_NAME: {
            "properties": {
                "id": {
                    "type": "string"
                },
                "tweet_id": {
                    "type": "string"
                },
                "user_id": {
                    "type": "string"
                },
                "user_screen_name": {
                    "type": "string"
                },
                "tweet": {
                    "type": "string"
                }
            }
        }
    }
    try:
        # 先銷燬，後建立Index和mapping
        delete_index = es.indices.delete(index=index_name)  # {u'acknowledged': True}
        create_index = es.indices.create(index=index_name)  # {u'acknowledged': True}
        mapping_index = es.indices.put_mapping(index=index_name, doc_type=doc_type_name,
                                                    body=my_mapping)  # {u'acknowledged': True}
        if delete_index["acknowledged"] != True or create_index["acknowledged"] != True or mapping_index["acknowledged"] != True:
            print "Index creation failed..."
    except Exception, e:
        print "set_mapping except", e

# 主函式
if __name__ == '__main__':
    # args = read_args()
    # 初始化es環境
    init_es(hosts=["192.168.1.32:9200"], timeout=5000)
    # 建立es類
    es = es_tool(hosts=["192.168.1.32:9200"], timeout=5000)
    # 執行寫入操作
    tweet_list = [("111","222","333","444","555"), ("11","22","33","44","55")]
    es.set_data(tweet_list)

ElasticSearch寫入和查詢測試

1，ES的儲存結構瞭解在ES中，儲存結構主要有四種，與傳統的關係型資料庫對比如下： index（Indices）相當於一個database type相當於一個table document相當於一個row properties（Fields）相當於一個

11 分散式搜尋引擎寫入和查詢的工作流程是什麼樣的？

目錄 1、面試題 2、面試官心理分析 3、面試題剖析（1）es寫資料過程（2）es讀資料過程（3）es搜尋資料過程（4）搜尋的底層原理，倒排索引，畫圖說明傳統資料庫和倒排索引的區別（5）寫資料底層原理 1、面試題 es寫入資料的工作原理是什麼啊？

.NET 雲原生架構師訓練營（模組二基礎鞏固 MongoDB 寫入和查詢）--學習筆記

# 2.5.3 MongoDB -- 寫入和查詢 - 寫入 - 查詢 - 查詢操作符 - 邏輯操作符 - 其他 - 巢狀物件 - 陣列 - 遊標方法 ## 寫入 [https://docs.mongodb.com/manual/tutorial/insert-documents/](https://do

Mysql慢查詢開啟和查看 ,存儲過程批量插入1000萬條記錄進行慢查詢測試

har src spa not 生成 con image creat 進入首先登陸進入Mysql命令行執行sql show variables like ‘slow_query%‘; 結果為OFF 說明還未開啟慢查詢執行sql show var

【MongoDb】一次關於Oracle和MongoDb的插入和查詢效能測試

本次實驗是在筆者上學期期末一次課程實習中的一部分，現在整理出來以供參考。本次資料用的是不同數量級別上的資料分別在Oracle和MongoDb中進行實驗的。其中兩者的表結構一樣，都是如下欄位：

傳送郵件方法和將資料寫入.csv檔案---測試有效

最近在程式裡有用到發郵件的功能，在網上找了一個傳送郵件的方法，但需要稍微做些修改，現整理後如下：帶傳送附件功能，也可抄送。在VS2010環境下，測試有效。 public static bool SendMails(string recieve, strin

ElasticSearch term和match查詢機制解析和隱藏的查詢問題

2. 關於預設分析使用term查詢的問題之前說過es的預設分析器會講中文拆分成一個個的單個漢子，搜尋條件“內科”會被分析為“內”和“科”，從而進行搜尋。而對於搜尋我們常用的match搜尋類似於資料庫的模糊查詢，term搜尋為精確查詢。使用的時候會出現以下

ElasticSearch學習（八）在Java應用中實現批量操作（mget&bulk）和查詢刪除、match_all（查詢所有）

//mget批量查詢 @Test public void test6() throws Exception { //指定ES叢集 Settings settings = Settings.builder().put("clus

spark+kafka+Elasticsearch單機環境的部署和效能測試

版本選型 spark 1.5.2 + kafka 0.9.0.1 + Elasticsearch 2.2.1 安裝部署 1. 安裝指令碼及檔案密碼 4m7l 2. 指令碼使用 vi /etc/hosts 新增 127.0.0.1 hostnamecd npminstall instal

Elasticsearch(5) --- Query查詢和Filter查詢

Elasticsearch(5) --- Query查詢和Filter查詢這篇部落格主要分為：Query查詢和Filter查詢。有關複合查詢、聚合查詢也會單獨寫篇部落格。一、概念 1、概念一個查詢語句究竟具有什麼樣的行為和得到什麼結果，主要取決於它到底是處Query還是Filter。兩者有很大區別

依賴註入和單元測試

單元測試1. 一輛簡單的car首先我們考慮一個簡單的例子，這裏我們使用engine 類和car 類。為了更加清楚的描述問題，我們將類和接口都置空。每輛car會有一個engine，我們想給car裝備上著名的MooseEngine。Engine類如下： 1 public interface Engine { 2

Hadoop 0.20.2+Ubuntu13.04配置和WordCount測試

password trac 讓我說明 core jvm -m launchpad 1.7 事實上這篇博客寫的有些晚了。之前做過一些總結後來學校的事給忘了，這幾天想又一次拿來玩玩發現有的東西記不住了。翻博客發現居然沒有。好吧，所以趕緊寫一份留著自己用吧。這東西網上有非常

unity xml的讀取和寫入和創建

功能 edit eno sum load 定義鏈接庫 cto tab unity xml的讀取和寫入 Xml是一種常用的數據格式，方便數據的索引查找 1.首先引入相關的動態鏈接庫： 1.1System.Data.dll 1.2Excel.DLL 1.3文件應用擡頭

單元測試、集成測試、系統測試和驗收測試的聯系和區別

是否功能條件黑盒測試模塊期望值設計 tex 代碼根據不同的測試階段，測試可以分為單元測試、集成測試、系統測試和驗收測試體現了測試由小到大、又內至外、循序漸進的測試過程和分而治之的思想。單元測試的粒度最小，一般由開發小組采用白盒方式來測試，主要測試單元是

Django分頁和查詢參數的問題

內容 pytho 傳參 earch ear 現實 dpm .net repl 查詢是通過get的方式，之前沒有分頁之前，url是這樣的： http：//hostname/search?query=port%3A8080 那麽我的想法是如果分頁了。 1，不帶page參數了。n

基於MySQL元數據的Hive的安裝和簡單測試

信息 rop msu time trying 功能條件 ans ack 引言：　Hive是一種強大的數據倉庫查詢語言，類似SQL，本文將介紹怎樣搭建Hive的開發測試環境。 1. 什麽是Hive? hive是基於Hadoop的一個數據倉庫工

Jememeter和Loadrunner測試MySQL性能

found execute mes 執行sql 驅動程序 ack output data con From：http://blog.csdn.net/testingstar/article/details/60579454 MySQL數據庫性能測試的方法前置條件：

Azure Stack技術深入淺出系列1：Azure Stack與Azure的有QoS保證的網絡聯通實現方法和對比測試

azure stack 雲計算微軟 azure源自Azure的Azure stack作為一款業界唯一的和領先的公有雲平臺一致的混合雲平臺，能夠幫助企業客戶從自有數據中心交付Azure雲服務。它作為微軟混合雲戰略中的重頭戲，官方宣稱其將在今年年中GA了。上海儀電集團高度重視這一產品，同時成立了一個專門的團隊來

select 查詢所有和查詢所有非空

text table sel 必須 -1 from size rom 表示 select * from table_name 是查詢出table_name 裏所有的記錄。select * from table_name where column_name like ‘%%

極簡邏輯表達式的設計和查詢

and pan gif varchar express sof display 不能 soft 在數據庫開發中，對兩個關系表進行連接查詢，能夠直接做“邏輯或”的查詢，而對於邏輯與和邏輯非的查詢，則稍復雜點，需要編寫額外的代碼來實現。在關系型數據庫中，

ElasticSearch寫入和查詢測試

1，ES的儲存結構瞭解

2，ES寫入測試

3，ES查詢測試

4，ES批量寫入測試

5，下一步計劃

6，參考資料

7，附件（Python寫入ES程式碼）

相關推薦