ElasticSearch增刪改查之python sort、scroll、scan

阿新 • • 發佈：2019-02-15

1、用python操作elasticsearch有兩個庫可以呼叫

# ElasticSearch不支援scroll（分頁查詢）查詢
from pyelasticsearch import ElasticSearch
# Elasticsearch支援scroll查詢，一般建議使用這個庫
from elasticsearch import helpers,Elasticsearch

""" 注意：以上兩個庫各自在查詢或更新傳遞的引數是不同的 """
# ElasticSearch查詢使用方式
ES = ElasticSearch(URL)
res = ES.search(
            query,
            index=index,
            size=size
        )

# Elasticsearch查詢使用方式
ES = ElasticSearch(URL)
res = ES.search(
            body=query,
            index=index,
            size=size
        )

ES中的高效能的部分大部分在helpers中實現

如果要批量查詢大量的資料，建議使用helpers.scan，search查詢最大隻能返回10000條資料
是有效能限制的

2、Elasticsearch中search scroll使用

scroll的優勢：支援分頁查詢，自動排序，並把查詢結果返回
scroll使用方式：每次查詢獲取下一次查詢需要使用的scroll_id，查詢時傳遞引數scroll='2m'，後臺ES即可以將查詢的結果儲存2分鐘
查詢時常用技巧
1、將必須包含欄位新增到 must中
2、將必須不包含欄位新增到 must_not中
3、單一條件匹配選用 term，多個單一條件任何一個匹配選用 terms

4、from 指定從結果資料中的第多少條開始返回，from的最大值超不過2000，所以在使用大資料查詢基本使用不上
5、size 指定結果資料中共返回多少條資料

# 在使用時一定要注意Elasticsearch與ElasticSearch還是有一定的區別的，傳遞引數不一樣
from elasticsearch import Elasticsearch

ES_SEARCH_HOSTURL = 'http://domain:9000/'
ES = Elasticsearch(ES_SEARCH_HOSTURL)

query = {
        "query": {
            "bool": {
                "must": [],
                "must_not": []
            }
        }
    }

# index可以為索引的列表或者單個索引，如果是索引的列表，則使用search時不能傳遞doc_type，也就是如果同時查詢多個索引，不能指定文件的型別
def scroll_search(index, query, size, page):
    """ 使用scroll查詢ES，實現分頁查詢

    :param index: type of list or str
    :param query: type of dict，查詢條件
    :param size: type of int(1-100)，指定返回資料中每頁的資料條數
    :param page: type of int(>0)，指定返回第幾頁資料
    :return: 查詢結果總數和某頁的資料
    """

    try:
        res = ES.search(
            index=index,
            scroll='5m',            # 查詢一次資料在ES中快取5分鐘再銷燬
            size=size,
            body=query,
            sort="modified:desc",      # sort增加排序功能，多個欄位排序可以以逗號隔開
            # sort="modified:desc,_score:desc",  # 指定某個欄位按照升序或者降序排列,modifie為資料欄位
            # sort="_doc",        # ES會計算一個最優的排序方案
            # search_type='scan',   # 如果不關注排序的話，可以增加該欄位，查詢速度十分高效，效能比較好
        )
    except Exception as e:
        raise e
    else:
        sid = res['_scroll_id']           # 獲得查詢下一條資料的scroll_id
        total = res['hits']['total']      # 獲取查詢結果中總資料的條數
        hits = res["hits"]["hits"]        # 首次查詢返回第一頁的結果資料
        results = [hit["_source"] for hit in hits]

        first_page = 1
        while page > first_page:
            try:
                res = ES.scroll(scroll_id=sid, scroll='2m')
            except Exception as e:
                raise e
            else:
                sid = res['_scroll_id']
                hits = res["hits"]["hits"]
                results = [hit["_source"] for hit in hits]
                first_page += 1

    return total, results

# terms使用，其中categories為list型別，含義為categories中任何一個滿足條件即可
temp = {"terms": {"categories": categories}}
query["query"]["bool"]["must"].append(temp)

3、Elasticsearch中update區域性更新

""" 功能：從多個索引中查詢需要更新的對應資料的id，再更新此資料 """
from elasticsearch import Elasticsearch

ES_SEARCH_HOSTURL = 'http://domain:9000/'
ES = Elasticsearch(ES_SEARCH_HOSTURL)

indexs = [index1, index2]

query = {
        "query": {
            "bool": {
                "must": []
            }
        }
    }

for index in indexs:
	try:
		res = ES.search(body=query, index=index, doc_type='info')
	except Exception as e:
		print(e)
		# logger.error("Request search_indicator function error. Error: %s" % e)
		message = "Internal server error"
		results = data_formatter(message=message)
		return Response(results, status=500)
	else:
		if res["hits"]["total"] > 0:
			hits = res["hits"]["hits"][0]
			update_id = hits["_id"]

			try:
                                # 注意，如果ES為pyelasticsearch的物件，則需要更新的引數傳遞形式應該為doc= {"revoked": revoked}
				ES.update(index=index, doc_type='indicator_info', id=update_id, body={"doc": {"revoked": revoked}})
			except Exception as e:
				print(e)
				message = "Update {} failed".format(id)
				results = data_formatter(message=message)
				return Response(results, status=500)
			else:
				results = data_formatter()
				return Response(results, status=200)

ElasticSearch增刪改查之python sort、scroll、scan

1、用python操作elasticsearch有兩個庫可以呼叫 # ElasticSearch不支援scroll（分頁查詢）查詢 from pyelasticsearch import ElasticSearch # Elasticsearch支援scroll查詢，一般建

Elasticsearch增刪改查之 —— Delete刪除

刪除文件也算是常用的操作了...如果把Elasticsearch當做一款普通的資料庫，那麼刪除操作自然就很常用了。如果僅僅是全文檢索，可能就不會太常用到刪除。 Delete API 刪除API，可以根據特定的ID刪除文件。 $ curl -XDELETE 'http://localhost:9200/tw

Elasticsearch增刪改查之 —— Get查詢

GET API是Elasticsearch中常用的操作，一般用於驗證文件是否存在；或者執行CURD中的文件查詢。與檢索不同的是，GET查詢是實時查詢，可以實時查詢到索引結果。而檢索則是需要經過處理，一般預設是1秒鐘吧...才能搜尋到。合理利用這些方法，可以更靈活的使用Elasticsearch。更多內容參

Elasticsearch增刪改查之 —— mget多文件查詢

之前說過了針對單一文件的增刪改查，基本也算是達到了一個基本資料庫的功能。本篇主要描述的是多文件的查詢，通過這個查詢語法，可以根據多個文件的查詢條件，返回多個文件集合。更多內容可以參考我整理的ELK文件教程 multi Get 多欄位查詢可以設定多個文件查詢條件，每個查詢條件在結構上都比較類似： curl

Elasticsearch增刪改查之 —— Update更新

更新操作，一般用這個的，應該不會很多吧！ES本身還是一個傾向於查詢檢索的框架，對於這種更新的操作，太過頻繁總歸是不好的。不過閱讀本篇後，你可以使用Script對所有的文件執行更新操作，也可以使用doc對部分文件執行更新，也可以使用upsert對不存在的文件執行新增操作。更新 Update更新操作允許E

Elasticsearch 增刪改查之 Sense 外掛使用，chrome瀏覽器Sense外掛的介紹，離線安裝，簡單使用記錄

Sense chrome外掛的概述Sense是一款基於chrome的外掛。通過Sense擴充套件外掛我們可以很方便的操作ElasticSearch。ElasticSearch是一個開源的分散式搜尋引擎，具備高可靠性，支援非常多的企業級搜尋用例。像Solr4一樣，是基於Luce

Java之Elasticsearch 增刪改查

exc tin rgs its ack 端口 try on() TE  <dependency> <groupId>org.elasticsearch.client</groupId>

MySQL增刪改查之“增”

nbsp table 插入語 baby 格式 password 動向 tab cde 插入記錄有兩種個基本語法：插入基本語法一類別詳細解示基本語法 insert into 表 values(值1,值2,值n); 示例 INSERT INTO user v

MySQL增刪改查之【刪】

rst 有用 trunc bsp 備份王寶強增刪改 fault lock 使用 delete 刪除記錄類別詳細解示基本語法 DELETE FROM 表 [where 條件]; 示例 DELETE FROM user where id > 10;

MySQL增刪改查之【改】

說明 war use 用戶表 head 增刪結構 fec 更新數據更新數據我們已經說過。需要修改內容，修改銀行卡余額，修改裝備信息的時候都需要使用到update，修改語句。修改(也叫更新)語句的基本語語法如下：類別詳細解示基本語法 update 表名 s

MySQL增刪改查之【多表聯合查詢】

包括實現鼠標 thead 黃曉明 eba 字符 order 有時很多時候在實際的業務中我們不只是查詢一張表。在電子商務系統中，查詢哪些用戶沒有購買過產品。銀行中可能查詢違規記錄，同時查詢出用戶的查詢中獎信息和中獎人員的基本信息。以上只是列的情況

JS源生代碼“增刪改查”之增

.get code 文件區別加載客戶存在 logs nbsp 　　51呢最近在做一個管理數據的，第一次接觸到用JS的源代碼去實現一些功能，才知道網頁裏的許多功能都是依賴於“增刪改查”完成的，下面的幾張圖片就是對於增的演示：　　

PHP MYSQL 增刪改查之增 jsonAdd

應該 php mysql 網站建設 text pos root pass cap _array <?php //header("Content-type: text/html; charset=UTF8"); //header("Content-Type: text

PHP MYSQL 增刪改查之list JsonList

arr roo pass int close lose 127.0.0.1 for 數據 <?php //header("Content-type: text/html; charset=UTF8"); //header("Content-Type: text/ht

PHP MYSQL 增刪改查之刪 jsonDel

let ade content sql數據庫 pre state 網站建設 password roo <?php //header("Content-type: text/html; charset=UTF8"); //header("Content-Type: t

SQL server ：“增刪改查” 之 “改”

image 表名語法多列 ring 意思就會單擊行修改 1.前言 2.通過SSMS修改數據 3.通過SQL語句修改數據 3.1 修改單列數據 3.2 修改多列數據 1.前言增刪改查都是對數據的操作，其中“改”對應的SQL語句便是“update”，也就是“更新

SQL server ：“增刪改查” 之 “增”

keyword 文件 ase ins gui lte dep 依次下載 1.前言 2.通過SSMS添加數據 3.通過SQL語句添加數據 3.1 添加單條數據 3.2 添加多條數據 4.通過其他表導入數據 4.1 通過數據庫中的其他表導入數據 4.2 通過excel表

Oracle增刪改查--之增

Oracle增刪改查--之增Oracle增刪改查--之增 1、新建數據庫用戶並設置密碼 create user 用戶名 identified by 密碼 2、為新建用戶授權dba grant dba to 用戶名; 3、登陸驗證feiyu用戶 conn feiyu； 4、創建表（首先切到

Oracle增刪改查--之刪

Oracle增刪改查--之刪Oracle增刪改查--之刪 1、刪除數據庫用戶 SQL> conn /as sysdbaConnected.SQL> drop user feiyu cascade;用戶已刪除如果用戶無法刪除，並報錯：ERROR at line 1:ORA-01940: canno

MySQL增刪改查--之增

MySQL之增加數據MySQL增加數據 1、新建數據庫用戶 //新建feiyu數據庫用戶允許在所有IP地址登陸mysql> create user ‘feiyu‘@‘%‘ identified by ‘123‘; //新建guest數據庫用戶允許在192.168.1網段所有地址登陸mysql> c

ElasticSearch增刪改查之python sort、scroll、scan

1、用python操作elasticsearch有兩個庫可以呼叫

2、Elasticsearch中search scroll使用

3、Elasticsearch中update區域性更新

相關推薦