1. 程式人生 > >Elasticsearch Java API深入詳解

Elasticsearch Java API深入詳解

0、題記

之前Elasticsearch的應用比較多,但大多集中在關係型、非關係型資料庫與Elasticsearch之間的同步。以上內容完成了Elasticsearch所需要的基礎資料量的供給。但想要在海量的資料中找到和自己相關的業務資料,實現對已有的資料實現全文檢索、分類統計等功能並應用到業務系統中,必須藉助Java API來實現。

1、Elasticsearch Java API 概覽

Elasticsearch Java API 相關使用研究結果:

1.1 國內的博文講解Elasticsearch Java API 大多偏重於實現,沒有對Elasticsearch Java API 整體進行講解。這樣的問題是頭疼醫頭,腳痛醫腳,始終不得原理。

1.2 Elasticsearch1.X,2.X,5.X隨著版本的迭代,除了系統升級,Java API也做了相對較大的調整。

也就是說,1.X的API在2.X以及5.X乃至未來6.X版本都不是通用的。如1.x的fuzzyLikeThisQuery在後續版本都不再存在。

1.3 Elasticsearch官網Java API提供了相對豐富的解讀。(文末參考給出了官網地址)

1.4 Elasticsearch Java API 大致分如下四類:

1.4.1、TransportClient

步驟1:獲取client;
步驟2:執行對應的增、刪、改、查操作。

查詢使用參考(以下我已經驗證過,好用ok):

/**
* Query Search
* @param index
* @param type
* @param term
* @param queryString
*/
private static void querySearch(String index, String type,String term,String queryString){
Client client = createTransportClient();
SearchResponse response = client.prepareSearch(index)
  .setTypes(type)
  // 設定查詢型別
// 1.
SearchType.DFS_QUERY_THEN_FETCH = 精確查詢 // 2.SearchType.SCAN = 掃描查詢,無序 // 3.SearchType.COUNT = 不設定的話,這個為預設值,還有的自己去試試吧 .setSearchType(SearchType.DFS_QUERY_THEN_FETCH) // 設定查詢關鍵詞 .setQuery(QueryBuilders.matchQuery(term, queryString)) .addHighlightedField(term) .setHighlighterPreTags("<em>") .setHighlighterPostTags("</em>") // 設定查詢資料的位置,分頁用 .setFrom(0) // 設定查詢結果集的最大條數 .setSize(60) // 設定是否按查詢匹配度排序 .setExplain(true) // 最後就是返回搜尋響應資訊 .execute() .actionGet(); SearchHits searchHits = response.getHits(); System.out.println("-----------------在["+term+"]中搜索關鍵字["+queryString+"]---------------------"); System.out.println("共匹配到:"+searchHits.getTotalHits()+"條記錄!"); SearchHit[] hits = searchHits.getHits(); for (SearchHit searchHit : hits) { //獲取高亮的欄位 Map<String, HighlightField> highlightFields = searchHit.getHighlightFields(); HighlightField highlightField = highlightFields.get(term); System.out.println("高亮欄位:"+highlightField.getName()+"\n高亮部分內容:"+highlightField.getFragments()[0].string()); Map<String, Object> sourceAsMap = searchHit.sourceAsMap(); Set<String> keySet = sourceAsMap.keySet(); for (String string : keySet) { //key value 值對應關係 System.out.println(string+":"+sourceAsMap.get(string)); } System.out.println(); } }
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46
  • 47
  • 48

1.4.2、RestClient

elasticsearch 5.0引入了一個新的客戶端 RestClient ,使用HTTP API elasticsearch代替內部協議。這需要更少依賴關係。你也不需要關注那麼多版本,當前客戶端也可以用於elasticsearch 2.x版本。

使用參考如下(以下我沒有程式碼驗證):

HttpEntity entity = new NStringEntity(
      "{ \"query\": { \"match_all\": {}}}",
      ContentType.APPLICATION_JSON);
  // alternative: performRequestAsync
  Response response = restClient.performRequest("POST",                                     "/_search", emptyMap(), entity);
  String json = toString(response.getEntity());
  // ...
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

1.4.3、Jest

Jest是ElasticSearch的Java HTTP Rest客戶端。 Jest填補了 ElasticSearch 缺少 Http Rest介面 客戶端的空白。
通過Maven編譯實現,需要設定好不同的版本。現在pom.xml最新的Elasticsearch版本為5.3.3(2017年5月27日),5.3.3的API向ES2.3.4插入索引資料,不能保障資料正常插入,且沒有報錯。

具體使用參考(以下示例跑通,驗證ok):

/**
* @brief:全文檢索入口
* @throws Exception
*/
private static void fullTextQuery(String queryString) throws Exception {
JestClient jestClient = JestExample.getJestClient();   //工廠模式實現
SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
searchSourceBuilder.query(QueryBuilders.queryStringQuery(queryString));

Search search = new Search.Builder(searchSourceBuilder.toString())
// .addIndex("article")
.build();
SearchResult result = jestClient.execute(search);
System.out.println(result.getJsonString());
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15

1.4.4、Spring Data Elasticsearch

這個,沒有深入研究。Spring Data Elasticsearch更適合於使用Spring資料庫的開發人員,並且不想直接與REST API接觸。附參考2有詳細介紹。

2、小結

1)以上API的呼叫方式各有利弊,具體根據開發實際情況做出選擇。
2)具體Java API的 TransportClient 方式與Jest方式的增、刪、改、查操作,可以參考(下附4)。
3)ES的實踐開發還有很長的路要走,尤其分散式部署、原理、出現問題排查、高效檢索 Java API的運用等。

3、參考

1)、API對比:http://blog.florian-hopf.de/2016/11/java-clients-elasticsearch.html
2)、官網API地址:https://www.elastic.co/guide/en/elasticsearch/client/java-api/2.3/index.html
3)、Jest地址:https://github.com/searchbox-io/Jest
4)、程式碼示例:https://github.com/ameizi/elasticsearch-jest-example

——————————————————————————————————
更多ES相關實戰乾貨經驗分享,請掃描下方【銘毅天下】微信公眾號二維碼關注。
(每週至少更新一篇!)

這裡寫圖片描述
和你一起,死磕Elasticsearch
——————————————————————————————————

2017-05-28 15:20 思於家中床前

作者:銘毅天下
轉載請標明出處,原文地址:
http://blog.csdn.net/laoyang360/article/details/72793210
如果感覺本文對您有幫助,請點選‘頂’支援一下,您的支援是我堅持寫作最大的動力,謝謝!

再分享一下我老師大神的人工智慧教程吧。零基礎!通俗易懂!風趣幽默!希望你也加入到我們人工智慧的隊伍中來!http://www.captainbed.net