ElasticSearch學習三:搜尋例項含高亮顯示及搜尋的特殊字元過濾
阿新 • • 發佈:2019-02-14
應用說明見程式碼註解。
或者:
SearchRequestBuilder常用方法說明:
檢索出結果後,通過response.getHits()可以得到所有的SearchHit,得到Hit後,便可迭代Hit取到對應的Document,轉化成為需要的實體。
程式執行結果:
1.簡單搜尋例項展示:
public void search() throws IOException { // 自定義叢集結點名稱 String clusterName = "elasticsearch_pudongping"; // 獲取客戶端 Client client = ESClient.initClient(clusterName); // 建立查詢索引,引數productindex表示要查詢的索引庫為productindex SearchRequestBuilder searchRequestBuilder = client .prepareSearch("productindex"); // 設定查詢索引型別,setTypes("productType1", "productType2","productType3"); // 用來設定在多個型別中搜索 searchRequestBuilder.setTypes("productIndex"); // 設定查詢型別 1.SearchType.DFS_QUERY_THEN_FETCH = 精確查詢 2.SearchType.SCAN = // 掃描查詢,無序 searchRequestBuilder.setSearchType(SearchType.DFS_QUERY_THEN_FETCH); // 設定查詢關鍵詞 searchRequestBuilder .setQuery(QueryBuilders.fieldQuery("title", "Acer")); // 查詢過濾器過濾價格在4000-5000內 這裡範圍為[4000,5000]區間閉包含,搜尋結果包含價格為4000和價格為5000的資料 searchRequestBuilder.setFilter(FilterBuilders.rangeFilter("price") .from(4000).to(5000)); // 分頁應用 searchRequestBuilder.setFrom(0).setSize(60); // 設定是否按查詢匹配度排序 searchRequestBuilder.setExplain(true); // 執行搜尋,返回搜尋響應資訊 SearchResponse response = searchRequestBuilder.execute().actionGet(); SearchHits searchHits = response.getHits(); SearchHit[] hits = searchHits.getHits(); for (int i = 0; i < hits.length; i++) { SearchHit hit = hits[i]; Map<String, Object> result = hit.getSource(); // 列印map集合:{id=26, onSale=true, title=巨集基Acer樂3, price=4009.0, // description=null, createDate=1380530123140, type=2} System.out.println(result); } System.out.println("search success .."); }
說明:
client.prepareSearch用來建立一個SearchRequestBuilder,搜尋即由SearchRequestBuilder執行。
client.prepareSearch方法有引數為一個或多個index,表現在資料庫中,即零個或多個數據庫名,你既可以使用(下面兩個都可以表示在多個索引庫中查詢):
client.prepareSearch().setIndices("index1","index2","index3","index4");
或者:
client.prepareSearch("index1","index2","index3","index4");
SearchRequestBuilder常用方法說明:
(1) setIndices(String... indices):上文中描述過,引數可為一個或多個字串,表示要進行檢索的index; (2) setTypes(String... types):引數可為一個或多個字串,表示要進行檢索的type,當引數為0個或者不呼叫此方法時,表示查詢所有的type; setSearchType(SearchType searchType):執行檢索的類別,值為org.elasticsearch.action.search.SearchType的元素,SearchType是一個列舉型別的類, 其值如下所示: QUERY_THEN_FETCH:查詢是針對所有的塊執行的,但返回的是足夠的資訊,而不是文件內容(Document)。結果會被排序和分級,基於此,只有相關的塊的文件物件會被返回。由於被取到的僅僅是這些,故而返回的hit的大小正好等於指定的size。這對於有許多塊的index來說是很便利的(返回結果不會有重複的,因為塊被分組了) QUERY_AND_FETCH:最原始(也可能是最快的)實現就是簡單的在所有相關的shard上執行檢索並返回結果。每個shard返回一定尺寸的結果。由於每個shard已經返回了一定尺寸的hit,這種型別實際上是返回多個shard的一定尺寸的結果給呼叫者。 DFS_QUERY_THEN_FETCH:與QUERY_THEN_FETCH相同,預期一個初始的散射相伴用來為更準確的score計算分配了的term頻率。 DFS_QUERY_AND_FETCH:與QUERY_AND_FETCH相同,預期一個初始的散射相伴用來為更準確的score計算分配了的term頻率。 SCAN:在執行了沒有進行任何排序的檢索時執行瀏覽。此時將會自動的開始滾動結果集。 COUNT:只計算結果的數量,也會執行facet。 (4) setSearchType(String searchType),與setSearchType(SearchType searchType)類似,區別在於其值為字串型的SearchType,值可為dfs_query_then_fetch、dfsQueryThenFetch、dfs_query_and_fetch、dfsQueryAndFetch、query_then_fetch、queryThenFetch、query_and_fetch或queryAndFetch; (5) setScroll(Scroll scroll)、setScroll(TimeValue keepAlive)和setScroll(String keepAlive),設定滾動,引數為Scroll時,直接用new Scroll(TimeValue)構造一個Scroll,為TimeValue或String時需要將TimeValue和String轉化為Scroll; (6) setTimeout(TimeValue timeout)和setTimeout(String timeout),設定搜尋的超時時間; (7) setQuery,設定查詢使用的Query; (8) setFilter,設定過濾器; (9) setMinScore,設定Score的最小數量; (10) setFrom,從哪一個Score開始查; (11) setSize,需要查詢出多少條結果;
檢索出結果後,通過response.getHits()可以得到所有的SearchHit,得到Hit後,便可迭代Hit取到對應的Document,轉化成為需要的實體。
2.搜尋高亮顯示
SearchRequestBuilder中的addHighlightedField()方法可以定製在哪個域值的檢索結果的關鍵字上增加高亮
public void search() throws IOException {
// 自定義叢集結點名稱
String clusterName = "elasticsearch_pudongping";
// 獲取客戶端
Client client = ESClient.initClient(clusterName);
// 建立查詢索引,引數productindex表示要查詢的索引庫為productindex
SearchRequestBuilder searchRequestBuilder = client
.prepareSearch("productindex");
// 設定查詢索引型別,setTypes("productType1", "productType2","productType3");
// 用來設定在多個型別中搜索
searchRequestBuilder.setTypes("productIndex");
// 設定查詢型別 1.SearchType.DFS_QUERY_THEN_FETCH = 精確查詢 2.SearchType.SCAN = 掃描查詢,無序
searchRequestBuilder.setSearchType(SearchType.DFS_QUERY_THEN_FETCH);
// 設定查詢關鍵詞
searchRequestBuilder
.setQuery(QueryBuilders.fieldQuery("title", "Acer"));
// 查詢過濾器過濾價格在4000-5000內 這裡範圍為[4000,5000]區間閉包含,搜尋結果包含價格為4000和價格為5000的資料
searchRequestBuilder.setFilter(FilterBuilders.rangeFilter("price")
.from(4000).to(5000));
// 分頁應用
searchRequestBuilder.setFrom(0).setSize(60);
// 設定是否按查詢匹配度排序
searchRequestBuilder.setExplain(true);
//設定高亮顯示
searchRequestBuilder.addHighlightedField("title");
searchRequestBuilder.setHighlighterPreTags("<span style=\"color:red\">");
searchRequestBuilder.setHighlighterPostTags("</span>");
// 執行搜尋,返回搜尋響應資訊
SearchResponse response = searchRequestBuilder.execute().actionGet();
//獲取搜尋的文件結果
SearchHits searchHits = response.getHits();
SearchHit[] hits = searchHits.getHits();
ObjectMapper mapper = new ObjectMapper();
for (int i = 0; i < hits.length; i++) {
SearchHit hit = hits[i];
//將文件中的每一個物件轉換json串值
String json = hit.getSourceAsString();
//將json串值轉換成對應的實體物件
Product product = mapper.readValue(json, Product.class);
//獲取對應的高亮域
Map<String, HighlightField> result = hit.highlightFields();
//從設定的高亮域中取得指定域
HighlightField titleField = result.get("title");
//取得定義的高亮標籤
Text[] titleTexts = titleField.fragments();
//為title串值增加自定義的高亮標籤
String title = "";
for(Text text : titleTexts){
title += text;
}
//將追加了高亮標籤的串值重新填充到對應的物件
product.setTitle(title);
//列印高亮標籤追加完成後的實體物件
System.out.println(product);
}
System.out.println("search success ..");
}
程式執行結果:
[id=8,title=巨集基<span style="color:red">Acer</span>,description=巨集基Acer蜂鳥系列,price=5000.0,onSale=true,type=1,createDate=Mon Sep 30 13:46:41 CST 2013]
[id=21,title=巨集基<span style="color:red">Acer</span>,description=巨集基Acer蜂鳥系列,price=5000.0,onSale=true,type=1,createDate=Mon Sep 30 13:48:17 CST 2013]
[id=7,title=巨集基<span style="color:red">Acer</span>,description=巨集基Acer蜂鳥系列,price=5000.0,onSale=true,type=1,createDate=Mon Sep 30 11:38:50 CST 2013]
[id=5,title=巨集基<span style="color:red">Acer</span>樂0,description=<null>,price=4000.0,onSale=true,type=1,createDate=Mon Sep 30 16:35:23 CST 2013]
[id=12,title=巨集基<span style="color:red">Acer</span>樂1,description=<null>,price=4003.0,onSale=false,type=2,createDate=Mon Sep 30 16:35:23 CST 2013]
[id=19,title=巨集基<span style="color:red">Acer</span>樂2,description=<null>,price=4006.0,onSale=false,type=1,createDate=Mon Sep 30 16:35:23 CST 2013]
[id=26,title=巨集基<span style="color:red">Acer</span>樂3,description=<null>,price=4009.0,onSale=true,type=2,createDate=Mon Sep 30 16:35:23 CST 2013]
[id=33,title=巨集基<span style="color:red">Acer</span>樂4,description=<null>,price=4012.0,onSale=false,type=1,createDate=Mon Sep 30 16:35:23 CST 2013]
從程式執行結果中我們可以看到,我們定義的高亮標籤已經追加到指定的域上了.
當搜尋索引的時候,你搜索關鍵字包含了特殊字元,那麼程式就會報錯
// fieldQuery 這個必須是你的索引欄位哦,不然查不到資料,這裡我只設定兩個欄位 id ,title
String title = "title+-&&||!(){}[]^\"~*?:\\";
title = QueryParser.escape(title);// 主要就是這一句把特殊字元都轉義,那麼lucene就可以識別
searchRequestBuilder.setQuery(QueryBuilders.fieldQuery("title", title));