lucene7.4總結

阿新 • • 發佈：2018-11-19

一、需求：使用lucene框架實現搜尋介面。

以下時本人記錄的需要注意的地地方及程式碼連結。

1、注意：因為IndexWriter存在寫鎖，需要考慮併發的問題，提供一個lucene工具類，可以參考下：

https://blog.csdn.net/chao2263263364/article/details/48628145

2、索引的建立與維護：

2.1、由於建立索引是一個很耗時的過程，所以在專案啟動時建立索引，索引如下：

2.2、在使用lucene的過程中，會經常對索引相關的資料進行增刪改，但增加和修改資料時，會使lucene建立大量的索引檔案，

如圖：

當大量修改索引資料後，資料夾中的索引檔案將達到可怕的數量。

當然，你可以使用indexWriter.deleteAll()方法刪除之前的索引後，再將索引全部建立一次。但是，之前已經說過了，建立索引是一個非常耗時的，且修改一次資料建立一次索引，想想都蛋疼，所以不建議這麼做。

在這裡本人採用定時器去重新建立索引，例如一個星期執行一次等。

3、搜尋：

3.1、實時搜尋：

https://blog.csdn.net/whuqin/article/details/42922813

IndexWriter writer = new IndexWriter(ramDir, writerConfig);
IndexReader reader = DirectoryReader.open(writer, true);
IndexSearcher searcher = new IndexSearcher(reader);
IndexReader newReader = DirectoryReader.openIfChanged((DirectoryReader) reader, writer, true);
if (reader != newReader) {
    searcher = new IndexSearcher(newReader);
    reader.close();

3.2、搜尋例項：

https://www.cnblogs.com/liuxianan/p/lucene-hello-world.html

String[] fields = {"fileName", "content"}; // 要搜尋的欄位，一般搜尋時都不會只搜尋一個欄位
// 欄位之間的與或非關係，MUST表示and，MUST_NOT表示not，SHOULD表示or，有幾個fields就必須有幾個clauses
BooleanClause.Occur[] clauses = {BooleanClause.Occur.SHOULD, BooleanClause.Occur.SHOULD};
// MultiFieldQueryParser表示多個域解析， 同時可以解析含空格的字串，如果我們搜尋"上海 中國"
Query multiFieldQuery = MultiFieldQueryParser.parse(keyWord, fields, clauses, analyzer);
Query termQuery = new TermQuery(new Term("content", keyWord));// 詞語搜尋,完全匹配,搜尋具體的域
Query wildqQuery = new WildcardQuery(new Term("content", keyWord));// 萬用字元查詢
Query prefixQuery = new PrefixQuery(new Term("content", keyWord));// 欄位字首搜尋
Query fuzzyQuery = new FuzzyQuery(new Term("content", keyWord));// 相似度查詢,模糊查詢比如OpenOffica，OpenOffice
BooleanQuery.Builder queryBuilder = new BooleanQuery.Builder();
queryBuilder.add(multiFieldQuery, BooleanClause.Occur.SHOULD);
queryBuilder.add(termQuery, BooleanClause.Occur.SHOULD);
queryBuilder.add(wildqQuery, BooleanClause.Occur.SHOULD);
queryBuilder.add(prefixQuery, BooleanClause.Occur.SHOULD);
queryBuilder.add(fuzzyQuery, BooleanClause.Occur.SHOULD);
BooleanQuery query = queryBuilder.build(); // 這才是最終的query
TopDocs topDocs = indexSearcher.search(query, 100); // 搜尋前100條結果

4、分頁：

https://blog.csdn.net/hu948162999/article/details/41209699

private ScoreDoc getLastScoreDoc(IndexSearcher indexSearcher, Sort sort, Query query,
                                     Integer pageSize, Integer pageNum) {
        try {
            //獲取上一頁的最後數量
            int num = (pageNum - 1) * pageSize;
            TopDocs tds = indexSearcher.search(query, num, sort);
            return tds.scoreDocs[num - 1];
        } catch (IOException e) {
            logger.error(e.getMessage(), e);
        }
        return null;
    }

ScoreDoc lastScoreDoc = getLastScoreDoc(indexSearcher, sort, query, pageSize,pageNum);
TopDocs docs = indexSearcher.searchAfter(lastScoreDoc, query, pageSize, sort);

5、排序：

首先，需要在建立索引時，建立排序欄位，然後，在根據該欄位new一個排序例項，如：

https://blog.csdn.net/u012965373/article/details/44852169

//構建索引資訊時建立 字串排序
Document doc = new Document();
doc.add(new SortedDocValuesField("name", new BytesRef(bean.getName())));
//數字排序
doc.add(new NumericDocValuesField("age", bean.getAge()));

//搜尋時 true降序
SortField sortField = new SortField("name", SortField.Type.STRING, true);
//SortField ageField = new SortField("age", SortField.Type.INT, false);
Sort sort = new Sort(sortField);
TopDocs docs = indexSearcher.search(query, 100, sort);

6、分詞器：

https://blog.csdn.net/flyingdog123/article/details/67637783

7、索引檢視器luck7.4.0下載地址：

https://download.csdn.net/download/w592376568/10691048

lucene7.4總結

一、需求：使用lucene框架實現搜尋介面。以下時本人記錄的需要注意的地地方及程式碼連結。 1、注意：因為IndexWriter存在寫鎖，需要考慮併發的問題，提供一個lucene工具類，可以

NOIP2016提高A組五校聯考4總結

是個 AC 直接小時打了 ID 訓練什麽知識坑爹的第一題，我居然想了足足3個小時，而且還不確定是否正確。於是，我就在這種情況下心驚膽跳的打了，好在ac了，否則就爆零了。第二題，樹形dp，本來差點就想到了正解，結果時間不夠，沒打完。第三題，比賽上直接棄療。感

10.4總結

取數 inline 總結 math 數據 pan 覆蓋今天路線今天學了\(manacher\)算法。上午是考試，炸裂 \(T1\) 進制轉換完全沒往正數進制轉換上想，死找規律，沒找出來，\(GG\)，我可能是唯一一個沒切掉此題的和正數進制轉換類似，短除法，處理一

Machine Learning week 4 總結

Multivariate Linear Regression 問題可以由函式表示函式，本質上就是兩集合的一種對映關係，從輸入值，得到輸出值。同時函式，也是現實世界的一種抽象表示，就如原因對應結果，事件A對應事件B。通常我們只要給一個問題建立起比較好的數學模型，

演算法-排序4(總結)

如何實現一個通用的，高效能的排序演算法。總結一下前面學過的幾種排序演算法演算法時間複雜度是穩定排序？是原地排序？氣泡排序 O(n^2) ✔

張新宇作業4 總結

軟體二班第三小組學號：2016035205052 姓名：張新宇團隊開發專案：軟體工程課程官網職務：專案經理負責：策劃專案，跟進專案，團隊溝通。一、耕耘情況： 1.給出付出的時間。此次此專案我們一共開發了接近兩個月時間接近2個月的時間 2.給出寫了多少文件，多少字

理解UNDO-4 總結

寫了前面3章後,感覺還魚尾,感覺不完整樣!有魚頭和魚尾的問題沒有得到解決. 好像吃了一條魚,只吃了魚身,沒有看到魚頭和魚頭之疑惑是讀一致性: 當一個查詢找到該塊,如何通過行來發現該行的是否被修改提交過. 怎麼樣找到ITL裡面哪個事務槽影響了該行? 實際上它不需要通過行來判斷

JBPM4.4總結（一）——基礎知識

JBPM(Java Business Process Management)，業務流程管理，是Jboss（現已被Redhat收購）旗下的開源工作流引擎，是覆蓋了業務流程管理，工作流，服務協議等領域的一個開源的，靈活的，易擴充套件的可執行流程語言框架。

Lucene7.4 初體驗

前言本文的簡要內容： Lucene簡介體驗Lucene Demo Lucene 核心類介紹 Lucene 索引檔案格式 Lucene簡介 Lucene是目前最流行的Java開源搜尋引擎類庫,最新版本為7.4.0。Lucene通常用於全文檢索,

coreData 深入理解4 --總結 (執行緒安全與同步--iOS5 前後對比)

Core Data是iOS中很重要的一個部分，可以理解為基於SQLite(當然也可以是其他的Storage，如In-memory，只是SQLite比較常見)的一個ORM實現，所以有關係資料庫的特性，又不用寫SQL。順便吐一下槽，官方說法是使用Core Data能減少50%-70%的程式碼量，但相信用過的人

2019.5.4總結

要去方法打了的人走了不知道中間暫時 5.4 　　又打了一次網絡賽，是東北大學校賽重現賽，兩個簽到模擬題，我和fz一人一道，之後fz聯立一元二次方程，很快過了B，（wcc他們好像卡到這題了）。之後我開那個圖論題，兩三個小時的時候還沒人過，我寫的dij堆優化跑了6

高性能mysql 4,5,6章優化總結

重復自適應數據存儲復雜 insert reat order 是我條目針對數據庫的優化，我們不能單純的說從哪一個方面，需要結合數據表的建立，數據類型的選擇，索引的設計和sql語句來考慮，我就針對怎麽建表，怎麽選擇數據類型，如何應用B-tree索引，hash索引和覆蓋

個人總結4-dbutils總結

基本 user 步驟昨天基礎問題頁面發現個人總結昨天學習了dbutils的使用方法，簡化了使用的步驟，可以使用三四步就可以寫出來，queryRunner的使用方法有了簡單的了解，目前可以使用dbutils實現最簡單的增刪改查。今天

近一個月的學習總結（4.8—5.12）

line spa java泛型思想習題 cti mysql 數組對象 Java-se基礎知識的學習已經告一段落，對自己這一個月的知識體系做一個大致的總結： 1.Java語言基礎（基礎完成） 2.面向對象基礎（封裝、繼承、多態）（基礎完成） 3.抽象類、接口（基礎完成）

Unity 的一些優化總結（難度3 推薦4）

rdo serial 分配內存 down 物理系統頂點最大 nbsp ade 原文地址： http://www.jianshu.com/p/3acee1101fe4 從別的地方看到一些資源使用方面的文章，從中抽取一些細節在這裏總結一下： Draw Call數量、Tria

Unity遊戲項目性能優化總結（難度3 推薦4）

節點 alloc debug.log 系統 form 都是開發變量聲明 oid 原文地址： https://zhuanlan.zhihu.com/p/24392681 本文就Unity遊戲項目性能優化作出了總結。包括Profile工具、Unity使用、機制設計、腳本編寫

Git總結筆記4-git push origin master 報錯的解決方法

failed 總結筆記 rebase nbsp read hint err ont version 1 錯誤提示如下： 2 [[email protected]/* */ php]# git push -u origin master 3 To [ema

UML總結4---UML九種圖關系說明

-cp 旅行聯系 charge 5.1 用戶通過屬於又是轉自：http://blog.csdn.NET/chenyujing1234/article/details/8173519 UML中包括九種圖：用例圖、類圖、對象圖、狀態圖、時序圖、協作圖、活動圖、組件

zabbix 2.4.5升級到3.2.6總結

zabbix1、如果php版本小於5.6，需要升級到5.6以上。2、保存數據庫不變，當zabbix server或zabbix proxy升級後啟動時會自動更新數據庫。3、整個架構的zabbix server 和 zabbix proxy都要同時升級。4、如果升級後新增到proxy的機器無法識別，先重啟pro

Ubuntu12.04.4 Vmware 虛擬機安裝總結

uri 文章 smb.conf 點擊 oot 匹配 sdi 指令 unity Ubuntu12.04.4 Vmware 虛擬機安裝總結背景：近期準備入手一塊樹莓派（RaspberryPI），準備一下開發環境，可惜機器硬盤小，又舍不得格調Win7，所以僅僅好裝虛擬機了。

lucene7.4總結

相關推薦