重新更新索引的方法

阿新 • • 發佈：2019-01-04

由於分詞工具用的使用者字典有了更新，比如加入了一些出現頻度較高的專有名詞。
這時候希望通過重建索引，使查詢結果更加準確。
但是，由於一些資訊是當初建索引時加入的，而且這些資訊是不能從原始檔案中提取的，如當初的上傳者是誰、上傳日期等。所以，不能夠直接刪除索引檔案，重新來過。

為此，必須遍歷原有索引，將其中進行了分析的Field重新分析並更新，不需要分析的Field則保持不變。

/**
 * 為現有檔案重新建立索引
 * 例如當更新了使用者字典時使用
 */
public void rebuildIndex(){
    IndexReader ireader = null;
    IndexWriter iwriter = null;
    Directory directory = null;
    try {
        long start = new Date().getTime();
        //前期準備工作
        File indexPath = new File(SystemProperties.getIndexPath());
        directory = FSDirectory.open(indexPath);
        //例項化IKAnalyzer分詞器
        Analyzer analyzer = new IKAnalyzer();
        //Analyzer analyzer = new CJKAnalyzer(Version.LUCENE_CURRENT);
        //建立記憶體索引物件
        ireader = IndexReader.open(directory);
        if (indexPath.list().length > 0) {
            // 已有以往索引
            iwriter = new IndexWriter(directory, analyzer, false, IndexWriter.MaxFieldLength.LIMITED);
        } else {
            // 首次建立索引
            iwriter = new IndexWriter(directory, analyzer, true, IndexWriter.MaxFieldLength.LIMITED);
        }
        //遍歷每一已有Document
        for (int i = 0; i < ireader.maxDoc(); i++) {
            try {
                // 提取原Document
                Document oldDoc = ireader.document(i);
                // 建立新Document
                Document newDoc = new Document();
                // 不變的Field直接從原Document中取
                // KEY
                newDoc.add(oldDoc.getField(Constants.FEILD_NAME_KEY));
                // 檔名
                newDoc.add(oldDoc.getField(Constants.FEILD_NAME_CLIENTNAME)); 
                newDoc.add(oldDoc.getField(Constants.FEILD_NAME_SERVERNAME));
                // 檔案型別
                newDoc.add(oldDoc.getField(Constants.FEILD_NAME_FILETYPE));
                // 加入時間
                newDoc.add(oldDoc.getField(Constants.FEILD_NAME_ADDTIME));
                // 所屬部門，使用者查詢時的許可權控制
                newDoc.add(oldDoc.getField(Constants.FEILD_NAME_OWNER));
                // 不變的Field從原Document中取得後，重新Analyse
                // 標題
                String title = oldDoc.getField(Constants.FEILD_NAME_TITLE).stringValue();
                newDoc.add(new Field(Constants.FEILD_NAME_TITLE, title, Field.Store.YES, Field.Index.ANALYZED));
                // 內容
                String text = oldDoc.getField(Constants.FEILD_NAME_CONTENTS).stringValue();
                newDoc.add(new Field(Constants.FEILD_NAME_CONTENTS, text, Field.Store.YES, Field.Index.ANALYZED));
                String key = oldDoc.getField(Constants.FEILD_NAME_KEY).stringValue();
                // 用KEY做查詢條件
                Term term = new Term(Constants.FEILD_NAME_KEY, key);
                // 替換原有的Document
                iwriter.updateDocument(term, newDoc);   
            } catch (Throwable t) {
                if (log.isErrorEnabled()) {
                    log.error(t.getMessage());
                }
            }
        }
        long end = new Date().getTime();

        if (log.isDebugEnabled()) {
            log.debug("Rebuild Index: " + ireader.maxDoc() + " documents, in " + (end - start) + " milliseconds.");
        }
    } catch (Throwable t) {
        if (log.isErrorEnabled()) {
            log.error(t.getMessage());
        }
    } finally {
        if (ireader != null) {
            try {
                ireader.close();
            } catch (AlreadyClosedException e) {
                log.error(e.getMessage());
            } catch (IOException e) {
                log.error(e.getMessage());
            }
        }
        if (iwriter != null) {
            try {
                // 注意這一句非常重要，否則雖然效果已經達到，但Documents數和儲存空間都會翻倍！
                // 但使用此方法的前提是，磁碟剩餘空間必須有已用索引空間的2倍
                // 此時由於重建，索引空間已經是翻倍的了，所以剩餘空間應該有之前索引空間的4被！
                iwriter.optimize();
                iwriter.close();
            } catch (AlreadyClosedException e) {
                log.error(e.getMessage());
            } catch (IOException e) {
                log.error(e.getMessage());
            }
        }
        if (directory != null) {
            try {
                directory.close();
            } catch (IOException e) {
                log.error(e.getMessage());
            }
        }
    }
}

剛剛接觸Lucene時間不長，不知道以上自己“杜撰”的程式碼是否可行，請大家多多指點。

重新更新索引的方法

由於分詞工具用的使用者字典有了更新，比如加入了一些出現頻度較高的專有名詞。這時候希望通過重建索引，使查詢結果更加準確。但是，由於一些資訊是當初建索引時加入的，而且這些資訊是不能從原始檔案中提取的，如當初的上傳者是誰、上傳日期等。所以，不能夠直接刪除索引檔案，重新來過。為此

PRISM 6 命令Command 屬性更改時自動通知命令重新更新命令狀態的方法

屬性更改時自動通知命令重新更新命令狀態的方法方法一 1、定義屬性。性性中新增此句ExecuteDelegateCommand.RaiseCanExecuteChanged(); private bool _isEnabled; publi

nexus 離線更新索引

pan sonatype ava repo earch home repos 下載 r文件 1、到http://repo.maven.apache.org/maven2/.index/頁面下載下面這兩個文件：　　nexus-maven-repository-index.g

Python中的分片和索引方法

python分片和索引本章淺寫字符串的分片和索引分片分片就是給定義的字符串中分離出部分內容字符串的分片和索引取第5位字符的值為e註意給出一個字符串，可輸出任意一個字符，也可從後往前取，是從-1開始的負數; string[0]代表第一個字符，string[-1]為最後一個字符，空格也算一個字符； aa =

PHP中調用SVN命令更新網站方法（解決文件名包含中文更新失敗的問題）

設置 php tro 參數名稱 www 文件命令更新失敗想說寫一個通過網頁就可以執行 SVN 升級的程序，結果並不是我想得那樣簡單，有一些眉角需要註意的說。先以 Apache 的用戶帳號執行 SVN checkout，這樣 Apache 才有 SVN 的鏈結權力，

簡單的反編譯class文件並重新編譯的方法

編譯報錯令行技術 ssp .cn lib cnblogs ron 系統在沒有.java源碼的情況下，如果想修改一個.class文件。可以通過以下步驟實現：修改前的class文件：一、反編譯.class文件成.java文件。　　1、可以使用Java Decomp

Red Hat Enterprise Linux Server6.5使用CentOS yum源更新的方法

[[email protected] yum.repos.d]# cat /etc/redhat-release Red Hat Enterprise Linux Server release 6.5 (Santiago) [[email protected]

phpcms 更換新域名更新欄目url和內容頁url無法更新解決方法

更換域名後更新欄目url和內容頁url還是無法更新為新的域名，手動把cache資料夾下能清除的快取檔案清除了還是不行，把資料庫的快取表內容清空了還是不行，問題在於欄目快取並沒有清除。解決辦法: （1）、找到檔案：/caches/configs/system.php裡面所有和域名有關的

1107_Linux系統下如何安裝Nexus（使用Nexus搭建Maven私服）-2.Nexus倉庫設定，手動更新索引，自動更新索引

Linux系統下如何安裝Nexus（使用Nexus搭建Maven私服）-2.Nexus倉庫設定，手動更新索引，自動更新索引 2018年08月27日 17:30:53 weixin_42828741 閱讀數：64 還未安裝的可閱讀以下文章： Linux系統下如何安裝Nexus（使用Nexus搭

windows10禁用更新新方法

data .cn asc sel sni 更新 lse gin lec 本方法由本人在無意中發現，實測有效 1.第一步打開文件管理器路徑進入到win10的下載更新文件的目錄 C:\Windows\SoftwareDistribution ? 選中Download文件夾

win10徹底關閉windows update 自動更新的方法

1、關閉windows update服務右鍵我的電腦→“管理”→“服務”→“windows update” 右鍵“windows update”→“屬性” 在“常規”標籤下，選擇“啟動型別”為“禁用”，點選“停止”，點選“應用” 在“恢復”標籤下，把三個失敗選項均改為“無操作”，

mysql索引類型和索引方法

重復如果得到但是保存數據 ng- 決定點距數據庫索引類型 mysql索引類型normal，unique，full text的區別是什麽？ normal：表示普通索引 unique：表示唯一的，不允許重復的索引，如果該字段信息保證不會重復例如身份

2.Nexus更新索引

1.手動更新1. 下載索引檔案在http://repo.maven.apache.org/maven2/.index/ 中下載nexus-maven-repository-index.gznexus-maven-repository-index.properties然

Apk去掉簽名以及重新簽名的方法

Android開發中很重要的一部就是用自己的金鑰給Apk檔案簽名，不經過簽名的Apk檔案一般是無法安裝的，就算裝了最後也是失敗。網上流傳的“勾選允許安裝未知來源的應用”其實跟籤不簽名沒啥關係，說白了就是允許安裝不從電子市場上下載的應用而已。近幾日需要修改一個Apk中JNI呼叫的.so檔案

Laravel一次更新多條記錄，批量更新的方法

在我們實際應用中，免不了這樣的情況——例如我們同時錄入多條資訊，可能三條五條還好說，但量一旦變大，就會增加讀寫資料庫的次數，會降低效率，那麼，我們該如何實現，做到一次讀寫資料庫，批量更新呢？例如這種情況： HTML程式碼： <!doctype html> &l

mysql索引型別Normal,Unique,Full Text區別及索引方法Btree,Hash的區別

mysql索引型別Normal,Unique,Full Text區別 Normal: 表示普通索引，大多數情況下都可以使用 Unique: 約束唯一標識資料庫表中的每一條記錄，即在單表中不能用每條記錄是唯一的（例如身份證就是唯一的），Unique(要求列唯

重新更新！謝謝大家的支援與關注！再次感謝！

大家好，我從16年開始做軟體開發，經過漫長歲月，忙的自己都沒有時間去更新部落格了，從Salesforce的二次開發再到商業軟體的應用，包括CRM，EHR，HCM，ERP，BI，OA，E-learing

Swift重新父類方法定義一個可讀屬性進行懶載入

//重新父類的方法重新必須要寫的單詞是override override func run() { print("奔跑吧兄弟") } //定義一個只讀屬性 var height:String{ return "

模擬人生4 春夏秋冬、星夢起飛版更新下載方法以及常見問題

很多小夥伴在更新模擬人生4的時候，經常出現各種各樣的問題，今天廢魚就根據大家的問題，整理了一下模擬人生4更新安裝的方法，以及一些常用問題的解決方法給大家。模擬人生下載：http://www.macbl.com/app/games/the-sims-4 模擬人生4（星夢起飛

ElasticSearch批量更新索引的優化

1. 多執行緒程式插入可以根據伺服器情況開啟多個執行緒index，速度可以提高n倍, n>=2 2. 取消replias 如果有多臺機器，可以以每臺設定n個shards的方式，根據業務情況，可以考慮取消replias curl -XPUT ‘http://127

重新更新索引的方法

相關推薦