1. 程式人生 > >Lucene : 基於Java的全文搜尋引擎

Lucene : 基於Java的全文搜尋引擎

  Lucene是一款基於Java的全文檢索引擎,跟Sphinx相比,Lucene的功能更為強大,應用面也更加廣闊。目前市面上也有不少全文搜尋引擎也是基於Lucene實現的,比如Elastic Search、Solr、Luke等。

  下面是Lucene的一些優點,摘自百度百科

  ·索引檔案格式獨立於應用平臺。Lucene定義了一套以8位位元組為基礎的索引檔案格式,使得相容系統或者不同平臺的應用能夠共享建立的索引檔案。

  ·在傳統全文檢索引擎的倒排索引的基礎上,實現了分塊索引,能夠針對新的檔案建立小檔案索引,提升索引速度。然後通過與原有索引的合併,達到優化的目的。

  ·優秀的面向物件的系統架構,使得對於Lucene擴充套件的學習難度降低,方便擴充新功能。

  ·設計了獨立於語言和檔案格式的文字分析介面,索引器通過接受Token流完成索引檔案的創立,使用者擴充套件新的語言和檔案格式,只需要實現文字分析的介面。

  ·已經預設實現了一套強大的查詢引擎,使用者無需自己編寫程式碼即可使系統可獲得強大的查詢能力,Lucene的查詢實現中預設實現了布林操作、模糊查詢(Fuzzy Search[11])、分組查詢等等。