1. 程式人生 > >全文索引 Solr

全文索引 Solr

(一)概念介紹

  1 分詞: 把一串文字分割成多個關鍵詞,也叫關鍵字.

  2 倒敘索引: 根據詞來找文件 ,而普通索引是在文件中找詞,所以效率很低.

  

 

(二) Lucene引入

  Luceneapache軟體基金會的一個專案,是一個開放原始碼的全文檢索引擎工具包,在Java開發環境裡Lucene是一個成熟的免費開源工具。就其本身而言,Lucene是當前以及最近幾年最受歡迎的免費Java資訊檢索程式庫。

  缺點:

  1. 效率太低
  2. 如果商品修改了,則需要同步索引檔案.
  3. 如果商品新增了,則需要重新遍歷重新索引.
  4. 重新生成索引檔案的時間較長
    .

 

(三) Solr介紹 (底層用的是Lucene)

  同類型產品: ElasticSearch

 

   (1) Solr是一個獨立的企業級搜尋應用伺服器,它對外提供類似於Web-serviceAPI介面。使用者可以通過http請求,向搜尋引擎伺服器提交一定格式的XML檔案,生成索引;也可以通過Http Get操作提出查詢請求,並得到XML格式的返回結果.

  基於Lucene的全文搜尋伺服器。同時對其進行了擴充套件,提供了比Lucene更為豐富的查詢語言,同時實現了可配置、可擴充套件並對查詢效能進行了優化,並且提供了一個完善的功能管理介面,是一款非常優秀的全文搜尋引擎。

  使用 HttpSolrClient 進行遠端呼叫

 

  特點:

  1. solr可以根據資料庫表自動生成索引檔案.

  2. Solr可以動態的定期自動更新索引(對更新的資料進行索引的修改)

  (2) 安裝

  1. Solr5.0以上版本要求jdk必須是1.8
  2. 將Solr壓縮包上傳到linux伺服器中
  3. tar -xzvf 壓縮包名.tgz 進行解壓
  4. 進入bin目錄   使用命令   sh solr start 啟動solr
  5. 進入 http://伺服器IP:8983 檢視頁面,有頁面就成功了.

 


 

      

        以前歌詞裡的安河橋

             現在這裡的安河橋