全文索引 Solr
阿新 • • 發佈:2018-11-21
(一)概念介紹
1 分詞: 把一串文字分割成多個關鍵詞,也叫關鍵字.
2 倒敘索引: 根據詞來找文件 ,而普通索引是在文件中找詞,所以效率很低.
(二) Lucene引入
Lucene是apache軟體基金會的一個專案,是一個開放原始碼的全文檢索引擎工具包,在Java開發環境裡Lucene是一個成熟的免費開源工具。就其本身而言,Lucene是當前以及最近幾年最受歡迎的免費Java資訊檢索程式庫。
缺點:
- 效率太低
- 如果商品修改了,則需要同步索引檔案.
- 如果商品新增了,則需要重新遍歷重新索引.
- 重新生成索引檔案的時間較長
(三) Solr介紹 (底層用的是Lucene)
同類型產品: ElasticSearch
(1) Solr是一個獨立的企業級搜尋應用伺服器,它對外提供類似於Web-service的API介面。使用者可以通過http請求,向搜尋引擎伺服器提交一定格式的XML檔案,生成索引;也可以通過Http Get操作提出查詢請求,並得到XML格式的返回結果.
基於Lucene的全文搜尋伺服器。同時對其進行了擴充套件,提供了比Lucene更為豐富的查詢語言,同時實現了可配置、可擴充套件並對查詢效能進行了優化,並且提供了一個完善的功能管理介面,是一款非常優秀的全文搜尋引擎。
使用 HttpSolrClient 進行遠端呼叫
特點:
1. solr可以根據資料庫表自動生成索引檔案.
2. Solr可以動態的定期自動更新索引(對更新的資料進行索引的修改)
(2) 安裝
- Solr5.0以上版本要求jdk必須是1.8
- 將Solr壓縮包上傳到linux伺服器中
- tar -xzvf 壓縮包名.tgz 進行解壓
- 進入bin目錄 使用命令 sh solr start 啟動solr
- 進入 http://伺服器IP:8983 檢視頁面,有頁面就成功了.
以前歌詞裡的安河橋
現在這裡的安河橋