(基礎)CDH Solr 一點通
阿新 • • 發佈:2018-11-09
前言
我用5天時間從零開始瞭解使用Solr,僅僅是片面的瞭解了Solr大概使用
博文目的,只是用於記錄 和 給剛開始學習Solr的朋友一些參考
都是個人理解,如內容有錯誤請見諒並給予評論
概述
需求說明
使用Solr搜尋引擎提高內容檢索效率
元件說明
Hbase :分散式的、面向列的開源資料庫,用於儲存資料
Solr : 基於Lucene的,獨立的,企業級搜尋應用伺服器
ZooKeeper :用於SolrCloud各節點間共享配置等
Key-Value Store Indexer :Hbase到Solr生成索引的中間工具 ,使用的是Lily HBase NRT Indexer服務.
Lily HBase Indexer:一款靈活的、可擴充套件的、高容錯的、事務性的,並且近實時的處理HBase列索引資料的分散式服務軟體元件流程
Solr是通過對檢索目標設定索引來提高檢索響應速度,所以
流程一: 啟動 收集器 與 索引生成器 , 該流程內容包括:
一:建立Hbase資料表
二:生成並設定Solr配置檔案:scheme.xml(自定義Hbase檢索列(名稱,型別,是否建索引,是否儲存),分詞 , 合併其他列等)
三:建立collection(收集器,個人理解),並將上一步生成設定的配置檔案上傳Zookeeper,供Solr叢集節點下載使用,然後啟動收集器
四:生成並配置Lily HBase Indexer配置檔案,用於註冊Hbase索引,並啟動該服務(個人理解:索引生成器)(啟動需指定收集器名)
說明:一,二,三步目的是設定索引項,啟動收集器,並沒有與Hbase表相對映和建立索引項的索引,四步中則是配置Hbase表名及列名與scheme.xml中自定義索引列名的對映關係並啟動
寫入Hbase的資料會通過索引生成器近實時的建立索引,供客戶端搜尋
流程二:使用Solr JAVA客戶端對索引項進行搜尋