(基礎:流程一)CDH Solr 一點通
阿新 • • 發佈:2018-11-09
流程一: 啟動 收集器 與 索引生成器
該流程內容包括
一:建立Hbase資料表
<Hbase shell> <!--Hbase表開啟列簇REPLICATION複製功能--> create 'test',{NAME => 'cf', REPLICATION_SCOPE => 1} <!--如建表時已設定REPLICATION_SCOPE=>1 , 該步驟省略--> disable 'test' alter 'test',{NAME => 'cf', REPLICATION_SCOPE => 1} enable 'test'
二:生成並設定Solr配置檔案:scheme.xml
(自定義域(名稱,型別,是否建索引,是否儲存),分詞 , 合併其他列等)
<Linux shell> solrctl instancedir --generate ./test vi ./test/conf/schema.xml <!-- solr 索引定義--> <!-- 域名隨意,避免與該檔案預設field名字重複,預設有(id,title等) 名稱要與Morphline.conf檔案(該檔案在第四步生成配置)>中的outputField屬性值對應 **屬性多且有講究,該處不做描述 name:自定義域名稱 type:域型別 indexed:是否建索引 stored:是否儲存 -->
<!-- 在<fields>..</fields>中新增--> <field name="title_" type="string" indexed="true" stored="true" />三:建立collection(收集器,個人理解),並將上一步生成設定的配置檔案上傳Zookeeper,供Solr叢集節點下載使用,然後啟動收集器
四:生成並配置Lily HBase Indexer配置檔案,用於註冊Hbase索引,並啟動該服務(個人理解:索引生成器)(啟動需指定收集器名)