Solr安裝步驟
一、Solr概述
1、什麽是Solr
Solr 是Apache下的一個頂級開源項目,采用Java開發,它是基於Lucene的全文搜索服務器。Solr提供了比Lucene更為豐富的查詢語言,同時實現了可配置、可擴展,並對索引、搜索性能進行了優化。
Solr可以獨立運行,運行在Jetty、Tomcat等這些Servlet容器中,Solr 索引的實現方法很簡單,用 POST 方法向 Solr 服務器發送一個描述 Field 及其內容的 XML 文檔,Solr根據xml文檔添加、刪除、更新索引 。Solr 搜索只需要發送 HTTP GET 請求,然後對 Solr 返回Xml、json等格式的查詢結果進行解析,組織頁面布局。Solr不提供構建UI的功能,Solr提供了一個管理界面,通過管理界面可以查詢Solr的配置和運行情況。
2、下載
從Solr官方網站(http://lucene.apache.org/solr/ )下載Solr4.10.3,根據Solr的運行環境,Linux下需要下載lucene-4.10.3.tgz,windows下需要下載lucene-4.10.3.zip。
Solr使用指南可參考:https://wiki.apache.org/solr/FrontPage。
下載lucene-4.10.3.zip並解壓:
bin:solr的運行腳本
contrib:solr的一些貢獻軟件/插件,用於增強solr的功能。
dist:該目錄包含build過程中產生的war和jar文件,以及相關的依賴文件。
docs:solr的API文檔
example:solr工程的例子目錄:
l example/solr:
該目錄是一個包含了默認配置信息的Solr的Core目錄。
l example/multicore:
該目錄包含了在Solr的multicore中設置的多個Core目錄。
l example/webapps:
該目錄中包括一個solr.war,該war可作為solr的運行實例工程。
licenses:solr相關的一些許可信息
二、Windows下的Solr安裝及配置
1、運行環境
solr 需要運行在一個Servlet容器中,Solr4.10.3要求jdk使用1.7以上,Solr默認提供Jetty(java寫的Servlet容器),本教程使用Tocmat作為Servlet容器,環境如下:
Solr:Solr4.10.3
Jdk:jdk1.7.0_72
Tomcat:apache-tomcat-7.0.53
2、Solr整合Tomcat
- 將dist\solr-4.10.3.war拷貝到Tomcat的webapp目錄下改名為solr.war
- 啟動tomcat後,solr.war自動解壓,將原來的solr.war刪除。
- 拷貝example\lib\ext 目錄下所有jar包到Tomcat的webapp\solr\WEB-INF\lib目錄下
- 拷貝log4j.properties文件
在 Tomcat下webapps\solr\WEB-INF目錄中創建文件 classes文件夾,
復制Solr目錄下example\resources\log4j.properties至Tomcat下webapps\solr\WEB-INF\classes目錄
- 創建solrhome及配置solrcore的solrconfig.xml文件
- 修改Tomcat目錄 下webapp\solr\WEB-INF\web.xml文件,如下所示:
設置Solr home
<!--配置jndi告訴solr工程我們的solrhome的位置--> <env-entry> <env-entry-name>solr/home</env-entry-name> <env-entry-value>D:/temp/solr/solrhome</env-entry-value> <env-entry-type>java.lang.String</env-entry-type> </env-entry>
三、Linux下的Solr安裝及配置
- 第一步:安裝linux、jdk、tomcat
[[email protected] ~]# ll total 8044 -rw-r--r--. 1 root root 8234674 Oct 27 2013 apache-tomcat-7.0.47.tar.gz [root@localhost ~]# tar -zxf apache-tomcat-7.0.47.tar.gz [[email protected] ~]# ll total 8048 drwxr-xr-x. 9 root root 4096 Sep 10 17:55 apache-tomcat-7.0.47 -rw-r--r--. 1 root root 8234674 Oct 27 2013 apache-tomcat-7.0.47.tar.gz [root@localhost ~]# mkdir /usr/local/solr [[email protected] ~]# cp apache-tomcat-7.0.47 /usr/local/solr/tomcat cp: omitting directory `apache-tomcat-7.0.47‘ [root@localhost ~]# cp apache-tomcat-7.0.47 /usr/local/solr/tomcat -r [[email protected] ~]# cd /usr/local/solr/ [[email protected] solr]# ll total 4 drwxr-xr-x. 9 root root 4096 Sep 10 17:56 tomcat [root@localhost solr]#
- 第二步:把solr的壓縮包上傳到服務器。並解壓
- 第三步:把/root/solr-4.10.3/dist/solr-4.10.3.war包部署到tomcat下。並改名為solr.war
[[email protected] dist]# cp solr-4.10.3.war /usr/local/solr/tomcat/webapps/solr.war
- 第四步:解壓war包。啟動tomcat自動解壓。關閉tomcat。刪除solr.war
- 第五步:把/root/solr-4.10.3/example/lib/ext 目錄下所有的jar包復制到solr工程中
[[email protected] ext]# cp * /usr/local/solr/tomcat/webapps/solr/WEB-INF/lib/
- 第六步:創建solrhome。Solrhome是存放solr服務器所有配置文件的目錄
[[email protected] example]# pwd /root/solr-4.10.3/example [root@localhost example]# cp -r solr /usr/local/solr/solrhome [[email protected] example]#
- 第七步:告訴solr服務器solrhome的位置
需要修改solr工程的web.xml文件:
- 第八步:啟動tomcat
四、Solr界面功能
五、安裝中文分詞器
- 第一步:使用IK-Analyzer。把分析器的文件夾上傳到服務器
- 第二步:需要把分析器的jar包添加到solr工程中
[[email protected] IK Analyzer 2012FF_hf1]# cp IKAnalyzer2012FF_u1.jar /usr/local/solr/tomcat/webapps/solr/WEB-INF/lib/ [[email protected] IK Analyzer 2012FF_hf1]#
- 第三步:需要把IKAnalyzer需要的擴展詞典及停用詞詞典、配置文件復制到solr工程的classpath
/usr/local/solr/tomcat/webapps/solr/WEB-INF/classes [root@localhost IK Analyzer 2012FF_hf1]# cp IKAnalyzer.cfg.xml ext_stopword.dic mydict.dic /usr/local/solr/tomcat/webapps/solr/WEB-INF/classes [[email protected] IK Analyzer 2012FF_hf1]#
註意:擴展詞典及停用詞詞典的字符集必須是utf-8。不能使用windows記事本編輯
- 第四步:配置fieldType。需要在solrhome/collection1/conf/schema.xml中配置
技巧:使用vi、vim跳轉到文檔開頭gg。跳轉到文檔末尾:G
<fieldType name="text_ik" class="solr.TextField"> <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/> </fieldType>
六、業務字段配置
業務字段判斷標準:
1、在搜索時是否需要在此字段上進行搜索。例如:商品名稱、商品的賣點、商品的描述
2、後續的業務是否需要用到此字段。例如:商品id。
需要用到的字段:
1、商品id
2、商品title
3、賣點
4、價格
5、商品圖片
6、商品分類名稱
7、商品描述
需要在solrhome/collection1/conf/schema.xml末尾處配置
<field name="item_title" type="text_ik" indexed="true" stored="true"/> <field name="item_sell_point" type="text_ik" indexed="true" stored="true"/> <field name="item_price" type="long" indexed="true" stored="true"/> <field name="item_image" type="string" indexed="false" stored="true" /> <field name="item_category_name" type="string" indexed="true" stored="true" /> <field name="item_desc" type="text_ik" indexed="true" stored="false" /> <field name="item_keywords" type="text_ik" indexed="true" stored="false" multiValued="true"/> <copyField source="item_title" dest="item_keywords"/> <copyField source="item_sell_point" dest="item_keywords"/> <copyField source="item_category_name" dest="item_keywords"/> <copyField source="item_desc" dest="item_keywords"/>
重新啟動tomcat
Solr安裝步驟