1. 程式人生 > >Solr安裝步驟

Solr安裝步驟

復制 copy 格式 什麽是 是否 src page conf 文件夾

一、Solr概述

1、什麽是Solr

Solr 是Apache下的一個頂級開源項目,采用Java開發,它是基於Lucene的全文搜索服務器。Solr提供了比Lucene更為豐富的查詢語言,同時實現了可配置、可擴展,並對索引、搜索性能進行了優化。

Solr可以獨立運行,運行在Jetty、Tomcat等這些Servlet容器中,Solr 索引的實現方法很簡單,用 POST 方法向 Solr 服務器發送一個描述 Field 及其內容的 XML 文檔,Solr根據xml文檔添加、刪除、更新索引 。Solr 搜索只需要發送 HTTP GET 請求,然後對 Solr 返回Xml、json等格式的查詢結果進行解析,組織頁面布局。Solr不提供構建UI的功能,Solr提供了一個管理界面,通過管理界面可以查詢Solr的配置和運行情況。

2、下載

從Solr官方網站(http://lucene.apache.org/solr/ )下載Solr4.10.3,根據Solr的運行環境,Linux下需要下載lucene-4.10.3.tgz,windows下需要下載lucene-4.10.3.zip。

Solr使用指南可參考:https://wiki.apache.org/solr/FrontPage。

下載lucene-4.10.3.zip並解壓:

技術分享

bin:solr的運行腳本

contrib:solr的一些貢獻軟件/插件,用於增強solr的功能。

dist:該目錄包含build過程中產生的war和jar文件,以及相關的依賴文件。

docs:solr的API文檔

example:solr工程的例子目錄:

l example/solr:

該目錄是一個包含了默認配置信息的Solr的Core目錄。

l example/multicore:

該目錄包含了在Solr的multicore中設置的多個Core目錄。

l example/webapps:

該目錄中包括一個solr.war,該war可作為solr的運行實例工程。

licenses:solr相關的一些許可信息

二、Windows下的Solr安裝及配置

1、運行環境

solr 需要運行在一個Servlet容器中,Solr4.10.3要求jdk使用1.7以上,Solr默認提供Jetty(java寫的Servlet容器),本教程使用Tocmat作為Servlet容器,環境如下:

Solr:Solr4.10.3

Jdk:jdk1.7.0_72

Tomcat:apache-tomcat-7.0.53

2、Solr整合Tomcat

  • 將dist\solr-4.10.3.war拷貝到Tomcat的webapp目錄下改名為solr.war
  • 啟動tomcat後,solr.war自動解壓,將原來的solr.war刪除。
  • 拷貝example\lib\ext 目錄下所有jar包到Tomcat的webapp\solr\WEB-INF\lib目錄下

技術分享

技術分享

  • 拷貝log4j.properties文件

在 Tomcat下webapps\solr\WEB-INF目錄中創建文件 classes文件夾,

復制Solr目錄下example\resources\log4j.properties至Tomcat下webapps\solr\WEB-INF\classes目錄

  • 創建solrhome及配置solrcore的solrconfig.xml文件
  • 修改Tomcat目錄 下webapp\solr\WEB-INF\web.xml文件,如下所示:

設置Solr home

<!--配置jndi告訴solr工程我們的solrhome的位置-->
<env-entry>
    <env-entry-name>solr/home</env-entry-name>
    <env-entry-value>D:/temp/solr/solrhome</env-entry-value>
    <env-entry-type>java.lang.String</env-entry-type>
</env-entry>

三、Linux下的Solr安裝及配置

  • 第一步:安裝linux、jdk、tomcat
[[email protected] ~]# ll
total 8044
-rw-r--r--. 1 root root 8234674 Oct 27  2013 apache-tomcat-7.0.47.tar.gz
[root@localhost ~]# tar -zxf apache-tomcat-7.0.47.tar.gz 
[[email protected] ~]# ll
total 8048
drwxr-xr-x. 9 root root    4096 Sep 10 17:55 apache-tomcat-7.0.47
-rw-r--r--. 1 root root 8234674 Oct 27  2013 apache-tomcat-7.0.47.tar.gz
[root@localhost ~]# mkdir /usr/local/solr
[[email protected] ~]# cp apache-tomcat-7.0.47 /usr/local/solr/tomcat
cp: omitting directory `apache-tomcat-7.0.47‘
[root@localhost ~]# cp apache-tomcat-7.0.47 /usr/local/solr/tomcat -r
[[email protected] ~]# cd /usr/local/solr/
[[email protected] solr]# ll
total 4
drwxr-xr-x. 9 root root 4096 Sep 10 17:56 tomcat
[root@localhost solr]#
  • 第二步:把solr的壓縮包上傳到服務器。並解壓
  • 第三步:把/root/solr-4.10.3/dist/solr-4.10.3.war包部署到tomcat下。並改名為solr.war
[[email protected] dist]# cp solr-4.10.3.war /usr/local/solr/tomcat/webapps/solr.war
  • 第四步:解壓war包。啟動tomcat自動解壓。關閉tomcat。刪除solr.war
  • 第五步:把/root/solr-4.10.3/example/lib/ext 目錄下所有的jar包復制到solr工程中
[[email protected] ext]# cp * /usr/local/solr/tomcat/webapps/solr/WEB-INF/lib/
  • 第六步:創建solrhome。Solrhome是存放solr服務器所有配置文件的目錄
[[email protected] example]# pwd
/root/solr-4.10.3/example
[root@localhost example]# cp -r solr /usr/local/solr/solrhome
[[email protected] example]#
  • 第七步:告訴solr服務器solrhome的位置

需要修改solr工程的web.xml文件:

技術分享

  • 第八步:啟動tomcat

技術分享

四、Solr界面功能

技術分享

技術分享

技術分享

技術分享

技術分享

五、安裝中文分詞器

  • 第一步:使用IK-Analyzer。把分析器的文件夾上傳到服務器
  • 第二步:需要把分析器的jar包添加到solr工程中
[[email protected] IK Analyzer 2012FF_hf1]# cp IKAnalyzer2012FF_u1.jar /usr/local/solr/tomcat/webapps/solr/WEB-INF/lib/
[[email protected] IK Analyzer 2012FF_hf1]#
  • 第三步:需要把IKAnalyzer需要的擴展詞典及停用詞詞典、配置文件復制到solr工程的classpath
/usr/local/solr/tomcat/webapps/solr/WEB-INF/classes

[root@localhost IK Analyzer 2012FF_hf1]# cp IKAnalyzer.cfg.xml ext_stopword.dic mydict.dic /usr/local/solr/tomcat/webapps/solr/WEB-INF/classes
[[email protected] IK Analyzer 2012FF_hf1]# 

註意:擴展詞典及停用詞詞典的字符集必須是utf-8。不能使用windows記事本編輯

  • 第四步:配置fieldType。需要在solrhome/collection1/conf/schema.xml中配置

技巧:使用vi、vim跳轉到文檔開頭gg。跳轉到文檔末尾:G

<fieldType name="text_ik" class="solr.TextField">
    <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

技術分享

六、業務字段配置

業務字段判斷標準:

1、在搜索時是否需要在此字段上進行搜索。例如:商品名稱、商品的賣點、商品的描述

2、後續的業務是否需要用到此字段。例如:商品id。

需要用到的字段:

1、商品id

2、商品title

3、賣點

4、價格

5、商品圖片

6、商品分類名稱

7、商品描述

需要在solrhome/collection1/conf/schema.xml末尾處配置

<field name="item_title" type="text_ik" indexed="true" stored="true"/>
<field name="item_sell_point" type="text_ik" indexed="true" stored="true"/>
<field name="item_price"  type="long" indexed="true" stored="true"/>
<field name="item_image" type="string" indexed="false" stored="true" />
<field name="item_category_name" type="string" indexed="true" stored="true" />
<field name="item_desc" type="text_ik" indexed="true" stored="false" />

<field name="item_keywords" type="text_ik" indexed="true" stored="false" multiValued="true"/>
<copyField source="item_title" dest="item_keywords"/>
<copyField source="item_sell_point" dest="item_keywords"/>
<copyField source="item_category_name" dest="item_keywords"/>
<copyField source="item_desc" dest="item_keywords"/>

重新啟動tomcat

技術分享

Solr安裝步驟