solr安裝
下載地址:http://apache.dataguru.cn/lucene/solr/4.7.2/
環境搭建:http://www.tuicool.com/articles/vaquIb
建立core:http://my.oschina.net/zhanyu/blog/86147
http://blog.csdn.net/cq1982/article/details/44671859
1)將下載下來的 solr 壓縮包解壓,解壓後的目錄結構如下圖
2)將 solr-4.7.2/example/ 資料夾下的 solr 資料夾放到你硬碟中的任意你想要的存放的位置,我放到了 C 盤目錄下。
3)將解壓後的 solr 目錄中的 solr-4.7.0/example/webapp/solr 目錄下的 solr.war 複製到 C:\apache-tomcat-8.0.8\webapps 目錄下,然後啟動 tomcat , solr.war 會自動解壓, webapp 目錄下將會出現 solr 目錄,在些目錄下找到 WEB-INF 資料夾,修改資料夾下的 web.xml 檔案
把這個節點的註釋去掉,修改 <env-entry-value> 節點裡的內容為:第二步 的solr 的目錄,例如: <env-entry-value>C:\solr</env-entry-value>
4)將 solr-4.7.2/example/lib/ext 目錄下的 jar 包放到 C:\apache-tomcat-8.0.8\webapps\solr\WEB-INF\lib 下面
5)然後重啟 tomcat, 在位址列裡輸入 http://localhost:8080/solr/admin, 看到 solr 的頁面則表示配置成功。
本地:http://localhost:8983/solr/#/
拼音分詞器的安裝:
http://my.oschina.net/MrMichael/blog/261231
<field name="pinyin" type ="text_pinyin" indexed ="true" stored ="false" multiValued ="true"/>
<copyField source="name" dest="pinyin"/>
<copyField source="author" dest="pinyin"/>
<copyField source="region" dest="pinyin"/>
<copyField source="theme" dest="pinyin"/>
<!-- by michael: pinyin -->
<fieldType name="text_pinyin" class="solr.TextField" positionIncrementGap="0">
<analyzer type="index">
<tokenizer class="org.apache.lucene.analysis.cn.smart.SmartChineseSentenceTokenizerFactory"/>
<filter class="org.apache.lucene.analysis.cn.smart.SmartChineseWordTokenFilterFactory"/>
<filter class="com.shentong.search.analyzers.PinyinTransformTokenFilterFactory" minTermLenght="2" />
<filter class="com.shentong.search.analyzers.PinyinNGramTokenFilterFactory" minGram="6" maxGram="20" />
</analyzer>
<analyzer type="query">
<tokenizer class="org.apache.lucene.analysis.cn.smart.SmartChineseSentenceTokenizerFactory"/>
<filter class="org.apache.lucene.analysis.cn.smart.SmartChineseWordTokenFilterFactory"/>
<filter class="com.shentong.search.analyzers.PinyinTransformTokenFilterFactory" minTermLenght="2" />
<filter class="com.shentong.search.analyzers.PinyinNGramTokenFilterFactory" minGram="6" maxGram="20" />
</analyzer>
</fieldType>