第二章：基於IK的智慧分詞、細粒度分詞、同義詞、停用詞

阿新 • • 發佈：2019-01-02

2. 將檔案放入solr.war的WEB-INF/lib下

3. 將IKAnalyzer.cfg.xml、ext.dic、stopword.dic放到WEB-INF/classes目錄下，注意：classes目錄沒有，需要手動建立

4. 配置同義詞與停用詞

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">  
<properties>  
	<comment>IK Analyzer 擴充套件配置</comment>
	<!--使用者可以在這裡配置自己的擴充套件字典--> 
	<entry key="ext_dict">ext.dic;</entry> 
	<!--使用者可以在這裡配置自己的擴充套件停止詞字典-->
	<entry key="ext_stopwords">stopword.dic;</entry> 
	
</properties>

5. 配置schema.xml

<fieldType name="text_ik" class="solr.TextField" positionIncrementGap="100">  
   <analyzer type="index">  
       <tokenizer class="org.wltea.analyzer.lucene.IKAnalyzerSolrFactory"  isMaxWordLength="false"/>  
       <filter class="solr.LowerCaseFilterFactory"/>  
   </analyzer>  
   <analyzer type="query">  
       <tokenizer class="org.wltea.analyzer.lucene.IKAnalyzerSolrFactory"  isMaxWordLength="true"/>       
       <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>  
       <filter class="solr.LowerCaseFilterFactory"/>  
   </analyzer>  
</fieldType>

注意：isMaxWordLength為true表示進行智慧分詞，相反為細粒度分詞 6. 測試，搜尋關鍵詞“一臺筆記本” ext.dic檔案內容

一臺
筆記本

stopword.dic檔案內容

的

synonyms.txt檔案內容

筆記本 => 膝上型電腦 超薄筆記本

7. 使用solr admin進行測試，搜尋關鍵詞“一臺筆記本”

IKT：使用IK的Tokenizer進行解析的結果

ST：使用StandardTokenizer解析的結果

LCF：使用LowercaseFilter解析的結果

參考資料：

http://blog.csdn.net/clj198606061111/article/details/21289897

http://onlyonetoone.iteye.com/blog/2155740

第二章：基於IK的智慧分詞、細粒度分詞、同義詞、停用詞

2. 將檔案放入solr.war的WEB-INF/lib下 3. 將IKAnalyzer.cfg.xml、ext.dic、stopword.dic放到WEB-INF/classes目錄下，注意：classes目錄沒有，需要手動建立 4. 配置同義詞與停用詞 <

hadoop的安裝和配置——第二章：偽分布模式

manage 安裝和配置 for tex .com 偽分布 roo oca mat 這篇為大家帶來hadoop的偽分布模式：從最簡單的方面來說，偽分布模式就是在本地模式上修改配置文件： core-site.xml;hdfs-site.xml;mapred-site.xml

演算法導論第二章：演算法入門筆記（插入排序、迴圈不變式、演算法分析、最好和最壞時間複雜度、選擇排序、分治法、合併排序）

插入排序：排序問題的定義如下：輸入：N個數{a1, a2,..., an }。輸出：輸入序列的一個排列{a'1 ,a'1 ,...,a'n }，使得a'n <=a' n<=...<

《Gradle構建SpringBoot學習筆記》第二章：建立基於Gradle構建的Spring Boot Web專案

1.生成初始化專案通過 SpringBoot 官方提供的 Spring Initializr初始化一個Web專案，網址為https://start.spring.io/，瀏覽器開啟該網址顯示如下選擇構建Gradle Project，語言選擇Java，Spr

程式設計師程式設計藝術第二十六章：基於給定的文件生成倒排索引（含原始碼下載）

第二十六章：基於給定的文件生成倒排索引的編碼與實踐作者：July、yansha。出處：結構之法演算法之道引言本週實現倒排索引。實現過程中，尋找資料，結果發現找份資料諸多不易：1、網上搜倒排索引實現，結果千篇一律，例子都是那幾個同樣的單詞；2、到谷歌學術上想找點稍微有價

《集體智慧編中文版》讀書筆記——第二章：協作型過濾

前言一本比較老的書，偏實用，正好打算入手python機器學習，實現一遍程式碼。關於協作型過濾介紹他的一個引用場景：已有使用者對自己感興趣的電影評分的情況下，怎麼合理的為使用者推薦新電影？或者一個新使用者在瀏覽電影時，推薦其他相關的電影？協作性

基於CentOS7開發之路 --- 第二章： CentOS 7 配置Java環境變數

在windows上面，很多配置Java環境變數的時候，可能都沒有注意到是要配置到系統環境變數還是配置到使用者環境變數裡面。但是在CentOS下，配置環境變數的時候，尤其要注意是配置系統環境變數還是使用者環境變數，因為配置到系統環境變數的話，稍微不注意，可能就把系

機器學習第二章：模型評估與選擇-總結

但是交叉 roc曲線掃描 com ram hidden 技術分享 preview 1、數據集包含1000個樣本，其中500個正例，500個反例，將其劃分為包含70%樣本的訓練集和30%樣本的測試集用於留出法評估，試估算共有多少種劃分方式。留出法將數據集劃分為兩個互斥的

【機器學習筆記】第二章：模型評估與選擇

機器學習 ini ppi 第二章 err cap ner rate rac 2.1 經驗誤差與過擬合 1. error rate/accuracy 2. error: training error/empirical error, generalization error

第二章：數據類型和運算符

取反可能 tin 中間接口 double類型變量名不能修飾第二章:數據類型和運算符計算機中的進制 **標識符總的命名規則:見名知意。如果有多個單詞組成，首單詞小寫，其余單詞的首字母大寫(駝峰命名法)。1.首字母只能是字母，下劃線和$2.其余字母可以字母,下

第二章： Java總結

存儲空間基本類型 code 字節運行時 void 科學編程語言數值第二章筆記什麽是變量：變量代表一塊內存區域，變量類型不一樣，這一塊內存的大小也不一樣。#在編程語言裏面，你可以通過定義變量，向內存裏添加數據或者修改內存已有的數據。說白了，變量就是代表程序運行時存放

第二章：列表與元素

擴展不可變數據結構--棧需求帳號追加 line -h 隱式本章將引入一個新的概念：數據結構。數據結構是通過某種方式（例如對元素進行編號）組織在一起的數據元素的集合。這些數據元素可以是數字或者字符，甚至可以是其他數據結構。在python中，最基本的數據結構是序列。

【書中示例】--《C程序設計語言》第二章：類型、運算符、表達式

類型 tar c程序設計 http 第二章 dtb wix gyp ng2 8azxgp景劫鋼槍勞趴http://tushu.docin.com/sina_636267481113rl5i職旱諛劑興勞http://www.docin.com/krm61755owd5q改坡拖

《Python基礎教程》第二章：列表和元組（2）

ber 次數 eve sorted 反向 bsp del 對象復制 list函數可以將字符串轉換為列表 ‘ ‘.join(somelist)可以將列表轉換為字符串從列表中刪除元素可以使用del語句來實現方法是與對象有緊密聯系的函數：對象.方法(參數) append方

ES6標準入門第二章：塊級作用域以及 let和const命令

函數聲明 web 頂部 16px 地址 value length window對象成功一、塊級作用域　　1、為什麽需要塊級作用域？　　ES5中只有全局作用域和函數作用域，帶來很多不合理的場景。　　（1）內層變量可能會覆蓋外層變量；　　　 var tem = ne

性能測試第二章：性能測試關註點

過程使用數據庫虛擬理解體驗 class 恢復用戶反饋 1、更好的理解性能測試的作用和價值 2、軟件測試的作用和價值：產品、用戶產品的角度：主要關註研發過程，盡可能早的發現問題，產品交付、功能完善用戶角度：用戶使用體驗，用戶反饋收集和持

Python爬蟲學習==>第二章：MongoDB環境配置

擴展建立 body 網絡 dash blog 虛擬 bson 階段　　學習目的： MongoDB的安裝正式步驟（VMWare 虛擬機上無法安裝這個MongoDB的自啟動服務，如果你能辦到，請多賜教） Step1：MongoDB的簡介

Node入門教程(3)第二章： Node 安裝

nod ash pan -m 通過 windows linu 方式 spa Node 安裝官網下載地址： https://nodejs.org/en/download/ 安裝方式 windows 下安裝建議直接選擇：Windows Installer (

（轉）Django學習之第二章：Django快速上手

nbsp ida IT 介紹你在 django edi nal python代碼安裝Python 安裝Django非常容易。因為Django可以運行在任何可以運行Python的環境中，所以可以以多種方式進行配置。在本章我們將嘗試覆蓋幾種常見的Django安裝場景。

第二章：數據類型

可能一個地方 push 不知道結構等價 n) 範圍編譯器初學SystemVerilog我們在Verilog的基礎之上提供了很多改進的數據結構。本章將分為幾篇文章來講述一下對驗證很有用的數據結構。 2.1 Verilog中的數據類型通常，在Verilog中我們

第二章：基於IK的智慧分詞、細粒度分詞、同義詞、停用詞

相關推薦