solr實現同義詞查詢及分詞粒度

阿新 • • 發佈：2018-12-10

首先要自己修改IKAnalyzer2012FF_u2.jar包然後重新打包

修改後的jar包下載地址：http://download.csdn.net/detail/u014793522/9594470

同義詞下載地址：

http://download.csdn.net/detail/u014793522/9594519

然後修改schema.xml檔案，在末尾處新增如下程式碼

	<!-- lang: xml -->
<fieldType name="text_syn" class="solr.TextField">
    <analyzer type="query">
    <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false"/>
    <filter class="solr.LowerCaseFilterFactory"/>
    </analyzer>
   <analyzer type="index">
   <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="fasle"/>
  <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" />
<filter class="solr.LowerCaseFilterFactory"/>
    </analyzer> </fieldType>

在增加一個field

useSmart="false"表示使用粒度進行分詞

效果如圖所示

就是將中國人在進行粒度分詞

synonyms="synonyms.txt"這個就是同義詞檔案，expand這個屬性一定要設定為true，就是儘可能多的顯示

synonyms="synonyms.txt"內容如圖所示

搜尋一下即可出現效果

後一個詞搜前一個詞

注：synonyms.txt檔案中的內容如果是相同的同義詞可以寫在同一行用,隔開

如果這樣寫我搜一個樂天知命就只能搜到安分守己其他的幾個就不能搜出來

可以做一下修改

修改後的效果如圖所示

solr實現同義詞查詢及分詞粒度

首先要自己修改IKAnalyzer2012FF_u2.jar包然後重新打包修改後的jar包下載地址：http://download.csdn.net/detail/u014793522/9594470 同義詞下載地址： http://download.csdn.net

spring boot專案實現條件查詢及分頁

EmpMapper <resultMap id="BaseResultMap" type="com.test.po.Emp" > <id column="empno" property="empno" jdbcType="INTEGER" />

SpringCloud學習筆記024---SpringBoot整合Lucene實現全文檢索_分詞_索引_更新_刪除文件_詞條搜尋_多條件查詢

先看程式碼實現,下面有lucene介紹: 測試用例 Github 程式碼程式碼我已放到 Github ，匯入spring-boot-lucene-demo 專案新增依賴  <dependency>

【搜尋引擎】Solr Suggester 實現全文檢索功能-分詞和和自動提示

功能需求全文檢索搜尋引擎都會有這樣一個功能：輸入一個字元便自動提示出可選的短語：要實現這種功能，可以利用solr的SuggestComponent，SuggestComponent這種方法利用Lucene的Suggester實現，並支援Lucene中可用的所有查詢實現。實現 1. 配置 manage

13.solr學習速成之IK分詞器

更新 api 一個廣泛針對 -i 處理器多個 -1 IKAnalyzer簡介 IKAnalyzer是一個開源的，基於java語言開發的輕量級的中文分詞工具包。 IKAnalyzer特性 a. 算法采用“正向叠代最細粒度切分算法”，支持細粒度和最大詞

轉：TensorFlow入門（六）雙端 LSTM 實現序列標註（分詞）

vsm max poc 代碼單詞 arch 大致雙端 fun http://blog.csdn.net/Jerr__y/article/details/70471066 歡迎轉載，但請務必註明原文出處及作者信息。 @author: huangyongye @creat_

C#實現航班查詢及預訂

icon span bob com from window rand class comm using System;using System.Collections.Generic;using System.ComponentModel;using System.Data

python使用jieba實現中文文檔分詞和去停用詞

分享圖片 lac lena idt center cut inpu span code 分詞工具的選擇：　　現在對於中文分詞，分詞工具有很多種，比如說：jieba分詞、thulac、SnowNLP等。在這篇文檔中，筆者使用的jieba分詞，並且基於python3環境，選擇

solr（2）配置分詞器，配置定義域

collection1 在sorlhome目錄下面分詞器：現在是一個一個字的分，因為只是搭建了solr環境，並沒有配置分詞器 IK Analyzer配置步驟： 1、把IKAnalyzer2012FF_u1.jar 新增到 solr 工程的

自編DataBase函式庫，內有引數查詢及分頁操作

下面是DataBase.asp的完整程式碼。內有許多不相干的自編的偷懶函式（大家不要學我，我是嫌VB太囉嗦)，你不需要可以去掉 <%'以下程式碼為通用程式碼Option ExplicitConst SqlUserID = "sa" &n

分布式電商項目（04）--商品列表查詢及分頁

builder 就是及其 aid auto 系統 lec 數據封裝頁面前言：前面寫了後天管理系統工程搭建以及框架的整合測試，今天寫一下商品列表的分頁查詢 1 需求分析前臺使用easyui的分頁工具，後臺則使用mybatis分頁插件pagehelper 如上圖所示，

分散式電商專案（04）--商品列表查詢及分頁

前言：前面寫了後天管理系統工程搭建以及框架的整合測試，今天寫一下商品列表的分頁查詢 1 需求分析前臺使用easyui的分頁工具，後臺則使用mybatis分頁外掛pagehelper 如上圖所示，開啟後臺首頁，點選查詢商品，按下F12,可以看到easyui的分頁介面會向controller傳送兩個資

【elasticsearch安裝篇】Linux Centos 7.5 安裝 Kibana及分詞器

安裝elasticsearch，可參考：【elasticsearch安裝篇】Linux centos6.8 安裝配置elasticsearch6.3.2 親測成功（一）【elasticsearch安裝篇】Linux centos6.8 安裝配置elasticsearch6

Solr-4.10 配置中文分詞器(IKAnalyzer)

1、下載IKAnalyzer http://pan.baidu.com/s/1i3eXhAH 密碼：34w6 2、將ik的相關檔案拷貝到 webapps\solr\WEB-INF\lib 目錄下 3、引入相應詞典配置放到&

自然語言處理——中文分詞原理及分詞工具介紹

本文首先介紹下中文分詞的基本原理，然後介紹下國內比較流行的中文分詞工具，如jieba、SnowNLP、THULAC、NLPIR，上述分詞工具都已經在github上開源，後續也會附上github連結，以供參考。 1.中文分詞原理介紹 1.1 中文分詞概述中文分詞(Chinese Word Seg

layui列表查詢及分頁

官方文件： https://www.layui.com/doc/modules/table.html 效果圖：頁面： <!DOCTYPE html> <html> <head> <meta charset="utf-8">

Solr搜尋引擎之整合IKAnalyzer分詞器

將"IKAnalyzer2012_V5.jar"放入"webapps\solr\WEB-INF\lib"中, 將"ext_stopword.dic"、“IKAnalyzer.cfg.xml”、“my

hql學習2:通用查詢及分頁原生sql的使用以及檢視的使用

本篇部落格主要分享的內容: 1.建立BaseDao 通用查詢加分頁 2.hihernate中原生sql的使用 3.hibernate檢視的使用先來比較一下以下兩種分頁 1>平常分頁的Dao方法 public List<Book> list1

elasticsearch-手動設定_mapping中欄位型別及分詞器-ES5.X與ES6.X區別

【問題描述】：手動設定mapping，給指定欄位設定是否進行分詞，以及分詞器型別。環境資訊：學習elasticsearch時，案例使用的是5.x版本，自己本地使用的是6.x版本。案例如下，5.x版本編輯：PUT /website{ "mappings": { "art

ElasticSearch（四）查詢、分詞器

正向索引　　正排表是以文件的ID為關鍵字，表中記錄文件中每個字的位置資訊，查詢時掃描表中每個文件中字的資訊直到找出所有包含查詢關鍵字的文件。　　這種組織方法在建立索引的時候結構比較簡單，建立比較方便且易於維護;因為索引是基於文件建立的，若是有新的文件加入，直接為該文件建立一個新的索引塊

solr實現同義詞查詢及分詞粒度

相關推薦