全文搜尋技術--Solr7.1之配置中文分析器

阿新 • • 發佈：2018-11-14

前言：中國文化博大精深，但是solr只能一個一個的識別，而是更加符合中國人的習慣，所以加了中文分析器。

1.安裝中文分詞器

第一步：把中文分詞器(ik-analyzer-solr7-7.x.jar)/usr/local/solr_tomcat/webapps/solr/WEB-INF/lib下

第二步：將stopword，ext.dic，IKAnalyzer.cfg.xml 放在/usr/local/solr_tomcat/webaapps/solr7/WEB-INF/class

第三步：在/usr/local/solrhome/new_core/conf/managed-schema檔案（schema.xml）中新增一個自定義的fieldType，使用中文分析器。

<!-- ik分詞器 -->
<fieldType name="text_ik" class="solr.TextField">
  <analyzer type="index">
      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
      <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
  <analyzer type="query">
      <tokenizer class 
="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
      <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
</fieldType>

第四步：定義field,指定field的type屬性為text_ik

<!--IKAnalyzer Field-->

       <field name="title_ik" type="text_ik" indexed="true" stored="true" />

       <field name="content_ik" type="text_ik" indexed="true" stored="false" multiValued="true"/>

第四步：重啟tomcat

測試：

全文搜尋技術--Solr7.1之配置中文分析器

前言：中國文化博大精深，但是solr只能一個一個的識別，而是更加符合中國人的習慣，所以加了中文分析器。 1.安裝中文分詞器第一步：把中文分詞器(ik-analyzer-solr7-7.x.jar)/usr/local/solr_tomcat/webapps/solr/WEB-INF/lib下第二步：

全文搜尋技術--solr7.1之mysql的安裝步驟

1.安裝命令 #>線上安裝wget http://repo.mysql.com/mysql-community-release-el7-5.noarch.rpm 輸完上面一句話不能正常的下載安裝包可以試試下面這句話 yum -y install wget 然後繼續執行下面的語句 rpm -ivh

solr7.3配置中文分析器和自定義業務域

1、拷貝jar包[[email protected] conf]# cp /usr/local/solr/solr-7.3.0/dist/solr-dataimporthandler-7.3.0.jar /usr/local/solr/tomcat8/webapp

技術實現(1)之業務日誌和監控日誌的設計與實現

APDPlat提供了業務日誌和監控日誌，以便對使用者操作進行審計、對系統性能進行調優。業務日誌主要包括資料的增刪改日誌、備份恢復日誌以及使用者登入登出日誌。監控日誌主要包括使用者請求響應時間、記憶體使用情況、全文索引重建情況、系統啟動關閉事件。設計目標： 1、靈活

全文搜尋技術

全文檢索技術是資訊檢索技術的一種，主要是使用者的查詢請求和全文中的每一個詞進行比較，不考慮查詢請求和文件的語法上的匹配，在資訊檢索工具中，全文檢索技術是最通用的和實用的。簡單的說先建立索引，再對索引進行搜尋的過程就叫全文檢索（Full-text Search）我們把每次

全文檢索技術學習(三)——Lucene支援中文分詞

分析器（Analyzer）的執行過程如下圖是語彙單元的生成過程：從一個Reader字元流開始，建立一個基於Reader的Tokenizer分詞器，經過三個TokenFilter生成語彙單元Token。要看分析器的分析效果，只需要看TokenStr

【Lucene】全文搜尋技術

大綱 2.3 索引 1、需求分析 1.1 資料分類我們生活中的資料總體分為兩種：結構化資料和非結構化資料。結構化資料：指具有固定格式或有限長度的資料，如資料庫，元資料等。非結構化資

Solr之配置中文分詞器

1、使用solr自帶分詞器 1.1、拷貝Jar包 cp /opt/solr/solr-7.3.1/contrib/analysis-extras/lucene-libs/lucene-ana

solr 配置中文分析器/定義業務域/配置DataImport功能(測試用)

span host utf-8 handle copy float jar包 rds blog 一、配置中文分析器使用IKAnalyzer 配置方法： 1）把IK的jar包添加到solr工程中/WEB-INF/lib目錄下 2）把I

webpack 1.x 之配置的坑

blog .html 現在 file output col strong html中 logs 一、靜態資源目錄改變（默認在dist下面）默認： webpack配置 output: { path: path.join(__dirname, ‘./dist‘)

spring boot框架學習學前掌握之重要註解(1)-java配置方式

spring boot 　　本節主要內容：　　1:重點註解介紹　　2:使用重點註解環境搭建　　聲明：　　本文是《凱哥陪你學系列-框架學習之spring boot框架學習》中學前掌握之重要註解(1)　　java配置是spring 4.x推薦的撇嘴方式。可以完全代替xml配置。　　1：重點註解　　@con

java技術學習路徑之：Javaweb監聽器總結（應用場景、方法、配置）

配置包名 quest ner web.xml 監聽器接口 tty 數據 XML JavaWeb中，監聽器是一種組件，能夠監聽項目的啟動和停止，用戶會話的創建和銷毀，以及各種組件的添加、更新和刪除，能夠通過監聽對象的狀態改變，自動做出反應執行響應代碼。應用場景：啟動網站

Elam的caffe筆記之配置篇（五）：Centos6.5配置opencv3.1.0

Elam的caffe筆記之配置篇（五）：Centos6.5配置opencv3.1.0 配置要求：系統：centos6.5 目標：基於CUDA8.0+Opencv3.1+Cudnnv5.1+python3.6介面的caffe框架 1.下載opencv-3.1.0.t

Elam的caffe筆記之配置篇（三）：Centos 6.5下裝CUDA8.0 和cudnnv5.1

Elam的caffe筆記之配置篇（三）：Centos 6.5下裝CUDA8.0 和cudnnv5.1 配置要求：系統：centos6.5 目標：基於CUDA8.0+Opencv3.1+Cudnnv5.1+python3.6介面的caffe框架寫在前面，本文是在C

Elam的caffe筆記之配置篇：基於CentOS6.5 python3.6 CUDA8.0 cudnnv5.1 opencv3.1 下的caffe配置

Elam的caffe筆記之配置篇：基於CentOS6.5 python3.6 CUDA8.0 cudnnv5.1 opencv3.1 下的caffe配置作為一個完完全全的linux小白，平時連cmd開啟資料夾都要百度的人，面對單獨配置caffe這個棘手任務，第一反應就是搜教程。

大資料技術學習筆記之網站流量日誌分析專案：Flume日誌採集系統1

一、網站日誌流量專案 -》專案開發階段： -》可行性分析 -》需求分析

大資料技術學習筆記之hive框架基礎1-基本架構及環境部署

一、hive的介紹及其發展 "27.38.5.159" "-" "31/Aug/2015:00:04:37 +0800" "GET /course/view.php?id=27 HTTP/1.1" "303" "440" - "http://www.micro.com/user.php?act

大資料技術學習筆記之Hadoop框架基礎1-Hadoop介紹及偽分散式部署

一、學習建議 -》學習思想 -》設計思想：分散式 -》資料採集

大資料技術學習筆記之linux基礎1-基礎環境與基礎命令

一、Linux系統介紹及部署 -》常見作業系統 -》windows、Linux（類unix系統）、Android、iOS、unix（HP UNIX）

一起玩"Docker"之1——Ubuntu配置安裝Docker執行環境並安裝（Ubuntu、Centos）映象

Docker 是一個開源的應用容器引擎，基於 Go 語言並遵從Apache2.0協議開源。 Docker 可以讓開發者打包他們的應用以及依賴包到一個輕量級、可移植的容器中，然後釋出到任何流行的 Linux 機器上，也可以實現虛擬化。容器是完全使用沙箱機制，相互之間

全文搜尋技術--Solr7.1之配置中文分析器

相關推薦