1. 程式人生 > >Elasticsearch-ik同義詞,近義詞,聯想詞

Elasticsearch-ik同義詞,近義詞,聯想詞

Elasticsearch-ik同義詞,近義詞,聯想詞

1. ik安裝到elasticsearch/plugin/
兩種方式:

             方式2:

./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.2.3/elasticsearch-analysis-ik-6.2.3.zip
     (2)重啟elasticsearch
2. ik目錄下建立聯想詞檔案synonyms.txt(路徑隨意但是建索引setting的時候需要對應)
3. 建立索引,指定synonyms_path(相對於
/etc/elasticsearch/)如下面的analysis-ik/synonyms.txt完整路徑是/etc/elasticsearch/analysis-ik/synonyms.txt

{

    "settings": {

        "index" : {

            "analysis" : {

                "analyzer" : {

                    "synonym" : {

                        "tokenizer" : "whitespace",

                        "filter" : ["synonym"]

                    }

                },

                "filter" : {

                    "synonym" : {

                        "type" : "synonym",

                        "synonyms_path" : "analysis-ik/synonyms.txt"

                    }

                }

            }

        }

    }

}

4. 建立mapping注意索引的欄位需要指定type
為上面3synonym

{

    "properties": {

      "id": {

        "type": "integer"

      },

      "cname": {

        "type": "text",

        "analyzer": "synonym",

        "search_analyzer": "synonym"

      }

    }

  }

}

相關推薦

Elasticsearch-ik同義詞聯想

Elasticsearch-ik同義詞,近義詞,聯想詞1. 將ik安裝到elasticsearch/plugin/兩種方式:             方式2:./bin/elasticsearch-plugin install https://github.com/medcl

獲取一周兩周本月上個月

nth ava @override model for cal post del instance @RequestMapping(value = "/date", method = RequestMethod.GET) public String age

Elasticsearch IK 同義詞

同義詞配置 step 1 elasticserach.yml 最後一行新增: index.analysis.analyzer.default.type: ik step 2 在elas

sql語句實現查詢今天昨天7天30天當月上個月資料

幾個小時內的資料 DATE_SUB(NOW(), INTERVAL 5 HOUR) 今天 select * from 表名 where to_days(時間欄位名) = to_days(now()); 昨天 SELECT * FROM 表名 WHERE TO_DAYS(

關鍵字: C/C++預定巨集__FILE__ __LINE__ __DATE____TIME____func____FUNCTION__ __FILE__:當前原始碼檔名的字串文

C/C++,預定義巨集,__FILE__, __LINE__, __DATE__,__TIME__,__func__,__FUNCTION__ __FILE__:當前原始碼檔名的字串文字 __LINE__:當前原始碼中的行號的整數常量 __DATE__:進行預處理的

elasticsearch 拼音+ikspring data elasticsearch 拼音分

maven打包 vat tokenizer origin emp 下載源 case remove 解壓 elasticsearch 自定義分詞器 安裝拼音分詞器、ik分詞器   拼音分詞器: https://github.com/medcl/elasticsearch-an

elasticsearch 5.6.7線上安裝ik親測有效

官網的線上安裝命令  ./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.3.0/elasticsearch-anal

solr 4.2配置使用的是IKAnalyzer2012FF_u1版本時無法實現處理

最近要弄商品搜尋近義詞功能, 比如輸入商汞 要搜到混泥土,我用的是solr4.2版本,網上轉了一圈都沒有我要的方案,也沒有現成的類, 於是找到 lucene TokenFilterFactory類 但我用的是IKAnalyzer2012FF_u1版本 其中分詞只有 IKAn

ElasticSearch最佳入門實踐(四十)分器的內部組成到底是什麼以及內建分器的介紹

1、什麼是分詞器 一個分詞器,很重要,將一段文字進行各種處理,最後處理好的結果才會拿去建立倒排索引 切分詞語,normalization(提升recall召回率) 給你一段句子,然後將這段句子拆分成一個一個的單個的單詞,同時對每個單詞進行normalizat

Elasticsearch 之(12)query string的分修改分器以及自定義分

query string分詞query string必須以和index建立時相同的analyzer進行分詞query string對exact value和full text的區別對待 (第10節中詳細闡述過)date:exact value_all:full text比如我

使用 Elasticsearch ik實現同義詞搜尋

1、首先需要安裝好Elasticsearch 和elasticsearch-analysis-ik分詞器 2、配置ik同義詞 Elasticsearch 自帶一個名為 synonym 的同義詞 filter。為了能讓 IK 和 synonym 同時工作,我們需要定義新的

elasticsearch ik實現 中文、拼音、同義詞搜尋

EasticSearch版本:1.5.2   2.1、在elasticsearch的plugins目錄下,新建analysis-pinyin資料夾,解壓上述壓縮包,將裡面的    放到analys

elasticksearch分導致kibana的url出現問題

har log agent 查看 修改 生成 template shard req 在Kibana的展示頁面中,我們點擊Table的左側欄,發現Elasticsearch中的數據在展示中是正確的數據,比如:agent中www.baidu.com/test,該界面中會正確的顯

python中文分使用結巴分對python進行分

php 分詞 在采集美女站時,需要對關鍵詞進行分詞,最終采用的是python的結巴分詞方法.中文分詞是中文文本處理的一個基礎性工作,結巴分詞利用進行中文分詞。其基本實現原理有三點:基於Trie樹結構實現高效的詞圖掃描,生成句子中漢字所有可能成詞情況所構成的有向無環圖(DAG)采用了動態規劃查找最大概率

14套java精品高級架構課緩存架構深入Jvm虛擬機全文檢索Elasticsearch視頻教程

http soft 精品 target mysql rocket body 精通 ava 14套java精品高級架構課,緩存架構,深入Jvm虛擬機,全文檢索Elasticsearch,Dubbo分布式Restful服務,並發原理編程,SpringBoot,SpringClo

015-elasticsearch【五】-搜索模板多搜索模板

cat closed def min 索引 zed using 問題 separate 一、搜索模板 查看地址 二、多搜索模板 查看地址 三、搜索分片API   搜索分片api返回將執行搜索請求的索引和分片。這可以提供有用的反饋,用於解決問題或使用路由和分片首選項

CountVectorizerTf-idfVectorizer和word2vec構建向量的區別

tor 兩種方法 閾值 出現 使用 方法 詞典 idfv 情感 CountVectorizer和Tf-idfVectorizer構建詞向量都是通過構建字典的方式,比如在情感分析問題中,我需要把每一個句子(評論)轉化為詞向量,這兩種方法是如何構建的呢?拿CountVector

使用Dockerfile文件制作centos6.8基礎鏡像基於centos基礎鏡像的ssh遠程登錄鏡像jdk1.8鏡像tomcat鏡像elasticsearch鏡像等等

完整 dont -s chmod IT 需要 sed lib mage 一、首先制作一個centos6.8的裸機鏡像 創建一個幹凈的目錄: 1 [root@docker centos6.8]# ls 2 c68-docker.tar.xz Dockerfile

python小白也可以分分鐘爬取微博數據並生成有個性的你get到了嗎?

python 爬蟲 web開發 編程Python(發音:英[?pa?θ?n],美[?pa?θɑ:n]),是一種面向對象、直譯式電腦編程語言,也是一種功能強大的通用型語言,已經具有近二十年的發展歷史,成熟且穩定。它包含了一組完善而且容易理解的標準庫,能夠輕松完成很多常見的任務。它的語法非常簡捷和清晰,與其它大多

查詢Elasticsearch嵌套類型數據且只返回嵌套數據中命中的元素

sea ota gpo fse smi tex range pin cse 測試環境 Elasticsearch 6.3 Kibana 6.3 造點測試數據 新建一個index作為測試 以下是一個存儲博客文章及其評論的數據結構,評論(comment