nodejs之elasticsearch實現分詞功能

阿新 • • 發佈：2018-12-12

nodejs之elasticsearch實現分詞功能

一：首先安裝ik分詞器
二：在nodejs中的使用

一：首先安裝ik分詞器

具體安裝步驟可參考我之前的文章：https://blog.csdn.net/wushichao0325/article/details/84826073

二：在nodejs中的使用

1.首先npm install 安裝elasticsearch模組

npm install elasticsearch --save

2.在nodejs程式碼中建立連線

var elasticsearch= 
require('elasticsearch');
var client=new elasticsearch.Client({
    host:"**.**.***.**:9200",
    //將日誌資訊顯示在控制檯，預設level:"console"
    log:"trace",
    //將日誌資訊寫入檔案中
    // log:{
    //     type:'file',
    //     level:"trace",
    //     path:"url"
    // }
    //設定不同等級輸出到不同的地方
    // log:[
    //     {
    //         type:'console', 

    //         level:"error",
    //     },
    //     {
    //         type:"file",
    //         level:"trace",
    //         path:"url"
    //     }
    // ]
});

3.使用elasticsearch的JavaScript api中的indices裡的analyze函式實現

async function analyze(){
    let resp;
    try{
        resp=await client.indices.analyze 
({
            body:{
                "analyzer":'ik_smart',//ik_max_word兩種不同的分詞形式，後者會把所有可能都列舉出來
                "text":["中華人民共和國是我們的祖國"]
            }
        });
    }catch(e){
        resp=null;
    }
    return resp;
}
(async function(){
    let resp=await analyze();
    console.log(resp)
})();

以上程式碼的列印資訊如下：

"ik_smart":
{ tokens:
   [ { token: '中華人民共和國',
       start_offset: 0,
       end_offset: 7,
       type: 'CN_WORD',
       position: 0 },
     { token: '是',
       start_offset: 7,
       end_offset: 8,
       type: 'CN_CHAR',
       position: 1 },
     { token: '我們',
       start_offset: 8,
       end_offset: 10,
       type: 'CN_WORD',
       position: 2 },
     { token: '的',
       start_offset: 10,
       end_offset: 11,
       type: 'CN_CHAR',
       position: 3 },
     { token: '祖國',
       start_offset: 11,
       end_offset: 13,
       type: 'CN_WORD',
       position: 4 } ] }

"ik_max_word":
{ tokens:
   [ { token: '中華人民共和國',
       start_offset: 0,
       end_offset: 7,
       type: 'CN_WORD',
       position: 0 },
     { token: '中華人民',
       start_offset: 0,
       end_offset: 4,
       type: 'CN_WORD',
       position: 1 },
     { token: '中華',
       start_offset: 0,
       end_offset: 2,
       type: 'CN_WORD',
       position: 2 },
     { token: '華人',
       start_offset: 1,
       end_offset: 3,
       type: 'CN_WORD',
       position: 3 },
     { token: '人民共和國',
       start_offset: 2,
       end_offset: 7,
       type: 'CN_WORD',
       position: 4 },
     { token: '人民',
       start_offset: 2,
       end_offset: 4,
       type: 'CN_WORD',
       position: 5 },
     { token: '共和國',
       start_offset: 4,
       end_offset: 7,
       type: 'CN_WORD',
       position: 6 },
     { token: '共和',
       start_offset: 4,
       end_offset: 6,
       type: 'CN_WORD',
       position: 7 },
     { token: '國是',
       start_offset: 6,
       end_offset: 8,
       type: 'CN_WORD',
       position: 8 },
     { token: '我們',
       start_offset: 8,
       end_offset: 10,
       type: 'CN_WORD',
       position: 9 },
     { token: '的',
       start_offset: 10,
       end_offset: 11,
       type: 'CN_CHAR',
       position: 10 },
     { token: '祖國',
       start_offset: 11,
       end_offset: 13,
       type: 'CN_WORD',
       position: 11 } ] }

成功的人千方百計，失敗的人千難萬險

nodejs之elasticsearch實現分詞功能

nodejs之elasticsearch實現分詞功能一：首先安裝ik分詞器二：在nodejs中的使用一：首先安裝ik分詞器具體安裝步驟可參考我之前的文章：https://blog.csdn.net/wushic

Elasticsearch-IK分詞器詳解以及原始碼修改實現mysql熱更新

IK分詞器的安裝和使用訪問ik分詞器github專案地址：https://github.com/medcl/elasticsearch-analysis-ik 1.在本地clone專案程式碼，git clone https://github.com/me

使用 Elasticsearch ik分詞實現同義詞搜尋

1、首先需要安裝好Elasticsearch 和elasticsearch-analysis-ik分詞器 2、配置ik同義詞 Elasticsearch 自帶一個名為 synonym 的同義詞 filter。為了能讓 IK 和 synonym 同時工作，我們需要定義新的

Elasticsearch之安裝ik分詞外掛

IK簡介 IK Analyzer是一個開源的，基於java語言開發的輕量級的中文分詞工具包。從2006年12月推出1.0版開始， IKAnalyzer已經推出了4個大版本。最初，它是以開源專案Luence為應用主體的，結合詞典分詞和文法分析演算法的中文分片語件

總結之java web實現分頁功能（一）

網頁開發離不開分頁，分頁如何實現呢可以看一下百度的分頁有什麼功能上一頁、下一頁、10頁按鈕、一頁顯示10條資訊定義一個 PageResult類專門返回分頁所需資訊## public class PageResult { //滿足條件的

Hadoop學習之網路爬蟲+分詞+倒排索引實現搜尋引擎案例

本專案實現的是：自己寫一個網路爬蟲，對搜狐(或者csdn)爬取新聞(部落格)標題,然後把這些新聞標題和它的連結地址上傳到hdfs多個檔案上，一個檔案對應一個標題和連結地址，然後通過分詞技術對每個檔案中的標題進行分詞，分詞後建立倒排索引以此來實現搜尋引擎的功能，建

elasticsearch ik分詞實現中文、拼音、同義詞搜尋

EasticSearch版本：1.5.2 2.1、在elasticsearch的plugins目錄下，新建analysis-pinyin資料夾，解壓上述壓縮包，將裡面的放到analys

【Elasticsearch】Elasticsearch 6.x 探索之路-中文分詞器IK

1.分詞機制 Elasticsearch對於查詢，是採取按分詞的結果進行查詢的，作為一款非國產的軟體，自然對於中文的查詢支援並不是很好，預設只會把中文拆分成單字，而通常使用都是以“詞”作為基準單位的。我們可以使用外掛（plugins）機制去拓展Elasticsearch

基於Tire樹和最大概率法的中文分詞功能的Java實現

對於分詞系統的實現來說，主要應集中在兩方面的考慮上：一是對語料庫的組織，二是分詞策略的制訂。 1. Tire樹 Tire樹，即字典樹，是通過字串的公共字首來對字串進行統計、排序及儲存的一種樹形結構。其具有如下三個性質： 1) 根節點不包含字元（或漢字），除根節

Elasticsearch ik分詞器修改原始碼實現從mysql中定時更新詞庫

下載原始碼匯入eclispe請參考我的上一篇文章ik分詞器安裝第一步修改pom檔案加入mysql驅動jar 如圖所示第二步修改Java類 1.在Dictionary.java檔案中新增一個方法 /** * 批量載

hibernate查詢之Criteria實現分頁方法(GROOVY語法)

tracking b2b earch urn eat con div 查詢 mod public int searchTest(String name, Integer pageIndex, List<Test> resultList){ def

java實現分頁功能的類

oid gen asf agen pre 首頁 != eno true package smn.util; public class Pager { private int pageNow; private int pageSize=4; pri

elasticsearch中文分詞+全文搜索

分詞器。。中文 search img 版本下載地址源碼包 -i 安裝ik中文分詞器我在百度上搜索了下，大多介紹的都是用maven打包下載下來的源碼，這種方法也行，但是不夠方便，為什麽這麽說？首先需要安裝maven吧？其次需要下載源碼吧？最後需要打包吧？我

如何開發自己的搜索帝國之安裝ik分詞器

style utf-8 編碼 ref 文本需要 shell pack 用戶 you 　　 Elasticsearch默認提供的分詞器，會把每個漢字分開，而不是我們想要的根據關鍵詞來分詞，我是中國人不能簡單的分成一個個字，我們更希望 “中國人”，&

ListView實現分頁功能

ryu uem col events dac com 引入 fct ole 1.ViewPager實現Tab 目錄結構: 主布局文件: activity_main.xml 引入頭，尾，中間區域是一個ViewPager 頂部與底部文件寫固定高度，中間View

jQuery WeUI實現分頁功能

ini turn pla ++ font 狀態 pre ffffff document 使用前記得先引入：weui.min.css、jquery-weui.min.css、jquery-weui.min.js 第一步：將下面的代碼放在body結束標簽上面(這個位置可以自

elasticsearch 中文分詞（elasticsearch-analysis-ik）安裝

star 最好好玩的 failed dex source 在線 3.0 github elasticsearch 中文分詞（elasticsearch-analysis-ik）安裝下載最新的發布版本 https://github.com/medcl/elasticsea

[ Laravel 5.5 文檔 ] 數據庫操作 —— 在 Laravel 中輕松實現分頁功能

pub thp erp 不能 res bootstrap 自己的 post 自動 ? 簡介在其他框架中，分頁是件非常痛苦的事，Laravel 讓這件事變得簡單易於上手。Laravel 的分頁器與查詢構建器和 Eloquent ORM 集成在一起，並開箱提供方便的、易於使用

HTML 基於 Python 實現分頁功能

ner mode 一個 div 樣式 def navi itl import 前面的話： 1. 網頁引用的bootstrap 中的表格，所以需要引入樣式類 2. 第一次寫文章，不喜勿噴。有不足的地方，可留言我改正，在此先謝過。 HTML代碼： <

elasticsearch 拼音+ik分詞，spring data elasticsearch 拼音分詞

maven打包 vat tokenizer origin emp 下載源 case remove 解壓 elasticsearch 自定義分詞器安裝拼音分詞器、ik分詞器　　拼音分詞器： https://github.com/medcl/elasticsearch-an

nodejs之elasticsearch實現分詞功能