lucene英文分詞器（StandarAnalyzer）中會被忽略的詞（stopWords）

阿新 • • 發佈：2018-12-10

使用Lucene進行索引查詢時發現有一部分詞會被分詞器直接忽略掉了，被忽略的分詞稱為stopWords,在英文中通常是一些語氣助詞或者無法表達明確含義的詞。

在定義含有stopWords分詞器的時候都會指定stopWords，如果沒有指定可以引用預設的stopWords，在StandardAnalyzer、StopAnalyzer和ClassicAnalyzer分詞器中stopWords是

      "a", "an", "and", "are", "as", "at", "be", "but", "by", 
      "for", "if", "in", "into", "is" 
, "it", 
      "no", "not", "of", "on", "or", "such", 
      "that", "the", "their", "then", "there", "these", 
      "they", "this", "to", "was", "will", "with"

如果想使用自定義的StopWords可以使用lucene提供的StopWordAnalyzer：

      public static final String[] self_stop_words={ "a", "an", "and", "are", "as", "at" 
, "be", "but", "by",  
            "for", "if", "in", "into", "is", "it",  
            "no", "not", "of", "on", "or", "such",  
            "that", "the", "their", "then", "there", "these",  
            "they", "this", "to", "was", "will", "with",  
            "very"  
      };

      //Analyzer analyzer=new StopAnalyzer();   

      Analyzer analyzer=new StopAnalyzer(self_stop_words);

lucene英文分詞器（StandarAnalyzer）中會被忽略的詞（stopWords）

使用Lucene進行索引查詢時發現有一部分詞會被分詞器直接忽略掉了，被忽略的分詞稱為stopWords,在英文中通常是一些語氣助詞或者無法表達明確含義的詞。在定義含有stopWords分詞器的時候都會指定stopWords，如果沒有指定可以引用預設的stop

3P（PS、PR、PDF編輯器Acrobat）中的基基本操作（三）

確認密碼安全性 inf 選中編輯器 png nbsp 打開順序本文介紹一些關於圖片、視頻、PDF的最常用操作：圖像方面：旋轉、裁剪、拼接、水印（文字）、導出　　　　　軟件：Photoshop 視頻方面：剪切（拼接）、水印（文字、字幕）、導出　　　　軟件：Premi

SQL Server（MySql）中的聯合主鍵（聯合索引）索引分析

判斷 reat 系統 lap creat insert 結果問題 select 最近有人問到這個問題，之前也一直沒有深究聯合索引具體使用邏輯，查閱多篇文章，並經過測試，得出一些結論測試環境：SQL Server 2008 R2 測試結果與MySql聯合索引查詢機制類似，

c++ try catch 問題（沒有throw就會被刪除，加上/EHa這樣就不會被刪除）

pla 還要得出我們狀態其它編譯錯誤 isa member 以前都是用try{} catch(…){}來捕獲C++中一些意想不到的異常，今天看了Winhack的帖子才知道，這種方法在VC中其實是靠不住的。例如下面的代碼：以前都是用try{} c

Javascript知識匯總------js中容易被忽略的細節（持續更新）

bsp true 方式 efi 定義沒有快捷快捷方式 == in運算符　　　　語法：boolean “name” in Object 判斷對象是否具有某一個屬性 var myObject

身份證脫敏處理（業務開發中，有時候身份證需要隱藏一部分）

sem turn boot.s tboot del work card 隱藏 public package com.test.TestBoot.SingleModel;import org.springframework.util.StringUtils;public cl

ASP.NET sync over async（異步中同步，什麽鬼？）

bsp 只有一個 send 寫法 efault get c-c arch for 轉自：http://www.cnblogs.com/xishuai/p/asp-net-sync-over-async.html async/await 是我們在 ASP.NET 應用程序中，

C++中min_element()與max_element（）（取容器中的最大最小值）

min_element 和 max_element 標頭檔案：#include<algorithm> 作用：返回容器中最小值和最大值的指標。max_element(first,end,cmp);其中cmp為可選擇引數! 例1 #include<ios

Python進階系列連載（2）——那些容易被忽略的問題（中）

字串快速轉換為列表在入門階段我們講了不同資料型別的轉換關係，比如列表和元組。這裡講講字串轉為列表！小明：有需要Python學習資料的小夥伴嗎?小編整理【一套Python資料、原始碼和PDF】，感興趣者可以加學習群：548377875，反正閒著也是閒著呢，不如學

Python進階系列連載（1）——那些容易被忽略的問題（上）

本篇我們來聊一聊一些在入門部分容易被忽略的問題 int（）強制轉換浮點數在int（）的強制轉換浮點數時候，不管是正數還是負數，只取整數部分。注意：這裡不是向上或者向下取整，也不是四捨五入。無限遞迴還記得我們講的俄羅斯套娃麼，還記得

zcmu 4931（前序+中序轉後序遍歷）

4931: 二叉樹遍歷時間限制: 1 Sec 記憶體限制: 32 MB 提交: 16 解決: 10 [提交][狀態][討論版] 題目描述二叉樹的前序、中序、後序遍歷的定義：前序遍歷：對任一子樹，先訪問跟，然後遍歷其左子樹，最後遍歷其右子樹；中序遍歷：對任一子

VisualSVN Server的配置和使用方法圖文（在伺服器中使用配置 svn 進行版本控制）

一、VisualSVN Server的配置和使用方法【伺服器端】安裝好VisualSVN Server後【安裝過程看這裡】，執行VisualSVN Server Manger，下面是啟動介面：好的，下面我來新增一個程式碼庫【Repository】，如下圖：

vue 移動端，頁面左右頁面切換效果（切換過程中會出現白屏效果，布吉島怎麼優化，後來就釋出前就棄用了）

<transition name="left"> <router-view v-if="getCms" class="Router"/> </transition> data() { names: 'left' } watch: { '$route'(to,

vue 移動端，頁面左右頁面切換效果（切換過程中會出現白屏效果，布吉島怎麽優化，後來就發布前就棄用了）

names out name watch bsp etc () nsf his <transition name="left"> <router-view v-if="getCms" class="Router"/> </transition

Glide 4.x Placeholder（佔位圖）不會被處理成圓角

解決這個問提一種方法就是讓UI直接切圓角圖;另一箇中就是通過thumbnail方法對佔位圖再做圓角處理,具體實現如下： public static void loadRoundImg(Imag

建立及呼叫基於QT5 QML的 DLL（舉例QML中使用QZXing識別二維碼）

1. 概述 Qt Quick技術的引入，使得你能夠快速構建 UI，具有動畫、各種絢麗效果的 UI都不在話下。在許多情況下基於QML開發的漂亮的介面想將他設計成元件提供給其他人使用，又不想讓別人看到QML原始碼，另外如果其他人是基於vc環境又如何使用你的QML介面呢？

【解決方案】Windows10區域網內配置資料夾共享（附網路中沒有找到的情況解決方案）

第一步，找到對應的資料夾選擇“特定的使用者” 這裡不好截圖，我就不展示圖片了。這裡選擇下拉框！！！如果在這裡發現有EveryOne的話，就直接點 |||| |||| |||| 如果發現沒有EveryOne的話，就選擇建立（但是一般都是有的！所以看看

kvm命令（qemu-system-x86_64）啟動虛擬機器過程記錄（虛擬機器中啟動虛擬機器、建立映象）

1.環境：vmware workstation10、虛擬機器Ubuntu14.04、Centos7-1511；後記：我的Mac筆記本裝的雙系統、我登入win10系統、安裝vmware workstation10、新建虛擬機器、安裝Ubuntu14.04作業系統、開機進入

JAVA實驗二：設計一個帶表頭的雙向連結串列（連結串列中資料的具體型別可以隨意）泛型

題目：設計一個帶表頭的雙向連結串列（連結串列中資料的具體型別可以隨意）提供以下方法：（1）insert：在某個位置插入物件；（2）insert：在連結串列的最後插入物件；（3）delete：在某個位置刪除物件；（4）delete：刪除連結串列中與x相同的元素；（5）siz

python語法 3 for迴圈（for i in range (0,10,3): #只打印0到9這10個數中能被3整除的數）

# -*- coding:utf-8 -*- # -Author: Paulliam - for i in range (10): print("loop",i) print("------------------------") for i in range (

lucene英文分詞器（StandarAnalyzer）中會被忽略的詞（stopWords）

相關推薦