創建索引之代碼開發

阿新 • • 發佈：2018-10-14

first mode 調整結構 commons reset pri .get 邏輯

【創建索引庫】

使用indexwriter對象創建索引。

【實現步驟】

（1）創建一個java工程，並導入jar包。

（2）創建一個indexwriter對象。

1）指定索引庫的存放位置Directory對象。

2）指定一個分析器，對文檔內容進行分析。

（3）創建Document對象

（4）創建filed對象，將field添加到Document對象中。

（5）使用indexwriter對象將Document對象寫入到索引庫，此過程進行索引創建，並將索引和Document對象寫入索引庫。

（6）關閉IndexWriter對象。

FirstLucene.java：

  1 package com.itheima.lucene;
  2 
  3 import static org.junit.Assert.*;
  4 import java.io.File;
  5 import org.apache.commons.io.FileUtils;
  6 import org.apache.lucene.analysis.Analyzer;
  7 import org.apache.lucene.analysis.TokenStream;
  8 import org.apache.lucene.analysis.cjk.CJKAnalyzer;
 
  9 import org.apache.lucene.analysis.cn.smart.SmartChineseAnalyzer;
 10 import org.apache.lucene.analysis.standard.StandardAnalyzer;
 11 import org.apache.lucene.analysis.tokenattributes.CharTermAttribute;
 12 import org.apache.lucene.analysis.tokenattributes.OffsetAttribute;
 13 import org.apache.lucene.document.Document;
 
 14 import org.apache.lucene.document.Field;
 15 import org.apache.lucene.document.Field.Store;
 16 import org.apache.lucene.document.LongField;
 17 import org.apache.lucene.document.StoredField;
 18 import org.apache.lucene.document.TextField;
 19 import org.apache.lucene.index.DirectoryReader;
 20 import org.apache.lucene.index.IndexReader;
 21 import org.apache.lucene.index.IndexWriter;
 22 import org.apache.lucene.index.IndexWriterConfig;
 23 import org.apache.lucene.index.Term;
 24 import org.apache.lucene.search.IndexSearcher;
 25 import org.apache.lucene.search.Query;
 26 import org.apache.lucene.search.ScoreDoc;
 27 import org.apache.lucene.search.TermQuery;
 28 import org.apache.lucene.search.TopDocs;
 29 import org.apache.lucene.store.Directory;
 30 import org.apache.lucene.store.FSDirectory;
 31 import org.apache.lucene.store.RAMDirectory;
 32 import org.apache.lucene.util.Version;
 33 import org.junit.Test;
 34 import org.wltea.analyzer.lucene.IKAnalyzer;
 35 
 36 public class FirstLucene {
 37 
 38     // 創建索引
 39     @Test
 40     public void testIndex() throws Exception {
 41         // 第一步：創建一個java工程，並導入jar包。
 42         // 第二步：創建一個indexwriter對象。
 43         Directory directory = FSDirectory.open(new File("D:\\temp\\index"));
 44         // Directory directory = new RAMDirectory();//保存索引到內存中 （內存索引庫）
 45         //Analyzer analyzer = new StandardAnalyzer();// 官方推薦
 46         Analyzer analyzer = new IKAnalyzer();// 官方推薦
 47         IndexWriterConfig config = new IndexWriterConfig(Version.LATEST, analyzer);
 48         IndexWriter indexWriter = new IndexWriter(directory, config);
 49         // 1）指定索引庫的存放位置Directory對象
 50         // 2）指定一個分析器，對文檔內容進行分析。
 51         // 第三步：創建field對象，將field添加到document對象中。
 52         File f = new File("D:\\Lucene&solr\\searchsource");
 53         File[] listFiles = f.listFiles();
 54         for (File file : listFiles) {
 55             // 第三步：創建document對象。
 56             Document document = new Document();
 57             // 文件名稱
 58             String file_name = file.getName();
 59             Field fileNameField = new TextField("fileName", file_name, Store.YES);
 60             // 文件大小
 61             long file_size = FileUtils.sizeOf(file);
 62             Field fileSizeField = new LongField("fileSize", file_size, Store.YES);
 63             // 文件路徑
 64             String file_path = file.getPath();
 65             Field filePathField = new StoredField("filePath", file_path);
 66             // 文件內容
 67             String file_content = FileUtils.readFileToString(file);
 68             Field fileContentField = new TextField("fileContent", file_content, Store.NO);
 69 
 70             document.add(fileNameField);
 71             document.add(fileSizeField);
 72             document.add(filePathField);
 73             document.add(fileContentField);
 74             // 第四步：使用indexwriter對象將document對象寫入索引庫，此過程進行索引創建。並將索引和document對象寫入索引庫。
 75             indexWriter.addDocument(document);
 76 
 77         }
 78         // 第五步：關閉IndexWriter對象。
 79         indexWriter.close();
 80     }
 81 
 82     // 搜索索引
 83     @Test
 84     public void testSearch() throws Exception {
 85         // 第一步：創建一個Directory對象，也就是索引庫存放的位置。
 86         Directory directory = FSDirectory.open(new File("D:\\temp\\index"));// 磁盤
 87         // 第二步：創建一個indexReader對象，需要指定Directory對象。
 88         IndexReader indexReader = DirectoryReader.open(directory);
 89         // 第三步：創建一個indexsearcher對象，需要指定IndexReader對象
 90         IndexSearcher indexSearcher = new IndexSearcher(indexReader);
 91         // 第四步：創建一個TermQuery對象，指定查詢的域和查詢的關鍵詞。
 92         Query query = new TermQuery(new Term("fileName", "lucene"));
 93         // 第五步：執行查詢。
 94         TopDocs topDocs = indexSearcher.search(query, 10);
 95         // 第六步：返回查詢結果。遍歷查詢結果並輸出。
 96         ScoreDoc[] scoreDocs = topDocs.scoreDocs;
 97         for (ScoreDoc scoreDoc : scoreDocs) {
 98             int doc = scoreDoc.doc;
 99             Document document = indexSearcher.doc(doc);
100             // 文件名稱
101             String fileName = document.get("fileName");
102             System.out.println(fileName);
103             // 文件內容
104             String fileContent = document.get("fileContent");
105             System.out.println(fileContent);
106             // 文件大小
107             String fileSize = document.get("fileSize");
108             System.out.println(fileSize);
109             // 文件路徑
110             String filePath = document.get("filePath");
111             System.out.println(filePath);
112             System.out.println("------------");
113         }
114         // 第七步：關閉IndexReader對象
115         indexReader.close();
116 
117     }
118 
119     // 查看標準分析器的分詞效果
120     @Test
121     public void testTokenStream() throws Exception {
122         // 創建一個標準分析器對象
123 //        Analyzer analyzer = new StandardAnalyzer();
124 //        Analyzer analyzer = new CJKAnalyzer();
125 //        Analyzer analyzer = new SmartChineseAnalyzer();
126         Analyzer analyzer = new IKAnalyzer();
127         // 獲得tokenStream對象
128         // 第一個參數：域名，可以隨便給一個
129         // 第二個參數：要分析的文本內容
130 //        TokenStream tokenStream = analyzer.tokenStream("test",
131 //                "The Spring Framework provides a comprehensive programming and configuration model.");
132         TokenStream tokenStream = analyzer.tokenStream("test",
133                 "高富帥可以用二維表結構來邏輯表達實現的數據");
134         // 添加一個引用，可以獲得每個關鍵詞
135         CharTermAttribute charTermAttribute = tokenStream.addAttribute(CharTermAttribute.class);
136         // 添加一個偏移量的引用，記錄了關鍵詞的開始位置以及結束位置
137         OffsetAttribute offsetAttribute = tokenStream.addAttribute(OffsetAttribute.class);
138         // 將指針調整到列表的頭部
139         tokenStream.reset();
140         // 遍歷關鍵詞列表，通過incrementToken方法判斷列表是否結束
141         while (tokenStream.incrementToken()) {
142             // 關鍵詞的起始位置
143             System.out.println("start->" + offsetAttribute.startOffset());
144             // 取關鍵詞
145             System.out.println(charTermAttribute);
146             // 結束位置
147             System.out.println("end->" + offsetAttribute.endOffset());
148         }
149         tokenStream.close();
150     }
151 
152 }

創建索引之代碼開發

first mode 調整結構 commons reset pri .get 邏輯【創建索引庫】使用indexwriter對象創建索引。【實現步驟】（1）創建一個java工程，並導入jar包。（2）創建一個indexwriter對象。 1）指

一、創建索引之代碼開發

第一步其它 lis span ava public pub apach pen jar包： Lucene包： lucene-core-4.10.3.jar lucene-analyzers-common-4.10.3.jar lucene-queryparser-4.10

創建自己的代碼片段（CodeSnippet）

-- mage 好的自帶 .com int arp 格式 ima 前言工作中經常會寫一些重復的代碼片段，如自動屬性、for循環、Action等等，針對這種情況，VisualStudio已經給我們提供了一個非常方便的功能——代碼片段，是我們可以簡單的輸入幾個字母就能生成大

使用Myvatis Generator自動創建項目代碼

編寫 http blog log details xml文件 art gen .net 1)構建環境 (2)xml文件代碼編寫 (3)自動代碼生成轉載自: http://blog.csdn.net/u012562943/article/details/50341469使用

maven如何實現創建帶源代碼的jar包

tag number export includes -a porting 項目源代碼改變實現目標 maven打包，在生成的jar包中帶有源代碼。記住，這個帶源代碼的意思是源代碼跟編譯生成的文件放在一個jar文件裏面，而不是單獨的一個XXX-source.jar包。

C#獲取文件創建時間的代碼

關於 tostring 獲取朋友 environ ont ole creation sage 下面資料是關於C#獲取文件創建時間的內容，應該是對各朋友也有用處。using System;using System.IO;class Class1 {static void M

lucene之創建索引代碼

dao 根據 arr conf document 通過數據 getname pan public void createIndex() throws IOException { // 第一步采集數據：(jdbc采集數據) BookDao dao = new BookDao

nova創建虛擬機源碼分析系列之七傳入參數轉換成內部id

接口函數 device 博文 nat build 消息通過 rop 上一篇博文將nova創建虛機的流程推進到了/compute/api.py中的create()函數，接下來就繼續分析。在分析之前簡單介紹nova組件源碼的架構。以conductor組件為例：每個組件

nova創建虛擬機源碼分析系列之八 compute創建虛機

alt 創建 put manager 信息模塊 manage tor float /conductor/api.py _build_instance() /conductor/rpcapi.py _build_instance() 1 構造一些數據類型2 修改一些a

數據庫優化之創建索引

索引 sql 楊書凡索引提供指針以指向存儲在表中指定列的數據，然後根據指定的次序排列這些指針，在根據指針到達包含該值的行什麽是索引數據庫中的索引和數據的目錄相似，利用目錄快速查找所需的信息。在數據庫中，索引是某個表中一列或者若幹列值的集合，以及物流標識這些值的數據頁的邏輯指針清單

ASP.NET Aries 高級開發教程：Excel導入之代碼編寫（番外篇）

chan 導入設置 jna 配置決定 ptc UNC 番外篇前言：以許框架提供的導入配置功能，已經能解決95%以上的導入情況，但有些情況總歸還是得代碼來解決。本篇介紹與導入相關的代碼。 1、前端追加導入時Post的參數： var grid = new

mongo之前後臺創建索引 --noIndexBuildRetry

.net msg containe widget 後臺 gif 可能 reset 創建失敗在數據量超大的情形下，任何數據庫系統在創建索引時都是一個耗時的大工程。MongoDB也不例外。因此，MongoDB索引的創建有兩個選擇，一個是前臺方式，一個是後臺方式。那這兩種方式

力軟V7.0快速開發平臺之代碼生成器

框架力軟是一款基於代碼生成器的智能快速開發平臺，可以幫助解決項目中90%的重復工作，讓開發者更多關註業務邏輯。既能快速提高開發效率，幫助公司節省人力成本，同時不失靈活性。力軟可以應用在任何J2EE項目的開發中，尤其適合企業資源計劃系統（ERP）、企業辦公系統（OA）、客戶關

lucene創建索引以及索引文件合並

dex null menu test alt tor document oid stand 1 package test; 2 3 import java.io.File; 4 import java.io.IOException; 5 import

TS流之代碼分析

xtra new 校正 reat ted 跟著 ror enable 好的　　代碼分析前，先要了解TS流基本概念：TS流之基本概念。　　VLC解析TS流是通過libts庫來分離的，libts庫使用libdvbpsi庫來解TS表。 1. libts庫在加載的時候，會將以下

SQL Server 查詢性能優化——創建索引原則（二）

技術分享 dex ble 銷售得到 with 9.png ron 條件三：索引的建立原則　　一般來說，建立索引要看數據使用的場景，換句話來說哪些訪問數據的SQL語句是常用的，而這些語句是否因為缺少索引（也有可能是索引過多）變的效率低下。但絕不是所有的SQL語句都要建

創建一個簡單項目的開發步驟

ges 技術 nbsp .cn 簡單一個技術分享 mage logs 創建一個簡單項目的開發步驟

基於Axis1.4的webservice接口開發（代碼開發）

-c oba config soap blog schema vid hand lock 基於Axis1.4的webservice接口開發（代碼開發）一、開發環境：　　我的開發環境是MyEclipse 2015+Apache-Tomcat-8.0.21。二、代碼開發：

lucene創建索引

lucene創建索引1.導入jar包2.創建實體Beanpackage com.zhishang.lucene; /** * Created by Administrator on 2017/7/8. */ public class HtmlBean { private String title

讀Zepto源碼之代碼結構

zepto雖然最近工作中沒有怎麽用 zepto ，但是據說 zepto 的源碼比較簡單，而且網上的資料也比較多，所以我就挑了 zepto 下手，希望能為以後閱讀其他框架的源碼打下基礎吧。源碼版本本文閱讀的源碼為 zepto1.2.0閱讀zepto之前需要了解 javascript 原型鏈和閉包的知識，推薦閱讀

創建索引之代碼開發

【創建索引庫】

【實現步驟】

相關推薦