lucene原始碼分析---1

阿新 • • 發佈：2019-01-09

lucene原始碼分析—例項

本章開始分析lucene的原始碼，版本為目前最新的6.1.0，下面先看一段常見的lucene建立索引和進行搜尋的例項，

建立索引例項：

            String filePath = ...//檔案路徑
            String indexPath = ...//索引路徑
            File fileDir = new File(filePath);    
            Directory dir = FSDirectory.open(Paths.get(indexPath));  

            Analyzer luceneAnalyzer = new StandardAnalyzer();
            IndexWriterConfig iwc = new IndexWriterConfig(luceneAnalyzer);  
            iwc.setOpenMode(OpenMode.CREATE);  
            IndexWriter indexWriter = new IndexWriter(dir,iwc);    
            File[] textFiles = fileDir.listFiles();    

            for 
 (int i = 0; i < textFiles.length; i++) {    
                if (textFiles[i].isFile()) {     
                    String temp = FileReaderAll(textFiles[i].getCanonicalPath(),    
                            "GBK");    
                    Document document = new Document();    
                    Field FieldPath = new StringField("path" 
, textFiles[i].getPath(), Field.Store.YES);
                    Field FieldBody = new TextField("body", temp, Field.Store.YES);    
                    document.add(FieldPath);    
                    document.add(FieldBody);    
                    indexWriter.addDocument(document);    
                }    
            }    
            indexWriter.close();

其中，FileReaderAll函式用來從檔案中讀取字串。

搜尋例項：

            String indexPath=...//索引路徑  
            IndexReader reader = DirectoryReader.open(FSDirectory.open(Paths.get(indexPath)));
            IndexSearcher searcher=new IndexSearcher(reader);
            ScoreDoc[] hits=null;  
            String queryString=...//關鍵字串
            Query query=null;  
            Analyzer analyzer= new StandardAnalyzer();  
            try {  
                QueryParser qp=new QueryParser("body",analyzer);
                query=qp.parse(queryString);  
            } catch (ParseException e) {  

            }  
            if (searcher!=null) {  
                TopDocs results=searcher.search(query, 10);
                hits=results.scoreDocs;  
                Document document=null;  
                for (int i = 0; i < hits.length; i++) {  
                    document=searcher.doc(hits[i].doc);  
                    String body=document.get("body");  
                    String path=document.get("path");  
                    String modifiedtime=document.get("modifiField");  
                }  
                reader.close();  
            }

後面的章節就會開始分析這兩個例項究竟做了哪些工作，以及探究lucene背後的原理。

lucene原始碼分析---1

lucene原始碼分析—例項本章開始分析lucene的原始碼，版本為目前最新的6.1.0，下面先看一段常見的lucene建立索引和進行搜尋的例項，建立索引例項： String filePath = ...//檔案路徑

Netty Pipeline原始碼分析(1)

原文連結：wangwei.one/posts/netty… 前面，我們分析了Netty EventLoop的建立與啟動原理，接下里我們來分析Netty中另外兩個重要元件—— ChannelHandler 與 Pipeline。Netty中I/O事件的傳播機制均由它負責，下面我們來看看它是如

lucene原始碼分析(2)讀取過程例項

1.官方提供的程式碼demo Analyzer analyzer = new StandardAnalyzer(); // Store the index in memory: Directory directory = new RAMDirec

vue原始碼分析1-new Vue做了哪些操作

首先我們可以看到vue的原始碼在github上有，大家可以克隆下來。 git地址我們主要看src下的內容。 1.現在我們來分析下 new Vue都做了哪些操作 var app = new Vue({ el: '#app', mounted:{ console.log(t

lucene原始碼分析(3)facet例項

簡單的facet例項 public class SimpleFacetsExample { private final Directory indexDir = new RAMDirectory(); private final Directory taxoDir = new RAMD

redis原始碼分析1------dict的實現

1. 總體結構 redis的dict就是hash表，使用鏈式結構來解決key值衝突，典型的資料結構結構體的定義如下： typedef struct dictEntry { void *key; union { void *val; uint64_t

Netty原始碼分析:1.4伺服器啟動流程

第一章節是主要是伺服器啟動的程式碼分析。章節目錄有： |———1.1初始化NioEventLoopGroup |———1.2初始化NioEventLoop |———1.3初始化NioServerSocketChannel |———1.4伺服器啟動流程為什麼先從初始化開

Netty原始碼分析:1.3初始化NioServerSocketChannel

Netty原始碼分析:1.2初始化NioEventLoop

Netty原始碼分析:1.1初始化NioEventLoopGroup

《2.uboot和系統移植-第5部分-2.5.uboot原始碼分析1-啟動第一階段》

《2.uboot和系統移植-第5部分-2.5.uboot原始碼分析1-啟動第一階段》第一部分、章節目錄 2.5.1.start.S引入 2.5.2.start.S解析1 2.5.3.start.S解析2 2.5.4.start.S解析3 2.5.5.start.S解析4 2.5.6.s

lucene原始碼分析(5)Query分析

查詢的入口 /** Lower-level search API. * * <p>{@link LeafCollector#collect(int)} is called for every matching document. * * @throws

MyBatis原始碼分析-1-基礎支援層-反射模組-Reflector/ReflectorFactory

本文主要介紹MyBatis的反射模組是如何實現的。 MyBatis 反射的核心類Reflector，下面我先說明它的建構函式和成員變數。具體方法下面詳解。 org.apache.ibatis.reflection.Reflector public class Reflector {

rxjs 原始碼分析1-(fromEvent)

前言 Rxjs是使用 Observables 的響應式程式設計的庫，它使編寫非同步或基於回撥的程式碼更容易。我們現在針對Rxjs 6 來進行原始碼分析，分析其實現的基本原理，我們可以根據中文文件來學習Rxjs 的基本使用，但是這個文件是Rxjs 5 的版本。其最基本的使用區別如下,Rxjs 6的操作符都放

谷歌瀏覽器的原始碼分析 1

隨著網路技術的發展，越來越多應用都已經離不開網路，特別像人類大腦一樣的知識庫的搜尋引擎，更加是離不開功能強大的雲端計算。不過，即便雲端計算非常強大，但它還不能直接地把結果呈現給使用者，這樣就需要一個客戶端來呈現出來，這個客戶端就是瀏覽器。現在越來越多人上網，他們每一次上網，都離不開瀏覽的使用，這已經是一

Shiro原始碼分析(1)

簡介 SecurityManager：安全管理器，Shiro最核心元件。Shiro通過SecurityManager來管理內部元件例項，並通過它來提供安全管理的各種服務。 Authenticator：認證器，認證AuthenticationToken是否有

3.21以太貓原始碼分析1

概述： Cryptokitties，眾所周知的迷戀貓的遊戲，是基於以太坊平臺執行的。使用者在遊戲中可以養大、買賣並繁育“電子寵物”小貓，每隻小貓和繁衍的後代都是獨一無二的。由於它是第一款真正意義上的區塊

以太坊原始碼分析(1)go-ethereum的設計思路及模組組織形式

# go-ethereum原始碼解析因為go ethereum是最被廣泛使用的以太坊客戶端，所以後續的原始碼分析都從github上面的這份程式碼進行分析。然後我使用的是windows 10 64位的環境。### 搭建go ethereum除錯環境首先下載go安裝包進行安裝，因為GO的網站被牆，所以從下面

lucene原始碼分析—倒排索引的寫過程

lucene將倒排索引的資訊寫入.tim和.tip檔案，這部分程式碼也是lucene最核心的一部分。倒排索引的寫過程從BlockTreeTermsWriter的write函式開始， BlockTreeTermsWriter::write public void wri

lucene原始碼分析---9

lucene原始碼分析—倒排索引的寫過程本章介紹倒排索引的寫過程，下一章再介紹其讀過程，和前幾章相似，本章所有程式碼會基於原有程式碼進行少量的改寫，方便閱讀，省略了一些不重要的部分。 lucene將倒排索引的資訊寫入.tim和.tip檔案，這部分程式碼也是

lucene原始碼分析---1

lucene原始碼分析—例項

相關推薦