1. 程式人生 > >lucene和倒排索引

lucene和倒排索引

https://www.cnblogs.com/zlslch/p/6440114.html  對倒排索引講的很好

正排索引:由document 到單詞

例如: “文件1”的ID > 單詞1:出現次數,出現位置列表;單詞2:出現次數,出現位置列表;

倒排索引:由單詞到document

例如:單詞  > 文件的Id1;文件的id2

倒排索引主要由兩個部分組成:“單詞詞典”和“倒排檔案”。

單詞詞典:指所有被切分開來想要查詢的terms

倒排檔案:指的是單詞詞典中的term對應的資訊

lucene:lucene是一個工具包,實現了全文檢索的功能。

主要是建立文件物件   建立索引 然後供別人查詢。