1. 程式人生 > >JAVA菜鳥學習總結:Lucene的搜尋

JAVA菜鳥學習總結:Lucene的搜尋

小號 **

搜尋Lucene的學習:

** 搜尋按功能分為:垂直搜尋(細分搜尋),綜合搜尋,還此外包括站網站內搜尋軟體狀語從句:搜尋內部搜尋的關鍵字:索引搜尋引擎的英文通過網路爬蟲從網際網路電子雜誌|網頁放在臨時庫中,然後通過過濾篩選出符合規則並且索引庫沒有的網頁,放入索引庫,根據使用者就索引可以電子雜誌這些|網頁倒排索引技術(反向索引):將文件內容劃分為多個詞條,每個詞條就是索引,詞條獨一無二,包含這些詞條的文件就放在該詞條的關聯列表中,使用該索引就可以得到包含該詞條的多個文件內容的Lucene的的是開發搜尋引擎的工具包,Solr的是基於Lucene的開發的企業級搜尋引擎產品,根據實現原理就是分詞建立索引庫:資料 - >文件物件 - >索引寫入器(索引寫入器配置物件(分詞詞)器,Lucene的版本),索引庫地址) - >索引庫maven工程匯入依賴出現jre版本 對的錯,右鍵 - > maven->更新專案建立索引庫:資料 - >文件物件 - >索引寫入器(索引寫入器配置物件,分詞器) - >庫索引新建索引庫,向索引庫新增索引的案例:

——————————- @SuppressWarnings(“resource”)public static void main(String [] args)丟擲IOException {//建立文件物件Document doc = new Document(); //新增欄位,Store.YES表示儲存,NO表示不儲存// LongField IntField DoubleField // StringField TextField LongField id = new LongField(“id”,11L,Store.YES); doc.add(ID); StringField title = new StringField(“title”,“谷歌地圖之父跳槽Facebook”,Store.YES); doc.add(標題); //指定索引庫位置目錄dir = FSDirectory.open(新檔案(“D:\ index”)); //索引寫入器的配置1配置Lucene的版本2指定分詞器IndexWriterConfig iwc = new IndexWriterConfig(Version.LATEST,new StandardAnalyzer()); //建立索引寫入器indexwriter物件IndexWriter indexWriter = new IndexWriter(dir,iwc); //將資料寫入到索引庫indexWriter.addDocument(DOC); //提交indexWriter.commit(); //關閉索引寫入器indexWriter.close(); }}

索引寫入器記得提交後要關閉,不然其他索引寫入器不能訪問索引庫StringField欄位類預設不使用分詞器,所以詞條只有一個,文字欄位欄位類使用提供的分詞器,詞條項有多個Store.YES表示將資料儲存在索引的文件列表,NO表示不儲存Version.LATEST表示的Lucene的版本索引寫入器支援批量提交(引數是一個集合):Lucene的的預設的中文分詞已經被棄用,現在IK的分類器(IKanalyzer)自定義分詞器:在資源放入IKAnakyzer.cfg.xml配置檔案,建立分詞檔案,寫進自定義分詞<?xml version =“1.0”編碼=“UTF-8”? > <!DOCTYPE屬性SYSTEM“

http://java.sun.com/dtd/properties.dtd ”> < properties > < comment > IK Analyzer擴充套件配置 <! - 使用者可以在這裡配置自己的擴充套件字典- > < dict“> ext.dic; <! - 使用者可以在這裡配置自己的擴充套件停止詞字典 - >

離線寫部落格即使使用者在沒有網路的情況下,也可以通過本編輯器離線寫部落格(直接在曾經使用過的瀏覽器中輸入[write.blog.csdn.net/mdeditor](HTTP://寫。 blog.csdn.net / mdeditor)即可。* Markdown編輯器使用瀏覽器離線儲存將內容儲存在本地。使用者寫部落格的過程中,內容實時儲存在瀏覽器快取中,在使用者關閉使用者可以選擇<我類別=瀏覽器或者其他異常情況下,內容不會丟失“icon-disk”>把正在寫的部落格儲存到伺服器草稿箱,即使換瀏覽器或者清除快取,內容也不會丟失。>注意:雖然瀏覽器儲存大部分時候都比較可靠,但為了你的資料安全,在聯網後,請務必及時發表或者儲存到伺服器草稿箱*

瀏覽器相容1.目前,本編輯器對鉻瀏覽器支援最為完整。建議大家使用較新版本的鉻.3.IE9以下不支援4.IE9,10,11存在以下問題1.不支援離線功能1 .IE9不支援檔案匯入匯出1.IE10不支援拖載檔案匯入--- [1]:HTTP://math.stackexchange.com/ [2]:https://開頭github上的.com / jmcmanus /下頁-額外“Pagedown Extra”[3]:http://meta.math.stackexchange.com/questions/5020 / mathjax-basic-tutorial-and-quick-reference [4]:http:// bramp .github.io / js -sequence-diagrams / [5]:http://adrai.github.io/flowchart.js/ [6]:https://github.com/benweet/stackedit