solr學習
當 Solr 在 Tomcat 服務器上部署成功後,我們可以登錄 Solr 網頁版的管理界面進行基本的操作。
一、首先來了解一下 Solr 頁面各個功能模塊的基本功能是什麽?這裏主要包括 Dashboard(儀表盤)、Logging(日誌)、 Core Admin(索引庫管理)、 Java Properties(Java 屬性)、 Thread Dump(線程管道)、 Core Selector(Core 選擇器)幾部分組成,接下來將一一介紹。
二、Dashboard(儀表盤):包含 solr 搭建路徑、版本信息,還有系統內存、jvm 內存和 jvm 參數等信息。
三、日誌:用來查看警告或異常的信息,黃色代表警告,紅色代表異常
在這裏我們可以看到 【Level】選項
在 【Level】 中可以看到 ALL、TRACE、DEBUG、INFO、WARN、ERROR、FATAL、OFF、UNSET 幾個可選項。Level 是用來控制相關類日誌的顯示信息的內容,其中:
ALL:顯示全部信息
INFO:除了正常信息,其余信息全部顯示
WARN:顯示警告信息
ERROR:顯示異常信息
UNSET:移除之前設置的信息
其他信息不再贅述(但是本人設置了也沒有看到什麽效果,[汗].......)
四、索引庫管理:Core 管理,索引庫優化等。主要包括 Add Core(添加 Core)、Unload(卸載 Core)、Rename(重命名 Core)、Optimize(優化索引庫)幾個功能
其中:
instanceDir:代表當前 Core 的根目錄
dataDir:代表當前 Core 索引文件的存放目錄
numDocs:代表當前 Core 索引文檔數量。它可能大於 xml 文件個數,因為一個 xml 文件可能存在多個 <doc> 標簽。
maxDoc:代表當前 Core 最大索引文檔數量。它可能因為重復提交時 maxDoc 就會變大。
(關於 numDocs 和 maxDoc 具體意義我也不是很清楚......)
四、Select Core(選擇 Core):選擇相應的 Core 進行操作。
1、Overview(概覽):選擇 Core 的基本信息。
2、Analysis 分詞器檢驗:用來校驗所引用分詞器的效果。其中 Field Value(Index) 代表需要分詞的文本,Field Value(Query) 代表分詞標準
其中:
SF:StopFielter,代表停止詞
LCF:LowerCaseFielter,代表忽略大小寫
ST:(不知道)
五、Config 就是 solrconfig.xml 文件
六、Dataimport:是從數據庫中導入索引文件
七、Document(從文件中導入數據):通過該界面,我們可以選擇相應的文件向服務器中導入索引文件。
1、DocumentType:導入文件的形式:
File Upload:從文件中導入,即上傳文件
JSON:在 Document(s)中寫入特定格式的 JSON 文件
XML:在 Document(s)中寫入特定格式的 XML 文件
2、Document(s):寫入特定格式的 JSON 或 XML 文件
3、CommitWithin:提交的最大數量
4、Overwrite:是否覆蓋(如果兩個索引文件的 ID 相同,是否覆蓋舊的索引文件)
5、Boot(權重):如果想對不同類型的文章,或者字段設置不同的權重,或者對不同的搜索詞語設置權重。但是這樣會消耗內存。
1)、添加 JSON 格式文件
2)添加 XML 文件
3)、添加物理文件
八、Query(查詢、重要):查詢索引文檔
1、q:查詢參數,格式 FieldName:FieldValue,查詢忽略大小寫,單詞匹配。例如:name:solr(查找 name 中包含 solr 的全部數據)。
2、fq:過濾查詢參數,在 q 的查詢結果上進一步篩選結果。例如:id:1212(在 name 中包含 solr 的結果上查找 id 為 1212 的數據)。
3、sort:排序,格式:fieldName desc|asc [,fieldName desc|asc ]。例如:name desc 按 name 屬性降序排列
4、start,rows:返回結果從第幾行顯示,一共顯示多少行。分頁中用到
5、fl:字段過濾,返回結果中顯示的 Field 。例如: id,name :返回結果中只包含 id 和 name 字段值,其他字段不顯示
6、Raw Query Parameters:組合查詢條件,相當於多個 q
7、wt : 輸出結果格式。
8、indent:返回結果是否縮進。通常調試 XML 結果用
9、debugQuery:是否顯示 Debug 信息。
10、dismax:它是基於 Lucene 的 DisjunctionMaxQuery 的擴展,用來取得文檔最大打分(設置權重)
11、edismax:dismax 的加強版
12、hl:高亮顯示
13、facet:Solr高級查詢facet
14、spatial:空間查詢
15、spellcheck:拼寫檢查
solr學習