1. 程式人生 > >solr:基於lucene的全文檢索解決方案

solr:基於lucene的全文檢索解決方案

採用Lucene搜尋庫為核心,提供全文索引和搜尋開源企業平臺,提供REST的HTTP/XML和JSON的API,如果你是Solr新手,那麼就和我一起來入門吧!本教程以solr4.8作為測試環境,jdk版本需要1.7及以上版本。

準備

本文假設你對Java有初中級以上水平,因此不再介紹Java相關環境的配置。下載解壓縮solr,在example目錄有start.jar檔案,啟動:

1 java -jar start.jar

索引資料

服務啟動後,目前你看到的介面沒有任何資料,你可以通過POSTing命令向Solr中新增(更新)文件,刪除文件,在exampledocs目錄包含一些示例檔案,執行命令:

1 java -jar post.jar solr.xml monitor.xml

上面的命令是向solr添加了兩份文件,開啟這兩個檔案看看裡面是什麼內容,solr.xml裡面的內容是:

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 <add> <doc> <field name=
"id">SOLR1000</field> <field name="name">Solr, the Enterprise Search Server</field> <field name="manu">Apache Software Foundation</field> <field name="cat">software</field> <field name="cat">search</field> <field name="features"
>Advanced Full-Text Search Capabilities using Lucene</field> <field name="features">OptimizedforHigh Volume Web Traffic</field> <field name="features">Standards Based Open Interfaces - XML and HTTP</field> <field name="features">Comprehensive HTML Administration Interfaces</field> <field name="features">Scalability - Efficient Replication to other Solr Search Servers</field> <field name="features">Flexible and Adaptable with XML configuration and Schema</field> <field name="features">Good unicode support: h&#xE9;llo (hello with an accent over the e)</field> <field name="price">0</field> <field name="popularity">10</field> <field name="inStock">true</field> <field name="incubationdate_dt"

相關推薦

solr基於lucene全文檢索解決方案

採用Lucene搜尋庫為核心,提供全文索引和搜尋開源企業平臺,提供REST的HTTP/XML和JSON的API,如果你是Solr新手,那麼就和我一起來入門吧!本教程以solr4.8作為測試環境,jdk版本需要1.7及以上版本。 準備 本文假設你對J

lucene框架全文檢索搜尋引擎方案

搜尋引擎技術方案 搜尋引擎方案 功能需求背景: ----有搜尋引擎需求   功能需求 提高查詢效率,關鍵詞全文檢索。 不需要訪問多次資料庫,只能一次資料庫查詢。 準確關鍵詞全文檢索。 由於查詢功能效

物聯網平臺構架系列 (六)Amazon, Microsoft, IBM IoT 解決方案導論 之 結語

物聯網; iot; aws; 亞馬遜; greengrass;microsoft; azure;ibm; watson; bluemix最近研究了一些物聯網平臺技術資料,以做選型參考。腦子裏積累大量信息,便想寫出來做一些普及。作為科普文章,力爭通俗易懂,不確保概念嚴謹性。我會給考據癖者提供相關英文鏈接,以便深

一次誤報引發的DNS檢測方案的思考DNS隧道檢測平民解決方案

行為 解決 程序 其他 大量 評測 檢測 列表 jpg 摘自:http://www.freebuf.com/articles/network/149328.html 通過以上分析得出監控需要關註的幾個要素:長域名、頻率、txt類型、終端是否對解析ip發起訪問、是否有全域

vs無法調試解決方案

工程 。。 為什麽 什麽 輸入 bsp 命令 tails csdn 轉:http://blog.csdn.net/jean7155/article/details/48223739 vs中無法加入斷點進行調試的解決方案 【 1】 以前也遇到過同樣的問題,但沒有問個為什麽,也

集中式存儲解決方案

div 陣列 部署 通道 系統 困難 sata samba 計算 ①DAS:直接附加存儲(適合單臺服務器) 1:DAS指的是什麽:指將存儲設備通過SCSI接口或光纖通道直接連接到一臺計算機上 2:DAS的適用哪些環境: a:服務器在地理分布上很分散,通過SAN或NAS在

Lucene全文檢索引擎

getname 通過 nal dem 檢索 數據庫 project cep 關閉 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSch

APICloudAPP開發痛點與解決方案

實力 移動 資深 最好的 問題 互聯 效果 簡單的 優化   大眾創業,萬眾創新。進入移動互聯網時代,創業者們的關註點不僅僅在PC端,還有APP客戶端,而各種APP開發公司也應時而起。不過令很多創業者頭痛的是,APP開發公司參差不齊,自己開發除了不夠專業以外又耗時耗力。

QT常見問題一VS打開QT解決方案,Qt Visual StudioAdd-in插件報錯誤

vs打開 51cto pro alt 方案 ces 解決 方法 重新編譯 VS打開工程報錯,具體如下圖所示:解決方法如下圖所示:①VS菜單選擇Qt5,點擊Qt Project Settings項 ②在Qt項目配置窗口,Properties頁,配置自己需要使用的QT版本根據自

Lucene 全文檢索入門

sdi 執行 option getter itl .get png 廣泛 fig 博客地址:http://www.moonxy.com 一、前言 Lucene 是 apache 軟件基金會的一個子項目,由 Doug Cutting 開發,是一個開放源代碼的全文檢索引擎工具包

其他計算機訪問django 網址127.0.0.08000 出問題的解決方案

預設方法啟動django manage.py runserver 這時啟動的服務只能在本機訪問,這是因為服務只向本機(127.0.0.1:8000)提供,所以區域網的其他機器不能訪問。   如果想讓網路上的其他計算機能夠訪問djang的服務,需要更改啟動django的命令

Lucene全文檢索之倒排索引實現原理、API解析【2018.11】

》 官網 http://lucene.apache.org/ 下載地址:https://mirrors.tuna.tsinghua.edu.cn/apache/lucene/java/7.5.0/ 》 Lucene的全文檢索是指什麼: 程式掃描文件

Python爬蟲開發(四)動態載入頁面的解決方案與爬蟲代理

0×00 前言 如果讀者讀過我前面的關於爬蟲的文章,應該大概都清楚我們現在可以對一個靜態的web頁面”為所欲為“了,但是技術的發展總是沒有止境的,僅僅是這樣對靜態頁面處理遠遠不夠,要知道現在很多的web頁面有意無意為了防止靜態爬蟲使用ajax技術動態載入頁面,這就導致了在面對這些網站的時候,我們

Elasticsearch什麼是全文檢索

什麼是全文檢索? 全文檢索是指計算機索引程式通過掃描文章中的每一個詞,對每一個詞建立一個索引,指明該詞在文章中出現的次數和位置,當用戶查詢時,檢索程式就根據事先建立的索引進行查詢,並將查詢的結果反饋給使用者的檢索方式。這個過程類似於通過字典中的檢索字表查字的過程。 在說全文檢索之前我們先

Lucene全文檢索框架

Lucene全文檢索框架 1、什麼時Lucene? 是一個全文搜尋框架,而不是應用產品,他只是一種工具讓你能實現某些產品,並不像www.baidu.com拿來就能用 是apache組織的一個用java實現的全文搜尋引擎的開源專案 2、Luncen的工作方式? 提供的服務實際包含兩部分:一入一

Lucene全文檢索學習

花了一段時間學習lucene今天有時間把所學的寫下來,網上有很多文章但大部分都是2.X和3.X版本的(當前最新版本4.9),希望這篇文章對自己和初學者有所幫助。    學習目錄 (1)什麼是lucene (2)lucene常用類詳解 (3)lucene簡單例項 (4)luce

Multisim 安裝報錯encountered an improper argument 解決方案(部分儀器實用)

在進行Multisim 12.0 安裝時,將下載好的安裝包解壓以後沒有彈出下一步安裝步驟,這個時候到解壓完以後的安裝路徑下面去,看到了autorun.exe ,點選autorun.exe檔案系統沒反應或者出現“encountered an improper argument”

Centos 中 PING 外部連結,出現 ping unknown host XXXXX 的解決方案

目錄 問題 方案 1. 問題: 在終端ping 外部連結時,出現 “ ping: unknown host XXXXX” 問題??? 2. 方案: 步驟一: vi /etc/resolv.conf  新增 nameserver 192.168

多執行緒程式設計偽共享以及其解決方案

首先本文是根據多篇部落格的整合而來,依照本人的理解所寫 1.基本概念的瞭解 回到正題,建議先從下面的部落格連結看起以便對下列概念有個基本的瞭解: 1)CPU快取 2)MESI協議以及RFO請求 3)快取行 具體部落格連結:https://www.cnbl

Lucene全文檢索隨筆

一,什麼是全文檢索 全文檢索是計算機程式通過掃描文章中的每一個詞,對每一個詞建立一個索引,指明該詞在文章中出現的次數和位置。當用戶查詢時根據建立的索引查詢,類似於通過字典的檢索字表查字的過程。 全文檢索(Full-Text Retrieval)以文字作為檢索物件,找出含有指定詞彙的文字。全面、準確和快速是