php 中文分詞 全文搜尋引擎 xunsearch 例項
阿新 • • 發佈:2019-01-07
xunsearch 安裝
下載
cd ~/downloads/
wget http://www.xunsearch.com/download/xunsearch-full-latest.tar.bz2
解壓
tar -xvf xunsearch-full-latest.tar.bz2
安裝
cd xunsearch-full-1.4.11/
./setup.sh
安裝成功
+=================================================+
| Installation completed successfully, Thanks you |
| 安裝成功,感謝選擇和使用 xunsearch |
+-------------------------------------------------+
| 說明和注意事項: |
| 1. 開啟/重新開啟 xunsearch 服務程式,命令如下: |
| /usr/local/xunsearch/bin/xs-ctl.sh restart
| 強烈建議將此命令寫入伺服器開機指令碼中 |
| |
| 2. 所有的索引資料將被儲存在下面這個目錄中: |
| /usr/local/xunsearch/data
| 如需要轉移到其它目錄,請使用軟連結。 |
| |
| 3. 您現在就可以在我們提供的開發包(SDK)基礎上 |
| 開發您自己的搜尋了。 |
| 目前只支援 PHP 語言,參見下面文件: |
| /usr/local/xunsearch/sdk/php/README
+=================================================+
配置資訊
SCWS 中文分詞
設計表
CREATE TABLE `test` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`username` varchar(255) COLLATE utf8_unicode_ci NOT NULL,
`mobile` varchar(11) COLLATE utf8_unicode_ci NOT NULL,
`message` text COLLATE utf8_unicode_ci,
PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=10002 DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci;
做測試資料
先來個1,2百萬
配置檔案
project.name = usersearch
project.default_charset = utf-8
server.index = 8383
server.search = 8384
[id]
type = id
[username]
type = title
[mobile]
index = mixed
; 這裡的欄位如果參與搜尋,一定要加索引
[message]
index = mixed
tokenizer = split
建立索引
util/Indexer.php usersearch --source=mysql://root:[email protected]/yiiExam/ --sql='select id,username,mobile,message from test' --clean
測試索引
util/Quest.php usersearch 風景
注意這裡的 usersearch 是專案名稱;最好專案名稱與配置檔名稱一致