1. 程式人生 > >php 中文分詞 全文搜尋引擎 xunsearch 例項

php 中文分詞 全文搜尋引擎 xunsearch 例項

xunsearch 安裝

下載

cd  ~/downloads/
wget http://www.xunsearch.com/download/xunsearch-full-latest.tar.bz2

解壓

 tar -xvf xunsearch-full-latest.tar.bz2 

安裝

cd xunsearch-full-1.4.11/
./setup.sh 

安裝成功

+=================================================+
| Installation completed successfully, Thanks you | | 安裝成功,感謝選擇和使用 xunsearch | +-------------------------------------------------+ | 說明和注意事項: | | 1. 開啟/重新開啟 xunsearch 服務程式,命令如下: | | /usr/local/xunsearch/bin/xs-ctl.sh restart | 強烈建議將此命令寫入伺服器開機指令碼中 | | | | 2. 所有的索引資料將被儲存在下面這個目錄中: | | /usr/local/xunsearch/data | 如需要轉移到其它目錄,請使用軟連結。 | | | | 3. 您現在就可以在我們提供的開發包(SDK)基礎上 | | 開發您自己的搜尋了。 | | 目前只支援 PHP 語言,參見下面文件: | | /usr/local/xunsearch/sdk/php/README +=================================================+

配置資訊

SCWS 中文分詞

設計表

CREATE TABLE `test` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `username` varchar(255) COLLATE utf8_unicode_ci NOT NULL,
  `mobile` varchar(11) COLLATE utf8_unicode_ci NOT NULL,
  `message` text COLLATE utf8_unicode_ci,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=10002
DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci;

做測試資料

先來個1,2百萬

配置檔案

project.name = usersearch
project.default_charset = utf-8
server.index = 8383
server.search = 8384

[id]
type = id

[username]
type = title

[mobile]
index = mixed

; 這裡的欄位如果參與搜尋,一定要加索引
[message]
index = mixed
tokenizer = split

建立索引

util/Indexer.php usersearch   --source=mysql://root:[email protected]/yiiExam/ --sql='select id,username,mobile,message from test'  --clean

測試索引

util/Quest.php usersearch 風景

注意這裡的 usersearch 是專案名稱;最好專案名稱與配置檔名稱一致