Mysql全文搜尋match against的用法
1.使用Mysql全文檢索fulltext的先決條件
表的型別必須是MyISAM
建立全文檢索的欄位型別必須是char,varchar,text
2.建立全文檢索先期配置
由於Mysql的預設配置是索引的詞的長度是4,所以要支援中文單字的話,首先更改這個.
*Unix使用者要修改my.cnf,一般此檔案在/etc/my.cnf,如果沒有找到,先查詢一下find / -name 'my.cnf'
在 [mysqld] 位置內加入:
ft_min_word_len = 2
其它屬性還有
ft_wordlist_charset = gbk
ft_wordlist_file = /home/soft/mysql/share/mysql/wordlist-gbk.txt
ft_stopword_file = /home/soft/mysql/share/mysql/stopwords-gbk.txt
稍微解釋一下:
ft_wordlist_charset 表示詞典的字符集, 目前支援良好的有(UTF-8, gbk, gb2312, big5)
ft_wordlist_file 是詞表檔案, 每行包括一個詞及其詞頻(用若干製表符或空格分開,消岐專用)
ft_stopword_file 表示過濾掉不索引的詞表, 一行一個.
ft_min_word_len 加入索引的詞的最小長度, 預設是 4, 為了支援中文單字故改為 2
3.建立全文檢索
在建表中用FullText關鍵字標識欄位,已存在的表用 ALTER TABLE (或 CREATE INDEX) 建立索引
CREATE fulltext INDEX index_name ON table_name(colum_name);
4.使用全文檢索
在SELECT的WHERE字句中用MATCH函式,索引的關鍵詞用AGAINST標識,IN BOOLEAN MODE是隻有含有關鍵字就行,不用在乎位置,是不是起啟位置.
SELECT * FROM articles WHERE MATCH (tags) AGAINST ('旅遊' IN BOOLEAN MODE);
5.詳細的說明請引數Mysql官方網站
這是Mysql 5.1的,不過4.X也可以做為參考,基本一置.我用的就是Mysql 4.1.
MySQL支援全文索引(Full-Text) 已經很久了,目前,fulltext是一種只適用於MyISAM表的一個索引型別,而且對定義索引列的資料型別也有限制,只能是以下三種的組合char、 varchar、text。fulltext可以在建立表的同時就一起定義好,或者在表建立完成之後,通過語句alter
table或create index來追加索引,總之先後的效果是一樣的,但是兩者的效率卻是存在很大差異的,大量的實驗證明,對於大數量的表來說,先載入資料再來定義全文索引的 速度要遠遠優於在一個已經定義好全文索引的表裡面插入大量資料的速度。一定會問:這是問什麼呢?其實,道理很簡單,前者只需要一次性對你的索引列表進行操 作,排序比較都是在記憶體中完成,然後寫入硬碟;後者則要一條一條去硬碟中讀取索引表然後再進行比較最後寫入,自然這樣速度就會很慢。
家用一下搜尋引擎就會發現,分詞的情況只是出現在當整詞命中為0的情況下。
而具體怎樣分詞,大家可以參考一下baidu搜尋試驗結果:
·如果搜“徐祖寧寧”,結果為“徐祖”+“寧寧”。(搜人名的情況下,它可能有一個百家姓詞典,自動將姓後第一個字歸前)
·搜“徐寧願”,結果為“徐寧願”。(說明“寧願”歸“徐”所有。同上。因為徐是姓。)
·搜“徐祖寧願”,結果為“徐祖”+“寧願”。(因為“寧願”是詞,故“徐”只帶“祖”。)
·搜“徐祖寧高”,結果為“徐祖寧”。(因為“寧高”不是關鍵字,所以“寧”歸前詞所有。而“高”可能因為是單字,為提高前詞搜尋效率故被省略。)