MySQL使用全文索引(fulltext index)

阿新 • • 發佈：2020-08-27

1.建立全文索引(FullText index)

舊版的MySQL的全文索引只能用在MyISAM表格的char、varchar和text的欄位上。

不過新版的MySQL5.6.24上InnoDB引擎也加入了全文索引，所以具體資訊要隨時關注官網，

1.1. 建立表的同時建立全文索引

CREATE TABLE article (
id INT AUTO_INCREMENT NOT NULL PRIMARY KEY,
title VARCHAR(200),
body TEXT,
FULLTEXT(title, body)

) TYPE=MYISAM;

1.2.通過 alter table 的方式來新增

ALTER TABLE `student` ADDFULLTEXTINDEXft_stu_name (`name`)#ft_stu_name是索引名，可以隨便起

或者：ALTER TABLE `student` ADDFULLTEXTft_stu_name (`name`)

1.3. 直接通過create index的方式

CREATEFULLTEXT INDEXft_email_name ON `student` (`name`)

也可以在建立索引的時候指定索引的長度：

CREATEFULLTEXT INDEXft_email_name ON `student` (`name`(20))

2. 刪除全文索引

2.1. 直接使用 drop index(注意：沒有 drop fulltext index 這種用法)

DROP INDEX full_idx_name ON tommy.girl ;

2.2. 使用 alter table的方式

ALTER TABLE tommy.girl DROP INDEX ft_email_abcd;

3.使用全文索引

跟普通索引稍有不同

使用全文索引的格式： MATCH (columnName) AGAINST ('string')

eg:

SELECT * FROM `student`WHEREMATCH(`name`)AGAINST('聰')

當查詢多列資料時：

建議在此多列資料上建立一個聯合的全文索引，否則使用不了索引的。

SELECT * FROM `student`WHEREMATCH(`name`,`address`)AGAINST('聰廣東')

3.1. 使用全文索引需要注意的是：(基本單位是詞)

分詞，全文索引以詞為基礎的，MySQL預設的分詞是所有非字母和數字的特殊符號都是分詞符(外國人嘛)

這裡推薦一篇文章：利用mysql的全文索引實現模糊查詢

3.2. MySQL中與全文索引相關的幾個變數：

使用命令：mysql>SHOW VARIABLES LIKE 'ft%'; #ft就是FullText的簡寫

ft_boolean_syntax+ -><()~*:""&| #改變IN BOOLEAN MODE的查詢字元，不用重新啟動MySQL也不用重建索引
ft_min_word_len4 #最短的索引字串，預設值為4，(通常改為1)修改後必須重建索引檔案

重新建立索引命令：repair table tablename quick

ft_max_word_len84 #最長的索引字串，預設值為84，修改後必須重建索引檔案

ft_query_expansion_limit20 #查詢括展時取最相關的幾個值用作二次查詢

ft_stopword_file(built-in) #全文索引的過濾詞檔案，具體可以參考：MySQL全文檢索中不進行全文索引預設過濾詞

特別注意：50%的門坎限制(當查詢結果很多，幾乎所有記錄都有，或者極少的資料，都有可能會返回非所期望的結果)

-->可用IN BOOLEAN MODE即可以避開50%的限制。

此時使用全文索引的格式就變成了：SELECT * FROM `student`WHEREMATCH(`name`)AGAINST('聰'IN BOOLEAN MODE)

更多內容請參考：MySQL中的全文檢索(1)

4. ft_boolean_syntax(+ -><()~*:""&|)使用的例子：

4.1 + : 用在詞的前面，表示一定要包含該詞，並且必須在開始位置。

eg: +Apple 匹配：Apple123, "tommy,Apple"

4.2 - : 不包含該詞，所以不能只用「-yoursql」這樣是查不到任何row的，必須搭配其他語法使用。

eg: MATCH (girl_name) AGAINST ('-林志玲 +張筱雨')

匹配到：所有不包含林志玲，但包含張筱雨的記錄

4.3. 空(也就是預設情況)，表示可選的，包含該詞的順序較高。

例子：

apple banana 找至少包含上面詞中的一個的記錄行

+apple +juice 兩個詞均在被包含

+apple macintosh 包含詞 “apple”，但是如果同時包含 “macintosh”，它的排列將更高一些

+apple -macintosh 包含 “apple” 但不包含 “macintosh”

4.4. > :提高該字的相關性，查詢的結果會排在比較靠前的位置。

4.5.< :降低相關性，查詢的結果會排在比較靠後的位置。

例子：4.5.1.先不使用 ><

select * from tommy.girl where match(girl_name) against('張欣婷' in boolean mode);

可以看到完全匹配的排的比較靠前

4.5.2. 單獨使用 >

select * from tommy.girl where match(girl_name) against('張欣婷>李秀琴' in boolean mode);

使用了>的李秀琴馬上就排到最前面了

4.5.3. 單獨使用 <

select * from tommy.girl where match(girl_name) against('張欣婷<不是人' in boolean mode);

看到沒，不是人也排到最前面了，這裡使用的可是 < 哦，說好的降低相關性呢，往下看吧。

4.5.4.同時使用><

select * from tommy.girl where match(girl_name) against('張欣婷>李秀琴<練習冊<不是人>是個鬼' in boolean mode);

到這裡終於有答案了，只要使用了 ><的都會往前排，而且>的總是排在<的前面

小結一下：1. 只要使用 ><的總比沒用的靠前；

2. 使用 >的一定比 <的排的靠前(這就符合相關性提高和降低)；

3. 使用同一類的，使用的越早，排的越前。

4.6.( )：可以通過括號來使用字條件。

eg: +aaa +(>bbb <ccc) // 找到有aaa和bbb和ccc，aaa和bbb，或者aaa和ccc(因為bbb，ccc前面沒有+，所以表示可有可無)，

然後 aaa&bbb>aaa&bbb&ccc>aaa&ccc

4.7. ~ :將其相關性由正轉負，表示擁有該字會降低相關性，但不像「-」將之排除，只是排在較後面。

eg: +apple ~macintosh 先匹配apple，但如果同時包含macintosh，就排名會靠後。

4.8. * :萬用字元，這個只能接在字串後面。

MATCH (girl_name) AGAINST ('+*ABC*') #錯誤，不能放前面

MATCH (girl_name) AGAINST ('+張筱雨*') #正確

4.9. " " :整體匹配，用雙引號將一段句子包起來表示要完全相符，不可拆字。

eg: "tommy huang" 可以匹配 tommy huangxxxxx 但是不能匹配tommyishuang。

5.補充：Windows下無法修改 ft_min_word_len的情況，

5. 1. 使用cmd開啟 services.msc，

找到你的 MySQL服務，右鍵Properties,找到你的my.ini所在的路徑

5.2. 停止MySQL,在my.ini中增加 ft_min_word_len = 1,重啟MySQL,

然後使用命令show variables like 'ft_min_word_len';檢視是否生效了

MySQL使用全文索引(fulltext index)

1.建立全文索引(FullText index) 舊版的MySQL的全文索引只能用在MyISAM表格的char、varchar和text的欄位上。

MySQL全文索引實現簡單版搜尋引擎例項程式碼

前言只有Innodb和myisam儲存引擎能用全文索引（innodb支援全文索引是從mysql5.6開始的）

MySQL全文索引、聯合索引、like查詢、json查詢速度哪個快

查詢背景有一個表tmp_test_course大概有10萬條記錄，然後有個json欄位叫outline，存了一對多關係(儲存了多個編碼，例如jy1577683381775)

MySQL 全文索引的原理與缺陷

MySQL全文索引一種特殊的索引，它會把某個資料表的某個資料列出現過的所有單詞生成一份清單。

Mysql全文索引的使用

前言在MySQL 5.6版本以前,只有MyISAM儲存引擎支援全文引擎.在5.6版本中,InnoDB加入了對全文索引的支援,但是不支援中文全文索引.在5.7.6版本,MySQL內建了ngram全文解析器,用來支援亞洲語種的分詞.

用ELK分析每天4億多條騰訊雲MySQL審計日誌(4)--MySQL全文索引

前言：該文章將會介紹以下： 1，MySQL全文索引的使用 2，全文索引STOPWORD 3，使用全文索引的高效和準確

mysql全文索引

最近在複習資料庫索引部分，看到了 fulltext，也即全文索引，雖然全文索引在平時的業務中用到的不多，但是感覺它有點兒意思，所以花了點時間研究一下，特此記錄。

MySQL 的全文索引.

一、為什麼需要全文索引？通過前面的文章我們瞭解到 B+ 樹索引具有"最左字首匹配"的特性，因此，對於以下查詢 B+ 樹索引能很好的適配。

MySQL索引結構之Hash索引、full-text全文索引(面)

Hash索引主要就是通過Hash演算法（常見的Hash演算法有直接定址法、平方取中法、摺疊法、除數取餘法、隨機數法），將資料庫欄位資料轉換成定長的Hash值，與這條資料的行指標一併存入Hash表的對應位置；如果發生Hash

<p>MySQL 雜湊索引、空間資料索引、全文索引</p>

緊接上一小節，本小節重點介紹雜湊索引、空間資料索引、全文索引。 1.雜湊索引

MySQL建立索引（CREATE INDEX）

建立索引是指在某個表的一列或多列上建立一個索引，可以提高對錶的訪問速度。建立索引對MySQL資料庫的高效執行來說是很重要的。

MySQL 之全文索引

概念通常數值比較、範圍過濾等就可以完成絕大多數我們需要的查詢，但是，如果希望通過關鍵字的匹配來進行查詢過濾，那麼就需要基於相似度的查詢，而不是原來的精確數值比較。全文索引就是為這種場景設計的

《跬步千里系列》高效能MySql之索引到底是個啥

首發：www.leroyling.com/archives/my… 生活中，如果你想要快速的在一本書中找到某個你感興趣的內容，一般來講是會先看書的“索引”部分，也就是書的目錄，找到對應的頁碼之後，再翻去看你感興趣的具體內容。

MySql 表索引設計原則

索引的優點 1.加快資料的檢索速度，這是建立索引的最主要的原因; 2.通過建立唯一性索引，可以保證資料庫表中每一行資料的唯一性;

MySQL字串索引更合理的建立規則討論

前言針對使用MySQL的索引，我們之前介紹過索引的最左字首規則，索引覆蓋，唯一索引和普通索引的使用以及優化器選擇索引等概念，今天我們討論下如何更合理的給字串建立索引。

MySQL中表索引定義的方法與介紹

概述索引是 DBMS 根據表中的一列或若干列按一定的順序建立的列值與記錄行之間的對應關係表，方便 DBA 管理

mysql重複索引與冗餘索引例項分析

本文例項講述了mysql重複索引與冗餘索引。分享給大家供大家參考，具體如下：

使用shell指令碼來給mysql加索引的方法

用shell指令碼來給mysql加索引剛好用到， mark一下： #! /bin/bash tb_base=tb_student_ arr=(\"0\" \"1\" \"2\" \"3\" \"4\" \"5\" \"6\" \"7\" \"8\" \"9\" \"a\" \"b\" \"c\" \"d\" \"e\" \"f\")

Mysql覆蓋索引詳解

概念如果索引包含所有滿足查詢需要的資料的索引成為覆蓋索引(Covering Index)，也就是平時所說的不需要回表操作

MySQL組合索引與最左匹配原則詳解

前言之前在網上看到過很多關於mysql聯合索引最左字首匹配的文章，自以為就瞭解了其原理，最近面試時和麵試官交流，發現遺漏了些東西，這裡自己整理一下這方面的內容。

MySQL使用全文索引(fulltext index)

1.建立全文索引(FullText index)

1.1. 建立表的同時建立全文索引

1.2.通過 alter table 的方式來新增

1.3. 直接通過create index的方式

2. 刪除全文索引

2.1. 直接使用 drop index(注意：沒有 drop fulltext index 這種用法)

2.2. 使用 alter table的方式

3.使用全文索引

3.1. 使用全文索引需要注意的是：(基本單位是詞)

4. ft_boolean_syntax(+ -><()~*:""&|)使用的例子：

4.1 + : 用在詞的前面，表示一定要包含該詞，並且必須在開始位置。

4.2 - : 不包含該詞，所以不能只用「-yoursql」這樣是查不到任何row的，必須搭配其他語法使用。

4.3. 空(也就是預設情況)，表示可選的，包含該詞的順序較高。

4.4. > :提高該字的相關性，查詢的結果會排在比較靠前的位置。

4.5.< :降低相關性，查詢的結果會排在比較靠後的位置。

4.6.( )：可以通過括號來使用字條件。

4.7. ~ :將其相關性由正轉負，表示擁有該字會降低相關性，但不像「-」將之排除，只是排在較後面。

4.8. * :萬用字元，這個只能接在字串後面。

4.9. " " :整體匹配，用雙引號將一段句子包起來表示要完全相符，不可拆字。

5.補充：Windows下無法修改 ft_min_word_len的情況，

5. 1. 使用cmd開啟 services.msc，

5.2. 停止MySQL,在my.ini中增加 ft_min_word_len = 1,重啟MySQL,

相關推薦