1. 程式人生 > >為mysql資料庫建立索引;mysql索引總結----mysql 索引型別以及建立;mysql_建立索引的優缺點

為mysql資料庫建立索引;mysql索引總結----mysql 索引型別以及建立;mysql_建立索引的優缺點

因為欣賞所以轉載:

http://www.cnblogs.com/cy163/archive/2008/10/27/1320798.html

http://www.cnblogs.com/lihuiyong/p/5623191.html

http://www.cnblogs.com/wb118115/p/6066171.html

前些時候,一位頗高階的程式設計師居然問我什麼叫做索引,令我感到十分的驚奇,我想這絕不會是滄海一粟,因為有成千上萬的開發者(可能大部分是使用MySQL的)都沒有受過有關資料庫的正規培訓,儘管他們都為客戶做過一些開發,但卻對如何為資料庫建立適當的索引所知較少,因此我起了寫一篇相關文章

的念頭。

  最普通的情況,是為出現在where子句的欄位建一個索引。為方便講述,我們先建立一個如下的表。

Code程式碼如下:
CREATE TABLE mytable (
 id serial primary key,
 category_id int not null default 0,
 user_id int not null default 0,
 adddate int not null default 0
);



  很簡單吧,不過對於要說明這個問題,已經足夠了。如果你在查詢時常用類似以下的語句:

SELECT * FROM mytable WHERE category_id=1; 

  最直接的應對之道,是為category_id建立一個簡單的索引:

CREATE INDEX mytable_categoryid 
 ON mytable (category_id);

  OK,搞定?先別高興,如果你有不止一個選擇

條件呢?例如:

SELECT * FROM mytable WHERE category_id=1 AND user_id=2;

  你的第一反應可能是,再給user_id建立一個索引。不好,這不是一個最佳的方法。你可以建立多重的索引。

CREATE INDEX mytable_categoryid_userid ON mytable (category_id,user_id);

  注意到我在命名時的習慣了嗎?我使用"表名_欄位1名_欄位2名"的方式。你很快就會知道我為什麼這樣做了。

  現在你已經為適當的欄位建立了索引,不過,還是有點不放心吧,你可能會問,資料庫會真正用到這些索引嗎?測試一下就OK,對於大多數的資料庫來說,這是很容易的,只要使用EXPLAIN命令:

EXPLAIN

 SELECT * FROM mytable 
  WHERE category_id=1 AND user_id=2;

This is what Postgres 7.1 returns (exactly as I expected) 

 NOTICE: QUERY PLAN:

Index Scan using mytable_categoryid_userid on 
  mytable (cost=0.00..2.02 rows=1 width=16)

EXPLAIN

  以上是postgres的資料,可以看到該資料庫在查詢的時候使用了一個索引(一個好開始),而且它使用的是我建立的第二個索引。看到我上面命名的好處了吧,你馬上知道它使用適當的索引了。

  接著,來個稍微複雜一點的,如果有個ORDER BY字句呢?不管你信不信,大多數的資料庫在使用order by的時候,都將會從索引中受益。

SELECT * FROM mytable 
  WHERE category_id=1 AND user_id=2
    ORDER BY adddate DESC;

  有點迷惑了吧?很簡單,就象為where字句中的欄位建立一個索引一樣,也為ORDER BY的字句中的欄位建立一個索引:

CREATE INDEX mytable_categoryid_userid_adddate
  ON mytable (category_id,user_id,adddate);

  注意: "mytable_categoryid_userid_adddate" 將會被截短為

"mytable_categoryid_userid_addda"

CREATE

  EXPLAIN SELECT * FROM mytable
  WHERE category_id=1 AND user_id=2
   ORDER BY adddate DESC;

 NOTICE: QUERY PLAN:

 Sort (cost=2.03..2.03 rows=1 width=16)
  -> Index Scan using mytable_categoryid_userid_addda 
    on mytable (cost=0.00..2.02 rows=1 width=16)

EXPLAIN

  看看EXPLAIN的輸出,好象有點恐怖啊,資料庫多做了一個我們沒有要求的排序,這下知道效能如何受損了吧,看來我們對於資料庫的自身運作是有點過於樂觀了,那麼,給資料庫多一點提示吧。

  為了跳過排序這一步,我們並不需要其它另外的索引,只要將查詢語句稍微改一下。這裡用的是postgres,我們將給該資料庫一個額外的提示--在ORDER BY語句中,加入
where語句中的欄位。這只是一個技術上的處理,並不是必須的,因為實際上在另外兩個欄位上,並不會有任何的排序操作,不過如果加入,postgres將會知道哪些是它應該做的。

EXPLAIN SELECT * FROM mytable 
  WHERE category_id=1 AND user_id=2
  ORDER BY category_id DESC,user_id DESC,adddate DESC;

NOTICE: QUERY PLAN:

Index Scan Backward using 
 mytable_categoryid_userid_addda on mytable 
   (cost=0.00..2.02 rows=1 width=16)

EXPLAIN

  現在使用我們料想的索引了,而且它還挺聰明,知道可以從索引後面開始讀,從而避免了任何的排序。

  以上說得細了一點,不過如果你的資料庫非常巨大,並且每日的頁面請求達上百萬算,我想你會獲益良多的。不過,如果你要做更為複雜的查詢呢,例如將多張表結合起來查詢,特別是where限制字句中的欄位是來自不止一個表格時,應該怎樣處理呢?我通常都儘量避免這種做法,因為這樣資料庫要將各個表中的東西都結合起來,然後再排除那些不合適的行,搞不好開銷會很大。

  如果不能避免,你應該檢視每張要結合起來的表,並且使用以上的策略來建立索引,然後再用EXPLAIN命令驗證一下是否使用了你料想中的索引。如果是的話,就OK。不是的話,你可能要建立臨時的表來將他們結合在一起,並且使用適當的索引。

  要注意的是,建立太多的索引將會影響更新和插入的速度,因為它需要同樣更新每個索引檔案。對於一個經常需要更新和插入的表格,就沒有必要為一個很少使用的where字句單獨建立索引了,對於比較小的表,排序的開銷不會很大,也沒有必要建立另外的索引。

  以上介紹的只是一些十分基本的東西,其實裡面的學問也不少,單憑EXPLAIN我們是不能判定該方法是否就是最優化的,每個資料庫都有自己的一些優化器,雖然可能還不太完善,但是它們都會在查詢時對比過哪種方式較快,在某些情況下,建立索引的話也未必會快,例如索引放在一個不連續的儲存空間時,這會增加讀磁碟的負擔,因此,哪個是最優,應該通過實際的使用環境來檢驗。

  在剛開始的時候,如果表不大,沒有必要作索引,我的意見是在需要的時候才作索引,也可用一些命令來優化表,例如MySQL可用"OPTIMIZE TABLE"。

  綜上所述,在如何為資料庫建立恰當的索引方面,你應該有一些基本的概念了。

關於MySQL索引的好處,如果正確合理設計並且使用索引的MySQL是一輛蘭博基尼的話,那麼沒有設計和使用索引的MySQL就是一個人力三輪車。對於沒有索引的表,單表查詢可能幾十萬資料就是瓶頸,而通常大型網站單日就可能會產生幾十萬甚至幾百萬的資料,沒有索引查詢會變的非常緩慢。還是以WordPress來說,其多個數據表都會對經常被查詢的欄位新增索引,比如wp_comments表中針對5個欄位設計了BTREE索引。

一個簡單的對比測試

以我去年測試的資料作為一個簡單示例,20多條資料來源隨機生成200萬條資料,平均每條資料來源都重複大概10萬次,表結構比較簡單,僅包含一個自增ID,一個char型別,一個text型別和一個int型別,單表2G大小,使用MyIASM引擎。開始測試未新增任何索引。

執行下面的SQL語句:

1 mysql> SELECT id,FROM_UNIXTIME(timeFROM article WHERE a.title='測試標題'

查詢需要的時間非常恐怖的,如果加上聯合查詢和其他一些約束條件,資料庫會瘋狂的消耗記憶體,並且會影響前端程式的執行。這時給title欄位新增一個BTREE索引:

1 mysql> ALTER TABLE article ADD INDEX index_article_title ON title(200);

再次執行上述查詢語句,其對比非常明顯:

MySQL索引的概念

索引是一種特殊的檔案(InnoDB資料表上的索引是表空間的一個組成部分),它們包含著對資料表裡所有記錄的引用指標。更通俗的說,資料庫索引好比是一本書前面的目錄,能加快資料庫的查詢速度。上述SQL語句,在沒有索引的情況下,資料庫會遍歷全部200條資料後選擇符合條件的;而有了相應的索引之後,資料庫會直接在索引中查詢符合條件的選項。如果我們把SQL語句換成“SELECT * FROM article WHERE id=2000000”,那麼你是希望資料庫按照順序讀取完200萬行資料以後給你結果還是直接在索引中定位呢?上面的兩個圖片鮮明的用時對比已經給出了答案(注:一般資料庫預設都會為主鍵生成索引)。

索引分為聚簇索引和非聚簇索引兩種,聚簇索引是按照資料存放的物理位置為順序的,而非聚簇索引就不一樣了;聚簇索引能提高多行檢索的速度,而非聚簇索引對於單行的檢索很快。

MySQL索引的型別

1. 普通索引

這是最基本的索引,它沒有任何限制,比如上文中為title欄位建立的索引就是一個普通索引,MyIASM中預設的BTREE型別的索引,也是我們大多數情況下用到的索引。

01 –直接建立索引
02 CREATE INDEX index_name ON table(column(length))
03 –修改表結構的方式新增索引
04 ALTER TABLE table_name ADD INDEX index_name ON (column(length))
05 –建立表的時候同時建立索引

相關推薦

mysql資料庫簡單一些簡單操作和總結

1. mysql 資料庫操作方法: 進入資料庫 mysql -uroot -p 退出 quite exit 預設引擎 innodb 檢視版本 select verison(); 檢視時間 select now(); 邏輯運算 select 1+1; 查詢資料庫 show databases ; 建立資料

Mysql資料庫的基本操作的一些總結

Mysql資料庫的基本操作 總注:所有sql語句結尾處最好加上分號符; MySQL中的一些語句使用方法: #檢視所有的資料庫 show databases;   #檢視資料庫下所有的表 show tables;   注:sql語句不區分大小寫,但是嚴重區分中英文

MySQL資料庫加密和解密~認證登陸密碼(mysql.user)和MySQL不區分大小寫

MySQL資料庫認證密碼有兩種方式: 1:MySQL 4.1版本之前是MySQL323加密 2:MySQL 4.1和之後的版本都是MySQLSHA1加密 還有函式:AES_ENCRYPT()加密函式

Java向Mysql資料庫中儲存圖片等二進位制檔案的實現,以及常見報錯的解決!

Mysql資料庫的功能很強大,除了能儲存字元等常見資料以外,它同樣可以儲存圖片等二進位制檔案,本文以儲存照片為例。 一、Mysql儲存二進位制檔案常見報錯有: 1.com.mysql.jdbc.PacketTooBigException: Packet for query

MySQL資料庫InnoDB資料恢復工具使用總結

本文從實際使用經驗出發,介紹一款開源的MySQL資料庫InnoDB資料恢復工具:innodb-tools,它通過從原始資料檔案中提取表的行記錄,實現從丟失的或者被毀壞的MySQL表中恢復資料。例如,當你不小心執行DROP TABLE、TRUNCATE TABLE或

MySQL資料庫表結構設計優化技巧總結 讓你的表結構更加合理

很多人都將 資料庫設計正規化 作為資料庫表結構設計“聖經”,認為只要按照這個正規化需求設計,就能讓設計出來的表結構足夠優化,既能保證效能優異同時還能滿足擴充套件性要求。殊不知,在N年前被奉為“聖經”的資料庫設計3正規化早就已經不完全適用了。這裡我整理了一些比

mysql資料庫的備份和還原的總結

此外需要特別注意的一點時,不加--databases對資料庫進行備份後,如過被備份的資料庫直接被刪除後,無法直接用備份進行恢復,因為 “mysqldump -u root -p db_name>E:/db.sql”只備份了db_name資料庫下的所有表,檔案中不包括建立資料庫的CREATE DATABA

MyBatis實現Mysql資料庫分庫分表操作和總結

前言 作為一個數據庫,作為資料庫中的一張表,隨著使用者的增多隨著時間的推移,總有一天,資料量會大到一個難以處理的地步。這時僅僅一張表的資料就已經超過了千萬,無論是查詢還是修改,對於它的操作都會很耗時,這時就需要進行資料庫切分的操作了。 MyBatis實現分表最簡單步驟 既

用c語言連結MySQL資料庫出現Can't connect to local MySQL server through socket '/var/run/mysqld/mysqld.sock'

這個問題,困擾了我好幾天,最後終於解決了。首先,我用find命令找了半天,也只有/tmp/mysql.sock,當時我很崩潰啊,後來看到一篇文章,我忘了地址,讓我有感,於是解決了這個問題。 1、在/var/run/目錄下建立一個mysqld的資料夾(如果這個資

mysql資料庫插入時間日期資料異常com.mysql.jdbc.MysqlDataTruncation

今天在學習mybatis的時候學習到insert的時候發現一個錯誤,這個錯誤在查詢的時候不會出現 但是在新增的時候出現了 org.apache.ibatis.exceptions.Persist

mysql 冷備資料庫將某個機子的mysql資料庫資料遷移到另一臺mysql資料庫

mysql冷備指的是指將mysql的配置檔案中datadir屬性所指定的相關資料資訊直接拷貝到另一個數據庫相應目錄下,就可以直接實現資料庫資料的遷移。 步驟: 一 關閉mysql服務 二開始拷貝檔案,備份。 mysql資料庫預設儲存模式是INNOB儲存模式,  主要拷

mysql資料庫建立索引mysql索引總結----mysql 索引型別以及建立mysql_建立索引優缺點

因為欣賞所以轉載: http://www.cnblogs.com/cy163/archive/2008/10/27/1320798.html http://www.cnblogs.com/lihuiyong/p/5623191.html ht

mysql資料庫建立索引

前些時候,一位頗高階的程式設計師居然問我什麼叫做索引,令我感到十分的驚奇,我想這絕不會是滄海一粟,因為有成千上萬的開發者(可能大部分是使用MySQL的)都沒有受過有關資料庫的正規培訓,儘管他們都為客戶做過一些開發,但卻對如何為資料庫建立適當的索引所知較少,因此我起了寫一篇相關文章的念頭。   最普通的情況,

mysql資料庫建立索引和使用

1. 2               需要注意: ,後續新增修改索引。。需要注意索引需要的不同資料庫引擎 alter table user add fulltext(欄

千萬級MySQL資料庫建立索引的事項及提高效能的手段

1.對查詢進行優化,應儘量避免全表掃描,首先應考慮在 where 及 order by 涉及的列上建立索引。 2.應儘量避免在 where 子句中對欄位進行 null 值判斷,否則將導致引擎放棄使用索引而進行全表掃描,如:select id from t where nu

mysql資料庫和oracle資料庫建立索引的原則

資料庫建立索引的原則  1,確定針對該表的操作是大量的查詢操作還是大量的增刪改操作。  2,嘗試建立索引來幫助特定的查詢。檢查自己的sql語句,為那些頻繁在where子句中出現的欄位建立索引。  3,嘗試建立複合索引來進一步提高系統性能。修改複合索引將消耗更長時間,同時,複合

利用solr的 DataImportHandler從mysql資料庫建立索引

步驟1: 首先修改solrconfig.xml 加往上DataImportHandler的配置 <requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler"> &

通過建立索引解決MySQL資料庫查詢慢的問題

當前有一個表是從12366的orcale資料庫裡抽取過來的,原orcale資料庫裡面有三個clob欄位,轉化到MySQL為longtext型別,資料大約有三萬條資料,但是查詢的時候卻要10來秒,實在影響效率,經過詢問,要建索引,SQL如下: ALTER TABLE tb_z

MySQL資料庫】效能優化之索引及優化(一)

一、Mysql效能優化之影響效能的因素 1.商業需求的影響 不合理的需求造成的資源投入產出,這裡就用一個看上去很簡單的功能分析。需求:一個論壇帖子的總量統計,附加要求:實時更新。從功能上看來是非常容易實現的,執行一條select count(*)from表名就可以得到結果,但是如果我們採

阿里P8架構師談:MySQL資料庫索引原理、與慢SQL優化的5大原則

MySQL憑藉著出色的效能、低廉的成本、豐富的資源,已經成為絕大多數網際網路公司的首選關係型資料庫。雖然效能出色,但所謂“好馬配好鞍”,如何能夠更好的使用它,已經成為開發工程師的必修課,我們經常會從職位描述上看到諸如“精通MySQL”、“SQL語句優化”、“瞭解資料庫原理”等要求。 我們知道一般