1. 程式人生 > >MongoDB 基礎(三)mongodb 中的索引使用

MongoDB 基礎(三)mongodb 中的索引使用

MongoDB中的索引和其他資料庫索引類似,也是使用B-Tree結構。MongoDB的索引是在collection級別上的,並且支援在任何列或者集合內的文件的子列中建立索引。

下面是官方給出的一個使用索引查詢和排序的一個結構圖。


所有的MongoDB集合預設都有一個唯一索引在欄位“_id”上,如果應用程式沒有為 “_id”列定義一個值,MongoDB將建立一個帶有ObjectId值的列。(ObjectId是基於 時間、計算機ID、程序ID、本地程序計數器 生成的)


MongoDB 同樣支援在一列或多列上建立升序或降序索引。

MongoDB還可以建立 多鍵索引、陣列索引、空間索引、text索引、雜湊索引,其屬性可以是唯一性索引、稀疏性索引、TTL(time to live

)索引。

索引的限制:

索引名稱不能超過128個字元

每個集合不能超過64個索引

複合索引不能超過31列


MongoDB 索引語法

db.collection.createIndex({ <field>: < 1 or -1 > })

db.collection.ensureIndex({ <field>: < 1 or -1 > })

db.collection.createIndex( { "filed": sort } )

db.collection.createIndex( { "filed": sort , "filed2": sort } )

db.tab.ensureIndex({"id":1})

db.tab.ensureIndex({"id":1} ,{ name:"id_ind"})

db.tab.ensureIndex({"id":1,"name":1},{background:1,unique:1})

db.tab.ensureIndex( { "id" : "hashed" })

建立索引(兩種方法)

filed :為鍵列

sort :為排序。1 為升序;-1為降序。

建立單列索引

建立索引並給定索引名稱

後臺建立唯一的複合索引

建立雜湊索引

 (更多引數 看文章底部)

db.tab.indexStats( { index: "id_ind" } )

db.runCommand( { indexStats: "tab", index: "id_ind" } )

db.tab.getIndexes()

db.system.indexes.find()

(前2個似乎不能用,官方文件解釋)

(not intended for production deployments)

檢視索引

db.tab.totalIndexSize();

檢視索引大小

db.tab.reIndex()

db.runCommand({reIndex:"tab"})

重建索引

db.tab.dropIndex(<indexname>)

db.tab.dropIndex("id_1")

db.tab.dropIndexes()

刪除索引

<indexname>為getIndexes看到的索引名稱

刪除所有索引(注意!)


索引效能測試:

檢視索引是否生效,分析查詢效能有沒有提高。先插入10萬資料到集合tab

for(var i=0;1<=100000;i++){

var value=parseInt(i*Math.random());

db.tab.insert({"id":i,"name":"kk"+i,"value":value});

}

不知道是不是虛擬機器的原因,插入了10分鐘都未完成!~

自己又開啟資料夾檢視,一直進不去資料夾。結果客戶端連線斷開了!~檢視服務竟然停了!


重啟服務,進去檢視行數:96萬!(過後再檢視吧!就用這資料測試了!)

db.tab.find().count()


分析函式

db.tab.find({"name":"kk50000"}).explain()

查詢name=”kk50000”的執行分析

db.tab.find({"name":"kk50000"}).explain("queryPlanner")

db.tab.find({"name":"kk50000"}).explain("Verbosity")

db.tab.find({"name":"kk50000"}).explain("executionStats")

db.tab.find({"name":"kk50000"}).explain("allPlansExecution")

這3種方法執行結果完全包括上面這種的結果

db.tab.find({"name":"kk50000"}).explain()  結果做分析:

"cursor" : "BasicCursor",

"isMultiKey" : false,

"n" : 1,

"nscannedObjects" : 966423,

"nscanned" : 966423,

"nscannedObjectsAllPlans" : 966423,

"nscannedAllPlans" : 966423,

"scanAndOrder" : false,

"indexOnly" : false,

"nYields" : 7555,

"nChunkSkips" : 0,

"millis" : 4677,

"server" : "kk-ad:27017",

"filterSet" : false

遊標型別。BasicCurso(掃描), BtreeCursor(索引)

是否多鍵(組合)索引

返回行數

掃描行數

掃描行數

所有計劃掃描的次數

所有計劃掃描的次數

是否在記憶體中排序

耗時(毫秒)

伺服器


現在建立索引:

db.tab.createIndex({"name":1})


db.tab.find({"name":"kk50000"}).explain() 使用索引的結果

"cursor" : "BtreeCursor name_1",

 "isMultiKey" : false,

 "n" : 1,

 "nscannedObjects" : 1,

 "nscanned" : 1,

 "nscannedObjectsAllPlans" : 1,

 "nscannedAllPlans" : 1,

 "scanAndOrder" : false,

 "indexOnly" : false,

 "nYields" : 0,

 "nChunkSkips" : 0,

 "millis" : 1,

 "indexBounds" : {

         "name" : [

                 [

                         "kk50000",

                         "kk50000"

                 ]

         ]

 },

 "server" : "kk-ad:27017",

 "filterSet" : false

遊標使用索引BtreeCursor = name_1

耗時:1毫秒


上面可以看到,沒使用索引時,耗時4677毫秒,使用索引後,1毫秒!~並且不用全文件掃描。


索引提示(hint),當前collection建立的索引:

db.tab.ensureIndex({"id":1} ,{name:"id_ind"})

db.tab.ensureIndex({"id":1,"name":1},{background:1,unique:1})

db.tab.ensureIndex( { "name" :"hashed" })


現在查詢 id=5000 的行(結果集為1行)

db.tab.find({"id": 5000}).explain()


查詢使用的是id和name的複合索引。

"nscannedObjectsAllPlans" : 2,

 "nscannedAllPlans" : 2,

現在加上索引提示,強制使用索引:

db.tab.find({"id": 5000}).hint({"id":1}).explain()


這時使用的是單個鍵列為id的索引。

"nscannedObjectsAllPlans" : 1,

"nscannedAllPlans" : 1,

上面還可以看到,索引有個邊界值“indexBounds”



當然我們也可以自己限制邊界值。

db.tab.find().min({"id":5000}).max({ "id":5005})


從上面看,實際只查詢這個邊界的內的數值。再檢視執行計劃:

db.tab.find().min({"id":5000}).max({ "id":5005}).explain()


只是5行資料。如果查詢id=5000的,但是索引邊界又有問題,這時可以限制邊界,如:

db.tab.find({"id": 5000 }).min({"id":5000}).max({ "id":5005})


在索引方法中,還有一個方法為cursor.snapshot(),它會確保查詢不會多次返回相同的文件,即使是寫操作在一個因為文件大小增長而移動的文件。但是,snapshot()不能保證插入或者刪除的隔離性。snapshot()是使用在_id鍵列上的索引,因此snapshot()不能使用sort() 或 hint()。


分快照函式析snapshot()的查詢結果:

db.tab.find({"id": 5000}).snapshot().explain()


雖然使用了索引“_id”,但是把整個集合都搜尋了!~

加索引提示看看,應該是報錯的:

db.tab.find({"id": 5000}).snapshot().hint({"id":1})


果然是出錯:snapshot 不能使用提示。


下面總結索引查詢的一些方法:

Indexing Query Modifiers

db.tab.find({"id": 5000 }).hint({"id":1})

db.tab.find({"id": 5000 })._addSpecial("$hint",{"id":1})

db.tab.find({ $query: {"id": 5000 }, $hint: { "id":1 }})

使用鍵列id的索引查詢id=5000的結果

db.tab.find({"id": 5000 }).snapshot()

db.tab.find({"id": 5000 })._addSpecial( "$snapshot", true )

db.tab.find({ $query: {"id": 5000 }, $snapshot: true })

使用快照的查詢id=5000的結果

db.tab.find({"id": 5000 }).hint({"id":1}).explain()

db.tab.find({"id": 5000})._addSpecial("$explain",1)

db.tab.find({ $query: {"id": 5000 }, $hint: { "id":1 }, $explain: 1})

檢視執行計劃資訊

索引邊界設定

db.tab.find({"id": 5000 }).max({ "id":5005})

db.tab.find({ $query:{"id": 5000 },$max:{ "id": 5005}})

db.tab.find({"id": 5000 })._addSpecial("$max",{"id": 5005})

db.tab.find({"id": 5000 }).min({ "id":5000}).max({ "id":5005}).explain()

db.tab.find({ $query:{"id": 5000 },$max:{ "id": 5005},$min:{ "id": 5000}})

db.tab.find({"id": 5000 })._addSpecial("$min",{"id": 5000})._addSpecial("$max",{"id": 5005})


Parameter

Type

Description

background

Boolean

建索引過程會阻塞其它資料庫操作,background可指定以後臺方式建立索引,即增加 "background" 可選引數。 "background" 預設值為false

unique

Boolean

建立的索引是否唯一。指定為true建立唯一索引。預設值為false.

name

string

索引的名稱。如果未指定,MongoDB的通過連線索引的欄位名和排序順序生成一個索引名稱。

dropDups

Boolean

在建立唯一索引時是否刪除重複記錄,指定 true 建立唯一索引。預設值為 false.

sparse

Boolean

對文件中不存在的欄位資料不啟用索引;這個引數需要特別注意,如果設定為true的話,在索引欄位中不會查詢出不包含對應欄位的文件.。預設值為 false.

expireAfterSeconds

integer

指定一個以秒為單位的數值,完成 TTL設定,設定集合的生存時間。

v

index version

索引的版本號。預設的索引版本取決於mongod建立索引時執行的版本。

weights

document

索引權重值,數值在 1 到 99,999 之間,表示該索引相對於其他索引欄位的得分權重。

default_language

string

對於文字索引,該引數決定了停用詞及詞幹和詞器的規則的列表。 預設為英語

language_override

string

對於文字索引,該引數指定了包含在文件中的欄位名,語言覆蓋預設的language,預設值為 language.