1. 程式人生 > 資料庫 >MongoDB中唯一索引(Unique)的那些事

MongoDB中唯一索引(Unique)的那些事

寫在前面

MongoDB支援的索引種類很多,諸如單鍵索引,複合索引,多鍵索引,TTL索引,文字索引,空間地理索引等。同時索引的屬性可以具有唯一性,即唯一索引。唯一索引用於確保索引欄位不儲存重複的值,即強制索引欄位的唯一性。預設情況下,MongoDB的_id欄位在建立集合的時候會自動建立一個唯一索引。本文主要描述唯一索引的用法。

關於什麼是索引以及唯一索引這裡就不做說明了,不清楚的可以自行谷歌或者百度。是什麼引起我寫這篇文章呢,這來自於之前專案中的一個問題。

我們用的是MongoDB資料儲存使用者資訊,使用者表中曾經使用者註冊是通過手機號註冊的,所以很理所當然的給手機號加上了唯一索引(Unique),這是沒有什麼毛病。後期,我們需求改了。你也可以想到變成了既可以手機號註冊又可以郵箱註冊,這個時候由於手機號加了Unique索引,事實上這時候是會出現問題的。

func init() {
 phoneIndex := mgo.Index{
 Key: []string{"phone"},Unique: true,}

 col := db.Collection(&User{})
 col.EnsureIndex(phoneIndex)
}

當然這問題其實也容易想到,當用戶通過郵箱註冊此時手機號填空的時候,第一次沒什麼問題,下個使用者再以這種方式註冊的時候便會提示建立在phone上的索引值重複,很正常嘛,因為插入了兩個空值,注意這裡是空字串,而不是null。

於是我們嘗試修改,由於MongoDB是文件型靈活的資料庫,少插多插一兩個欄位不受影響,所以我們嘗試修改User實體Phone欄位的入口,當phone是空字串的時候,不讓插入此欄位。於是,我們便在phone欄位中加入了omitempty標籤(我們微服務用Go語言寫的)。下面展示User一部分內容:

type User struct {
 Email  string `bson:"email"`
 Salt  string `bson:"salt"`
 Phone  string `bson:"phone,omitempty"`
 IDCard string `bson:"idcard"`
 RealName string `bson:"realname"`
 AuthStatus int `bson:"auth_status"`
}

可以看到phone欄位後加了omitempty標籤,表示當該欄位為空的時候不插入。這還是會出現問題,那麼既然還是會出問題為什麼會想到這麼解決呢?這源於對Mysql的使用經驗,習慣性的以為MongoDB和Mysql那樣,對null的值會不做其索引。也就是說,在Mysql中,若在多條記錄中Phone值為Null是被允許的。

上面那種做法,還是會報錯,提示插入了重複的值,只不過這時不是空字串,而是null。所以有時候就不要把Mysql那套拿來了,Mysql是可以的,但Mongo不行。mongo還是會對該條記錄索引,即使該欄位為被插入。

我喜歡看官方文件,下面給出MongoDB官方文件說明:

If a document does not have a value for the indexed field in a unique
index,the index will store a null value for this document. Because of
the unique constraint,MongoDB will only permit one document that
lacks the indexed field. If there is more than one document without a
value for the indexed field or is missing the indexed field,the index
build will fail with a duplicate key error.

其實已經說得很清楚了,稍微會點英語應該都能看懂,下面還是給出翻譯版:

如果文件沒有唯一索引中索引欄位的值,則索引將為此文件儲存null值。由於唯一約束,MongoDB只允許一個缺少索引欄位的文件。如果有多個文件沒有索引欄位的值或缺少索引欄位,則索引構建將失敗並出現重複鍵錯誤。

也就是說這個欄位哪怕在文件中沒有,那麼該欄位將會存null值,該欄位上也不能同時出現兩個null值,這就是為什麼上面那種做法還是行不通的原因,其實上面那種做法也打破了資料結構,雖然手機號未填,但資料庫中也不應該缺少這個欄位,儘管是非關係資料庫,畢竟還得考慮下業務設計。

解決方式

是不是就沒有解決方式了呢?當然有,Mongo提供了Sparse Index,被翻譯為稀疏索引。下面是建立稀疏索引的例子:

db.getCollection("test").createIndex( { "phone": 1 },{ sparse: true })

執行上面的語句後,不會去索引不存在phone欄位的文件。也就是說存在才對其索引,那麼此時和Unique索引結合起來就可以派上用場了。Unqiue是唯一,Sparse是存在才索引。所以,當phone或email為空的時候我們可以不將其插入這是可以實現的。

db.getCollection("test").createIndex( { "phone": 1 },{ sparse: true,unique: true } )

上面是是mongo shell語法,通常我們一般通過程式碼中建立索引,修改如下(當然User結構體中Phone欄位omitempty標籤還是要有的):

func init() {
 phoneIndex := mgo.Index{
 Key: []string{"phone"},Sparse: true,}

 col := db.Collection(&User{})
 col.EnsureIndex(phoneIndex)
}

但是這又正如我們前面說的那樣,打破了資料原有的資料結構。哎,有得有得。當然我們還可以從業務層面去解決,比如註冊時對其查詢等操作,當然會耗一定效能,不管你是那空間換時間,還是拿時間換空間總得付出一個,別做一個太貪心的人。

總結

以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,如果有疑問大家可以留言交流,謝謝大家對我們的支援。