1. 程式人生 > >MongoDB-學習筆記-基本概念

MongoDB-學習筆記-基本概念

MongoDB  概念解析

不管我們學習什麼資料庫都應該學習其中的基礎概念,在mongodb中基本的概念是文件、集合、資料庫,下面我們挨個介紹。

下表將幫助您更容易理解Mongo中的一些概念:

SQL術語/概念 MongoDB術語/概念 解釋/說明
database database 資料庫
table collection 資料庫表/集合
row document 資料記錄行/文件
column field 資料欄位/域
index index 索引
table joins 表連線,MongoDB不支援
primary key primary key 主鍵,MongoDB自動將_id欄位設定為主鍵

通過下圖例項,我們也可以更直觀的的瞭解Mongo中的一些概念:

資料庫

一個mongodb中可以建立多個數據庫。

MongoDB的預設資料庫為"db",該資料庫儲存在data目錄中。

MongoDB的單個例項可以容納多個獨立的資料庫,每一個都有自己的集合和許可權,不同的資料庫也放置在不同的檔案中。

"show dbs" 命令可以顯示所有資料的列表。

$ ./mongo
MongoDB shell version:3.0.6
connecting to: test
> show dbs
local0.078GB
test   0.078GB>

執行 "db" 命令可以顯示當前資料庫物件或集合。

$ ./mongo
MongoDB shell version:3.0.6
connecting to: test
> db
test
>

執行"use"命令,可以連線到一個指定的資料庫。

>uselocal
switched to db local> db
local>

以上例項命令中,"local" 是你要連結的資料庫。

在下一個章節我們將詳細講解MongoDB中命令的使用。

資料庫也通過名字來標識。資料庫名可以是滿足以下條件的任意UTF-8字串。

  • 不能是空字串("")。
  • 不得含有' '(空格)、.、$、/、\和\0 (空宇符)。
  • 應全部小寫。
  • 最多64位元組。

有一些資料庫名是保留的,可以直接訪問這些有特殊作用的資料庫。

  • admin: 從許可權的角度來看,這是"root"資料庫。要是將一個使用者新增到這個資料庫,這個使用者自動繼承所有資料庫的許可權。一些特定的伺服器端命令也只能從這個資料庫執行,比如列出所有的資料庫或者關閉伺服器。
  • local: 這個資料永遠不會被複制,可以用來儲存限於本地單臺伺服器的任意集合
  • config: 當Mongo用於分片設定時,config資料庫在內部使用,用於儲存分片的相關資訊。

文件

文件是一個鍵值(key-value)對(即BSON)。MongoDB 的文件不需要設定相同的欄位,並且相同的欄位不需要相同的資料型別,這與關係型資料庫有很大的區別,也是 MongoDB 非常突出的特點。

一個簡單的文件例子如下:

{"site":"www.runoob.com","name":"菜鳥教程"}

下表列出了 RDBMS 與 MongoDB 對應的術語:

RDBMS MongoDB
資料庫 資料庫
表格 集合
文件
欄位
表聯合 嵌入文件
主鍵 主鍵 (MongoDB 提供了 key 為 _id )
資料庫服務和客戶端
Mysqld/Oracle mongod
mysql/sqlplus mongo

需要注意的是:

  1. 文件中的鍵/值對是有序的。
  2. 文件中的值不僅可以是在雙引號裡面的字串,還可以是其他幾種資料型別(甚至可以是整個嵌入的文件)。
  3. MongoDB區分型別和大小寫。
  4. MongoDB的文件不能有重複的鍵。
  5. 文件的鍵是字串。除了少數例外情況,鍵可以使用任意UTF-8字元。

文件鍵命名規範:

  • 鍵不能含有\0 (空字元)。這個字元用來表示鍵的結尾。
  • .和$有特別的意義,只有在特定環境下才能使用。
  • 以下劃線"_"開頭的鍵是保留的(不是嚴格要求的)。

集合

集合就是 MongoDB 文件組,類似於 RDBMS (關係資料庫管理系統:Relational Database Management System)中的表格。

集合存在於資料庫中,集合沒有固定的結構,這意味著你在對集合可以插入不同格式和型別的資料,但通常情況下我們插入集合的資料都會有一定的關聯性。

比如,我們可以將以下不同資料結構的文件插入到集合中:

{"site":"www.baidu.com"}{"site":"www.google.com","name":"Google"}{"site":"www.runoob.com","name":"菜鳥教程","num":5}

當第一個文件插入時,集合就會被建立。

合法的集合名

  • 集合名不能是空字串""。
  • 集合名不能含有\0字元(空字元),這個字元表示集合名的結尾。
  • 集合名不能以"system."開頭,這是為系統集合保留的字首。
  • 使用者建立的集合名字不能含有保留字元。有些驅動程式的確支援在集合名裡面包含,這是因為某些系統生成的集合中包含該字元。除非你要訪問這種系統建立的集合,否則千萬不要在名字裡出現$。 

如下例項:

db.col.findOne()

capped collections

Capped collections 就是固定大小的collection。

它有很高的效能以及佇列過期的特性(過期按照插入的順序). 有點和 "RRD" 概念類似。

Capped collections是高效能自動的維護物件的插入順序。它非常適合類似記錄日誌的功能 和標準的collection不同,你必須要顯式的建立一個capped collection, 指定一個collection的大小,單位是位元組。collection的資料儲存空間值提前分配的。

要注意的是指定的儲存大小包含了資料庫的頭資訊。
db.createCollection("mycoll",{capped:true, size:100000})
  • 在capped collection中,你能新增新的物件。
  • 能進行更新,然而,物件不會增加儲存空間。如果增加,更新就會失敗 。
  • 資料庫不允許進行刪除。使用drop()方法刪除collection所有的行。
  • 注意: 刪除之後,你必須顯式的重新建立這個collection。
  • 在32bit機器中,capped collection最大儲存為1e9( 1X109)個位元組。

元資料

資料庫的資訊是儲存在集合中。它們使用了系統的名稱空間:

dbname.system.*

在MongoDB資料庫中名字空間 <dbname>.system.* 是包含多種系統資訊的特殊集合(Collection),如下:

集合名稱空間 描述
dbname.system.namespaces 列出所有名字空間。
dbname.system.indexes 列出所有索引。
dbname.system.profile 包含資料庫概要(profile)資訊。
dbname.system.users 列出所有可訪問資料庫的使用者。
dbname.local.sources 包含複製對端(slave)的伺服器資訊和狀態。

對於修改系統集合中的物件有如下限制。

在{{system.indexes}}插入資料,可以建立索引。但除此之外該表資訊是不可變的(特殊的drop index命令將自動更新相關資訊)。 

{{system.users}}是可修改的。 {{system.profile}}是可刪除的。

MongoDB 資料型別

下表為MongoDB中常用的幾種資料型別。

資料型別 描述
String 字串。儲存資料常用的資料型別。在 MongoDB 中,UTF-8 編碼的字串才是合法的。 
Integer 整型數值。用於儲存數值。根據你所採用的伺服器,可分為 32 位或 64 位。 
Boolean 布林值。用於儲存布林值(真/假)。 
Double 雙精度浮點值。用於儲存浮點值。 
Min/Max keys 將一個值與 BSON(二進位制的 JSON)元素的最低值和最高值相對比。 
Arrays 用於將陣列或列表或多個值儲存為一個鍵。 
Timestamp 時間戳。記錄文件修改或新增的具體時間。 
Object 用於內嵌文件。 
Null 用於建立空值。 
Symbol 符號。該資料型別基本上等同於字串型別,但不同的是,它一般用於採用特殊符號型別的語言。
Date 日期時間。用 UNIX 時間格式來儲存當前日期或時間。你可以指定自己的日期時間:建立 Date 物件,傳入年月日資訊。 
Object ID 物件 ID。用於建立文件的 ID。 
Binary Data 二進位制資料。用於儲存二進位制資料。
Code 程式碼型別。用於在文件中儲存 JavaScript 程式碼。
Regular expression 正則表示式型別。用於儲存正則表示式。