MongoDB 學習筆記(1)
資料庫
一個mongodb中可以建立多個數據庫。
MongoDB的預設資料庫為"db",該資料庫儲存在data目錄中。
MongoDB的單個例項可以容納多個獨立的資料庫,每一個都有自己的集合和許可權,不同的資料庫也放置在不同的檔案中。
"show dbs" 命令可以顯示所有資料的列表。
$ ./mongo MongoDB shell version: 3.0.6 connecting to: test > show dbs local 0.078GB test 0.078GB >
執行 "db" 命令可以顯示當前資料庫物件或集合。
$ ./mongo MongoDB shell version: 3.0.6 connecting to: test > db test >
執行"use"命令,可以連線到一個指定的資料庫。
> use local switched to db local > db local >
以上例項命令中,"local" 是你要連結的資料庫。
資料庫也通過名字來標識。資料庫名可以是滿足以下條件的任意UTF-8字串。
- 不能是空字串("")。
- 不得含有' '(空格)、.、$、/、\和\0 (空字元)。
- 應全部小寫。
- 最多64位元組。
有一些資料庫名是保留的,可以直接訪問這些有特殊作用的資料庫。
- admin: 從許可權的角度來看,這是"root"資料庫。要是將一個使用者新增到這個資料庫,這個使用者自動繼承所有資料庫的許可權。一些特定的伺服器端命令也只能從這個資料庫執行,比如列出所有的資料庫或者關閉伺服器。
- local: 這個資料永遠不會被複制,可以用來儲存限於本地單臺伺服器的任意集合
- config: 當Mongo用於分片設定時,config資料庫在內部使用,用於儲存分片的相關資訊。
文件
文件是一組鍵值(key-value)對(即BSON)。MongoDB 的文件不需要設定相同的欄位,並且相同的欄位不需要相同的資料型別,這與關係型資料庫有很大的區別,也是 MongoDB 非常突出的特點。
一個簡單的文件例子如下:
{"site":"www.runoob.com", "name":"菜鳥教程"}
下表列出了 RDBMS 與 MongoDB 對應的術語:
RDBMS | MongoDB |
---|---|
資料庫 | 資料庫 |
表格 | 集合 |
行 | 文件 |
列 | 欄位 |
表聯合 | 嵌入文件 |
主鍵 | 主鍵 (MongoDB 提供了 key 為 _id ) |
資料庫服務和客戶端 | |
Mysqld/Oracle | mongod |
mysql/sqlplus | mongo |
需要注意的是:
- 文件中的鍵/值對是有序的。
- 文件中的值不僅可以是在雙引號裡面的字串,還可以是其他幾種資料型別(甚至可以是整個嵌入的文件)。
- MongoDB區分型別和大小寫。
- MongoDB的文件不能有重複的鍵。
- 文件的鍵是字串。除了少數例外情況,鍵可以使用任意UTF-8字元。
文件鍵命名規範:
- 鍵不能含有\0 (空字元)。這個字元用來表示鍵的結尾。
- .和$有特別的意義,只有在特定環境下才能使用。
- 以下劃線"_"開頭的鍵是保留的(不是嚴格要求的)。
集合
集合就是 MongoDB 文件組,類似於 RDBMS (關係資料庫管理系統:Relational Database Management System)中的表格。
集合存在於資料庫中,集合沒有固定的結構,這意味著你在對集合可以插入不同格式和型別的資料,但通常情況下我們插入集合的資料都會有一定的關聯性。
比如,我們可以將以下不同資料結構的文件插入到集合中:
{"site":"www.baidu.com"} {"site":"www.google.com","name":"Google"} {"site":"www.runoob.com","name":"菜鳥教程","num":5}
當第一個文件插入時,集合就會被建立。
合法的集合名
- 集合名不能是空字串""。
- 集合名不能含有\0字元(空字元),這個字元表示集合名的結尾。
- 集合名不能以"system."開頭,這是為系統集合保留的字首。
- 使用者建立的集合名字不能含有保留字元。有些驅動程式的確支援在集合名裡面包含,這是因為某些系統生成的集合中包含該字元。除非你要訪問這種系統建立的集合,否則千萬不要在名字裡出現$。
如下例項:
db.col.findOne()
capped collections
Capped collections 就是固定大小的collection。
它有很高的效能以及佇列過期的特性(過期按照插入的順序). 有點和 "RRD" 概念類似。
Capped collections 是高效能自動的維護物件的插入順序。它非常適合類似記錄日誌的功能和標準的 collection 不同,你必須要顯式的建立一個capped collection,指定一個 collection 的大小,單位是位元組。collection 的資料儲存空間值提前分配的。
Capped collections 可以按照文件的插入順序儲存到集合中,而且這些文件在磁碟上存放位置也是按照插入順序來儲存的,所以當我們更新Capped collections 中文件的時候,更新後的文件不可以超過之前文件的大小,這樣話就可以確保所有文件在磁碟上的位置一直保持不變。
由於 Capped collection 是按照文件的插入順序而不是使用索引確定插入位置,這樣的話可以提高增添資料的效率。MongoDB 的操作日誌檔案 oplog.rs 就是利用 Capped Collection 來實現的。
要注意的是指定的儲存大小包含了資料庫的頭資訊。
db.createCollection("mycoll", {capped:true, size:100000})
- 在 capped collection 中,你能新增新的物件。
- 能進行更新,然而,物件不會增加儲存空間。如果增加,更新就會失敗 。
- 使用 Capped Collection 不能刪除一個文件,可以使用 drop() 方法刪除 collection 所有的行。
- 刪除之後,你必須顯式的重新建立這個 collection。
- 在32位機器上,一個Capped集合的最大值約為482.5M, 64位只受系統檔案大小的限制,建立的時候,可以預指定大小。
db.log.drop() true db.createCollection("log", { capped : true, size : 1000, max : 5 } ) { "ok" : 1 }
固定集合屬性及用法
屬性
- 屬性1:對固定集合進行插入速度極快
-
屬性2:按照插入順序的查詢輸出速度極快
-
屬性3:能夠在插入最新資料時,淘汰最早的資料
用法
-
用法1:儲存日誌資訊
-
用法2:快取一些少量的文件
Capped集合建立語法
db.createCollection("集合名稱", { capped : true, size : num, max : num } ) db.createCollection("log", { capped : true, size : 1000, max : 5 } )
-
1, size用來指定集合大小,單位KB。
-
2, 限制集合中物件的個數:可以在建立時設定max引數。
-
3, 指定mac數量的時候必須同時指定size容量。淘汰機制只有在容量還沒有滿時才會依據文件數量工作。
要是容量滿了,淘汰機制會依據容量來工作。
檢視一個集合是不是Capped集合
db.collection.isCapped()
db.log.isCapped() true //false 不是Capped集合
檢視Capped集合狀態
db.log.stats() { "ns" : "leyue.log", "count" : 4, "size" : 140, "avgObjSize" : 35, "storageSize" : 36864, "capped" : true, "max" : 5, "maxSize" : 1024, "sleepCount" : 0, "sleepMS" : 0, .... }
-
1, max: Capped集合最多可以有多少條資料
-
2, maxSize:Capped集合最多可以有多少位元組
把一個集合轉換成Capped集合,反之不行
db.runCommand({"convertToCapped": "要轉換的集合", size: 100000}); db.runCommand({"convertToCapped": "mycoll", size: 100000});
元資料
資料庫的資訊是儲存在集合中。它們使用了系統的名稱空間:
dbname.system.*
在MongoDB資料庫中名字空間 <dbname>.system.* 是包含多種系統資訊的特殊集合(Collection),如下:
集合名稱空間 | 描述 |
---|---|
dbname.system.namespaces | 列出所有名字空間。 |
dbname.system.indexes | 列出所有索引。 |
dbname.system.profile | 包含資料庫概要(profile)資訊。 |
dbname.system.users | 列出所有可訪問資料庫的使用者。 |
dbname.local.sources | 包含複製對端(slave)的伺服器資訊和狀態。 |
對於修改系統集合中的物件有如下限制。
在{{system.indexes}}插入資料,可以建立索引。但除此之外該表資訊是不可變的(特殊的drop index命令將自動更新相關資訊)。
{{system.users}}是可修改的。 {{system.profile}}是可刪除的。
MongoDB 資料型別
下表為MongoDB中常用的幾種資料型別。
資料型別 | 描述 |
---|---|
String | 字串。儲存資料常用的資料型別。在 MongoDB 中,UTF-8 編碼的字串才是合法的。 |
Integer | 整型數值。用於儲存數值。根據你所採用的伺服器,可分為 32 位或 64 位。 |
Boolean | 布林值。用於儲存布林值(真/假)。 |
Double | 雙精度浮點值。用於儲存浮點值。 |
Min/Max keys | 將一個值與 BSON(二進位制的 JSON)元素的最低值和最高值相對比。 |
Array | 用於將陣列或列表或多個值儲存為一個鍵。 |
Timestamp | 時間戳。記錄文件修改或新增的具體時間。 |
Object | 用於內嵌文件。 |
Null | 用於建立空值。 |
Symbol | 符號。該資料型別基本上等同於字串型別,但不同的是,它一般用於採用特殊符號型別的語言。 |
Date | 日期時間。用 UNIX 時間格式來儲存當前日期或時間。你可以指定自己的日期時間:建立 Date 物件,傳入年月日資訊。 |
Object ID | 物件 ID。用於建立文件的 ID。 |
Binary Data | 二進位制資料。用於儲存二進位制資料。 |
Code | 程式碼型別。用於在文件中儲存 JavaScript 程式碼。 |
Regular expression | 正則表示式型別。用於儲存正則表示式。 |
下面說明下幾種重要的資料型別。
ObjectId
ObjectId 類似唯一主鍵,可以很快的去生成和排序,包含 12 bytes,含義是:
- 前 4 個位元組表示建立 unix 時間戳,格林尼治時間 UTC 時間,比北京時間晚了 8 個小時
- 接下來的 3 個位元組是機器標識碼
- 緊接的兩個位元組由程序 id 組成 PID
- 最後三個位元組是隨機數
MongoDB 中儲存的文件必須有一個 _id 鍵。這個鍵的值可以是任何型別的,預設是個 ObjectId 物件
由於 ObjectId 中儲存了建立的時間戳,所以你不需要為你的文件儲存時間戳欄位,你可以通過 getTimestamp 函式來獲取文件的建立時間:
> var newObject = ObjectId() > newObject.getTimestamp() ISODate("2017-11-25T07:21:10Z")
ObjectId 轉為字串
> newObject.str
5a1919e63df83ce79df8b38f
字串
BSON 字串都是 UTF-8 編碼。
時間戳
BSON 有一個特殊的時間戳型別用於 MongoDB 內部使用,與普通的 日期 型別不相關。 時間戳值是一個 64 位的值。其中:
- 前32位是一個 time_t 值(與Unix新紀元相差的秒數)
- 後32位是在某秒中操作的一個遞增的
序數
在單個 mongod 例項中,時間戳值通常是唯一的。
在複製集中, oplog 有一個 ts 欄位。這個欄位中的值使用BSON時間戳表示了操作時間。
BSON 時間戳型別主要用於 MongoDB 內部使用。在大多數情況下的應用開發中,你可以使用 BSON 日期型別。
日期
表示當前距離 Unix新紀元(1970年1月1日)的毫秒數。日期型別是有符號的, 負數表示 1970 年之前的日期。
> var mydate1 = new Date() //格林尼治時間 > mydate1 ISODate("2018-03-04T14:58:51.233Z") > typeof mydate1 object
> var mydate2 = ISODate() //格林尼治時間 > mydate2 ISODate("2018-03-04T15:00:45.479Z") > typeof mydate2 object
這樣建立的時間是日期型別,可以使用 JS 中的 Date 型別的方法。
返回一個時間型別的字串:
> var mydate1str = mydate1.toString() > mydate1str Sun Mar 04 2018 14:58:51 GMT+0000 (UTC) > typeof mydate1str string
或者
> Date()
Sun Mar 04 2018 15:02:59 GMT+0000 (UTC)