1. 程式人生 > >BSON的介紹及BSON與JSON的區別

BSON的介紹及BSON與JSON的區別

概念

  參考百科說明:BSON( Binary Serialized Document Format) 是一種二進位制形式的儲存格式,採用了類似於 C 語言結構體的名稱、對錶示方法,支援內嵌的文件物件和陣列物件,具有輕量性、可遍歷性、高效性的特點,可以有效描述非結構化資料和結構化資料。

  BSON是一種類json的一種二進位制形式的儲存格式,簡稱Binary JSON,它和JSON一樣,支援內嵌的文件物件和陣列物件,但是BSON有JSON沒有的一些資料型別,如Date和BinData型別。BSON可以做為網路資料交換的一種儲存形式,這個有點類似於Google的Protocol Buffer,但是BSON是一種schema-less的儲存形式,它的優點是靈活性高,但它的缺點是空間利用率不是很理想。

  BSON有三個特點:輕量性、可遍歷性、高效性。

 

與JSON的區別

  BSON是由10gen開發的一個數據格式,目前主要用於MongoDB中,是mongodb的資料儲存格式。BSON基於JSON格式,選擇JSON進行改造的原因主要是JSON的通用性及JSON的schemaless的特性。

BSON主要會實現以下三點目標
  (1)更快的遍歷速度
  對JSON格式來說,太大的JSON結構會導致資料遍歷非常慢。在JSON中,要跳過一個文件進行資料讀取,需要對此文件進行掃描才行,需要進行麻煩的資料結構匹配,比如括號的匹配,而BSON對JSON的一大改進就是,它會將JSON的每一個元素的長度存在元素的頭部,這樣你只需要讀取到元素長度就能直接seek到指定的點上進行讀取了。

  (2)操作更簡易
  對JSON來說,資料儲存是無型別的,比如你要修改基本一個值,從9到10,由於從一個字元變成了兩個,所以可能其後面的所有內容都需要往後移一位才可以。而使用BSON,你可以指定這個列為數字列,那麼無論數字從9長到10還是100,我們都只是在儲存數字的那一位上進行修改,不會導致資料總長變大。當然,在MongoDB中,如果數字從整形增大到長整型,還是會導致資料總長變大的。
  (3)增加了額外的資料型別
  JSON是一個很方便的資料交換格式,但是其型別比較有限。BSON在其基礎上增加了“byte array”資料型別。這使得二進位制的儲存不再需要先base64轉換後再存成JSON。大大減少了計算開銷和資料大小
但是,在有的時候,BSON相對JSON來說也並沒有空間上的優勢,比如對{“field”:7},在JSON的儲存上7只使用了一個位元組,而如果用BSON,那就是至少4個位元組(32位)
  目前在10gen的努力下,BSON已經有了針對多種語言的編碼解碼包。並且都是Apache 2 license下開源的。並且還在隨著MongoDB進一步地發展。