JSON的使用場景及注意事項介紹
上篇我們講解了JSON的誕生原因是因為XML整合到HTML中各個瀏覽器實現的細節不盡相同,所以道格拉斯·克羅克福特(Douglas Crockford) 和 奇普·莫寧斯達(Chip Morningstar)一起從JS的資料型別中提取了一個子集,作為新的資料交換格式,因為主流的瀏覽器使用了通用的JavaScript引擎元件,所以在解析這種新資料格式時就不存在相容性問題,於是他們將這種資料格式命名為 “JavaScript Object Notation”,縮寫為 JSON,由此JSON便誕生了!
今天我們來學習一下JSON的結構形式、資料型別、使用場景以及注意事項吧!
一、JSON格式
上面我們知道JSON是從JavaScript的資料型別中提取出來的子集,那JSON有幾種結構形式呢?又有哪些資料型別呢?他們又分別對應著JavaScript中的哪些資料型別呢?
1.JSON的2種結構形式
1、鍵值對形式
上期我們舉了一個JSON的例項,就是鍵值對形式的,如下:
{
"person": {
"name": "pig",
"age": "18",
"sex": "man",
"hometown": {
"province": "江西省",
"city": "撫州市",
"county": "崇仁縣"
}
}
}
這種結構的JSON資料規則是:一個無序的“‘名稱/值’對”集合。一個物件以 {左括號 開始, }右括號 結束。每個“名稱”後跟一個 :冒號 ;“‘名稱/值’ 對”之間使用 ,逗號 分隔,。
2、陣列形式
因為大多數時候大家用的JSON可能都是上面那種key-value形式,所以很多人在講解JSON的時候總是會忽略陣列形式,這一點是需要注意的。
那JSON的陣列形式是怎麼樣的呢?豬哥也舉一個例項吧!
["pig", 18, "man", "江西省撫州市崇仁縣"]
陣列形式的JSON資料就是值(value)的有序集合。一個數組以 [左中括號 開始, ]右中括號 結束。值之間使用 ,逗號 分隔。
2.JOSN的6種資料型別
上面兩種JSON形式內部都是包含value的,那JSON的value到底有哪些型別,而且上期我們說JSON其實就是從Js資料格式中提取了一個子集,那具體有哪幾種資料型別呢?
- string:字串,必須要用雙引號引起來。
- number:數值,與JavaScript的number一致,整數(不使用小數點或指數計數法)最多為 15 位。小數的最大位數是 17。
- object:JavaScript的物件形式,{ key:value }表示方式,可巢狀。
- array:陣列,JavaScript的Array表示方式[ value ],可巢狀。
- true/false:布林型別,JavaScript的boolean型別。
- null:空值,JavaScript的null。
以上資料形式圖片來源JSON官方文件:http://www.json.org/json-zh.html
二、JSON使用場景
介紹完JSON的資料格式,那我們來看看JSON在企業中使用的比較多的場景。
1.介面返回資料
JSON用的最多的地方莫過於Web了,現在的資料介面基本上都是返回的JSON,具體細化的場景有:
- Ajxa非同步訪問資料
- RPC遠端呼叫
- 前後端分離後端返回的資料
- 開放API,如百度、高德等一些開放介面
- 企業間合作介面
這種API介面一般都會提供一個介面文件,說明介面的入參、出參等,
一般的介面返回資料都會封裝成JSON格式,比如類似下面這種
{
"code": 1,
"msg": "success",
"data": {
"name": "pig",
"age": "18",
"sex": "man",
"hometown": {
"province": "江西省",
"city": "撫州市",
"county": "崇仁縣"
}
}
}
2.序列化
程式在執行時所有的變數都是儲存在記憶體當中的,如果出現程式重啟或者機器宕機的情況,那這些資料就丟失了。一般情況執行時變數並不是那麼重要丟了就丟了,但有些記憶體中的資料是需要儲存起來供下次程式或者其他程式使用。
儲存記憶體中的資料要麼儲存在資料庫,要麼儲存直接到檔案中,而將記憶體中的資料變成可儲存或可傳輸的資料的過程叫做序列化,在Python中叫pickling,在其他語言中也被稱之為serialization,marshalling,flattening等等,都是一個意思。
正常的序列化是將程式語言中的物件直接轉成可儲存或可傳輸的,這樣會儲存物件的型別資訊,而JSON序列化則不會保留物件型別!
為了讓大家更直觀的感受區別,豬哥用程式碼做一個測試,大家一目瞭然
- Python物件直接序列化會儲存class資訊,下次使用loads載入到記憶體時直接變成Python物件。
- JSON物件序列化只儲存屬性資料,不保留class資訊,下次使用loads載入到記憶體可以直接轉成dict物件,當然也可以轉為Person物件,但是需要寫輔助方法。
對於JSON序列化不能儲存class資訊的特點,那JSON序列化還有什麼用?答案是當然遊有用,對於不同程式語言序列化讀取有用,比如:我用Python爬取資料然後轉成物件,現在我需要將它序列化磁碟,然後使用Java語言讀取這份資料,這個時候由於跨語言資料型別不同,所以就需要用到JSON序列化。
存在即合理,兩種序列化可根據需求自行選擇!
3.生成Token
首先宣告Token的形式多種多樣,有JSON、字串、數字等等,只要能滿足需求即可,沒有規定用哪種形式。
JSON格式的Token最有代表性的莫過於JWT(JSON Web Tokens)。
隨著技術的發展,分散式web應用的普及,通過Session管理使用者登入狀態成本越來越高,因此慢慢發展成為Token的方式做登入身份校驗,然後通過Token去取Redis中的快取的使用者資訊,隨著之後JWT的出現,校驗方式更加簡單便捷化,無需通過Redis快取,而是直接根據Token取出儲存的使用者資訊,以及對Token可用性校驗,單點登入更為簡單。
豬哥也曾經使用JWT做過app的登入系統,大概的流程就是:
- 使用者輸入使用者名稱密碼
- app請求登入中心驗證使用者名稱密碼
- 如果驗證通過則生成一個Token,其中Token中包含:使用者的uid、Token過期時間、過期延期時間等,然後返回給app
- app獲得Token,儲存在cookie中,下次請求其他服務則帶上
- 其他服務獲取到Token之後呼叫登入中心介面驗證
- 驗證通過則響應
JWT登入認證有哪些優勢:
- 效能好:伺服器不需要儲存大量的session
- 單點登入(登入一個應用,同一個企業的其他應用都可以訪問):使用JWT做一個登入中心基本搞定,很容易實現。
- 相容性好:支援移動裝置,支援跨程式呼叫,Cookie 是不允許垮域訪問的,而 Token 則不存在這個問題。
- 安全性好:因為有簽名,所以JWT可以防止被篡改。
更多JWT相關知識自行在網上學習,本文不過多介紹!
4.配置檔案
說實話JSON作為配置檔案使用場景並不多,最具代表性的就是npm的package.json包管理配置檔案了,下面就是一個npm的package.json配置檔案內容。
{
"name": "server", //專案名稱
"version": "0.0.0",
"private": true,
"main": "server.js", //專案入口地址,即執行npm後會執行的專案
"scripts": {
"start": "node ./bin/www" ///scripts指定了執行指令碼命令的npm命令列縮寫
},
"dependencies": {
"cookie-parser": "~1.4.3", //指定專案開發所需的模組
"debug": "~2.6.9",
"express": "~4.16.0",
"http-errors": "~1.6.2",
"jade": "~1.11.0",
"morgan": "~1.9.0"
}
}
但其實JSON並不合適做配置檔案,因為它不能寫註釋、作為配置檔案的可讀性差等原因。
配置檔案的格式有很多種如:toml、yaml、xml、ini等,目前很多地方開始使用yaml作為配置檔案。
三、JSON在Python中的使用
最後我們來看看Python中操作JSON的方法有哪些,在Python中操作JSON時需要引入json
標準庫。
import json
1.型別轉換
1、Python型別轉JSON:json.dump()
# 1、Python的dict型別轉JSON
person_dict = {'name': 'pig', 'age': 18, 'sex': 'man', 'hometown': '江西撫州'}
# indent引數為縮排空格數
person_dict_json = json.dumps(person_dict, indent=4)
print(person_dict_json, '\n')
# 2、Python的列表型別轉JSON
person_list = ['pig', 18, 'man', '江西撫州']
person_list_json = json.dumps(person_list)
print(person_list_json, '\n')
# 3、Python的物件型別轉JSON
person_obj = Person('pig', 18, 'man', '江西撫州')
# 中間的匿名函式是獲得物件所有屬性的字典形式
person_obj_json = json.dumps(person_obj, default=lambda obj: obj.__dict__, indent=4)
print(person_obj_json, '\n')
執行結果:
2、JSON轉Python型別:json.loads()
# 4、JSON轉Python的dict型別
person_json = '{ "name": "pig","age": 18, "sex": "man", "hometown": "江西撫州"}'
person_json_dict = json.loads(person_json)
print(type(person_json_dict), '\n')
# 5、JSON轉Python的列表型別
person_json2 = '["pig", 18, "man", "江西撫州"]'
person_json_list = json.loads(person_json2)
print(type(person_json_list), '\n')
# 6、JSON轉Python的自定義物件型別
person_json = '{ "name": "pig","age": 18, "sex": "man", "hometown": "江西撫州"}'
# object_hook引數是將dict物件轉成自定義物件
person_json_obj = json.loads(person_json, object_hook=lambda d: Person(d['name'], d['age'], d['sex'], d['hometown']))
print(type(person_json_obj), '\n')
執行結果如下:
2.對應的資料型別
上面我們演示了Python型別與JSON的相互轉換,最開始的時候我們講過JSON有6種資料型別,那這6種資料型別分別對應Python中的哪些資料型別呢?
3.需要注意的點
- JSON的鍵名和字串都必須使用雙引號引起來,而Python中單引號也可以表示為字串,所以這是個比較容易犯的錯誤!
- Python型別與JSON相互轉換的時候到底是用
load/dump
還是用loads\dumps
?他們之間有什麼區別?什麼時候該加s
什麼時候不該加s
?這個我們可以通過檢視原始碼找到答案:不加s
的方法入參多了一個fp
表示filepath,最後多了一個寫入檔案的操作。所以我們在記憶的時候可以這樣記憶:加s
表示轉成字串(str),不加s
表示轉成檔案。 - Python自定義物件與JSON相互轉換的時候需要輔助方法來指明屬性與鍵名的對應關係,如果不指定一個方法則會丟擲異常!
- 相信有些看的仔細的同學會好奇上面豬哥使用json.dumps方法將Python型別轉JSON的時候,如果出現中文,則會出現:\u6c5f\u897f\u629a\u5dde這種東西,這是為什麼呢?原因是:Python 3中的json在做dumps操作時,會將中文轉換成unicode編碼,並以16進位制方式儲存,而並不是UTF-8格式!
四、總結
今天我們學習了JSON的2種形式,切記JSON還有[...]
這種形式的。
學習了JSON的6種資料型別他們分別對於Python中的哪些型別。
瞭解了JSON的一些使用場景以及實際的例子。
還學習了在Python中如何使用JSON以及需要注意的事項。
結合上期的JSON的誕生與發展介紹,我們JSON相關的知識基本就介紹的差不多,後面會出一些爬蟲實際案例來教大家如何解析返回JSON資料。
一個JSON知識點卻分兩篇長文(近萬字)來講,其重要性不言而喻。因為不管你是做爬蟲、還是做資料分析、web、甚至前端、測試、運維,JSON都是你必須要掌握的一個知識點