1. 程式人生 > 實用技巧 >Python爬蟲乾貨:資料分析小能手:JSON庫的用法

Python爬蟲乾貨:資料分析小能手:JSON庫的用法

本章節我們將為大家介紹如何使用 Python 語言來編碼和解碼 JSON 物件。

JSON(JavaScript Object Notation) 是一種輕量級的資料交換格式,易於人閱讀和編寫。

JSON 函式

使用 JSON 函式需要匯入 json 庫:import json

函式描述:json.dumps將 Python 物件編碼成 JSON 字串json.loads將已編碼的 JSON 字串解碼為 Python 物件

語法:

json.dumps(obj, skipkeys=False, ensure_ascii=True, check_circular=True, allow_nan=True, cls=None, indent=None, separators=None, encoding="
utf-8", default=None, sort_keys=False, **kw)

例如:將python陣列物件轉為JSON字串

#!/usr/bin/python
import json

data = [ { 'name' : '張三', 'age' : 25}, { 'name' : '李四', 'age' : 26} ]

jsonStr = json.dumps(data)
print(jsonStr)

結果:

[{"name": "\u5f20\u4e09", "age": 25}, {"name": "\u674e\u56db", "age": 26}]

例如:讓JSON資料格式化輸出:

#!/usr/bin/python
import json

data = [ { 'name' : '張三', 'age' : 25}, { 'name' : '李四', 'age' : 26} ]

jsonStr = json.dumps(data, sort_keys=True, indent=4, separators=(',', ': '))
print(jsonStr)

結果:

[
  {
    "age": 25,
    "name": "\u5f20\u4e09"
  },
  {
    "age": 26,
    "name": "\u674e\u56db"
  }
]

上面的格式化將漢字轉為unicode,在將JSON字串轉為python物件的時候是可以轉為漢字的,如果不想轉為unicode,可以用下面方法:

#!/usr/bin/python
import json

data = [ { 'name' : '張三', 'age' : 25}, { 'name' : '李四', 'age' : 26} ]

jsonStr = json.dumps(data, ensure_ascii=False)
print(type(jsonStr))
print(jsonStr)

結果:

<class 'str'>
[{"name": "張三", "age": 25}, {"name": "李四", "age": 26}]

  

python 原始型別向 json 型別的轉化對照表:

json.loads  解碼 JSON 資料。該函式返回 Python 欄位的資料型別。

語法:

json.loads(s[, encoding[, cls[, object_hook[, parse_float[, parse_int[, parse_constant[, object_pairs_hook[, **kw]]]]]]]])

例如:JSON字串轉py物件

#!/usr/bin/python
import json

data = [ { 'name' : '張三', 'age' : 25}, { 'name' : '李四', 'age' : 26} ]

jsonStr = json.dumps(data)
print(jsonStr)

jsonObj = json.loads(jsonStr)
print(jsonObj)
# 獲取集合第一個
print(jsonObj[1])

結果

[{"name": "\u5f20\u4e09", "age": 25}, {"name": "\u674e\u56db", "age": 26}]
[{'name': '張三', 'age': 25}, {'name': '李四', 'age': 26}]
{'name': '李四', 'age': 26}

json 型別轉換到 python 的型別對照表:

Demjson第三方庫的使用

Demjson 是 python 的第三方模組庫,可用於編碼和解碼 JSON 資料,包含了 JSONLint 的格式化及校驗功能。

(1)encode() 函式用於將 Python 物件編碼成 JSON 字串。

語法

demjson.encode(self, obj, nest_level=0)

  

例如:

#!/usr/bin/python
import demjson

data = [ { 'a' : 1, 'b' : 2, 'c' : 3, 'd' : 4, 'e' : 5 } ]

json = demjson.encode(data)
print(json)

  

結果:

[{"a":1,"b":2,"c":3,"d":4,"e":5}]

  

(2)demjson.decode() 函式解碼 JSON 資料。該函式返回 Python 欄位的資料型別。

語法:

demjson.decode(self, txt)

  

例如:將json字串轉為JSON物件:

#!/usr/bin/python
import demjson

jsonData = '{"name":"張三","age":20,"sex":"男"}';

obj = demjson.decode(jsonData)
print(obj)
print(type(obj))

  

結果:

{'name': '張三', 'age': 20, 'sex': '男'}
<class 'dict'>