1. 程式人生 > 程式設計 >Python如何讀取、寫入JSON資料

Python如何讀取、寫入JSON資料

問題

你想讀寫JSON(JavaScript Object Notation)編碼格式的資料。

解決方案

json 模組提供了一種很簡單的方式來編碼和解碼JSON資料。其中兩個主要的函式是 json.dumps() 和 json.loads() ,要比其他序列化函式庫如pickle的介面少得多。下面演示如何將一個Python資料結構轉換為JSON:

import json

data = {
 'name' : 'ACME','shares' : 100,'price' : 542.23
}

json_str = json.dumps(data)

下面演示如何將一個JSON編碼的字串轉換回一個Python資料結構:

data = json.loads(json_str)

如果你要處理的是檔案而不是字串,你可以使用json.dump()和json.load()來編碼和解碼JSON資料。例如:

# Writing JSON data
with open('data.json','w') as f:
 json.dump(data,f)

# Reading data back
with open('data.json','r') as f:
 data = json.load(f)

討論

JSON編碼支援的基本資料型別為None,bool,int,float和str,以及包含這些型別資料的lists,tuples和dictionaries。對於dictionaries,keys需要是字串型別(字典中任何非字串型別的key在編碼時會先轉換為字串)。為了遵循JSON規範,你應該只編碼Python的lists和dictionaries。而且,在web應用程式中,頂層物件被編碼為一個字典是一個標準做法。

JSON編碼的格式對於Python語法而已幾乎是完全一樣的,除了一些小的差異之外。比如,True會被對映為true,False被對映為false,而None會被對映為null。下面是一個例子,演示了編碼後的字串效果:

>>> json.dumps(False)
'false'
>>> d = {'a': True,...  'b': 'Hello',...  'c': None}
>>> json.dumps(d)
'{"b": "Hello","c": null,"a": true}'
>>>

如果你試著去檢查JSON解碼後的資料,你通常很難通過簡單的列印來確定它的結構,特別是當資料的巢狀結構層次很深或者包含大量的欄位時。為了解決這個問題,可以考慮使用pprint模組的 pprint() 函式來代替普通的 print() 函式。它會按照key的字母順序並以一種更加美觀的方式輸出。下面是一個演示如何漂亮的列印輸出Twitter上搜索結果的例子:

>>> from urllib.request import urlopen
>>> import json
>>> u = urlopen('http://search.twitter.com/search.json?q=python&rpp=5')
>>> resp = json.loads(u.read().decode('utf-8'))
>>> from pprint import pprint
>>> pprint(resp)
{'completed_in': 0.074,'max_id': 264043230692245504,'max_id_str': '264043230692245504','next_page': '?page=2&max_id=264043230692245504&q=python&rpp=5','page': 1,'query': 'python','refresh_url': '?since_id=264043230692245504&q=python','results': [{'created_at': 'Thu,01 Nov 2012 16:36:26 +0000','from_user': ...
   },{'created_at': 'Thu,01 Nov 2012 16:36:14 +0000',01 Nov 2012 16:36:13 +0000',01 Nov 2012 16:36:07 +0000','from_user': ...
   }
   {'created_at': 'Thu,01 Nov 2012 16:36:04 +0000','from_user': ...
   }],'results_per_page': 5,'since_id': 0,'since_id_str': '0'}
>>>

一般來講,JSON解碼會根據提供的資料建立dicts或lists。如果你想要建立其他型別的物件,可以給 json.loads() 傳遞object_pairs_hook或object_hook引數。例如,下面是演示如何解碼JSON資料並在一個OrderedDict中保留其順序的例子:

>>> s = '{"name": "ACME","shares": 50,"price": 490.1}'
>>> from collections import OrderedDict
>>> data = json.loads(s,object_pairs_hook=OrderedDict)
>>> data
OrderedDict([('name','ACME'),('shares',50),('price',490.1)])
>>>

下面是如何將一個JSON字典轉換為一個Python物件例子:

>>> class JSONObject:
...  def __init__(self,d):
...   self.__dict__ = d
...
>>>
>>> data = json.loads(s,object_hook=JSONObject)
>>> data.name
'ACME'
>>> data.shares
50
>>> data.price
490.1
>>>

最後一個例子中,JSON解碼後的字典作為一個單個引數傳遞給 __init__() 。然後,你就可以隨心所欲的使用它了,比如作為一個例項字典來直接使用它。

在編碼JSON的時候,還有一些選項很有用。如果你想獲得漂亮的格式化字串後輸出,可以使用 json.dumps() 的indent引數。它會使得輸出和pprint()函式效果類似。比如:

>>> print(json.dumps(data))
{"price": 542.23,"name": "ACME","shares": 100}
>>> print(json.dumps(data,indent=4))
{
 "price": 542.23,"shares": 100
}
>>>

物件例項通常並不是JSON可序列化的。例如:

>>> class Point:
...  def __init__(self,x,y):
...   self.x = x
...   self.y = y
...
>>> p = Point(2,3)
>>> json.dumps(p)
Traceback (most recent call last):
 File "<stdin>",line 1,in <module>
 File "/usr/local/lib/python3.3/json/__init__.py",line 226,in dumps
  return _default_encoder.encode(obj)
 File "/usr/local/lib/python3.3/json/encoder.py",line 187,in encode
  chunks = self.iterencode(o,_one_shot=True)
 File "/usr/local/lib/python3.3/json/encoder.py",line 245,in iterencode
  return _iterencode(o,0)
 File "/usr/local/lib/python3.3/json/encoder.py",line 169,in default
  raise TypeError(repr(o) + " is not JSON serializable")
TypeError: <__main__.Point object at 0x1006f2650> is not JSON serializable
>>>

如果你想序列化物件例項,你可以提供一個函式,它的輸入是一個例項,返回一個可序列化的字典。例如:

def serialize_instance(obj):
 d = { '__classname__' : type(obj).__name__ }
 d.update(vars(obj))
 return d

如果你想反過來獲取這個例項,可以這樣做:

# Dictionary mapping names to known classes
classes = {
 'Point' : Point
}

def unserialize_object(d):
 clsname = d.pop('__classname__',None)
 if clsname:
  cls = classes[clsname]
  obj = cls.__new__(cls) # Make instance without calling __init__
  for key,value in d.items():
   setattr(obj,key,value)
   return obj
 else:
  return d

下面是如何使用這些函式的例子:

>>> p = Point(2,3)
>>> s = json.dumps(p,default=serialize_instance)
>>> s
'{"__classname__": "Point","y": 3,"x": 2}'
>>> a = json.loads(s,object_hook=unserialize_object)
>>> a
<__main__.Point object at 0x1017577d0>
>>> a.x
2
>>> a.y
3
>>>

json 模組還有很多其他選項來控制更低級別的數字、特殊值如NaN等的解析。可以參考官方文件獲取更多細節。

以上就是Python如何讀取、寫入JSON資料的詳細內容,更多關於Python讀寫json資料的資料請關注我們其它相關文章!