Python中yaml資料格式的使用
最近在看程式碼時發現有人用Yaml —— Yet Another Markup Language :另一種標記語言。程式設計免不了要寫配置檔案,怎麼寫配置也是一門學問。YAML 是專門用來寫配置檔案的語言,非常簡潔和強大,遠比 JSON 格式方便。
YAML在python語言中有PyYAML安裝包。YAML 語言(發音 /ˈjæməl/ )的設計目標,就是方便人類讀寫。它實質上是一種通用的資料序列化格式。yaml是一種比xml和json更輕的檔案格式,也更簡單更強大,它可以通過縮排來表示結構,聽著就和Python很配對不對?
PyYaml
PyYaml是Python的一個專門針對yaml檔案操作的模組,使用起來非常簡單
- 安裝
pip install pyyaml
。或者到下載相應版本的包,人工安裝。 - 使用:使用起來非常簡單,就像json、pickle一樣,load、dump就足夠我們使用了。
- load()
結果:import yaml yaml_str = """ name: 灰藍 age: 0 job: Tester """ y = yaml.load(yaml_str) print y
{'job': 'Tester', 'age': 0, 'name': u'\u7070\u84dd'}
- dump()
輸出結果:import yaml python_obj =
上面只是簡單的兩個應用,還有 load_all()、dump_all() 等,我們一般用這四個足夠了,另外兩個下面會講到,其他方法可以自己看API。age: 0 job: Tester name: "\u7070\u84DD"
yaml語法
https://www.ibm.com/developerworks/cn/xml/x-cn-yamlintro/
有了上面的基礎,接下來我們看看yaml的語法,首先我們準備下測試語法的環境:
-
建立 test.yaml 檔案,我們練習語法就在這裡
-
建立 testyaml.py 檔案,用來檢視Python執行後的效果,其中內容如下:
# -*- coding: utf-8 -*-
import yaml
y = yaml.load(file('test.yaml', 'r'))
print y
1. 基本規則
- 大小寫敏感
- 使用縮排表示層級關係
- 縮排時不允許使用Tab,只允許使用空格
- 縮排的空格數目不重要,只要相同層級的元素左對齊即可
- # 表示註釋,從它開始到行尾都被忽略
2. yaml轉字典
yaml中支援對映或字典的表示,如下:
在test.yaml檔案中:
#test.yaml
#下面格式讀到Python裡會是個dict
name: 灰藍
age: 0
job: Tester
#coding:utf-8
import yaml
import os
#open('test.yaml','w') #如果沒有建立test.yaml,先使用open在當前目錄下建立檔案
#方法一
output = yaml.load(file("test.yaml"))
print output
#方法二
#filename = os.path.join(os.path.dirname(__file__), 'test.yaml').replace("\\", "/")
#output = yaml.load(open(filename))
#print output
輸出:{'job': 'Tester', 'age': 0, 'name': u'\u7070\u84dd'}
3. yaml轉列表
yaml中支援列表或陣列的表示,注意裂變中的每一個元素前面用符號 - 如下:
在test.yaml檔案中:
#test.yaml
#下面格式讀到Python裡會是個list
- 灰藍
- 0
- Tester
輸出:[u'\u7070\u84dd', 0, 'Tester']
4. 複合結構
字典和列表可以複合起來使用,注意這裡使用 - 如下:
# test.yaml
#下面格式讀到Python裡是個list裡包含dict
- name: 灰藍
age: 0
job: Tester
- name: James
age: 30
輸出:[{'job': 'Tester', 'age': 0, 'name': u'\u7070\u84dd'}, {'age': 30, 'name': 'James'}]
5. 基本型別
yaml中有以下基本型別:
- 字串
- 整型
- 浮點型
- 布林型
- null
- 時間
- 日期
我們寫個例子來看下:
# test.yaml
#這個例子輸出一個字典,其中value包括所有基本型別
str: "Hello World!"
int: 110
float: 3.141
boolean: true # or false
None: null # 也可以用 ~ 號來表示 null
time: 2016-09-22t11:43:30.20+08:00 # ISO8601,寫法百度
date: 2016-09-22 # 同樣ISO8601
輸出:
{'date': datetime.date(2016, 9, 22), 'None': None, 'boolean': True, 'str': 'Hello World!', 'time': datetime.datetime(2016, 9, 22, 3, 43, 30, 200000), 'int': 110, 'float': 3.141}
如果字串沒有空格或特殊字元,不需要加引號,但如果其中有空格或特殊字元,則需要加引號了
#test.yaml
str: 灰藍
str1: "Hello World"
str2: "Hello\nWorld"
輸出結果:{'str2': 'Hello\nWorld', 'str1': 'Hello World', 'str': u'\u7070\u84dd'}
這裡要注意單引號和雙引號的區別,單引號中的特殊字元轉到Python會被轉義,也就是到最後是原樣輸出了,雙引號不會被Python轉義,到最後是輸出了特殊字元;可能比較拗口,來個例子理解下:
#test.yaml
str1: 'Hello\nWorld'
str2: "Hello\nWorld"
# -*- coding: utf-8 -*-
import yaml
y = yaml.load(file('test.yaml', 'r'))
print y['str1']
print y['str2']
輸出:
Hello\nWorld
Hello
World
可以看到,單引號中的’\n’最後是輸出了,雙引號中的’\n’最後是轉義成了回車
字串處理中寫成多行、’|’、’>’、’+’、’-‘的意義這裡就不講了。
6. 引用
& 和 * 用於引用
#test.yaml
name: &name 灰藍
tester: *name
這個相當於一下指令碼:
#test.yaml
name: 灰藍
tester: 灰藍
輸出:{'name': u'\u7070\u84dd', 'tester': u'\u7070\u84dd'}
7. 強制轉換
yaml是可以進行強制轉換的,用 !! 實現,如下:
#test.yaml
str: !!str 3.14
int: !!int "123"
輸出:{'int': 123, 'str': '3.14'}
明顯能夠看出123被強轉成了int型別,而float型的3.14則被強轉成了str型。另外PyYaml還支援轉換成Python/object型別,這個我們下面再討論。
8. 分段
在同一個yaml檔案中,可以用 — 來分段,這樣可以將多個文件寫在一個檔案中
#test.yaml
---
name: James
age: 20
---
name: Lily
age: 19
這時候我們就得用到我們的 load_all() 方法出場了,load_all() 方法會生成一個迭代器,可以用for輸出出來:
# -*- coding: utf-8 -*-
import yaml
ys = yaml.load_all(file('test.yaml', 'r'))
for y in ys:
print y
輸出:
{'age': 20, 'name': 'James'}
{'age': 19, 'name': 'Lily'}
對應的也有 dump_all() 方法,一個意思,就是將多個段輸出到一個檔案中,如:
# -*- coding: utf-8 -*-
import yaml
obj1 = {"name": "James", "age": 20}
obj2 = ["Lily", 19]
with open('test.yaml', 'w') as f:
yaml.dump_all([obj1, obj2], f)
開啟test.yaml看看
{age: 20, name: James}
---
[Lily, 19]
dump() 和 dump_all() 方法可以傳入列表,也可以傳入一個可序列化生成器,如 range(10), 如下:
# -*- coding: utf-8 -*-
import yaml
y = yaml.dump(range(10))
print y
輸出:
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
在 dump 和 dump_all() 的時候還可以配一堆引數,不一一講解了(其實博主也不全瞭解…)
更高階用法
請參考博文:https://blog.csdn.net/rhx_qiuzhi/article/details/80153920