2Python進階強化訓練之csv|json|xml|excel高

阿新 • • 發佈：2017-05-12

中國股市 excel 如何

Python進階強化訓練之csv|json|xml|excel高

如何讀寫csv數據？

實際案例

我們可以通過http://table.finance.yahoo.com/table.csv?s=000001.sz，這個url獲取中國股市(深市)數據集，它以csv數據格式存儲：

Date,Open,High,Low,Close,Volume,Adj Close
2016-09-15,9.06,9.06,9.06,9.06,000,9.06
2016-09-14,9.17,9.18,9.05,9.06,42148100,9.06
2016-09-13,9.18,9.21,9.14,9.19,46093100,9.19
2016-09-12,9.29,9.32,9.13,9.16,75658100,9.16
2016-09-09,9.40,9.43,9.36,9.38,32743100,9.38
2016-09-08,9.39,9.42,9.38,9.40,29521800,9.40
2016-09-07,9.41,9.42,9.37,9.40,45937300,9.40
2016-09-06,9.42,9.43,9.36,9.41,57473800,9.41
2016-09-05,9.46,9.46,9.40,9.42,46993600,9.42
2016-09-02,9.43,9.46,9.42,9.45,36879600,9.45
2016-09-01,9.49,9.52,9.42,9.45,48013100,9.45
2016-08-31,9.46,9.50,9.43,9.49,48974600,9.49
2016-08-30,9.42,9.47,9.41,9.47,59508100,9.47
2016-08-29,9.41,9.45,9.38,9.42,56523100,9.42
2016-08-26,9.45,9.47,9.40,9.45,50223300,9.45
2016-08-25,9.42,9.45,9.34,9.44,61738900,9.44
2016-08-24,9.41,9.43,9.38,9.43,73228100,9.43

請將平安銀行這支股票，在2016年中成交量超過14000000的記錄存儲到另一個csv文件中

解決方案

使用標準庫中的csv模塊，可以使用其中reader和writer完成文件讀寫

下載數據

>>> from urllib import urlretrieve
# 獲取平安銀行股票信息，保存到pingan.csv文件中
>>> urlretrieve(‘http://table.finance.yahoo.com/table.csv?s=000001.sz‘, ‘pingan.csv‘)
(‘pingan.csv‘, <httplib.HTTPMessage instance at 0x1a997e8>)

使用csv模塊進行讀

>>> import csv
>>> rf = open(‘pingan.csv‘, ‘rb‘)
>>> reader = csv.reader(rf)
# 獲取的對象是一個可叠代的
>>> reader.next()
[‘Date‘, ‘Open‘, ‘High‘, ‘Low‘, ‘Close‘, ‘Volume‘, ‘Adj Close‘]
>>> reader.next()
[‘2016-09-15‘, ‘9.06‘, ‘9.06‘, ‘9.06‘, ‘9.06‘, ‘000‘, ‘9.06‘]

使用csv模塊進行寫

>>> wf = open(‘pingan_copy.csv‘, ‘wb‘)
>>> writer = csv.writer(wf)
>>> writer.writerow([‘2016-09-14‘, ‘9.17‘, ‘9.18‘, ‘9.05‘, ‘9.06‘, ‘42148100‘, ‘9.06‘])
>>> writer.writerow(reader.next())                                                     
>>> wf.flush()

查看寫入的文件內容

[[email protected] ~]# cat pingan_copy.csv 
2016-09-14,9.17,9.18,9.05,9.06,42148100,9.06
2016-09-13,9.18,9.21,9.14,9.19,46093100,9.19

如上的問題解決方案如下：

#!/use/bin/env python
# _*_ coding:utf-8 _*_

import csv

with open(‘pingan.csv‘, ‘rb‘) as rf:
    reader = csv.reader(rf)
    with open(‘pingan2016.csv‘, ‘wb‘) as wf:
        writer = csv.writer(wf)
        headers = reader.next()
        writer.writerow(headers)
        for row in reader:
            if row[0] < ‘2016-01-01‘:
                break
            if int(row[5]) >= 50000000:
                writer.writerow(row)

如何讀寫json數據？

實際案例

在web應用中常用JSON(JavaScript Object Notation)格式傳輸數據，在python中如何讀寫json數據?

解決方案

使用標準庫中的json模塊，其中loads、dumps函數可以完成json數據的讀寫

將數據類型轉換為字符串

>>> import json
# 創建一個列表
>>> l = [1,2,‘asd‘,{‘blgo_url‘,‘ansheng.me‘}]
# 使用dumps轉換為字符串
>>> json.dumps(l)
‘[1, 2, "asd", {"blgo_url": "ansheng.me"}]‘
# 去掉空格
>>> json.dumps(l, separators=[‘,‘,‘:‘])
‘[1,2,"asd",{"blgo_url":"ansheng.me"}]‘
# 排序
>>> d = {‘b‘:None,‘a‘:‘111‘,‘g‘:‘Null‘}
>>> json.dumps(d, sort_keys=True)
‘{"a": "111", "b": null, "g": "Null"}‘

將字符串轉換為數據類型

>>> json.loads(‘[1,2,"asd",{"blgo_url":"ansheng.me"}]‘)
[1, 2, ‘asd‘, {‘blgo_url‘: ‘ansheng.me‘}]

如何解析簡單的xml文檔？

實際案例

如以下XML文檔，如何使用python進行解析？

<?xml version="1.0" encoding="utf-8" ?>
<data>
    <country name="Liechtenstein">
        <rank update="yes">2</rank>
        <year>2008</year>
        <gdppc>141100</gdppc>
        <neighbor name="Austria" direction="E"/>
        <neighbor name="Switzerland" direction="W"/>
    </country>
    <country name="Singapore">
        <rank update="yes">5</rank>
        <year>2011</year>
        <gdppc>59900</gdppc>
        <neighbor name="Malaysia" direction="N"/>
    </country>
    <country name="Panama">
        <rank update="yes">69</rank>
        <year>2011</year>
        <gdppc>13600</gdppc>
        <neighbor name="Costa Rica" direction="W"/>
        <neighbor name="Colombia" direction="E"/>
    </country>
</data>

解決方案

可以使用標準庫中的xml.etree.ElementTree，其中的parse函數可以解析XML文檔

# 導入parse
>>> from xml.etree.ElementTree import parse
>>> f = open(‘a.xml‘)
# 獲得ElementTree對象
>>> et = parse(f)
# 獲取根節點，也就是data
>>> root = et.getroot()
>>> root
<Element ‘data‘ at 0x00000203ECA1E728>
# 查看標簽
>>> root.tag
‘data‘
# 屬性
>>> root.attrib
{}
# 文本
>>> root.text.strip()
‘‘
# 獲得一個節點的子元素，然後在獲取每個子元素的屬性
>>> for child in root: print(child.get(‘name‘))
...
Liechtenstein
Singapore
Panama
# 根據標簽尋找子元素，每次之尋找第一個
>>> root.find(‘country‘)
<Element ‘country‘ at 0x00000203ECBD3228>
# 尋找所有
>>> root.findall(‘country‘)
[<Element ‘country‘ at 0x00000203ECBD3228>, <Element ‘country‘ at 0x00000203ECBDBC28>, <Element ‘country‘ at 0x00000203ECBDBDB8>]
# 獲得一個生成器對象
>>> root.iterfind(‘country‘)
<generator object prepare_child.<locals>.select at 0x00000203ECBC5FC0>
>>> for e in root.iterfind(‘country‘): print(e.get(‘name‘))
...
Liechtenstein
Singapore
Panama
# 獲取所有的元素節點
>>> list(root.iter())
[<Element ‘data‘ at 0x00000203ECA1E728>, <Element ‘country‘ at 0x00000203ECBD3228>, <Element ‘rank‘ at 0x00000203ECBDBA98>, <Element ‘year‘ at 0x00000203ECBDBAE8>, <Element ‘gdppc‘ at 0x00000203ECBDBB38>, <Element ‘neighbor‘ at 0x00000203ECBDBB88>, <Element ‘neighbor‘ at 0x00000203ECBDBBD8>, <Element ‘country‘ at 0x00000203ECBDBC28>, <Element ‘rank‘ at 0x00000203ECBDBC78>, <Element ‘year‘ at 0x00000203ECBDBCC8>, <Element ‘gdppc‘ at 0x00000203ECBDBD18>, <Element ‘neighbor‘ at 0x00000203ECBDBD68>, <Element ‘country‘ at 0x00000203ECBDBDB8>, <Element ‘rank‘ at 0x00000203ECBDBE08>, <Element ‘year‘ at 0x00000203ECBDBE58>, <Element ‘gdppc‘ at 0x00000203ECBDBEA8>, <Element ‘neighbor‘ at 0x00000203ECBDBEF8>, <Element ‘neighbor‘ at 0x00000203ECBDBF48>]
# 尋找標簽為rank的子節點
>>> list(root.iter(‘rank‘))
[<Element ‘rank‘ at 0x00000203ECBDBA98>, <Element ‘rank‘ at 0x00000203ECBDBC78>, <Element ‘rank‘ at 0x00000203ECBDBE08>]

查找的高級用法

# 匹配country下的所有子節點
>>> root.findall(‘country/*‘)
[<Element ‘rank‘ at 0x00000203ECBDBA98>, <Element ‘year‘ at 0x00000203ECBDBAE8>, <Element ‘gdppc‘ at 0x00000203ECBDBB38>, <Element ‘neighbor‘ at 0x00000203ECBDBB88>, <Element ‘neighbor‘ at 0x00000203ECBDBBD8>, <Element ‘rank‘ at 0x00000203ECBDBC78>, <Element ‘year‘ at 0x00000203ECBDBCC8>, <Element ‘gdppc‘ at 0x00000203ECBDBD18>, <Element ‘neighbor‘ at 0x00000203ECBDBD68>, <Element ‘rank‘ at 0x00000203ECBDBE08>, <Element ‘year‘ at 0x00000203ECBDBE58>, <Element ‘gdppc‘ at 0x00000203ECBDBEA8>, <Element ‘neighbor‘ at 0x00000203ECBDBEF8>, <Element ‘neighbor‘ at 0x00000203ECBDBF48>]
# 找到所有節點的rank
>>> root.findall(‘.//rank‘)
[<Element ‘rank‘ at 0x00000203ECBDBA98>, <Element ‘rank‘ at 0x00000203ECBDBC78>, <Element ‘rank‘ at 0x00000203ECBDBE08>]
# 找到rank的父對象
>>> root.findall(‘.//rank/..‘)
[<Element ‘country‘ at 0x00000203ECBD3228>, <Element ‘country‘ at 0x00000203ECBDBC28>, <Element ‘country‘ at 0x00000203ECBDBDB8>]
# 查找country包含name屬性的
>>> root.findall(‘country[@name]‘)
[<Element ‘country‘ at 0x00000203ECBD3228>, <Element ‘country‘ at 0x00000203ECBDBC28>, <Element ‘country‘ at 0x00000203ECBDBDB8>]
>>> root.findall(‘country[@age]‘)
[]
# 查找屬性等於特定值的元素
>>> root.findall(‘country[@name="Singapore"]‘)
[<Element ‘country‘ at 0x00000203ECBDBC28>]
# 查找必須包含某一個子元素
>>> root.findall(‘country[rank]‘)
[<Element ‘country‘ at 0x00000203ECBD3228>, <Element ‘country‘ at 0x00000203ECBDBC28>, <Element ‘country‘ at 0x00000203ECBDBDB8>]
# 查找子元素等於指定的值
>>> root.findall(‘country[rank="5"]‘)
[<Element ‘country‘ at 0x00000203ECBDBC28>]
# 根據位置查找，從1開始
>>> root.findall(‘country‘)
[<Element ‘country‘ at 0x00000203ECBD3228>, <Element ‘country‘ at 0x00000203ECBDBC28>, <Element ‘country‘ at 0x00000203ECBDBDB8>]
# 根據位置查找
>>> root.findall(‘country[1]‘)
[<Element ‘country‘ at 0x00000203ECBD3228>]
# 倒數第一個
>>> root.findall(‘country[last()]‘)
[<Element ‘country‘ at 0x00000203ECBDBDB8>]
# 倒數第二個
>>> root.findall(‘country[last()-1]‘)
[<Element ‘country‘ at 0x00000203ECBDBC28>]

如何構建xml文檔？

實際案例

某些時候，我們需要將其他格式數據轉換為xml，例如下面的字符串如何轉換為XML？

解決方案

使用標準庫中的xml.etree.ElementTree，構建ElementTree，使用write方法寫入文件

>>> from xml.etree.ElementTree import Element, ElementTree
>>> from xml.etree.ElementTree import tostring
>>> e = Element(‘Data‘)
>>> e.set(‘name‘, ‘abc‘)
>>> e.text = ‘123‘
# 查看結果
>>> tostring(e)
b‘<Data name="abc">123</Data>‘
>>> e2 = Element(‘Row‘)
>>> e3 = Element(‘Open‘)
>>> e3.text = ‘9.17‘
>>> e2.append(e3)
>>> e.text = None
>>> e.append(e2)
>>> tostring(e)
b‘<Data name="abc"><Row><Open>9.17</Open></Row></Data>‘
>>> et = ElementTree(e)
>>> et.write(‘demo.xml‘)

解決如上問題的腳本如下：

import csv
from xml.etree.ElementTree import Element, ElementTree

def pretty(e, level=0):
    if len(e) > 0:
        e.text = ‘\n‘ + ‘\t‘ * (level + 1)
        for child in e:
            pretty(child, level + 1)
        child.tail = child.tail[:-1]
    e.tail = ‘\n‘ + ‘\t‘ * level
    
def csvToXML(fname):
    with open(fname, ‘rb‘) as f:
        reader = csv.reader(f)
        headers = reader.next()
        root = Element(‘Data‘)
        for row in reader:
            eRow = Element(‘Row‘)
            root.append(eRow)
            for tag, text in zip(headers, row):
                e = Element(tag)
                e.text = text
                eRow.append(e)
    pretty(root)
    return ElementTree(root)
    
et = csvToXML(‘pingan.csv‘)
et.write(‘pingan.xml‘)

轉換好的文件內容為：

<Data>
        <Row>
                <Date>2016-09-15</Date>
                <Open>9.06</Open>
                <High>9.06</High>
                <Low>9.06</Low>
                <Close>9.06</Close>
                <Volume>000</Volume>
                <Adj Close>9.06</Adj Close>
        </Row>
        <Row>
                <Date>2016-09-14</Date>
                <Open>9.17</Open>
                <High>9.18</High>
                <Low>9.05</Low>
                <Close>9.06</Close>
                <Volume>42148100</Volume>
                <Adj Close>9.06</Adj Close>
        </Row>
        .....

如何讀寫excel文件？

實際案例

Microsoft Excel是日常辦公中使用最頻繁的軟件，起數據格式為xls,xlsx,一種非常常用的電子表格。

某小學某班成績記錄在excel了文件中，內容如下：

姓名    語文    數學    外語
小明    95    96    94
張三    85    84    92
王五    86    85    75
小哈    96    92    100

利用python讀寫excel了，添加總分列，計算每人總分

解決方案

使用第三方庫xlrd和xlwt，這兩個庫分別用於excel讀和寫

安裝這兩個模塊

pip3 install xlrd
pip3 install xlwt

腳本如下：

#!/usr/bin/env python
# _*_ coding:utf-8 _*_

# 導入xlrd和xlwt
import xlrd
import xlwt

# 打開excel文件
rbook = xlrd.open_workbook(‘x.xlsx‘)
# 表
rsheet = rbook.sheet_by_index(0)

# 添加一個總分的列
# 列
nc = rsheet.ncols
# 第0行，列，文本類型，文字，內容
rsheet.put_cell(0, nc, xlrd.XL_CELL_TEXT, ‘總分‘, None)

# 叠代表中的所有數據，計算總分
for row in range(1, rsheet.nrows):
    # 計算每行的總分，跳過第0行,0==姓名,sum對列表進行求和，t等於最後加上拿出來的分數
    t = sum(rsheet.row_values(row, 1))
    # 寫入數據
    rsheet.put_cell(row, nc, xlrd.XL_CELL_NUMBER, t, None)
    
# 寫入到文件中
wbook = xlwt.Workbook()
wsheet = wbook.add_sheet(rsheet.name)

# 對其方式，垂直和水平都是劇中
style = xlwt.easyxf(‘align: vertical center, horizontal center‘)
# rsheet的每個單元格寫入到wsheet中
for r in range(rsheet.nrows):  # 行
    for c in range(rsheet.ncols):  # 列
        wsheet.write(r, c, rsheet.cell_value(r, c), style)
        
wbook.save(‘output.xlsx‘)

計算結果如下：

姓名    語文    數學    外語    總分
小明    95    96    94    285
張三    85    84    92    261
王五    86    85    75    246
小哈    96    92    100    288

#Python

本文出自 “Eden” 博客，轉載請與作者聯系！

2Python進階強化訓練之csv|json|xml|excel高

中國股市 excel 如何 Python進階強化訓練之csv|json|xml|excel高如何讀寫csv數據？實際案例我們可以通過http://table.finance.yahoo.com/table.csv?s=000001.sz，這個url獲取中國股市(深市)數據集，它以csv數據格式存儲

1Python進階強化訓練之裝飾器使用技巧進階

黃金分割解決方案 return 技巧原函數 Python進階強化訓練之裝飾器使用技巧進階如何使用函數裝飾器？實際案例某些時候我們想為多個函數，統一添加某種功能，比如記時統計、記錄日誌、緩存運算結果等等。我們不想在每個函數內一一添加完全相同的代碼，有什麽好的解決方案呢？解決方案定義裝飾奇

mysql進階（三）MHA高可用集群

mysql mha簡介： 1、MHA目前在MySQL高可用方面是一個相對成熟的解決方案，是MySQL高可用環境下故障切換和主從提升的高可用軟件 2、MHA能在短時間內完成故障切換，並且在最大程度上保證數據的一致性，以達到真正意義上的高可用 3、MHA基於mysql協議，通過mysql主從或主主進行復制 4、

關於linux的進階命令用法之來自noob的小結（1）

linux命令寫的很雜，先這樣，下午再來細細排版與貼圖umask 查詢當前shell的mask值umask xxx 可以設置當前目錄的mask值vim .bashrc 可以編輯當前用戶shell的mask值並且永久保存，source 後生效-S 可以用rwx顯示出當前的去掉的

【思庫教育】2017PHP項目實戰基礎+進階+項目之基礎篇

商品資源庫商城文件引入正則表達式匿名 header 類和對象多少下載鏈接：【思庫教育】2017PHP項目實戰基礎+進階+項目之基礎篇小白變大牛,您的專屬資源庫！小白變大牛,您的專屬資源庫！內容非常充實，可以看目錄，設計的面多，項目多，技能多

Android 高手進階教程(十三)之----Android 數據庫SQLiteDatabase的使用！！

value bre encoding class 圖片 parent tex getitem length Android 提供了三種數據存儲方式，第一種是文件存儲;第二種是SharedPreferences 存儲;第三種就是數據庫SQLiteDatabase 存儲。文件存

Android高手進階教程(九)之----Android Handler的使用!!!

() timer welcom csdn 發送 state img 技術分享技術大家好我們這一節講的是Android Handler的使用,在講Handler之前，我們先提個小問題，就是如何讓程序5秒鐘更新一下Title.首先我們看一下習慣了Java編程的人，在不知道H

進階的Redis之資料持久化RDB與AOF

大家都知道，Redis之所以效能好，讀寫快，是因為Redis是一個記憶體資料庫，它的操作都幾乎基於記憶體。但是記憶體型資料庫有一個很大的弊端，就是當資料庫程序崩潰或系統重啟的時候，如果記憶體資料不儲存的話，裡面的資料就會丟失不見了。這樣的資料庫並不是一個可靠的資料庫。所以資料的持久化是記憶體型資料庫的重中

重磅迴歸-SSM整合進階專案實戰之個人部落格系統

歷經一個多月的重新設計，需求分析以及前後端開發，終於有了一定的輸出：我自己實現的spring4+springmvc+mybatis3整合的進階專案實戰-個人部落格系統已然完成了，系統採用mvc三層模式進行整體的開發，涉及到技術一下子很難全部列出，其中不得不提的有：整

進階的Redis之雜湊分片原理與叢集實戰

前面介紹了《進階的Redis之資料持久化RDB與AOF》和《進階的Redis之Sentinel原理及實戰》，這次來了解下Redis的叢集功能，以及其中雜湊分片原理。叢集分片模式如果Redis只用複製功能做主從，那麼當資料量巨大的情況下，單機情況下可能已經承受不下一份資料，更不用說是主從都要各自儲存一份

進階的Redis之數據持久化RDB與AOF

加載數據意思 tro 關註數據持久化 -o blur 計數化工大家都知道，Redis之所以性能好，讀寫快，是因為Redis是一個內存數據庫，它的操作都幾乎基於內存。但是內存型數據庫有一個很大的弊端，就是當數據庫進程崩潰或系統重啟的時候，如果內存數據不保存的話，裏面的

U3D進階 | 常用 API 之 Invoke 函式呼叫

金錢副本細節完善寶箱掉落給寶箱預製體新增剛體元件即可。實現按鍵寶箱批量掉落將例項化生成寶箱的程式碼單獨封裝成一個函式；使用 for 迴圈，批量生成寶箱。寶箱自動掉落現在我們是通過按鍵，程式呼叫 “生成寶箱” 的函式來實現功能。在遊戲中，

python入門與進階篇(二)之變數和運算子

變數變數的命名規則：字母、數字、下劃線組成, 系統關鍵字不能在變數名中如and、if、import 變數名區分大小寫變數沒有型別限制同js 系統方法名建議不用來做變數名，避免造成衝突如type print Int str t

python入門與進階篇(四)之包、模組、函式與變數作用域

python專案的組織結構包（資料夾）-->模組（檔案）-->類-->函式和變數 seven.c4、six.c4:（seven）包名.模組名（c4）構成名稱空間 seven包的結構： seven --t(子包) --

python進階強化學習

執行效率速度程序地方 union 一段隨機函數 dead 最近學習了慕課的python進階強化訓練，將學習的內容記錄到這裏，同時也增加了很多相關知識。主要分為以下九個模塊：基本使用叠代器和生成器字符串文件IO操作自定義類和類的繼承函數裝飾器

python入門與進階篇(六)之高階語法及用法

高階知識針對包、類庫的開發者,函式只是一段可執行的程式碼並不是物件，閉包、函數語言程式設計閉包=函式+環境變數 a=10 def outer(): a=25 def inner(x): print(a*x*x) retu

【Java進階面試系列之二】：哥們，那你說說系統架構引入訊息中介軟體有什麼缺點？

歡迎關注個人公眾號：石杉的架構筆記（ID:shishan100）週一至週五早8點半！精品技術文章準時送上！一、前情回顧上篇文章「Java進階面試系列之一」你們系統架構中為何要引入訊息中介軟體？，給大家講了講訊息中介軟體引入系統架構的作用，主要是解決哪些問題的。其比較常見的實踐場景是：複雜系統

Android進階——效能優化之程序拉活原理及手段完全解析（二）

引言上一篇文章Android進階——效能優化之程序保活原理及手段完全解析（一）總結了Android程序和執行緒的相關知識，主要介紹了幾種提升程序優先順序的手段，通常僅僅是提高優先順序只能讓你的程序存活時間久一點，但是真正的被殺死之後就不會自動拉活的，如果你的程

未雨綢繆：Java高階架構進階必學之 ⑥ 大知識要點附視訊學習資料

程式設計師，一個令人嚮往的職業，看起來有著高薪酬、高技術，還是一群高智商、頭腦靈活的人。事實上，程式設計師的工作，讓人非常抓狂，程式設計師的生活，異常線性單調。而且技術更新快，相互之間競爭壓力非常大~~ 相信你可能經歷過這些：已經工作3年了，每個專案都會保質保量的完成，

【Java進階面試系列之三】哥們，訊息中介軟體在你們專案裡是如何落地的？【石杉的架構筆記】

歡迎關注個人公眾號：石杉的架構筆記（ID:shishan100）週一至週五早8點半！精品技術文章準時送上！一、前情回顧之前給大家聊了一下，面試時如果遇到訊息中介軟體這個話題，面試官上來可能問的兩個問題：你們的系統架構中為什麼要引入訊息中介軟體？系統架構中引入訊息中介軟體有什麼缺點？關於

2Python進階強化訓練之csv|json|xml|excel高

Python進階強化訓練之csv|json|xml|excel高

如何讀寫csv數據？

解決方案

如何讀寫json數據？

解決方案

如何解析簡單的xml文檔？

解決方案

如何構建xml文檔？

解決方案

如何讀寫excel文件？

解決方案

相關推薦