python3-cookbook第5章摘要-檔案與IO

阿新 • • 發佈：2019-02-20

1.如何在迭代一個序列的同時跟蹤正在被處理的元素索引。

內建的 enumerate() 函式可以很好的解決這個問題：

>>> my_list = ['a', 'b', 'c']
>>> for idx, val in enumerate(my_list):
...     print(idx, val)
...
0 a
1 b
2 c

為了按傳統行號輸出(行號從1開始)，你可以傳遞一個開始引數：

>>> my_list = ['a', 'b', 'c']
>>> for idx, val in enumerate(my_list, 1):
...     print(idx, val)
...
1 a
2 b
3 c

這種情況在你遍歷檔案時想在錯誤訊息中使用行號定位時候非常有用：

def parse_data(filename):
    with open(filename, 'rt') as f:
        for lineno, line in enumerate(f, 1):
            fields = line.split()
            try:
                count = int(fields[1])
                ...
            except ValueError as e:
                print('Line {}: Parse error: {}' 
.format(lineno, e))

2.如何同時迭代多個序列，每次分別從一個序列中取一個元素。

為了同時迭代多個序列，使用 zip() 函式。比如：

>>> xpts = [1, 5, 4, 2, 10, 7]
>>> ypts = [101, 78, 37, 15, 62, 99]
>>> for x, y in zip(xpts, ypts):
...     print(x,y)
...
1 101
5 78
4 37
2 15
10 62
7 99

zip(a, b) 會生成一個可返回元組 (x, y) 的迭代器，其中x來自a，y來自b。一旦其中某個序列到底結尾，迭代宣告結束。因此迭代長度跟引數中最短序列長度一致。

如果這個不是你想要的效果，那麼還可以使用 itertools.zip_longest() 函式來代替

>>> from itertools import zip_longest
>>> for i in zip_longest(a,b):
...     print(i)
...
(1, 'w')
(2, 'x')
(3, 'y')
(None, 'z')

>>> for i in zip_longest(a, b, fillvalue=0):
...     print(i)
...
(1, 'w')
(2, 'x')
(3, 'y')
(0, 'z')
>>>

雖然不常見，但是 zip() 可以接受多於兩個的序列的引數。這時候所生成的結果元組中元素個數跟輸入序列個數一樣。

3.如何將一系列排序序列合併後得到一個排序序列並在上面迭代遍歷。

heapq.merge() 函式可以幫你解決這個問題。比如：

>>> import heapq
>>> a = [1, 4, 7, 10]
>>> b = [2, 5, 6, 11]
>>> for c in heapq.merge(a, b):
...     print(c)
...
1
2
4
5
6
7
10
11

heapq.merge 可迭代特性意味著它不會立馬讀取所有序列。這就意味著你可以在非常長的序列中使用它，而不會有太大的開銷。比如，下面是一個例子來演示如何合併兩個排序檔案：

with open('sorted_file_1', 'rt') as file1, \
    open('sorted_file_2', 'rt') as file2, \
    open('merged_file', 'wt') as outf:

    for line in heapq.merge(file1, file2):
        outf.write(line)

有一點要強調的是 heapq.merge() 需要所有輸入序列必須是排過序的。特別的，它並不會預先讀取所有資料到堆疊中或者預先排序，也不會對輸入做任何的排序檢測。它僅僅是檢查所有序列的開始部分並返回最小的那個，這個過程一直會持續直到所有輸入序列中的元素都被遍歷完。

4.使用 print() 函式輸出資料，改變預設的分隔符或者行尾符。

可以使用在 print() 函式中使用 sep 和 end 關鍵字引數，以你想要的方式輸出。比如：

>>> print('ACME', 50, 91.5)
ACME 50 91.5
>>> print('ACME', 50, 91.5, sep=',')
ACME,50,91.5
>>> print('ACME', 50, 91.5, sep=',', end='!!\n')
ACME,50,91.5!!
>>>

使用 end 引數也可以在輸出中禁止換行。比如：

>>> for i in range(5):
...     print(i)
...
0
1
2
3
4
>>> for i in range(5):
...     print(i, end=' ')
...
0 1 2 3 4 >>>

5. 一個檔案中寫入資料，但是前提必須是這個檔案在檔案系統上不存在。也就是不允許覆蓋已存在的檔案內容。

可以在 open() 函式中使用 x 模式來代替 w 模式的方法來解決這個問題。比如：

>>> with open('somefile', 'wt') as f:
...     f.write('Hello\n')
...
>>> with open('somefile', 'xt') as f:
...     f.write('Hello\n')
...
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
FileExistsError: [Errno 17] File exists: 'somefile'
>>>

如果檔案是二進位制的，使用 xb 來代替 xt

6.如何讀寫一個gzip或bz2格式的壓縮檔案。

import gzip
with gzip.open('somefile.gz', 'rt') as f:
    text = f.read()

# bz2 compression
import bz2
with bz2.open('somefile.bz2', 'rt') as f:
    text = f.read()

類似的，為了寫入壓縮資料，可以這樣做：

# gzip compression
import gzip
with gzip.open('somefile.gz', 'wt') as f:
    f.write(text)

# bz2 compression
import bz2
with bz2.open('somefile.bz2', 'wt') as f:
    f.write(text)

當寫入壓縮資料時，可以使用 compresslevel 這個可選的關鍵字引數來指定一個壓縮級別。比如：

with gzip.open('somefile.gz', 'wt', compresslevel=5) as f:
    f.write(text)

7.在一個固定長度記錄或者資料塊的集合上迭代，而不是在一個檔案中一行一行的迭代。

#通過下面這個小技巧使用 iter 和 functools.partial() 函式：

from functools import partial

RECORD_SIZE = 32

with open('somefile.data', 'rb') as f:
    records = iter(partial(f.read, RECORD_SIZE), b'')
    for r in records:
        ...

8.在程式執行時建立一個臨時檔案或目錄，並希望使用完之後可以自動銷燬掉。

from tempfile import TemporaryFile

with TemporaryFile('w+t') as f:
    # Read/write to the file
    f.write('Hello World\n')
    f.write('Testing\n')

    # Seek back to beginning and read the data
    f.seek(0)
    data = f.read()

# Temporary file is destroyed
或者，如果你喜歡，你還可以像這樣使用臨時檔案：

f = TemporaryFile('w+t')
# Use the temporary file
...
f.close()
# File is destroyed

在大多數Unix系統上，通過 TemporaryFile() 建立的檔案都是匿名的，甚至連目錄都沒有。如果你想打破這個限制，可以使用 NamedTemporaryFile() 來代替。比如：

from tempfile import NamedTemporaryFile

with NamedTemporaryFile('w+t') as f:
    print('filename is:', f.name)
    ...

# File automatically destroyed

9.將一個Python物件序列化為一個位元組流，以便將它儲存到一個檔案、儲存到資料庫或者通過網路傳輸它。

對於序列化最普遍的做法就是使用 pickle 模組。為了將一個物件儲存到一個檔案中，可以這樣做：

import pickle

data = ... # Some Python object
f = open('somefile', 'wb')
pickle.dump(data, f)

為了將一個物件轉儲為一個字串，可以使用 pickle.dumps() ：

s = pickle.dumps(data)

為了從位元組流中恢復一個物件，使用 picle.load() 或 pickle.loads() 函式。比如：

# Restore from a file
f = open('somefile', 'rb')
data = pickle.load(f)

# Restore from a string
data = pickle.loads(s)

python3-cookbook第5章摘要-檔案與IO

1.如何在迭代一個序列的同時跟蹤正在被處理的元素索引。內建的 enumerate() 函式可以很好的解決這個問題： >>> my_list = ['a', 'b', 'c'] >>> for idx, val in en

第5章使用MUI與H5+構建移動端app

如果接觸過Bootstrap或者微信小程式的話，MUI它就相當於是一個基於CSS的一個庫，它是一個CSS的框架。同時它也集合了相應的JS，它也把大量的JS做了一個整合和封裝，所以它是一個工具集或者說是一個UI的集合，通過它可以編寫出非常好看的原生的樣式，它都幫我們做好了原生的封裝。我們只需要通過很簡單的程式碼

Linux一一第六章、檔案與目錄管理

主要介紹進一步操作與管理檔案及目錄，包括在不同的目錄間變換、建立與刪除目錄、建立與刪除檔案，還有尋找檔案、查閱檔案內容等等。 6.1 目錄與路徑 6.1.1 相對路徑與絕對路徑絕對路徑：路徑的寫法“一定由根目錄/寫起”，例如：/usr/share/doc這個目錄

鳥哥的linux私房菜——第5章首次登陸與線上求助man page

1. Linux登入環境 Ctrl + Alt + [F1~F6]：文字登入介面tty1~tty6終端（輸入startx啟動X視窗介面）　　//run level 3 Ctrl + Alt + F7：圖形介面桌面　　//run level 5 （1）終端介面登陸的預設顯示內容來自/ect/i

python3-cookbook第三章簡摘

1.對浮點數執行指定精度的舍入運算。對於簡單的舍入運算，使用內建的 round(value, ndigits) 函式即可 >>> round(1.23, 1) 1.2 >>> round(1.27, 1) 1.3 >

第5章-子類與繼承-子類與父類在同一包中的繼承性

問題：同一個包中三個類，people是student的父類，student是universtudent的父類，Test中進行呼叫程式碼： People.java public class People { double height=170,weight=67.

mfc深入淺出系列深入淺出mfc 第13章多重檔案與多重顯示

第13章多重檔案與多重顯示 1. 靜態分裂用到兩個CSplitterWnd成員函式： 1.BOOLCreateStatic( CWnd* pParentWnd, int nRows, in nCols,DWORDdwStyle = WS_CHILD |WS_VI

第11章　記憶體與IO訪問之裝置IO埠和I/O記憶體的訪問

11.4　裝置I/O埠和I/O記憶體的訪問裝置通常會提供一組暫存器來控制裝置、讀寫裝置和獲取裝置狀態，即控制暫存器、資料暫存器和狀態暫存器。這些暫存器可能位於I/O空間中，也可能位於記憶體空間中。當暫存器位於I/O空間時，被稱為I/O埠；當暫存器位於記憶體空間時，對應

裴禮文數學分析中的典型問題與方法第5章級數練習

函數定義 var 5.1 blog ots 數學分析整數問題參考解答見: http://www.cnblogs.com/zhangzujin/p/3527416.html 5.1.1 設 $k,i,j$ 都是自然數, 且 $k=i+j$, 試求級數

【vue大師晉級之路第一集：Vue基礎】第5章——Class 與 Style 繫結

Class 與 Style 繫結操作元素的 class 列表和內聯樣式是資料繫結的一個常見需求。因為它們都是屬性，所以我們可以用 v-bind 處理它們：只需要通過表示式計算出字串結果即可。不過，字串拼接麻煩且易錯。因此，在將 v-bind 用於 class 和 style 時，Vue

第5章：作為Web應用：屬性和監聽者/5.4 Servlet屬性的執行緒安全性、請求屬性與請求分派

上下文屬性它不是執行緒安全的，因為它屬於應用所有，全部servlet都都可以修改它，所以在呼叫setAttribute，removeAttribute時要加鎖操作操作方法如：，鎖要針對getServletContext物件請求屬性

易學筆記-Linux命令-第5章：操作檔案和目錄

操作檔案和目錄萬用字元 *：匹配任意多個字元（包括零個或者多個） [[email protected] ~]# ll -l * 列出所有檔案或者目錄，包括目錄中的子目錄或者子檔案 -rw-r--r--. 1 root root

易學筆記-系統分析師考試-第5章資料庫系統/5.5 資料庫設計與建模/5.5.1 資料庫設計階段

資料庫設計階段規劃主要是對資料庫設計的必要性和可行性分析確定資料庫系統在企業和資訊系統中的地位各個資料庫之間的關係需求分析分析資料庫中所涉及的資料、資料特徵、使用頻率、資料量等通常採用

易學筆記-系統分析師考試-第5章資料庫系統/5.4 資料庫控制功能/5.4.5 備份與恢復技術

備份分類按物理裝置冷備份熱備份按備份數量完全備份：整個資料庫的備份增量備份：上一次備份後的發生變化的資料差異備份：上一次完全備份後發生變化的所有資料物理備份

易學筆記-系統分析師考試-第5章資料庫系統/5.5 資料庫設計與建模/5.5.2 實體聯絡模型

實體聯絡模型概念：也稱為E-R模型或者E-R圖包括三個要素實體：用矩形表示，框內標註實體名稱屬性：用橢圓表示，用線連線實體和屬性實體之間的關係：用菱形表示，框內標準聯絡名稱，並用先連線菱形和兩個實體

易學筆記-系統分析師考試-第6章系統配置與效能評價/6.2 儲存器系統/6.2.5 虛擬儲存技術

虛擬儲存技術概念將多個儲存介質（如：硬碟、RAID等）通過一定的手段集中管理，形成統一管理的儲存池，為使用者提供大容量、高資料傳輸性的儲存系統將實際儲存實體和儲存邏輯分開實際使用時只分配邏輯卷，而不用關心資料在哪個物理儲存實體上虛擬儲存的分類按

易學筆記-系統分析師考試-第6章系統配置與效能評價/6.5 流水線技術/6.5.2 流水線效能分析

流水線效能分析吞吐率概念：單位時間內流水線完成的任務數量或輸出的結果數量公式：TP = n/Tk，其中n為任務數量，Tk為任務所用時間假設各段執行時間都為t 實際吞吐量： TP&nbs

易學筆記-系統分析師考試-第6章系統配置與效能評價/6.5 流水線技術/6.5.1 流水線工作原理

增加計算機效能的主要途徑空間並行性：一個處理機內設定多個獨立的操作部件並行工作時間並行性：採用流水線技術實現流水線工作原理流水線技術概念：把一個任務分解為多個順序執行的子任務，不同的子任務由不同的操作部件並行執行

易學筆記-系統分析師考試-第6章系統配置與效能評價/6.5 流水線技術/6.5.3 區域性相關與全域性相關

區域性相關概念：由於程式中往往會出現資料相關，而這類資料對應的指令一般相隔不超過基本快，對程式執行影響小表現：共享資源訪問衝突概念：後一條指令需要使用的資料與前一條指令傳送衝突或者相鄰指令使用了相同的暫存器表現：指令相關訪存運算元相關通用

Java程式設計思想學習(五)----第5章：初始化與清理

隨著計算機革命的發展，“不安全”的程式設計方式已逐漸成為程式設計代價高昂的主因之一。 C++引入了構造囂（constructor）的概念，這是一個在建立物件時被自動呼叫的特殊方法。Java中也採用了構造器，並額外提供了“垃圾回收器”。對於不再使用的記憶體資源，垃圾回收器能自動將其釋放。 5.1 用構造器確

python3-cookbook第5章摘要-檔案與IO

1.如何在迭代一個序列的同時跟蹤正在被處理的元素索引。

2.如何同時迭代多個序列，每次分別從一個序列中取一個元素。

3.如何將一系列排序序列合併後得到一個排序序列並在上面迭代遍歷。

4.使用 print() 函式輸出資料，改變預設的分隔符或者行尾符。

5. 一個檔案中寫入資料，但是前提必須是這個檔案在檔案系統上不存在。 也就是不允許覆蓋已存在的檔案內容。

6.如何讀寫一個gzip或bz2格式的壓縮檔案。

7.在一個固定長度記錄或者資料塊的集合上迭代，而不是在一個檔案中一行一行的迭代。

8.在程式執行時建立一個臨時檔案或目錄，並希望使用完之後可以自動銷燬掉。

9.將一個Python物件序列化為一個位元組流，以便將它儲存到一個檔案、儲存到資料庫或者通過網路傳輸它。

相關推薦

5. 一個檔案中寫入資料，但是前提必須是這個檔案在檔案系統上不存在。也就是不允許覆蓋已存在的檔案內容。