函式的祕密之 函式返回值
一 檔案操作 (----------------------------------------------------------------------)
一 介紹
計算機系統分為:計算機硬體,作業系統,應用程式三部分。
我們用python或其他語言編寫的應用程式若想要把資料永久儲存下來,必須要保存於硬碟中,這就涉及到應用程式要操作硬體,眾所周知,應用程式是無法直接操作硬體的,這就用到了作業系統。作業系統把複雜的硬體操作封裝成簡單的介面給使用者/應用程式使用,其中檔案就是作業系統提供給應用程式來操作硬碟虛擬概念,使用者或應用程式通過操作檔案,可以將自己的資料永久儲存下來。
有了檔案的概念,我們無需再去考慮操作硬碟的細節,只需要關注操作檔案的流程:
1. 開啟檔案,得到檔案控制代碼並賦值給一個變數
2. 通過控制代碼對檔案進行操作
3. 關閉檔案
二 在python中
1. 開啟檔案,得到檔案控制代碼並賦值給一個變數
f=open('a.txt','r',encoding='utf-8') #預設開啟模式就為r
2. 通過控制代碼對檔案進行操作
data=f.read()
3. 關閉檔案
f.close()
三 f=open('a.txt','r')的過程分析
1、由應用程式向作業系統發起系統呼叫open(...)
2、作業系統開啟該檔案,並返回一個檔案控制代碼給應用程式
3、應用程式將檔案控制代碼賦值給變數f
二 開啟檔案的模式
檔案控制代碼 = open('檔案路徑', '模式')
模式可以是以下方式以及他們之間的組合:
Character Meaning
‘r' open for reading (default)
‘w' open for writing, truncating the file first
‘a' open for writing, appending to the end of the file if it exists
‘b' binary mode
‘t' text mode (default)
‘+' open a disk file for updating (reading and writing)
‘U' universal newline mode (for backwards compatibility; should not be used in new code)
1. 開啟檔案的模式有(預設為文字模式):
r ,只讀模式【預設模式,檔案必須存在,不存在則丟擲異常】
w,只寫模式【不可讀;不存在則建立;存在則清空內容】
a, 之追加寫模式【不可讀;不存在則建立;存在則只追加內容】
2. 對於非文字檔案,我們只能使用b模式,"b"表示以位元組的方式操作(而所有檔案也都是以位元組的形式儲存的,使用這種模式無需考慮文字檔案的字元編碼、圖片檔案的jgp格式、視訊檔案的avi格式)
rb
wb
ab
注:以b方式開啟時,讀取到的內容是位元組型別,寫入時也需要提供位元組型別,不能指定編碼
3. 瞭解部分
"+" 表示可以同時讀寫某個檔案
r+, 讀寫【可讀,可寫】
w+,寫讀【可讀,可寫】
a+, 寫讀【可讀,可寫】
x, 只寫模式【不可讀;不存在則建立,存在則報錯】
x+ ,寫讀【可讀,可寫】
xb
三 操作檔案的方法
掌握
f.read() #讀取所有內容,游標移動到檔案末尾
f.readline() #讀取一行內容,游標移動到第二行首部
f.readlines() #讀取每一行內容,存放於列表中
f.write('1111\n222\n') #針對文字模式的寫,需要自己寫換行符
f.write('1111\n222\n'.encode('utf-8')) #針對b模式的寫,需要自己寫換行符
f.writelines(['333\n','444\n']) #檔案模式
f.writelines([bytes('333\n',encoding='utf-8'),'444\n'.encode('utf-8')]) #b模式
瞭解
f.readable() #檔案是否可讀
f.writable() #檔案是否可讀
f.closed #檔案是否關閉
f.encoding #如果檔案開啟模式為b,則沒有該屬性
f.flush() #立刻將檔案內容從記憶體刷到硬碟
f.name
四 檔案內游標移動
一: read(3):
1. 檔案開啟方式為文字模式時,代表讀取3個字元
2. 檔案開啟方式為b模式時,代表讀取3個位元組
二: 其餘的檔案內游標移動都是以位元組為單位如seek,tell,truncate
注意:
1. seek有三種移動方式0,1,2,其中1和2必須在b模式下進行,但無論哪種模式,都是以bytes為單位移動的
2. truncate是截斷檔案,所以檔案的開啟方式必須可寫,但是不能用w或w+等方式開啟,因為那樣直接清空檔案了,所以truncate要在r+或a或a+等模式下測試效果
五 檔案的修改
檔案的資料是存放於硬碟上的,因而只存在覆蓋、不存在修改這麼一說,我們平時看到的修改檔案,都是模擬出來的效果,具體的說有兩種實現方式:
方式一:將硬碟存放的該檔案的內容全部載入到記憶體,在記憶體中是可以修改的,修改完畢後,再由記憶體覆蓋到硬碟(word,vim,nodpad++等編輯器)
import os
with open('a.txt') as read_f,open('.a.txt.swap','w') as write_f:
data=read_f.read() #全部讀入記憶體,如果檔案很大,會很卡
data=data.replace('alex','SB') #在記憶體中完成修改
write_f.write(data) #一次性寫入新檔案
os.remove('a.txt')
os.rename('.a.txt.swap','a.txt')
方式二:將硬碟存放的該檔案的內容一行一行地讀入記憶體,修改完畢就寫入新檔案,最後用新檔案覆蓋原始檔
import os
with open('a.txt') as read_f,open('.a.txt.swap','w') as write_f:
for line in read_f:
line=line.replace('alex','SB')
write_f.write(line)
os.remove('a.txt')
os.rename('.a.txt.swap','a.txt')
- Lambda 函式
Lambda 函式是一種比較小的匿名函式——匿名是指它實際上沒有函式名。
Python 函式通常使用 def a_function_name() 樣式來定義,但對於 lambda 函式,我們根本沒為它命名。這是因為 lambda 函式的功能是執行某種簡單的表示式或運算,而無需完全定義函式。
lambda 函式可以使用任意數量的引數,但表示式只能有一個。
- Map 函式
Map() 是一種內建的 Python 函式,它可以將函式應用於各種資料結構中的元素,如列表或字典。對於這種運算來說,這是一種非常乾淨而且可讀的執行方式。
- Filter 函式
filter 內建函式與 map 函式非常相似,它也將函式應用於序列結構(列表、元組、字典)。二者的關鍵區別在於 filter() 將只返回應用函式返回 True 的元素。
我們不僅評估了每個列表元素的 True 或 False,filter() 函式還確保只返回匹配為 True 的元素。非常便於處理檢查表示式和構建返回列表這兩步。
- Itertools 模組
Python 的 Itertools 模組是處理迭代器的工具集合。迭代器是一種可以在 for 迴圈語句(包括列表、元組和字典)中使用的資料型別。
使用 Itertools 模組中的函式讓你可以執行很多迭代器操作,這些操作通常需要多行函式和複雜的列表理解。關於 Itertools 的神奇之處,請看以下示例:
- Generator 函式
Generator 函式是一個類似迭代器的函式,即它也可以用在 for 迴圈語句中。這大大簡化了你的程式碼,而且相比簡單的 for 迴圈,它節省了很多記憶體。
比如,我們想把 1 到 1000 的所有數字相加,以下程式碼塊的第一部分向你展示瞭如何使用 for 迴圈來進行這一計算。
如果列表很小,比如 1000 行,計算所需的記憶體還行。但如果列表巨長,比如十億浮點數,這樣做就會出現問題了。使用這種 for 迴圈,記憶體中將出現大量列表,但不是每個人都有無限的 RAM 來儲存這麼多東西的。Python 中的 range() 函式也是這麼幹的,它在記憶體中構建列表。
程式碼中第二部分展示了使用 Python generator 函式對數字列表求和。generator 函式建立元素,並只在必要時將其儲存在記憶體中,即一次一個。這意味著,如果你要建立十億浮點數,你只能一次一個地把它們儲存在記憶體中!Python 2.x 中的 xrange() 函式就是使用 generator 來構建列表。
如果你想對列表進行多次迭代,並且它足夠小,可以放進記憶體,那最好使用 for 迴圈或 Python 2.x 中的 range 函式。因為 generator 函式和 xrange 函式將會在你每次訪問它們時生成新的列表值,而 Python 2.x range 函式是靜態的列表,而且整數已經置於記憶體中,以便快速訪問。