012 Python語法之檔案操作
阿新 • • 發佈:2019-02-20
檔案
1. 檔案的介紹
- 大多數情況下我們要處理的檔案都是文字檔案
- 其他檔案都是二進位制進行讀寫的
2. 檔案開啟
open函式開啟檔案
file1 = open(檔案路徑)
open引數詳解
- 第一個引數引數路徑
- 第二個引數開啟方式(r(只讀),w(只寫),rb(二進位制讀),a(追加寫入),wb(二進位制寫))
- 返回值是一個檔案物件
3. 檔案讀取三種方式
read函式
file1.read()
read函式引數詳解
- 第一個引數讀取的字元個數,不寫預設全檔案讀取
read函式例子
檔案內容:I Love You!
str1 = file1.read (5)
print(str1)
# 列印:
I Love
readlines函式
fileList = file1.readlines()
readlines函式引數詳解
- 返回值是一個列表,列表元素是每一行的資料
readlines函式例子
檔案內容:
I Love You!
I Love You!
I Love You!
I Love You!
fileList = file1.readlines()
print(fileList)
列印:
[
"I Love You!",
"I Love You!",
"I Love You!",
"I Love You!" ]
readline函式
mystr = myfile.readline()
readline函式
- 返回值為讀取到的一行資料
- 資料為字串格式
- 讀取不到返回None
readline函式例子
檔案內容:
I Love You!
I Love You!
I Love You!
I Love You!
mystr = myfile.readline()
"I Love You!"
4. 檔案寫入(w:覆蓋寫入,a:追加寫入)
write函式
file.write("123")
write函式引數
- 第一個引數為要寫入的字串
5. 檔案關閉
file1.close()
close函式介紹
- close之後才會將資料寫入檔案
6. 緩衝區
- 因為磁碟讀寫次數是有限的,為了保持磁碟的壽命,所以有了緩衝區的概念
file1.flush函式
file1.flush() 資料重新整理到檔案中
flush函式介紹
- 資料實時重新整理
7. file的函式
檔案的方法 | 描述 |
---|---|
f.close() | 關閉檔案(要不然會記憶體洩漏) |
f.read(size=-1) | 從檔案中讀取size個字元,當未給定引數或者給定引數為負數的時候,讀取所有的字元並返回 |
f.readline() | 讀取一行資料,返回值是讀取到的一行資料 |
f.readlines() | 讀取整個檔案所有資料 |
f.write(str) | 將字串str寫入檔案 |
f.writelines(seq) | 向檔案中寫入字串序列seq,seq應該是一個返回字串 |
f.seek(offset, from) | 在檔案中移動檔案指標,從from開始偏移offset個位元組 |
f.tell() | 返回當前在檔案中的位置 |
8. 字串查詢的詳情
find 函式
post = "hello".find("llo")
find 函式詳解
- 如果找不到指定字串就返回-1
find 函式例子
post = "hello".find("llo")
print(post)
# 列印
2
split 函式
myList = "".split(",")
split 函式詳解
- 第一個引數為要按照分割的字元
- 返回值是一個列表
split 函式例子
myList = "123,456,789".split(",")
print(myList)
# 列印
["123","456","789"]
window cmd 資料預覽指令
1. type 檔名(檢視全部資料)
2. more 檔名(檢視檔案按百分比)
資料清洗
- 資料清洗就是將非法資料和資料格式不對的進行剔除
- 好的資料和壞的資料都需要進行儲存
- 中間資料會特別多