【Python】程式設計筆記8

阿新 • • 發佈：2018-12-24

文章目錄

IO程式設計

一、檔案讀寫

1、讀檔案

（1）open()
（2）read()
（3）close()
（4）try...finally實現
（5）with 語句（強烈推薦）
（6）注意
（7）二進位制檔案
（8）字元編碼——encoding、errors

2、寫檔案

（1）基本
（2）with 語句

二、StringIO 和 BytesIO

1、StringIO
2、BytesIO

1、系統屬性資訊
2、操作檔案和目錄

四、序列化

1、pickle模組
2、JSON模組

（1）class 的序列化

IO程式設計

通常，程式完成 IO 操作會有 Input 和 Output 兩個資料流。Input Stream 就是資料從外面（磁碟、網路）流進記憶體， Output Stream 就是資料從記憶體流到外面去。

分類：同步IO、非同步IO。區別就在於是否等待 IO 執行的結果。

非同步 IO 來編寫程式效能會遠遠高於同步 IO，但是非同步 IO
的缺點是程式設計模型複雜。

一、檔案讀寫

讀寫檔案：請求作業系統開啟一個檔案物件（通常稱為檔案描述符），然後，通過作業系統提供的介面從這個檔案物件中讀取資料（讀檔案），或者把資料寫入這個檔案物件（寫檔案）。

1、讀檔案

步驟：open()、read()、close()

（1）open()

open() 函式傳入檔名和標示符。其中，r 表示只讀。

f = open('E:\codes\python\basic\1.py', 'r')

==》若檔案不存在，則丟擲 IOError 錯誤。

（2）read()

呼叫 read() 方法可一次讀取檔案的全部內容到記憶體中，用一個 str 物件表示。

f.read()

（3）close()

關閉檔案——close() 方法
==》檔案使用完畢後必須關閉，因為檔案物件會佔用作業系統的資源，並且作業系統同一時間能開啟的檔案數量也是有限的。

f.close()

（4）try…finally實現

避免產生IOError的錯誤，而導致後面close()無法呼叫。

try:
    f = open('E:\\codes\\python\\basic\\1.txt', 'r')
    print(f.read())
finally:
    if f:
        f.close()

（5）with 語句（強烈推薦）

簡潔、不用 f.close() 方法

with open('E:\\codes\\python\\basic\\1.txt', 'r') as f:
    print(f.read())

（6）注意

若檔案大，直接呼叫 read() 會導致記憶體爆掉==》read(size)方法，每次最多讀取 size 個位元組的內容；
readline() 函式：每次讀取一行內容；
readlines() 函式：一次讀取所有內容並按行返回 list；

（7）二進位制檔案

二進位制檔案：圖片、視訊等等==》‘rb’模式開啟檔案

f = open('/Users/michael/test.jpg', 'rb')
f.read()
# b'\xff\xd8\xff\xe1\x00\x18Exif\x00\x00...' # 十六進位制表示的位元組

（8）字元編碼——encoding、errors

讀取 GBK 編碼的檔案。==》encoding = ‘gbk’

當遇到 UnicodeDecodeError （檔案中夾雜一些非法編碼的字元）==》errors = ‘ignore’，也就是忽略編碼錯誤。

f = open('/Users/michael/gbk.txt', 'r', encoding='gbk', errors='ignore')

2、寫檔案

（1）基本

open() 函式，標示符為 ‘w’ 或 ‘wb’，表示寫文字檔案或寫二進位制檔案。

f = open('/Users/michael/test.txt', 'w')
f.write('Hello, world!')
f.close()

注意：寫檔案時，作業系統往往不會立刻把資料寫入磁碟，而是放到記憶體快取起來，空閒的時候再慢慢寫入。只有呼叫 close()方法時，作業系統才保證把沒有寫入的資料全部寫入磁碟。

（2）with 語句

可以使用 encoding 引數設定指定的編碼。

with open('/Users/michael/test.txt', 'w') as f:
	f.write('Hello, world!')

二、StringIO 和 BytesIO

1、StringIO

表示在記憶體中讀寫 str。

from io import StringIO
#### 寫入
f = StringIO()
print(f.write('hello'))
print(f.write(' '))
print(f.write('world!'))
# getvalue(): 獲得寫入後的 str
print(f.getvalue())

#### 讀取
f = StringIO('Hello!\nHi!\nGoodbye!')
while True:
    s = f.readline()
    if s == '':
        break
    print(s.strip())

輸出結果

5
1
6
hello world!
Hello!
Hi!
Goodbye!

2、BytesIO

表示在記憶體中讀寫二進位制資料。

from io import BytesIO
### 寫入
f = BytesIO()
print(f.write('中文'.encode('utf-8')))
print(f.getvalue())

### 讀取
f = BytesIO(b'\xe4\xb8\xad\xe6\x96\x87')
print(f.read())

輸出結果

6
b'\xe4\xb8\xad\xe6\x96\x87'
b'\xe4\xb8\xad\xe6\x96\x87'

三、操作檔案和目錄

模組：os
注意：os 模組的某些函式是跟作業系統相關的

1、系統屬性資訊

import os
print(os.name)                  # 作業系統型別
# uname()在 Linux 有，Windows 沒有
# print(os.uname())   			# 獲取詳細的系統資訊
print(os.environ)               # 環境變數
print(os.environ.get('PATH'))   # 獲取某個環境變數的值

2、操作檔案和目錄

在 os 模組和 os.path 模組中 + shutil 模組

print(os.path.abspath('.'))     # 檢視當前目錄的絕對路徑
# 在某個目錄下建立一個新目錄，首先把新目錄的完整路徑表示出來
print(os.path.join('E:\codes\python\\basic', 'testdir'))
## 建立一個目錄
os.mkdir('E:\codes\python\\basic\\1')
## 刪除一個目錄
os.rmdir('E:\codes\python\\basic\\1')
# 對檔案重新命名:
os.rename('test.txt', 'test.py')
# 刪掉檔案:
os.remove('test.py')
# 複製檔案
from shutil import copyfile
copyfile('1.py', '11.py')   # 原始檔 ==》 目標檔案

把兩個路徑合成一個時，不要直接拼字串。==》os.path.join() 函式，可以正確處理不同作業系統的路徑分隔符。

同理，要拆分路徑時==》os.path.split()函式，後一級別總是目錄或檔名。

拆分副檔名——os.path.splitext() 函式

過濾檔案

## 列出所有的.py 檔案
print([x for x in os.listdir('.') if os.path.isfile(x) and os.path.splitext(x)[1] == '.py'])

四、序列化

序列化：把變數從記憶體中變成可儲存或傳輸的過程。在Python中稱為 picking。

反序列化：把變數內容從序列化的物件重新讀到記憶體裡的過程。在Python中稱為 unpicking。

1、pickle模組

把一個物件序列化並寫入檔案。

import pickle
d = dict(name = 'Bob', age = 20, score = 88)
pickle.dumps(d)
# b'\x80\x03}q\x00(X\x04\x00\x00\x00nameq\x01X\x03\x00\x00\x00Bobq\x02X\x03\x00\x00\x00ageq\x03K\x14X\x05\x00\x00\x00scoreq\x04KXu.'

## 序列化到dump.txt檔案中
f = open('dump.txt', 'wb')
pickle.dump(d, f)
f.close()

## 反序列化
f = open('dump.txt', 'rb')
d = pickle.load(f)
f.close()
print(d)

pickle.dumps() 方法：把任意物件序列化成一個bytes，然後就可以把這個 bytes 寫入檔案。
pickle.dump() 方法：直接把物件序列化後寫入一個 file-like Object.

把物件從磁碟讀取到記憶體時。
（1）內容=》bytes=》pickle.loads() 方法反序列化出物件
（2）直接用 pickle.load() 從一個file-like Object 中直接反序列化出物件。

注意：Python不同版本的Pickle可能不相容，所以只能儲存那些不重要的資料，不能成功反序列化也沒關係。

2、JSON模組

序列化的標準化格式：JSON，且比XML快，可以在Web網頁中讀取。

JSON 與 Python的內建資料型別對應如下：

JSON型別	Python型別
{}	dict
[]	list
“string”	str
1234.56	int 或 float
true/false	True/False
null	None

dict 《==》dict

import json
d = dict(name = 'Bob', age = 20, score = 88)
print(json.dumps(d))

json_str = '{"age":20, "score":88, "name":"Bob"}'
print(json.loads(json_str))

（1）class 的序列化

import json
class Student(object):
    def __init__(self, name, age, score):
        self.name = name
        self.age = age
        self.score = score
## 序列化——default引數
s = Student('Bob', 20, 88)
# obj.__dict__：把任意 class 的例項變為 dict
print(json.dumps(s, default=lambda obj: obj.__dict__))

## 反序列化
def dict2student(d):
    return Student(d['name'], d['age'], d['score'])
json_str = '{"age":20, "score":88, "name":"Bob"}'
print(json.loads(json_str, object_hook=dict2student))

【Python】程式設計筆記8

文章目錄 IO程式設計一、檔案讀寫 1、讀檔案（1）open() （2）read() （3）close() （4）try...finally實現（5）w

【Python】程式設計筆記3

一、dict 和 set 1、字典——dict 思想：空間換時間 dict 中的 key 必須是不可變物件（1）定義、初始化在其他語言中也稱為 map，使用鍵 - 值(key - value)儲存，根據key通過hash演算法計算value值，可進行快速查詢。 #

【Python】程式設計筆記2

一、字串和編碼 1、字元編碼過程：ASCII ==》Unicode ==》utf-8 ASCII編碼：一個位元組，127個字元； Unicode將所有語言都統一到一套編碼中，解決了亂碼的問題。Unicode最常用的用 2 個位元組表示一個字元（若要用到非常偏僻

【Python】程式設計筆記1

一、概述 Python 提供了非常完善的基礎程式碼庫: 覆蓋了網路、檔案、GUI、資料庫、文字等大量內容，被形象地稱作“內建電池（ batteries included） ”。 ==》許多功能不必從零編寫，直接使用現成的即可。特點：“優雅”、 “明確”、 “簡單” 編譯執行

【Python】程式設計筆記7

文章目錄面向物件高階程式設計一、__slots__ 二、@property裝飾器三、多重繼承——MixIn 四、定製類——`__xxx__` 1、`__str__()` 與 `__repr__()`

【Python】程式設計筆記6

文章目錄面向物件程式設計（Object Oriented Programming,OOP）一、類（class）和例項（instance）二、資料封裝三、訪問限制四、繼承和多型五、獲取物件資訊

【Python】程式設計筆記5

文章目錄函數語言程式設計（Functional Programming）一、高階函式（Higher-order function）二、map/reduce 1、map() 函式 2、reduce() 函式

【Python】程式設計筆記4

程式碼越少，開發效率越高。高階特性一、切片（slice） 1、list 的切片 ## L 是 0 - 99 的數列 L = list(range(100)) print(L) print(L[:10]) # 前 10 個數 print(L[-10:])

【Python】程式設計筆記11

文章目錄常用內建模組一、datetime模組二、collections模組 1、namedtuple() 函式 2、deque() 函式 3、defaultdict() 函式 4、Ord

【Python】程式設計筆記10

文章目錄正則表示式一、基本使用二、進階——更精確三、re模組 1、match()方法 2、split()——切分字串 3、()——分組 4、貪婪匹配 5、編譯

【Python】程式設計筆記9

文章目錄程序和執行緒一、基礎知識二、多程序（multiprocessing） 1、初體驗 2、Pool（程序池）（1）非阻塞（2）阻塞（4）程式碼解讀

【Python爬蟲學習筆記8-2】MongoDB數據庫操作詳解

參考資料 adding ocl 切換 username 詳解 top .com min 上一篇學習筆記8-1中介紹了MySQL和MongoDB的安裝、啟動和配置，本節我們接著學習有關MongoDB的一些概念、基本操作和在python中的使用。 MongoDB常用概念為更好

【Python】學習筆記——-10、IO程式設計

一、什麼是IO程式設計 IO在計算機中指Input/Output，也就是輸入和輸出。由於程式和執行時資料是在記憶體中駐留，由CPU這個超快的計算核心來執行，涉及到資料交換的地方，通常是磁碟、網路等，就需要IO介面。比如你開啟瀏覽器，訪問新浪首頁，瀏覽器這個程式就需要

【Python】學習筆記十三：函數的參數對應

color 筆記屏幕 *args borde 基於但是 all small 位置傳遞我們在定義函數時候已經對函數進行了參數傳遞調用，但是那只是粗淺的位置傳遞示例 def sum(a,b,c): d = a+b+c return d p

【python】GUI筆記

label屬性 enter mman sel 方法 elf fish 存儲路徑添加圖片 1.Scrapy dmoz開放式人工目錄。（1）創建項目：cmd-cd desktop Scrapy startproject pachong（2）parse接收 2.python如

【Python】學習筆記4-內置函數

打印數字筆記轉換查看判斷 lis clas 函數 ted 1、內置函數 1 print(all([1,2,3,0])) #判斷可叠代對象裏面是否都為真：非零即真非空即真原則 2 print(any([1,2,3,0])) #判斷可叠代對象裏面是否有一個為真：非

【Python】學習筆記4-time、md5、加密base64模塊

數據庫 sta 自己的 pri 時間 decode 不可字符 ftime 1、time # 1、格式化好的時間 2018-1-14 16:42# 2、時間戳是從unix元年到現在所有的秒數# 3、時間元組# 想時間戳和格式化好的時間互相轉換的話，都要先轉成時間元組，然後

【Python】學習筆記4-os、sys模塊

etc 創建記錄 body spa platform pri eas usr 1、os操作系統模塊 1 import os 2 print(os.getcwd()) #獲取當前工作目錄 3 # print(os.chdir("..")) #更改當前目錄.當前目錄

【Python】學習筆記5-操作mysql數據庫pymysql

rod bsp phone utf8 charset delet 建立包含 hone import pymysql#其他數據庫，比如oracle 模塊是pyoracle#1、鏈接數據庫mysq ip 端口號密碼賬戶數據庫#2、建立遊標#3、執行sql#4、獲取結果#

【Python】學習筆記5-利用flask來mock接口

入口輸出端口號 delet app file log asc conf # 1、mock接口# import flask #python的輕量級的開發框架# # 接口，後臺服務的開發# # 在瀏覽器運行http://127.0.0.1:8080/get_user即可，或

【Python】程式設計筆記8

文章目錄

IO程式設計

一、檔案讀寫

1、讀檔案

（1）open()

（2）read()

（3）close()

（4）try…finally實現

（5）with 語句（強烈推薦）

（6）注意

（7）二進位制檔案

（8）字元編碼——encoding、errors

2、寫檔案

（1）基本

（2）with 語句

二、StringIO 和 BytesIO

1、StringIO

2、BytesIO

三、操作檔案和目錄

1、系統屬性資訊

2、操作檔案和目錄

四、序列化

1、pickle模組

2、JSON模組

（1）class 的序列化

相關推薦