hand first python 選讀（2）

阿新 • • 發佈：2018-12-16

檔案讀取與異常

檔案讀取與判斷

os模組是呼叫來處理檔案的。

先從最原始的讀取txt檔案開始吧！

新建一個aaa.txt文件，鍵入如下英文名篇：

Li Lei:"Hello,Han Meimei."
Han Meimei:"Hi,Li Lei.How are you?"
Li Lei:"I am fine,thank you.And you?"

同目錄下建立一個新的file.py文件

import os
os.getcwd()

data=open('aaa.txt')
# 開啟檔案
print(data.readline(),end='')
# 讀取檔案
print(data.readline(), end='')

data.seek(0)
# 又回到最初的起點

for line in data:
    print(line,end='')

結果如下

如果檔案不存在怎麼辦？

import os

if os.path.exists('aaa.txt'):
    # 業務程式碼
else:
    print('error:the file is not existed.')

split切分

現在我們要把這個橋段轉化為第三人稱的形式

for line in data:
    (role,spoken)=line.split(':')
    print(role,end='')
    print(' said:',end='')
    print(spoken,end='')

這裡是個極其簡單對話區分。如果我把對話稍微複雜點

。。。

Han Meimei:"There is a question:shall we go to the bed together?"
(pause)
Li Lei:"Oh,let us go to the bed together!"

關鍵時刻豈可報錯。

首先發現問題出在冒號，split方法允許第二個引數.

以下例項展示了split()函式的使用方法：

#!/usr/bin/python

str = "Line1-abcdef \nLine2-abc \nLine4-abcd";
print str.split( );
print str.split(' ', 1 );

以上例項輸出結果如下：

['Line1-abcdef', 'Line2-abc', 'Line4-abcd']
['Line1-abcdef', '\nLine2-abc \nLine4-abcd']

data = open('aaa.txt')
# 開啟檔案

for line in data:
    (role,spoken)=line.split(':',1)
    print(role,end='')
    print(' said:',end='')
    print(spoken,end='')

取反：not

結果pause解析不了。每一行做多一個判斷。取反用的是not方法，查詢用的是find方法。

Python find() 方法檢測字串中是否包含子字串 str ，如果指定 beg（開始）和 end（結束）範圍，則檢查是否包含在指定範圍內，如果包含子字串返回開始的索引值，否則返回-1。

find()方法語法：
str.find(str, beg=0, end=len(string))

考慮這樣寫

for line in data:
    if not line.find(':')==-1:
        (role,spoken)=line.split(':',1)
        print(role,end='')
        print(' said:',end='')
        print(spoken,end='')
data.close()

關注程式碼本身的目的功能：try...except...捕獲處理異常

劇本里的對話千差萬別，而我只想要人物的對話。不斷增加程式碼複雜度是絕對不明智的。

python遇到程式碼錯誤會以traceback方式告訴你大概出了什麼錯，並中斷處理流程（程式崩了！）。

而try...except...類似try...catch語法，允許程式碼中的錯誤發生，不中斷業務流程。

在上述業務程式碼中我想統一忽略掉所有

只顯示
木有冒號的文字行

可以這麼寫：

for line in data:
    try:
        (role,spoken)=line.split(':',1)
        print(role,end='')
        print(' said:',end='')
        print(spoken,end='')
    except:
        pass

pass是python中的null語句，理解為啥也不做。

通過這個語法，忽略處理掉了所有不必要的複雜邏輯。

複雜系統中，aaa.txt可能是不存在的，你固然可以用if讀取，還有一個更激進（先進）的寫法：

import os

try:
    data = open('aaa.txt')
    # 開啟檔案

    for line in data:
        try:
            (role,spoken)=line.split(':',1)
            print(role,end='')
            print(' said:',end='')
            print(spoken,end='')
        except:
            pass
except:
    print('error:could not read the file.')

兩種邏輯是不一樣的，上述是無法讀取（可能讀取出錯），if是路徑不存在。於是引發了最後一個問題。

錯誤型別指定

過於一般化的程式碼，總是不能很好地判斷就是是哪出了錯。try語句無法判斷：究竟是檔案路徑不對還是別的問題

import os

try:
    data = open('aaa.txt')
    # 開啟檔案

    for line in data:
        try:
            (role,spoken)=line.split(':',1)
            print(role,end='')
            print(' said:',end='')
            print(spoken,end='')
        except ValueError:
            # 引數出錯
            pass
except IOError:
    # 輸入輸出出錯
    print('error:could not find the file.')

python中異常物件有很多，可自行查閱。

資料不符合期望格式：ValueError

IOError：路徑出錯

資料儲存到檔案

業務程式碼工作流程可以儲存到檔案中儲存下來。下面先看一個需求：

分別建立一個名為lilei和hanmeimei的空列表

刪除一個line裡面的換行符(replace方法和js中幾乎一樣。去除左右空格用strip方法)

給出條件和程式碼，根據role的值將line新增到適當的列表中

輸出各自列表。

簡單說就是一個條件查詢的實現。

try:
    data = open('aaa.txt')
    lilei = []
    hanmeimei = []
    for line in data:
        try:
            (role, spoken) = line.split(':', 1)
            spoken = spoken.replace('\n', '')
            if role == 'Li Lei':
                lilei.append(spoken)
            else:
                hanmeimei.append(spoken)
        except ValueError:
            pass
    data.close()
except IOError:
    print('error:the file is not found.')
    
print(lilei)
print(hanmeimei)

很簡單。

寫模式：open('bbb.txt',w')

open方法預設為讀模式open('bbb.txt','r')，寫模式對因為open('bbb.txt','w')。

在同目錄下建立一個bbb.txt

寫入檔案可以用以下命令：

out = open('bbb.txt', 'w')
print('we are who we are.', file=out)
out.close()

檔案訪問模式	釋義
r	讀取，是為預設模式
w	開啟一個檔案，覆寫檔案內容，如沒有則建立。
w+	讀取和追加寫入（不清除）
a	追加寫入

開啟的檔案必須執行關閉！

好了，介紹完知識之後可以在上一節程式碼中分別寫入檔案吧


try:
    data = open('aaa.txt')
    lilei = []
    hanmeimei = []
    for line in data:
        try:
            (role, spoken) = line.split(':', 1)
            spoken = spoken.strip()
            if role == 'Li Lei':
                lilei.append(spoken)
            else:
                hanmeimei.append(spoken)
        except ValueError:
            pass
    data.close()

    try:
        _lilei = open('lilei.txt', 'w')
        _hanmeimei = open('hanmeimei.txt', 'w')

        print(lilei,file=_lilei)
        print(hanmeimei,file=_hanmeimei)

        _lilei.close()
        _hanmeimei.close()
        print('works completed.')
    except IOError:
        print('file error.')
        
except IOError:
    print('error:the file is not found.')

測試成功，但以上程式碼有個問題：我需要無論IOError都執行一套程式碼。並且在檔案建立後關閉

擴充套件try語句

當我嘗試以read模式開啟一個檔案，：

    try:
        data = open('lilei.txt')
    except IOError as err:
        print('file error.'+str(err))
    finally:
        if 'data' in locals():
            _lilei.close()
        print('works completed.')

finally：無論是否執行成功都執行的程式碼。
locals()：告訴你檔案是否成功被建立並開啟。
as xxx：為異常物件命名，並且通過str()轉化為字元以便列印，也是一個賦值過程

實在太麻煩了。

with語句

with語句利用了一個上下文管理協議。有了它就不用些finally了。

目前為止條件查詢的方案是這樣的

# ...

    try:
        _lilei = open('lilei.txt','w')
        _hanmeimei = open('hanmeimei.txt','w')

        print(lilei, file=_lilei)
        print(hanmeimei, file=_hanmeimei)
    except IOError as err:
        print('file error.'+str(err))
    finally:
        if '_lilei' in locals():
            _lilei.close()
        if '_hanmeimei' in locals():
            _hanmeimei.close()
        print('works completed.')

except IOError:
    print('error:the file is not found.')

用with重寫之後：

    try:
        with open('lilei.txt','w') as _lilei:
            print(lilei, file=_lilei)
        with open('hanmeimei.txt','w') as _hanmeimei:        
            print(hanmeimei, file=_hanmeimei)
        print('works completed.')
    except IOError as err:
        print('file error.'+str(err))

寫好之後就非常簡潔了。

因地制宜選擇輸出樣式

對於列表資料來說，直接存字串是很不合適的。現在我要把第二章中的flatten加進來並加以改造。

# base.py

def flatten(_list, count=False, level=0):
    if(isinstance(_list, list)):
        for _item in _list:
            flatten(_item,count,level+1)
    else:
        if count:
            for step in range(level):
                print("\t", end='')
            print(_list)
        else:
            print(_list)

需求：向flatten新增第四個引數，標識資料寫入的位置，並允許預設。

# base.py
def flatten(_list, count=False, level=0,_file=False):
    if(isinstance(_list, list)):
        for _item in _list:
            flatten(_item,count,level+1,_file)
    else:

        if count:
            for step in range(level):
                print("\t", end='',file=_file)
            print(_list,file=_file)
        else:
            print(_list)

呼叫

import base as utils
try:
    data = open('aaa.txt')
    lilei = []
    hanmeimei = []
    for line in data:
        try:
            (role, spoken) = line.split(':', 1)
            spoken = spoken.strip()
            if role == 'Li Lei':
                lilei.append(spoken)
            else:
                hanmeimei.append(spoken)
        except ValueError:
            pass
    data.close()

    try:
        with open('lilei.txt','w') as _lilei:
            utils.flatten(lilei,True,0,_lilei)
        with open('hanmeimei.txt','w') as _hanmeimei:        
            utils.flatten(hanmeimei, True, 0, _hanmeimei)
        print('works completed.')
    except IOError as err:
        print('file error.'+str(err))

    
except IOError:
    print('error:the file is not found.')

輸出成功

把格局拉高點吧，這仍然是一個高度定製化的程式碼。

pickle庫的使用

pickle庫介紹

pickle是python語言的一個標準模組，安裝python後已包含pickle庫，不需要單獨再安裝。

pickle模組實現了基本的資料序列化和反序列化。通過pickle模組的序列化操作我們能夠將程式中執行的物件資訊儲存到檔案中去，永久儲存；通過pickle模組的反序列化操作，我們能夠從檔案中建立上一次程式儲存的物件。

一、記憶體中操作：
import pickle
#dumps 轉化為二進位制檔案
li = [11,22,33]
r = pickle.dumps(li)
print(r)

#loads 將二進位制資料編譯出來
result = pickle.loads(r)
print(result)
二、檔案中操作：
#dump：以二進位制形式開啟（讀取：rb,寫入wb）檔案
li = [11,22,33]
pickle.dump(li,open('db','wb'))

#load
ret = pickle.load(open('db','rb'))
print(ret)

把二進位制檔案寫入檔案中：

    try:
        with open('lilei.txt','wb') as _lilei:
            # utils.flatten(lilei,True,0,_lilei)
            pickle.dump(lilei,_lilei)
        with open('hanmeimei.txt','wb') as _hanmeimei:        
            # utils.flatten(hanmeimei, True, 0, _hanmeimei)
            pickle.dump(hanmeimei,_hanmeimei)
        print('works completed.')
    except IOError as err:
        print('file error.'+str(err))
    
    except pickle.PickleError as pError:
        print('err:'+str(pError))

資料已經被寫入。

舉例說：如何開啟lileii.txt並正確編譯呢？

new_lilei=[]
try:
    with open('lilei.txt','rb') as _new_lilei:
        new_lilei = pickle.load(_new_lilei)
        print(utils.flatten(new_lilei))
except IOError as io:
    print('err:'+str(io))
except pickle.PickleError as pError:
    print('pickleError'+str(pError))

測試成功。

用pickle的通用io才是上策。

hand first python 選讀（2）

檔案讀取與異常檔案讀取與判斷 os模組是呼叫來處理檔案的。先從最原始的讀取txt檔案開始吧！新建一個aaa.txt文件，鍵入如下英文名篇： Li Lei:"Hello,Han Meimei." Han Meimei:"Hi,Li Lei.How are you?" Li Lei:"I am f

hand first python 選讀（1）

列表(list) 基本操作比如說我要整理一個近期熱映的電影列表： movies = ["venom", "My Neighbor Totor", "Aquaman"] print(movies) # ['venom', 'My Neighbor Totor', 'Aquaman'] print(len

head first python選讀（5）

python web 開發犯了低階錯誤，這本書看了一半了才知道書名應為《head first python》,不是hand first.. 現在開始一個web應用。總算是熟悉的內容了。但專案的總體的配置還是有些麻煩的。考慮到Kelly教練的不斷變更的需求，現在需要開發一個網站。包括：

第一個python程序（2）

小結 nts 技術數學公式 spa 但是漂亮 num 回車輸入和輸出輸出用print加上字符串，就可以向屏幕上輸出指定的文字。比如輸出‘hello, world‘，用代碼實現如下： >>> print ‘hello, world‘ print語

53. Python 爬蟲（2）

expires www. als aid rgb user col pri request CookieRequests通過會話信息來獲取cookie信息Cookie的五要素： Name value domain path expires打印cookie

python學習（2）關於字符編碼

英語國標學習 utf for 美國電腦二進制 str 關於字符編碼的學習內容筆記如下： 1、計算機只能用0和1來進行記錄和存儲。計算機是二進制。 2、ASCII（American Standard Code for Information Interchange，美

Python基礎（2）：doc、文檔字符串docString、help()

png Go net dex django index csdn 自定義模塊 pan OS：Windows 10家庭中文版，Python：3.6.4 Python中的文檔字符串（docString）出現在模塊、函數、類的第一行，用於對這些程序進行說明。它在執行的

Python基礎（2）——運算符

系列所有不為相等 int inf 技術分享包括表格一、Python算術運算符以下假設變量a為10，變量b為21：以下實例演示了Python所有算術運算符的操作： 1 #!/usr/bin/python3 2 3 a = 21 4 b = 10

Python基礎（2）：列表

list：列表，python內建的一種資料型別。是一種有序集合，可以隨時新增和刪除其中的元素。 1，列表的定義 li1=[] #定義一個空列表 li2=[1,2,3,'hello'] #數字元素直接新增，字串元素要用括號

Python——列表（2）

文章目錄 1. 列表排序 (1).sort( ) (2).按逆序排列 (3). sorted( ) 2. 雙重列表 3. 小練習 1

Python學習（2）——函式

1、函式的引數（1）要注意定義可變引數和關鍵字引數的語法： *args是可變引數，args接收的是一個tuple； **kw是關鍵字引數，kw接收的是一個dict。（2）呼叫函式時如何傳入可變引數和關鍵字引數的語法：可變引數既可以直接傳入：func(1, 2, 3)，又

python:collections（2）之defaultdict和OrderedDict模組

#defaultdict模組統計序列中元素出現的次數示例1：給定序列users =[“body_1”,“body_2”,“body_3”,“body_4”,“body_1”,“body-3”]統計序列中各個元素出現的次數方法1： user_dict ={} fo

python高階（2）—— 基礎回顧2

回顧知識一作業系統的作用：隱藏醜陋複雜的硬體介面，提供良好的抽象介面管理、排程程序，並且將多個程序對硬體的競爭變得有序關於作業系統的發展史，可以參考我之前的一篇博文：傳送門二多道技術：產生背景：

Python學習（2）—— 運算子與基本資料型別

運算子與基本資料型別運算子有以下五種：算數運算：比較運算：邏輯運算：賦值運算：成員運算：以上圖片轉載來自：http://www.cnblogs.com/wupeiqi/ 。基本資料型別認識數字 (in

使用Visual Studio 2017開發Python程式（2）

建立第一個Hello Word程式（1）開啟Microsoft Visual Studio 2017，依次單擊頂部工具欄中的“檔案”>“新建” >“專案”命令，彈出“新建專案”對話方塊。在左側模板列表中選擇“Python”選項，在右側選擇“Python應用程式”選項。在下方文字

吳裕雄實戰python程式設計（2）

from urllib.parse import urlparse url = 'http://www.pm25x.com/city/beijing.htm'o = urlparse(url)print(o) print("scheme={}".format(o.scheme)) # httpprint

Python練習（2）

問題描述: 220的真因數之和為1+2+4+5+10+11+20+22+44+55+110=284 ， 284的真因數之和為1+2+4+71+142=220 ，畢達哥拉斯把這樣的數對A、B稱為相親數：A的真因數之和為B，而B的真因數之和為A。求100000以

每天一個python段子（2）：一句話http伺服器

0x00 Python版本: python2 ipv4 python -m SimpleHTTPServer 8080 ipv6 python -c "import socket,SocketServer,CGIHTTPServer;SocketServer.TCPSe

Python 學習（2）檔案

與檔案相關的兩個模組中的內建函式：os模組和os.path模組內的函式。 1.模組的概念模組就是實現某類特定功能的一類函式和變數的檔案，字尾名是.py，它可以被其他程式呼叫，呼叫語句是import。 2.os模組 getcwd（）函式：獲取當前工作目錄 chdir（）函式：改變當前目錄 list

python學習（2）——函數語言程式設計

函數語言程式設計的一個特點就是，允許把函式本身作為引數傳入另一個函式，還允許返回一個函式！ Python對函數語言程式設計提供部分支援。由於Python允許使用變數，因此，Python不是純函數語言程

hand first python 選讀（2）

檔案讀取與異常

檔案讀取與判斷

split切分

取反：not

關注程式碼本身的目的功能：try...except...捕獲處理異常

錯誤型別指定

資料儲存到檔案

寫模式：open('bbb.txt',w')

擴充套件try語句

with語句

因地制宜選擇輸出樣式

pickle庫的使用

pickle庫介紹

相關推薦