第8章：Python計算生態

阿新 • • 發佈：2018-11-30

註明：本系列課程專為全國計算機等級考試二級 Python 語言程式設計考試服務

考綱考點

考綱考點

基本的Python內建函式
瞭解Python計算生態

知識導圖

1、計算思維

人類在認識世界、改造世界過程中表現出三種基本的思維特徵：以實驗和驗證為特徵的實證思維，以物理學科為代表；以推理和演繹為特徵的邏輯思維，以數學學科為代表；以設計和構造為特徵的計算思維，以計算機學科為代表。

計算思維的本質是抽象（Abstraction）和自動化（Automation）

2、程式設計方法論

一個解決複雜問題行之有效的方法被稱作自頂而下的設計方法，其基本思想是以一個總問題開始，試圖把它表達為很多小問題組成的解決方案。再用同樣的技術依次攻破每個小問題，最終問題變得非常小，以至於可以很容易解決。然後只需把所有的碎片組合起來，就可以得到一個程式。

“體育競技分析”例項

兩個球員在一個有四面邊界的場地上用球拍擊球。開始比賽時，其中一個球員首先發球。接下來球員交替擊球，直到可以判定得分為止，這個過程稱為回合。當一名球員未能進行一次合法擊打時，回合結束。

未能打中球的球員輸掉這個回合。如果輸掉這個回合的是發球方，那麼發球權交給另一方；如果輸掉的是接球方，則仍然由這個回合的發球方繼續發球。
總之，每回合結束，由贏得該回合的一方發球。球員只能在他們自己的發球局中得分。首先達到15分的球員贏得一局比賽。

自頂向下設計

自頂向下設計中最重要的是頂層設計。體育競技分析從使用者處得到模擬引數，最後輸出結果。下面是一個基礎設計：

• 步驟1: 列印程式的介紹性資訊；

• 步驟2：獲得程式執行需要的引數：probA, probB, n；

• 步驟3：利用球員A和B的能力值probA和probB，模擬n次比賽；

• 步驟4：輸出球員A和B獲勝比賽的場次及概率。

步驟1 輸出一些介紹資訊，針對提升使用者體驗十分有益。下面是這個步驟的Python程式碼，頂層設計一般不寫出具體程式碼，僅給出函式定義，其中，printIntro()函式列印一些必要的說明。

def main():
    printIntro()

步驟2 獲得使用者輸入。通過函式將輸入語句及輸入格式等細節封裝或隱藏，只需要假設程式如果呼叫了getInputs()函式即可獲取變數probA，probB和n的值。這個函式必須為主程式返回這些值，截止第2步，全部程式碼如下。

def main():
    printIntro()
    probA, probB, n = getInputs()

步驟3 需要使用probA、probB模擬n場比賽。此時，可以採用解決步驟2的類似方法，設計一個simNGames()函式來模擬n場比賽

def main():
    printIntro()
    probA, probB, n = getInputs()
    winsA, winsB = simNGames(n, probA, probB)

步驟4 輸出結果，設計思想類似，仍然只規劃功能和函式，程式碼如下。

def main():
    printIntro()
    probA, probB, n = getInputs()
    winsA, winsB = simNGames(n, probA, probB)
    printSummary(winsA, winsB)

原問題被劃分為了4個獨立的函式：printIntro()，getInputs()，simNGames()和printSummary()。

每層設計中，引數和返回值如何設計是重點，其他細節可以暫時忽略。確定事件的重要特徵而忽略其它細節過程稱為抽象。抽象是一種基本設計方法，自頂向下的設計過程可以看作是發現功能並抽象功能的過程。
printIntro()函式應該輸出一個程式介紹，這個功能的Python程式碼如下，這個函式由Python基本表示式組合，不增加或改變程式結構。

def printIntro():
    print("這個程式模擬兩個選手A和B的某種競技比賽")
    print("程式執行需要A和B的能力值（以0到1之間的小數表示）")

getInputs()函式根據提示得到三個需要返回主程式的值，程式碼如下。

def getInputs():
    a = eval(input("請輸入選手A的能力值(0-1): "))
    b = eval(input("請輸入選手B的能力值(0-1): "))
    n = eval(input("模擬比賽的場次: "))
    return a, b, n

simNGames()函式是整個程式的核心，其基本思路是模擬n場比賽，並跟蹤記錄每個球員贏得了多少比賽。

def simNGames(n, probA, probB):
    winsA, winsB = 0, 0
    for i in range(n):
        scoreA, scoreB = simOneGame(probA, probB)
        if scoreA > scoreB:
            winsA += 1
        else:
            winsB += 1
    return winsA, winsB

程式碼中設計了simOneGame()函式，用於模擬一場比賽，這個函式需要知道每個球員的概率，返回兩個球員的最終得分

接下來需要實現simOneGame()函式。
為了模擬一場比賽，需要根據比賽規則來編寫程式碼，兩個球員A和B持續對攻直至比賽結束。可以採用無限迴圈結構直到比賽結束條件成立。同時，需要跟蹤記錄比賽得分，保留髮球局標記，
在模擬比賽的迴圈中，需要考慮單一的發球權和比分問題，通過隨機數和概率，可以確定發球方是否贏得了比分（random() < prob）。如果球員A發球，那麼需要使用A的概率，接著根據發球結果，更新球員A得分或是將球權交給球員B。

def simOneGame(probA, probB):
    scoreA, scoreB = 0, 0
    serving = "A"
    while not gameOver(scoreA, scoreB):
        if serving == "A":
            if random() < probA:
                scoreA += 1
            else:
                serving="B"
        else:
            if random() < probB:
                scoreB += 1
            else:
                serving="A"
    return scoreA, scoreB

根據比賽規則，當任意一個球員分數達到15分時比賽結束。gameOver()函式實現程式碼如下。

def gameOver(a,b):
    return a==15 or b==15

最後是printSummary()函式，其Python程式碼如下。

def printSummary(winsA, winsB):
    n = winsA + winsB
    print("競技分析開始，共模擬{}場比賽".format(n))
    print("選手A獲勝{}場比賽，佔比{:0.1%}".format(winsA, winsA/n))
    print("選手B獲勝{}場比賽，佔比{:0.1%}".format(winsB, winsB/n))

將上述所有程式碼放在一起，形成了例項全部程式碼。執行結果如下：

>>>
這個程式模擬兩個選手A和B的某種競技比賽
程式執行需要A和B的能力值（以0到1之間的小數表示）
請輸入選手A的能力值(0-1): 0.45
請輸入選手B的能力值(0-1): 0.5
模擬比賽的場次: 1000
競技分析開始，共模擬1000場比賽
選手A獲勝371場比賽，佔比37.1%
選手B獲勝629場比賽，佔比62.9%

結合體育競技例項介紹了自頂向下的設計過程。從問題輸入輸出確定開始，整體設計逐漸向下進行。每一層以大體演算法描述開始，然後逐步細化成程式碼，細節被函式封裝

整個過程可以概括為四個步驟：

步驟1：將演算法表達為一系列小問題；
步驟2：為每個小問題設計介面；
步驟3：通過將演算法表達為介面關聯的多個小問題來細化演算法；
步驟4：為每個小問題重複上述過程。

3、自底向上執行

開展測試的更好辦法也是將程式分成小部分逐個測試
執行中等規模程式的最好方法是從結構圖最底層開始，而不是從頂部開始，然後逐步上升。或者說，先執行和測試每一個基本函式，再測試由基礎函式組成的整體函式，這樣有助於定位錯誤
可以從gameOver()函式開始測試。Python 直譯器提供import 保留字輔助開展單元測試，語法格式如下：

import <原始檔名稱>

>>>import MatchAnalysis
>>>MatchAnalysis.gameOver(15, 10)
True
>>>MatchAnalysis.gameOver(10, 1)
False

初步測試說明gameOver()函式是正確的。進一步測試simOneGame()函式，如下：

>>>import e151MatchAnalysis
>>>e151MatchAnalysis.simOneGame(.45, .5)
(9, 15)
>>>e151MatchAnalysis.simOneGame(.45, .5)
(15, 13)

通過繼續進行這樣的單元測試可以檢測程式中的每個函式。獨立檢驗每個函式更容易發現錯誤。通過模組化設計可以分解問題使編寫複雜程式成為可能，通過單元測試方法分解問題使執行和除錯複雜程式成為可能。
自頂向下和自底向上貫穿程式設計和執行的整個過程。

4、計算生態

近20年的開源運動產生了深植於各資訊科技領域的大量可重用資源，直接且有力的支撐了資訊科技超越其他技術領域的發展速度，形成了“計算生態”。
Python語言從誕生之初致力於開源開放，建立了全球最大的程式設計計算生態。
Python官方網站提供了第三方庫索引功能（PyPI，the Python Package Index），網址如下：

https://pypi.python.org/pypi

該頁面列出了Python語言超過12萬個第三方庫的基本資訊，這些函式庫覆蓋資訊領域技術所有技術方向。
由於Python有非常簡單靈活的程式設計方式，很多采用C、C++等語言編寫的專業庫可以經過簡單的介面封裝供Python語言程式呼叫。這樣的粘性功能使得Python語言成為了各類程式語言之間的介面，Python語言也被稱為“膠水語言”。

Python標準庫

有一部分Python計算生態隨Python安裝包一起釋出，使用者可以隨時使用，被稱為Python標準庫。
受限於Python安裝包的設定大小，標準庫數量270個左右。

Python第三方庫

更廣泛的Python計算生態採用額外安裝方式服務使用者，被稱為Python第三方庫。這些第三方庫由全球各行業專家、工程師和愛好者開發，沒有頂層設計，由開發者採用“盡力而為”的方式維護。Python通過新一代安裝工具pip管理大部分Python第三方庫的安裝。

5、基本的Python內建函式

官方教材上使用的版本說Python直譯器提供了68個內建函式（下面介紹31個）
所有內建函式的詳細介紹以及舉例請查閱 -> Python內建函式查詢

函式名稱	函式說明
abs(x)	x的絕對值，如果x是複數，返回複數的模
all(x)	組合型別變數x中所有元素都為真時返回True，否則返回False；若x為空，返回True
any(x)	組合型別變數x中任一元素都為真時返回True，否則返回False；若x為空，返回False
bin(x)	將整數x轉換為等值的二進位制字串，bin(1010)的結果是'0b1111110010'
bool(x)	將x轉換為Boolean型別，即True或False，bool('') 的結果是False
chr(i)	返回Unicode為i的字元，chr(9996)的結果是'✌'
complex(r,i)	建立一個複數 r + i*1j，其中i可以省略，complex(10,10)的結果是10+10j
dict()	建立字典型別，dict()的結果是一個空字典{}
divmod(a,b)	返回a和b的商及餘數，divmod(10,3)結果是一個(3,1)
eval(s)	計算字串s作為Python表示式的值，eval('1+99')的結果是100
exec(s)	計算字串s作為Python語句的值，exec('a = 1+999')執行後，變數a的值為1000
float(x)	將x轉換成浮點數，float(1010)的結果是1010.0
hex(x)	將整數轉換為16進位制字串，hex(1010)的結果是'0x3f2'
input(s)	獲取使用者輸入，其中s是字串，作為提示資訊，s可選
int(x)	將x轉換成整數，int(9.9)的結果是9
list(x)	建立或將變數x轉換成一個列表型別，list({10,9,8})的結果是[8,9,10]
max(a1,a2,…)	返回引數的最大值，max(1,2,3,4,5)的結果是5
min(a1,a2,…)	返回引數的最小值，min(1,2,3,4,5)的結果是1
oct(x)	將整數x轉換成等值的八進位制字串形式，oct(1010)的結果是'0o1762'
open(fname, m)	開啟檔案，包括文字方式和二進位制方式等，其中，m部分可以省略，預設是以文字可讀形式開啟
ord(c)	返回一個字元的Unicode編碼值，ord('字')的結果是23383
pow(x,y)	返回x的y次冪，pow(2,pow(2,2))的結果是16
print(x)	列印變數或字串x，print()的end引數用來表示輸出的結尾字元
range(a,b,s)	從a到b(不含)以s為步長產生一個序列，list(range(1,10,3))的結果是[1, 4, 7]
reversed(r)	返回組合型別r的逆序迭代形式，for i in reversed([1,2,3])將逆序遍歷列表
round(n)	四捨五入方式計算n，round(10.6)的結果是11
set(x)	將組合資料型別x轉換成集合型別，set([1,1,1,1])的結果是{1}
sorted(x)	對組合資料型別x進行排序，預設從小到大，sorted([1,3,5,2,4])的結果是[1,2,3,4,5]
str(x)	將x轉換為等值的字串型別，str(0x1010)的結果是'4112'
sum(x)	對組合資料型別x計算求和結果，sum([1,3,5,2,4])的結果是15
type(x)	返回變數x的資料型別，type({1:2})的結果是<class 'dict'>

6、例項解析：Web頁面元素提取

Web頁面，一般是HTML頁面，是Internet組織資訊的基礎元素。Web頁面元素提取是一類常見問題，在網路爬蟲、瀏覽器等程式中有著不可或缺的重要作用。
HTML指超文字標記語言，嚴格來說，HTML不是一種程式語言，而是一種對資訊的標記語言，對Web的內容、格式進行描述。
自動地從一個連結獲取HTML頁面是網路爬蟲的功能，本例項功能可以整體分成如下4個步驟：

• 步驟1: 讀取儲存在本地的html檔案；

• 步驟2：解析並提取其中的圖片連結；

• 步驟3：輸出提取結果到螢幕；

• 步驟4：儲存提取結果為檔案。

根據上述步驟，可以寫出主程式如下。其中設定了4個函式getHTMLlines()、extractImageUrls()、showResults()和saveResults()分別對應上述4個步驟。

def main():
    inputfile = 'nationalgeographic.html'
    outputfile = 'nationalgeographic-urls.txt'
    htmlLines = getHTMLlines(inputfile)
    imageUrls = extractImageUrls(htmlLines)
    showResults(imageUrls)
    saveResults(outputfile, imageUrls)

定義main()函式的目的是為了讓程式碼更加清晰，作為主程式，也可以不採用函式形式而直接編寫。main()前兩行分別制定了擬獲取HTML檔案的路徑和結果輸出路徑。
主函式設計完成後，逐一編寫各函式功能。
getHTMLlines()函式讀取HTML檔案並內容，並將結果轉換為一個分行列表，為了相容不同編碼，建議在open()函式中增加encoding欄位，設定採用UTF-8編碼開啟檔案。程式碼如下。

def getHTMLlines(htmlpath):
    f = open(htmlpath, "r", encoding='utf-8')
    ls = f.readlines()
    f.close()
    return ls

extractImageUrls()是程式的核心，用於解析檔案並提取影象的URL。觀察HTML可以發現，影象採用img標籤表示，例如：

<img title="photo story"
src="http://image.nationalgeographic.com.cn/2018/0122/20
180122042251164.jpg" width="968px" />

其中，<img開頭是影象標籤的特點，其中由src=所引導的URL是這個影象的真實位置。每個URL都以http開頭。因此，可以通過字串操作提取其中的影象連結。

def extractImageUrls(htmllist):
    urls = []
    for line in htmllist:
        if 'img' in line:
            url = line.split('src=')[-1].split('"')[1]
            if 'http' in url:
                urls.append(url)
    return urls

showResults()函式將獲取的連結輸出到螢幕上，增加一個計數變數提供更好使用者體驗，程式碼如下。

def showResults(urls):
    count = 0
    for url in urls:
        print('第{:2}個URL:{}'.format(count, url))
        count += 1

saveResults()儲存結果到檔案，程式碼如下。

def saveResults(filepath, urls):
    f = open(filepath, "w")
    for url in urls:
        f.write(url+"\n")
    f.close()

各部分函式程式碼編寫後，全部程式碼功能具備，需要額外呼叫main()函式

def getHTMLlines(htmlpath):
    f = open(htmlpath, "r", encoding='utf-8')
    ls = f.readlines()
    f.close()
    return ls

def extractImageUrls(htmllist):
    urls = []
    for line in htmllist:
        if 'img' in line:
            url = line.split('src=')[-1].split('"')[1]
            if 'http' in url:
                urls.append(url)
    return urls
    
def showResults(urls):
    count = 0
    for url in urls:
        print('第{:2}個URL:{}'.format(count, url))
        count += 1
    
def saveResults(filepath, urls):
    f = open(filepath, "w")
    for url in urls:
        f.write(url+"\n")
    f.close()
    
def main():
    inputfile  = 'nationalgeographic.html'
    outputfile = 'nationalgeographic-urls.txt'
    htmlLines = getHTMLlines(inputfile)
    imageUrls = extractImageUrls(htmlLines)
    showResults(imageUrls)
    saveResults(outputfile, imageUrls)

main()

>>> 

第 0個URL:http://image.nationalgeographic.com.cn/2018/0122/20180122042251164.jpg
第 1個URL:http://image.nationalgeographic.com.cn/2018/0122/20180122120753804.jpg
第 2個URL:http://image.nationalgeographic.com.cn/2018/0122/20180122102058707.jpg
第 3個URL:http://image.nationalgeographic.com.cn/2018/0118/20180118124326995.jpg
第 4個URL:http://image.nationalgeographic.com.cn/2018/0116/20180116112407593.jpg
第 5個URL:http://image.nationalgeographic.com.cn/2018/0122/20180122035438691.jpg
第 6個URL:http://image.nationalgeographic.com.cn/2018/0118/20180118040311659.jpg
第 7個URL:http://image.nationalgeographic.com.cn/2018/0117/20180117022633730.jpg
第 8個URL:http://image.nationalgeographic.com.cn/2018/0115/20180115024334826.jpg
第 9個URL:http://image.nationalgeographic.com.cn/2018/0112/20180112025424524.png
第10個URL:http://image.nationalgeographic.com.cn/2018/0122/20180122105741158.jpg
#下面省去40個URL

本章小結

本章主要講解程式設計方法學，包括計算思維、自頂向下設計和自底向上執行等，進一步本章介紹了計算生態的概念及Python標準庫和第三方庫的劃分。通過Web頁面元素提取的例項幫助讀者理解自頂向下設計的基本方法。

從最基本的IPO到自頂向下設計，是否感受到了函數語言程式設計的優勢？

第8章：Python計算生態

註明：本系列課程專為全國計算機等級考試二級 Python 語言程式設計考試服務目錄考綱考點知識導圖 1、計算思維 2、程式設計方法論自頂向下設計 3、自底向上執行 4、計算生態 Python標準庫 Python第三方庫 5、基本的Python內

第四天：Python計算生態及 turtle(海龜）的使用

如有錯誤，請聯絡博主進行更改。 Python計算生態 Python計算生態 = 標準庫 + 第三方庫標準庫：隨直譯器直接安裝到作業系統中的操作模組第三方庫：需要經過安裝才能使用的功能模組庫-Library 包-Package 模組-Module

第8章：Shell腳本歸檔與壓縮

extract config 生成 -- dir exclude 硬盤分區 txt name 第8章：Shell腳本歸檔與壓縮　　定期備份不可小視，我們可以通過shell腳本來實現備份自動化。其中數據備份一般要使用到歸檔與壓縮，歸檔與壓縮對於系統

《.NET 設計規範》第 8 章：使用規範

lin add 技術具體類行數據數據 align 復制程序第 8 章：使用規範 8.1 數組　　要在公共 API 中優先使用集合，避免使用數組。　　不要使用只讀的數組字段。雖然字段本身是只讀的，用戶不能修改它們，但用戶可以修改數組中的元素。　　考慮使

MOOC清華《面向對象程序設計》第8章：用代理模式實現延遲初始化

blank ngx cin www. oci 初始化 lanp margin 程序 Z9閃5PFVL衣坑9http://shequ.docin.com/zdfi78227 哦3O8b4z宦塹7http://huiyi.docin.com/dvok6368 W34搜6csiy

MOOC清華《面向對象程序設計》第8章：棧的實現（采用模板實例化）

com mooc html 程序 ndt wot 面向 tar dmz 3lztmo1xf豪已4茲6http://www.zcool.com.cn/collection/ZMTkxNTY1OTI=.html 6桓50勞爻拍62誹喜0栽2http://www.zcool.c

MOOC清華《面向對象程序設計》第8章：智能指針與引用計數實驗

cst .com xtu w3c www. use sina com wxs s36aj3靖錘端垂淖洶http://docstore.docin.com/gxqnm86068a3350米虜姿椒蝕蛋http://weibo.com/u/6195707998rfg9h8劫咨鋼咆

第五章：Python 之 RabbitMQ消息持久化

rabbitmq#測試RabbitMQ消息永久化 #1. 分隊列永久化和信息永久化 #2. 意思為當服務重啟後，隊列和消息還存在，可供客戶端接受 #3. 在服務器查看消息隊列命令./rabbitmqctl list_queues #send 端 import pika credentials = pik

第五章：Python 之 RabbitMQ 基本示例

rabbitmq#send 端import pikacredentials = pika.PlainCredentials(‘root‘, ‘Password1‘)connection = pika.BlockingConnection(pika.ConnectionParameters(‘10.3.151.

第1章：Python程式設計基礎

變數和賦值語句在同一條賦值語句中可以引入多個變數交換變數 a 和 b 的值

易學筆記-Linux命令-第8章：從shell眼中看世界

第8章：從shell眼中看世界/8.0 echo：單詞分割機制 echo：單詞分割機制格式：echo 結果集，這裡的結果集可能是某個字串：abc 多個字串：abc edf 命令結果： ls

第2章： Python語言基本語法元素

目錄考綱考點知識導圖 1、程式的格式框架縮排註釋 2、語法元素的名稱變數命名保留字 3、資料型別資料型別概述數字型別字串 4、程式的語句元素表示式賦值語句其他語句分支語句迴圈語句 5、基

第11章：Python第三方庫縱覽

註明：本系列課程專為全國計算機等級考試二級 Python 語言程式設計考試服務目錄考綱考點知識導圖 1、網路爬蟲方向 requests scrapy 2、資料分析方向 numpy scipy pandas 3、文字處理方向 pdfminer

第10章：Python第三方庫概覽

註明：本系列課程專為全國計算機等級考試二級 Python 語言程式設計考試服務目錄考綱考點知識導圖 1、Python第三方庫的獲取和安裝 pip工具安裝自定義安裝檔案安裝 Python第三方庫的獲取和安裝 pip工具使用 2、PyInstalle

第9章：Python標準庫概覽

註明：本系列課程專為全國計算機等級考試二級 Python 語言程式設計考試服務目錄考綱考點知識導圖 1、turtle庫概述 turtle庫與基本繪圖窗體函式畫筆狀態函式畫筆運動函式 2、random庫概述 random庫與隨機數運用 3、t

第1章：Python語言介紹/1.1 如何學習一門新開發語言

* 如何學習一門新開發語言 1. 學習新語言套路 1. 瞭解語言背景：是幹什麼的？ 2. 安裝環境 1. 下載安裝包：Python-3.7.1.tar.xz、JDK、 2. 找一款好用的IDE： 1. JAVA：eclipse/myec

(8) 第8章：flask之其他模組

**url_for()**函式最簡單的用法是以檢視函式名作為引數，返回對應的url 實際上就是通過路由endpoint的反url機制實現，通過檢視函式名獲取對應url **redirect(url)**重定向跳轉到對應的url **flash(‘message’

精通Excel資料統計與分析 - 摘要（第8章：時間序列預測）

一、時間序列預測 8.1 簡介時間序列預測法：也稱歷史引申預測法，是以時間數列所能反映的社會經濟現象的發展過程和規律性進行引申外推，預測其發展趨勢的方法； 8.2 移動平均法預測有三種：簡單移動平均法、加權移動平均法、中心移動平均預測法。

《Flask 入門教程》第 8 章：使用者認證

目前為止，雖然程式的功能大部分已經實現，但還缺少一個非常重要的部分——使用者認證保護。頁面上的編輯和刪除按鈕是公開的，所有人都可以看到。假如我們現在把程式部署到網路上，那麼任何人都可以執行編輯和刪除條目的操作，這顯然是不合理的。這一章我們會為程式新增使用者認證功能，這會把使用者分成兩類，一類是管理員，通過使

第三章：python專案的結構和包的建立

python專案的結構和包的建立在python的圈子裡，有許多人無償得公開自己開發的程式庫，使用者可以通過pip 命令來安裝這些庫，我們在釋出時需要將其建立成一種特殊的檔案，這種檔案就是程式包，我們將會在本節學到程式包的製作流程： python專案目

第8章：Python計算生態

考綱考點

知識導圖

1、計算思維

2、程式設計方法論

自頂向下設計

3、自底向上執行

4、計算生態

Python標準庫

Python第三方庫

5、基本的Python內建函式

6、例項解析：Web頁面元素提取

本章小結

相關推薦