1. 程式人生 > >Python提升程序性能的七個手段

Python提升程序性能的七個手段

程序 cas 一次 比較 正則 span 維護 main mpi

1. 使用局部變量

  盡量使用局部變量代替全局變量: 便於維護, 也可以避免不必要的資源浪費

  使用局部變量替換模塊名字空間的變量, 例如: ls = os.linesep. 一方面給可以提高程序性能, 局部變量查找速度更快; 另一方面可以采用簡短標識符代替冗長的模塊變量, 提高可讀性.

2. 減少函數調用次數

  對象類型判斷時, 采用歐冠isinstance()最優, 采用對象類型身份(id())次之, 采用對象值(type())最次之.

#判斷變量num是否為整數類型
type(num) == type(0) #調用三次函數
type(num) is type(0) #
身份比較 isinstance(num,(int)) #調用一次函數

  不要將重復操作的內容作為參數放到循環條件中, 避免重復運算.

#每次循環都需要重新執行len(a)
while i < len(a):
   statement
#len(a)僅執行一次
m = len(a)
while i < m:
   statement

  如果使用某塊X的某一個函數或者對象Y, 應該直接使用from X import Y進行引用, 而不是import X; X.Y進行使用. 這樣在使用Y時, 可以減少一次查詢(解釋器不必首要找到X模塊, 然後再X模塊的字典中查找Y).

3. 采用映射替代條件查詢

  映射(比如dict等)的搜索速度遠快於條件語句(if等).. python中也沒有select-case語句.

#if查找
if a == 1:
   b = 10
elif a == 2:
   b = 20
...
 
#dict查找,性能更優
d = {1:10,2:20,...}
b = d[a]

4. 直接叠代序列元素

  對序列(str, list, tuple等), 直接叠代序列元素, 比叠代元素的索引速度要快.

a = [1,2,3]
#叠代元素
for item in a:
   print(item)
 
#叠代索引 for i in range(len(a)): print(a[i])

5. 采用生成器表達式替代列表解析

  列表解析(list comprehension), 會產生整個列表, 對大量數據的叠代會產生負面效應.

  而生成器表達式則不會, 其不會真正的創建一個列表, 而是返回一個生成器, 在需要時產生一個值(延遲計算), 對內存更加友好.

#計算文件f的非空字符個數
#生成器表達式
l = sum([len(word) for line in f for word in line.split()])
 
#列表解析
l = sum(len(word) for line in f for word in line.split())

6. 先編譯後調用

  使用eval(), exec()函數執行代碼時, 最好調用代碼對象(提前通過compile()函數編譯成字節碼,)而不是直接調用str, 可以避免多次執行重復編譯過程, 提高程序性能.

  正則表達式模式匹配也類似, 也最好先將正則表達式模式編譯成regex對象(通過re.complie

()函數), 然後再執行比較和匹配

7. 模塊編程習慣

  模塊中的最高級Python語句(無縮進的代碼)會在模塊導入(import)時執行(不論其是否真的有必要執行). 因此, 應盡量將模塊所有的功能代碼放到函數中, 包括主程序相關的代碼也可以放到main()函數中, 主程序本身調用main()函數.

  可以在模塊的main()函數中書寫測試的代碼. 在主程序中, 檢測name的值, 如果為"main"(表示模塊是被直接執行, 則調用main()函數進行測試; 如果為模塊名字(表示模塊是被調用),則不進行測試.

Python提升程序性能的七個手段