6年Python大神總結10個開發技巧，80%的人都不會

阿新 • • 發佈：2020-07-24

今天給大家分享 10 個我平時整理非常實用的 Python 開發小技巧，內容目錄如下：

值得一提的是，這 10 個技巧全部收錄在我自己寫的《Python黑魔法指南》裡

另外要特別注意：光理論是不夠的。這裡順便免費送大家一套2020最新python入門到高階專案實戰視訊教程，可以去小編的Python交流.裙 ：七衣衣九七七巴而五（數字的諧音）轉換下可以找到了，還可以跟老司機交流討教！

1. 如何在執行狀態檢視原始碼？

檢視函式的原始碼，我們通常會使用 IDE 來完成。

比如在 PyCharm 中，你可以 Ctrl + 滑鼠點選進入函式的原始碼。

那如果沒有 IDE 呢？

當我們想使用一個函式時，如何知道這個函式需要接收哪些引數呢？

當我們在使用函式時出現問題的時候，如何通過閱讀原始碼來排查問題所在呢？

這時候，我們可以使用 inspect 來代替 IDE 幫助你完成這些事

# demo.py
import inspect


def add(x, y):
    return x + y

print("===================")
print(inspect.getsource(add))
複製程式碼

執行結果如下

$ python demo.py
===================
def add(x, y):
    return x + y
複製程式碼

2. 如何關閉異常自動關聯上下文？

當你在處理異常時，由於處理不當或者其他問題，再次丟擲另一個異常時，往外丟擲的異常也會攜帶原始的異常資訊。

就像這樣子。

try:
    print(1 / 0)
except Exception as exc:
    raise RuntimeError("Something bad happened")
複製程式碼

從輸出可以看到兩個異常資訊

Traceback (most recent call last):
  File "demo.py", line 2, in <module>
    print(1 / 0)
ZeroDivisionError: division by zero

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "demo.py", line 4, in <module>
    raise RuntimeError("Something bad happened")
RuntimeError: Something bad happened
複製程式碼

如果在異常處理程式或 finally 塊中引發異常，預設情況下，異常機制會隱式工作會將先前的異常附加為新異常的__context__屬性。這就是 Python 預設開啟的自動關聯異常上下文。

如果你想自己控制這個上下文，可以加個 from 關鍵字（from語法會有個限制，就是第二個表示式必須是另一個異常類或例項。），來表明你的新異常是直接由哪個異常引起的。

try:
    print(1 / 0)
except Exception as exc:
    raise RuntimeError("Something bad happened") from exc
複製程式碼

輸出如下

Traceback (most recent call last):
  File "demo.py", line 2, in <module>
    print(1 / 0)
ZeroDivisionError: division by zero

The above exception was the direct cause of the following exception:

Traceback (most recent call last):
  File "demo.py", line 4, in <module>
    raise RuntimeError("Something bad happened") from exc
RuntimeError: Something bad happened
複製程式碼

當然，你也可以通過with_traceback()方法為異常設定上下文__context__屬性，這也能在traceback更好的顯示異常資訊。

try:
    print(1 / 0)
except Exception as exc:
    raise RuntimeError("bad thing").with_traceback(exc)
複製程式碼

最後，如果我想徹底關閉這個自動關聯異常上下文的機制？有什麼辦法呢？

可以使用raise...from None，從下面的例子上看，已經沒有了原始異常

$ cat demo.py
try:
    print(1 / 0)
except Exception as exc:
    raise RuntimeError("Something bad happened") from None
$
$ python demo.py
Traceback (most recent call last):
  File "demo.py", line 4, in <module>
    raise RuntimeError("Something bad happened") from None
RuntimeError: Something bad happened
(PythonCodingTime)
複製程式碼

03. 最快檢視包搜尋路徑的方式

當你使用 import 匯入一個包或模組時，Python 會去一些目錄下查詢，而這些目錄是有優先順序順序的，正常人會使用 sys.path 檢視。

>>> import sys
>>> from pprint import pprint   
>>> pprint(sys.path)
['',
 '/usr/local/Python3.7/lib/python37.zip',
 '/usr/local/Python3.7/lib/python3.7',
 '/usr/local/Python3.7/lib/python3.7/lib-dynload',
 '/home/wangbm/.local/lib/python3.7/site-packages',
 '/usr/local/Python3.7/lib/python3.7/site-packages']
>>> 
複製程式碼

那有沒有更快的方式呢？

我這有一種連 console 模式都不用進入的方法呢？

你可能會想到這種，但這本質上與上面並無區別

[wangbm@localhost ~]$ python -c "print('\n'.join(__import__('sys').path))"

/usr/lib/python2.7/site-packages/pip-18.1-py2.7.egg
/usr/lib/python2.7/site-packages/redis-3.0.1-py2.7.egg
/usr/lib64/python27.zip
/usr/lib64/python2.7
/usr/lib64/python2.7/plat-linux2
/usr/lib64/python2.7/lib-tk
/usr/lib64/python2.7/lib-old
/usr/lib64/python2.7/lib-dynload
/home/wangbm/.local/lib/python2.7/site-packages
/usr/lib64/python2.7/site-packages
/usr/lib64/python2.7/site-packages/gtk-2.0
/usr/lib/python2.7/site-packages
複製程式碼

這裡我要介紹的是比上面兩種都方便的多的方法，一行命令即可解決

[wangbm@localhost ~]$ python3 -m site
sys.path = [
    '/home/wangbm',
    '/usr/local/Python3.7/lib/python37.zip',
    '/usr/local/Python3.7/lib/python3.7',
    '/usr/local/Python3.7/lib/python3.7/lib-dynload',
    '/home/wangbm/.local/lib/python3.7/site-packages',
    '/usr/local/Python3.7/lib/python3.7/site-packages',
]
USER_BASE: '/home/wangbm/.local' (exists)
USER_SITE: '/home/wangbm/.local/lib/python3.7/site-packages' (exists)
ENABLE_USER_SITE: True
複製程式碼

從輸出你可以發現，這個列的路徑會比 sys.path 更全，它包含了使用者環境的目錄。

4. 將巢狀 for 迴圈寫成單行

我們經常會如下這種巢狀的 for 迴圈程式碼

list1 = range(1,3)
list2 = range(4,6)
list3 = range(7,9)
for item1 in list1:
    for item2 in list2:
      	for item3 in list3:
        	  print(item1+item2+item3)
複製程式碼

這裡僅僅是三個 for 迴圈，在實際編碼中，有可能會有更層。

這樣的程式碼，可讀性非常的差，很多人不想這麼寫，可又沒有更好的寫法。

這裡介紹一種我常用的寫法，使用 itertools 這個庫來實現更優雅易讀的程式碼。

from itertools import product
list1 = range(1,3)
list2 = range(4,6)
list3 = range(7,9)
for item1,item2,item3 in product(list1, list2, list3):
    print(item1+item2+item3)
複製程式碼

輸出如下

$ python demo.py
12
13
13
14
13
14
14
15
複製程式碼

5. 如何使用 print 輸出日誌

初學者喜歡使用 print 來除錯程式碼，並記錄程式執行過程。

但是 print 只會將內容輸出到終端上，不能持久化到日誌檔案中，並不利於問題的排查。

如果你熱衷於使用 print 來除錯程式碼（雖然這並不是最佳做法），記錄程式執行過程，那麼下面介紹的這個 print 用法，可能會對你有用。

Python 3 中的 print 作為一個函式，由於可以接收更多的引數，所以功能變為更加強大，指定一些引數可以將 print 的內容輸出到日誌檔案中

程式碼如下：

>>> with open('test.log', mode='w') as f:
...     print('hello, python', file=f, flush=True)
>>> exit()

$ cat test.log
hello, python
複製程式碼

6. 如何快速計算函式執行時間

計算一個函式的執行時間，你可能會這樣子做

import time

start = time.time()

# run the function

end = time.time()
print(end-start)
複製程式碼

你看看你為了計算函式執行時間，寫了幾行程式碼了。

有沒有一種方法可以更方便的計算這個執行時間呢？

有。

有一個內建模組叫 timeit

使用它，只用一行程式碼即可

import time
import timeit

def run_sleep(second):
    print(second)
    time.sleep(second)

# 只用這一行
print(timeit.timeit(lambda :run_sleep(2), number=5))
複製程式碼

執行結果如下

2
2
2
2
2
10.020059824
複製程式碼

7. 利用自帶的快取機制提高效率

快取是一種將定量資料加以儲存，以備迎合後續獲取需求的處理方式，旨在加快資料獲取的速度。

資料的生成過程可能需要經過計算，規整，遠端獲取等操作，如果是同一份資料需要多次使用，每次都重新生成會大大浪費時間。所以，如果將計算或者遠端請求等操作獲得的資料快取下來，會加快後續的資料獲取需求。

為了實現這個需求，Python 3.2 + 中給我們提供了一個機制，可以很方便的實現，而不需要你去寫這樣的邏輯程式碼。

這個機制實現於 functool 模組中的 lru_cache 裝飾器。

@functools.lru_cache(maxsize=None, typed=False)
複製程式碼

引數解讀：

maxsize：最多可以快取多少個此函式的呼叫結果，如果為None，則無限制，設定為 2 的冪時，效能最佳
typed：若為 True，則不同引數型別的呼叫將分別快取。

舉個例子

from functools import lru_cache

@lru_cache(None)
def add(x, y):
    print("calculating: %s + %s" % (x, y))
    return x + y

print(add(1, 2))
print(add(1, 2))
print(add(2, 3))
複製程式碼

輸出如下，可以看到第二次呼叫並沒有真正的執行函式體，而是直接返回快取裡的結果

calculating: 1 + 2
3
3
calculating: 2 + 3
5
複製程式碼

下面這個是經典的斐波那契數列，當你指定的 n 較大時，會存在大量的重複計算

def fib(n):
    if n < 2:
        return n
    return fib(n - 2) + fib(n - 1)
複製程式碼

第六點介紹的 timeit，現在可以用它來測試一下到底可以提高多少的效率。

不使用 lru_cache 的情況下，執行時間 31 秒

import timeit

def fib(n):
    if n < 2:
        return n
    return fib(n - 2) + fib(n - 1)



print(timeit.timeit(lambda :fib(40), number=1))
# output: 31.2725698948
複製程式碼

由於使用了 lru_cache 後，執行速度實在太快了，所以我將 n 值由 30 調到 500，可即使是這樣，執行時間也才 0.0004 秒。提高速度非常顯著。

import timeit
from functools import lru_cache

@lru_cache(None)
def fib(n):
    if n < 2:
        return n
    return fib(n - 2) + fib(n - 1)

print(timeit.timeit(lambda :fib(500), number=1))
# output: 0.0004921059880871326
複製程式碼

8. 在程式退出前執行程式碼的技巧

使用 atexit 這個內建模組，可以很方便的註冊退出函式。

不管你在哪個地方導致程式崩潰，都會執行那些你註冊過的函式。

示例如下

如果clean()函式有引數，那麼你可以不用裝飾器，而是直接呼叫atexit.register(clean_1, 引數1, 引數2, 引數3='xxx')。

可能你有其他方法可以處理這種需求，但肯定比上不使用 atexit 來得優雅，來得方便，並且它很容易擴充套件。

但是使用 atexit 仍然有一些侷限性，比如：

如果程式是被你沒有處理過的系統訊號殺死的，那麼註冊的函式無法正常執行。
如果發生了嚴重的 Python 內部錯誤，你註冊的函式無法正常執行。
如果你手動呼叫了os._exit()，你註冊的函式無法正常執行。

9. 實現類似 defer 的延遲呼叫

在 Golang 中有一種延遲呼叫的機制，關鍵字是 defer，例如下面的示例

import "fmt"

func myfunc() {
    fmt.Println("B")
}

func main() {
    defer myfunc()
    fmt.Println("A")
}
複製程式碼

輸出如下，myfunc 的呼叫會在函式返回前一步完成，即使你將 myfunc 的呼叫寫在函式的第一行，這就是延遲呼叫。

A
B
複製程式碼

那麼在 Python 中否有這種機制呢？

當然也有，只不過並沒有 Golang 這種簡便。

在 Python 可以使用上下文管理器達到這種效果

import contextlib

def callback():
    print('B')

with contextlib.ExitStack() as stack:
    stack.callback(callback)
    print('A')
複製程式碼

輸出如下

A
B
複製程式碼

10. 如何流式讀取數G超大檔案

使用 with...open... 可以從一個檔案中讀取資料，這是所有 Python 開發者都非常熟悉的操作。

但是如果你使用不當，也會帶來很大的麻煩。

比如當你使用了 read 函式，其實 Python 會將檔案的內容一次性的全部載入記憶體中，如果檔案有 10 個G甚至更多，那麼你的電腦就要消耗的記憶體非常巨大。

# 一次性讀取
with open("big_file.txt", "r") as fp:
    content = fp.read()
複製程式碼

對於這個問題，你也許會想到使用 readline 去做一個生成器來逐行返回。

def read_from_file(filename):
    with open(filename, "r") as fp:
        yield fp.readline()
複製程式碼

可如果這個檔案內容就一行呢，一行就 10個G，其實你還是會一次性讀取全部內容。

最優雅的解決方法是，在使用 read 方法時，指定每次只讀取固定大小的內容，比如下面的程式碼中，每次只讀取 8kb 返回。

def read_from_file(filename, block_size = 1024 * 8):
    with open(filename, "r") as fp:
        while True:
            chunk = fp.read(block_size)
            if not chunk:
                break

            yield chunk
複製程式碼

上面的程式碼，功能上已經沒有問題了，但是程式碼看起來程式碼還是有些臃腫。

藉助偏函式和 iter 函式可以優化一下程式碼

from functools import partial

def read_from_file(filename, block_size = 1024 * 8):
    with open(filename, "r") as fp:
        for chunk in iter(partial(fp.read, block_size), ""):
            yield chunk 最後注意：光理論是不夠的。這裡順便免費送大家一套2020最新python入門到高階專案實戰視訊教程，可以去小編的Python交流.裙 ：七衣衣九七七巴而五（數字的諧音）轉換下可以找到了，還可以跟老司機交流討教！