python入門-2.函式
呼叫函式
Python內建了很多有用的函式,我們可以直接呼叫。
要呼叫一個函式,需要知道函式的名稱和引數,比如求絕對值的函式abs
,只有一個引數。可以直接從Python的官方網站檢視文件:
http://docs.python.org/3/library/functions.html#abs
呼叫abs
函式:
>>> abs(100)
100
>>> abs(-20)
20
>>> abs(12.34)
12.34
呼叫函式的時候,如果傳入的引數數量不對,會報TypeError
的錯誤,並且Python會明確地告訴你:abs()
有且僅有1個引數,但給出了兩個:
>>> abs(1, 2) Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: abs() takes exactly one argument (2 given)
如果傳入的引數數量是對的,但引數型別不能被函式所接受,也會報TypeError
的錯誤,並且給出錯誤資訊:str
是錯誤的引數型別:
>>> abs('a')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: bad operand type for abs(): 'str'
而max
函式max()
可以接收任意多個引數,並返回最大的那個:
>>> max(1, 2) 2 >>> max(2, 3, 1, -5) 3
資料型別轉換
Python內建的常用函式還包括資料型別轉換函式,比如int()
函式可以把其他資料型別轉換為整數:
>>> int('123')
123
>>> int(12.34)
12
>>> float('12.34')
12.34
>>> str(1.23)
'1.23'
>>> str(100)
'100'
>>> bool(1)
True
>>> bool('')
False
函式名其實就是指向一個函式物件的引用,完全可以把函式名賦給一個變數,相當於給這個函式起了一個“別名”:
>>> a = abs # 變數a指向abs函式
>>> a(-1) # 所以也可以通過a呼叫abs函式
1
定義函式
在Python中,定義一個函式要使用def
語句,依次寫出函式名、括號、括號中的引數和冒號:
,然後,在縮排塊中編寫函式體,函式的返回值用return
語句返回。
我們以自定義一個求絕對值的my_abs
函式為例:
def my_abs(x):
if x >= 0:
return x
else:
return -x
請注意,函式體內部的語句在執行時,一旦執行到return
時,函式就執行完畢,並將結果返回。因此,函式內部通過條件判斷和迴圈可以實現非常複雜的邏輯。
如果沒有return
語句,函式執行完畢後也會返回結果,只是結果為None
。return None
可以簡寫為return
。
如果你已經把my_abs()
的函式定義儲存為abstest.py
檔案了,那麼,可以在該檔案的當前目錄下啟動Python直譯器,用from abstest import my_abs
來匯入my_abs()
函式,注意abstest
是檔名(不含.py
副檔名):
空函式
如果想定義一個什麼事也不做的空函式,可以用pass
語句:
def nop():
pass
pass
語句什麼都不做,那有什麼用?實際上pass
可以用來作為佔位符,比如現在還沒想好怎麼寫函式的程式碼,就可以先放一個pass
,讓程式碼能執行起來。
pass
還可以用在其他語句裡,比如:
if age >= 18: pass
缺少了pass
,程式碼執行就會有語法錯誤。
引數檢查
呼叫函式時,如果引數個數不對,Python直譯器會自動檢查出來,並丟擲TypeError
:
>>> my_abs(1, 2)Traceback (most recent call last): File "<stdin>", line 1, in <module>TypeError: my_abs() takes 1 positional argument but 2 were given
但是如果引數型別不對,Python直譯器就無法幫我們檢查。試試my_abs
和內建函式abs
的差別:
>>> my_abs('A')Traceback (most recent call last): File "<stdin>", line 1, in <module> File "<stdin>", line 2, in my_absTypeError: unorderable types: str() >= int()>>> abs('A')Traceback (most recent call last): File "<stdin>", line 1, in <module>TypeError: bad operand type for abs(): 'str'
當傳入了不恰當的引數時,內建函式abs
會檢查出引數錯誤,而我們定義的my_abs
沒有引數檢查,會導致if
語句出錯,出錯資訊和abs
不一樣。所以,這個函式定義不夠完善。
讓我們修改一下my_abs
的定義,對引數型別做檢查,只允許整數和浮點數型別的引數。資料型別檢查可以用內建函式isinstance()
實現:
def my_abs(x): if not isinstance(x, (int, float)): raise TypeError('bad operand type') if x >= 0: return x else: return -x
添加了引數檢查後,如果傳入錯誤的引數型別,函式就可以丟擲一個錯誤:
>>> my_abs('A')Traceback (most recent call last): File "<stdin>", line 1, in <module> File "<stdin>", line 3, in my_absTypeError: bad operand type
返回多個值
函式可以返回多個值嗎?答案是肯定的。
比如在遊戲中經常需要從一個點移動到另一個點,給出座標、位移和角度,就可以計算出新的座標:
import mathdef move(x, y, step, angle=0): nx = x + step * math.cos(angle) ny = y - step * math.sin(angle) return nx, ny
import math
語句表示匯入math
包,並允許後續程式碼引用math
包裡的sin
、cos
等函式。
然後,我們就可以同時獲得返回值:
>>> x, y = move(100, 100, 60, math.pi / 6)>>> print(x, y)151.96152422706632 70.0
但其實這只是一種假象,Python函式返回的仍然是單一值:
>>> r = move(100, 100, 60, math.pi / 6)>>> print(r)(151.96152422706632, 70.0)
原來返回值是一個tuple!但是,在語法上,返回一個tuple可以省略括號,而多個變數可以同時接收一個tuple,按位置賦給對應的值,所以,Python的函式返回多值其實就是返回一個tuple,但寫起來更方便。
小結
定義函式時,需要確定函式名和引數個數;
如果有必要,可以先對引數的資料型別做檢查;
函式體內部可以用return
隨時返回函式結果;
函式執行完畢也沒有return
語句時,自動return None
。
函式可以同時返回多個值,但其實就是一個tuple。
練習
請定義一個函式quadratic(a, b, c)
,接收3個引數,返回一元二次方程 ax2+bx+c=0 的兩個解。
計算平方根可以呼叫math.sqrt()
函式:
函式的引數
Python的函式定義非常簡單,但靈活度卻非常大。除了正常定義的必選引數外,還可以使用預設引數、可變引數和關鍵字引數,使得函式定義出來的介面,不但能處理複雜的引數,還可以簡化呼叫者的程式碼。
位置引數
我們先寫一個計算x2的函式:
def power(x): return x * x
對於power(x)
函式,引數x
就是一個位置引數。
當我們呼叫power
函式時,必須傳入有且僅有的一個引數x
:
>>> power(5)25>>> power(15)225
現在,如果我們要計算x3怎麼辦?可以再定義一個power3
函式,但是如果要計算x4、x5……怎麼辦?我們不可能定義無限多個函式。
你也許想到了,可以把power(x)
修改為power(x, n)
,用來計算xn,說幹就幹:
s = 1 while n > 0: n = n - 1 s = s * x return s
對於這個修改後的power(x, n)
函式,可以計算任意n次方:
>>> power(5, 2)25>>> power(5, 3)125
修改後的power(x, n)
函式有兩個引數:x
和n
,這兩個引數都是位置引數,呼叫函式時,傳入的兩個值按照位置順序依次賦給引數x
和n
。
預設引數
新的power(x, n)
函式定義沒有問題,但是,舊的呼叫程式碼失敗了,原因是我們增加了一個引數,導致舊的程式碼因為缺少一個引數而無法正常呼叫:
>>> power(5)Traceback (most recent call last): File "<stdin>", line 1, in <module>TypeError: power() missing 1 required positional argument: 'n'
這個時候,預設引數就排上用場了。由於我們經常計算x2,所以,完全可以把第二個引數n的預設值設定為2:
def power(x, n=2): s = 1 while n > 0: n = n - 1 s = s * x return s
這樣,當我們呼叫power(5)
時,相當於呼叫power(5, 2)
:
>>> power(5)25>>> power(5, 2)25
而對於n > 2
的其他情況,就必須明確地傳入n,比如power(5, 3)
。
從上面的例子可以看出,預設引數可以簡化函式的呼叫。設定預設引數時,有幾點要注意:
一是必選引數在前,預設引數在後,否則Python的直譯器會報錯(思考一下為什麼預設引數不能放在必選引數前面);
二是如何設定預設引數。
當函式有多個引數時,把變化大的引數放前面,變化小的引數放後面。變化小的引數就可以作為預設引數。
使用預設引數有什麼好處?最大的好處是能降低呼叫函式的難度。
舉個例子,我們寫個一年級小學生註冊的函式,需要傳入name
和gender
兩個引數:
def enroll(name, gender): print('name:', name) print('gender:', gender)
這樣,呼叫enroll()
函式只需要傳入兩個引數:
>>> enroll('Sarah', 'F')name: Sarahgender: F
如果要繼續傳入年齡、城市等資訊怎麼辦?這樣會使得呼叫函式的複雜度大大增加。
我們可以把年齡和城市設為預設引數:
def enroll(name, gender, age=6, city='Beijing'): print('name:', name) print('gender:', gender) print('age:', age) print('city:', city)
這樣,大多數學生註冊時不需要提供年齡和城市,只提供必須的兩個引數:
>>> enroll('Sarah', 'F')name: Sarahgender: Fage: 6city: Beijing
只有與預設引數不符的學生才需要提供額外的資訊:
enroll('Bob', 'M', 7)enroll('Adam', 'M', city='Tianjin')
可見,預設引數降低了函式呼叫的難度,而一旦需要更復雜的呼叫時,又可以傳遞更多的引數來實現。無論是簡單呼叫還是複雜呼叫,函式只需要定義一個。
有多個預設引數時,呼叫的時候,既可以按順序提供預設引數,比如呼叫enroll('Bob', 'M', 7)
,意思是,除了name
,gender
這兩個引數外,最後1個引數應用在引數age
上,city
引數由於沒有提供,仍然使用預設值。
也可以不按順序提供部分預設引數。當不按順序提供部分預設引數時,需要把引數名寫上。比如呼叫enroll('Adam', 'M', city='Tianjin')
,意思是,city
引數用傳進去的值,其他預設引數繼續使用預設值。
預設引數很有用,但使用不當,也會掉坑裡。預設引數有個最大的坑,演示如下:
先定義一個函式,傳入一個list,新增一個END
再返回:
def add_end(L=[]): L.append('END') return L
當你正常呼叫時,結果似乎不錯:
>>> add_end([1, 2, 3])[1, 2, 3, 'END']>>> add_end(['x', 'y', 'z'])['x', 'y', 'z', 'END']
當你使用預設引數呼叫時,一開始結果也是對的:
>>> add_end()['END']
但是,再次呼叫add_end()
時,結果就不對了:
>>> add_end()['END', 'END']>>> add_end()['END', 'END', 'END']
很多初學者很疑惑,預設引數是[]
,但是函式似乎每次都“記住了”上次添加了'END'
後的list。
Python函式在定義的時候,預設引數L
的值就被計算出來了,即[]
,因為預設引數L
也是一個變數,它指向物件[]
,每次呼叫該函式,如果改變了L
的內容,則下次呼叫時,預設引數的內容就變了,不再是函式定義時的[]
了。
定義預設引數要牢記一點:預設引數必須指向不變物件!
要修改上面的例子,我們可以用None
這個不變物件來實現:
def add_end(L=None): if L is None: L = [] L.append('END') return L
現在,無論呼叫多少次,都不會有問題:
>>> add_end()['END']>>> add_end()['END']
為什麼要設計str
、None
這樣的不變物件呢?因為不變物件一旦建立,物件內部的資料就不能修改,這樣就減少了由於修改資料導致的錯誤。此外,由於物件不變,多工環境下同時讀取物件不需要加鎖,同時讀一點問題都沒有。我們在編寫程式時,如果可以設計一個不變物件,那就儘量設計成不變物件。
可變引數
在Python函式中,還可以定義可變引數。顧名思義,可變引數就是傳入的引數個數是可變的,可以是1個、2個到任意個,還可以是0個。
我們以數學題為例子,給定一組數字a,b,c……,請計算a2 + b2 + c2 + ……。
要定義出這個函式,我們必須確定輸入的引數。由於引數個數不確定,我們首先想到可以把a,b,c……作為一個list或tuple傳進來,這樣,函式可以定義如下:
def calc(numbers): sum = 0 for n in numbers: sum = sum + n * n return sum
但是呼叫的時候,需要先組裝出一個list或tuple:
>>> calc([1, 2, 3])14>>> calc((1, 3, 5, 7))84
如果利用可變引數,呼叫函式的方式可以簡化成這樣:
>>> calc(1, 2, 3)14>>> calc(1, 3, 5, 7)84
所以,我們把函式的引數改為可變引數:
def calc(*numbers): sum = 0 for n in numbers: sum = sum + n * n return sum
定義可變引數和定義一個list或tuple引數相比,僅僅在引數前面加了一個*
號。在函式內部,引數numbers
接收到的是一個tuple,因此,函式程式碼完全不變。但是,呼叫該函式時,可以傳入任意個引數,包括0個引數:
>>> calc(1, 2)5>>> calc()0
如果已經有一個list或者tuple,要呼叫一個可變引數怎麼辦?可以這樣做:
>>> nums = [1, 2, 3]>>> calc(nums[0], nums[1], nums[2])14
這種寫法當然是可行的,問題是太繁瑣,所以Python允許你在list或tuple前面加一個*
號,把list或tuple的元素變成可變引數傳進去:
>>> nums = [1, 2, 3]>>> calc(*nums)14
關鍵字傳參
可變引數允許你傳入0個或任意個引數,這些可變引數在函式呼叫時自動組裝為一個tuple。而關鍵字引數允許你傳入0個或任意個含引數名的引數,這些關鍵字引數在函式內部自動組裝為一個dict。請看示例:
def person(name, age, **kw): print('name:', name, 'age:', age, 'other:', kw)
函式person
除了必選引數name
和age
外,還接受關鍵字引數kw
。在呼叫該函式時,可以只傳入必選引數:
>>> person('Michael', 30)name: Michael age: 30 other: {}
也可以傳入任意個數的關鍵字引數:
>>> person('Bob', 35, city='Beijing')name: Bob age: 35 other: {'city': 'Beijing'}>>> person('Adam', 45, gender='M', job='Engineer')name: Adam age: 45 other: {'gender': 'M', 'job': 'Engineer'}
關鍵字引數有什麼用?它可以擴充套件函式的功能。比如,在person
函式裡,我們保證能接收到name
和age
這兩個引數,但是,如果呼叫者願意提供更多的引數,我們也能收到。試想你正在做一個使用者註冊的功能,除了使用者名稱和年齡是必填項外,其他都是可選項,利用關鍵字引數來定義這個函式就能滿足註冊的需求。
和可變引數類似,也可以先組裝出一個dict,然後,把該dict轉換為關鍵字引數傳進去:
>>> extra = {'city': 'Beijing', 'job': 'Engineer'}>>> person('Jack', 24, city=extra['city'], job=extra['job'])name: Jack age: 24 other: {'city': 'Beijing', 'job': 'Engineer'}
當然,上面複雜的呼叫可以用簡化的寫法:
>>> extra = {'city': 'Beijing', 'job': 'Engineer'}>>> person('Jack', 24, **extra)name: Jack age: 24 other: {'city': 'Beijing', 'job': 'Engineer'}
**extra
表示把extra
這個dict的所有key-value用關鍵字引數傳入到函式的**kw
引數,kw
將獲得一個dict,注意kw
獲得的dict是extra
的一份拷貝,對kw
的改動不會影響到函式外的extra
。
命名關鍵字引數
對於關鍵字引數,函式的呼叫者可以傳入任意不受限制的關鍵字引數。至於到底傳入了哪些,就需要在函式內部通過kw
檢查。
仍以person()
函式為例,我們希望檢查是否有city
和job
引數:
def person(name, age, **kw): if 'city' in kw: # 有city引數 pass if 'job' in kw: # 有job引數 pass print('name:', name, 'age:', age, 'other:', kw)
但是呼叫者仍可以傳入不受限制的關鍵字引數:
>>> person('Jack', 24, city='Beijing', addr='Chaoyang', zipcode=123456)
如果要限制關鍵字引數的名字,就可以用命名關鍵字引數,例如,只接收city
和job
作為關鍵字引數。這種方式定義的函式如下:
def person(name, age, *, city, job): print(name, age, city, job)
和關鍵字引數**kw
不同,命名關鍵字引數需要一個特殊分隔符*
,*
後面的引數被視為命名關鍵字引數。
呼叫方式如下:
>>> person('Jack', 24, city='Beijing', job='Engineer')Jack 24 Beijing Engineer
如果函式定義中已經有了一個可變引數,後面跟著的命名關鍵字引數就不再需要一個特殊分隔符*
了:
def person(name, age, *args, city, job): print(name, age, args, city, job)
命名關鍵字引數必須傳入引數名,這和位置引數不同。如果沒有傳入引數名,呼叫將報錯:
>>> person('Jack', 24, 'Beijing', 'Engineer')Traceback (most recent call last): File "<stdin>", line 1, in <module>TypeError: person() missing 2 required keyword-only arguments: 'city' and 'job'
由於呼叫時缺少引數名city
和job
,Python直譯器把前兩個引數視為位置引數,後兩個引數傳給*args
,但缺少命名關鍵字引數導致報錯。
命名關鍵字引數可以有預設值,從而簡化呼叫:
def person(name, age, *, city='Beijing', job): print(name, age, city, job)
由於命名關鍵字引數city
具有預設值,呼叫時,可不傳入city
引數:
>>> person('Jack', 24, job='Engineer')Jack 24 Beijing Engineer
使用命名關鍵字引數時,要特別注意,如果沒有可變引數,就必須加一個*
作為特殊分隔符。如果缺少*
,Python直譯器將無法識別位置引數和命名關鍵字引數:
引數組合
在Python中定義函式,可以用必選引數、預設引數、可變引數、關鍵字引數和命名關鍵字引數,這5種引數都可以組合使用。但是請注意,引數定義的順序必須是:必選引數、預設引數、可變引數、命名關鍵字引數和關鍵字引數。
比如定義一個函式,包含上述若干種引數:
def f1(a, b, c=0, *args, **kw): print('a =', a, 'b =', b, 'c =', c, 'args =', args, 'kw =', kw)def f2(a, b, c=0, *, d, **kw): print('a =', a, 'b =', b, 'c =', c, 'd =', d, 'kw =', kw)
>>> f1(1, 2)a = 1 b = 2 c = 0 args = () kw = {}>>> f1(1, 2, c=3)a = 1 b = 2 c = 3 args = () kw = {}>>> f1(1, 2, 3, 'a', 'b')a = 1 b = 2 c = 3 args = ('a', 'b') kw = {}>>> f1(1, 2, 3, 'a', 'b', x=99)a = 1 b = 2 c = 3 args = ('a', 'b') kw = {'x': 99}>>> f2(1, 2, d=99, ext=None)a = 1 b = 2 c = 0 d = 99 kw = {'ext': None}
最神奇的是通過一個tuple和dict,你也可以呼叫上述函式:
>>> args = (1, 2, 3, 4)>>> kw = {'d': 99, 'x': '#'}>>> f1(*args, **kw)a = 1 b = 2 c = 3 args = (4,) kw = {'d': 99, 'x': '#'}>>> args = (1, 2, 3)>>> kw = {'d': 88, 'x': '#'}>>> f2(*args, **kw)a = 1 b = 2 c = 3 d = 88 kw = {'x': '#'}
所以,對於任意函式,都可以通過類似func(*args, **kw)
的形式呼叫它,無論它的引數是如何定義的。
雖然可以組合多達5種引數,但不要同時使用太多的組合,否則函式介面的可理解性很差。
小結
Python的函式具有非常靈活的引數形態,既可以實現簡單的呼叫,又可以傳入非常複雜的引數。
預設引數一定要用不可變物件,如果是可變物件,程式執行時會有邏輯錯誤!
要注意定義可變引數和關鍵字引數的語法:
*args
是可變引數,args接收的是一個tuple;
**kw
是關鍵字引數,kw接收的是一個dict。
以及呼叫函式時如何傳入可變引數和關鍵字引數的語法:
可變引數既可以直接傳入:func(1, 2, 3)
,又可以先組裝list或tuple,再通過*args
傳入:func(*(1, 2, 3))
;
關鍵字引數既可以直接傳入:func(a=1, b=2)
,又可以先組裝dict,再通過**kw
傳入:func(**{'a': 1, 'b': 2})
。
使用*args
和**kw
是Python的習慣寫法,當然也可以用其他引數名,但最好使用習慣用法。
命名的關鍵字引數是為了限制呼叫者可以傳入的引數名,同時可以提供預設值。
定義命名的關鍵字引數在沒有可變引數的情況下不要忘了寫分隔符*
,否則定義的將是位置引數。
遞迴函式
在函式內部,可以呼叫其他函式。如果一個函式在內部呼叫自身本身,這個函式就是遞迴函式。
舉個例子,我們來計算階乘n! = 1 x 2 x 3 x ... x n
,用函式fact(n)
表示,可以看出:
fact(n)=n!=1\times2\times3\times\cdot\cdot\cdot\times(n-1)\times n=(n-1)!\times n=fact(n-1)\times nfac**t(n)=n!=1×2×3×⋅⋅⋅×(n−1)×n=(n−1)!×n=fac**t(n−1)×n
所以,fact(n)
可以表示為n x fact(n-1)
,只有n=1時需要特殊處理。
於是,fact(n)
用遞迴的方式寫出來就是:
def fact(n): if n==1: return 1 return n * fact(n - 1)
>>> fact(1)1>>> fact(5)120>>> fact(100)93326215443944152681699238856266700490715968264381621468592963895217599993229915608941463976156518286253697920827223758251185210916864000000000000000000000000
如果我們計算fact(5)
,可以根據函式定義看到計算過程如下:
===> fact(5)===> 5 * fact(4)===> 5 * (4 * fact(3))===> 5 * (4 * (3 * fact(2)))===> 5 * (4 * (3 * (2 * fact(1))))===> 5 * (4 * (3 * (2 * 1)))===> 5 * (4 * (3 * 2))===> 5 * (4 * 6)===> 5 * 24===> 120
遞迴函式的優點是定義簡單,邏輯清晰。理論上,所有的遞迴函式都可以寫成迴圈的方式,但迴圈的邏輯不如遞迴清晰。
使用遞迴函式需要注意防止棧溢位。在計算機中,函式呼叫是通過棧(stack)這種資料結構實現的,每當進入一個函式呼叫,棧就會加一層棧幀,每當函式返回,棧就會減一層棧幀。由於棧的大小不是無限的,所以,遞迴呼叫的次數過多,會導致棧溢位。可以試試fact(1000)
:
>>> fact(1000)Traceback (most recent call last): File "<stdin>", line 1, in <module> File "<stdin>", line 4, in fact ... File "<stdin>", line 4, in factRuntimeError: maximum recursion depth exceeded in comparison
解決遞迴呼叫棧溢位的方法是通過尾遞迴優化,事實上尾遞迴和迴圈的效果是一樣的,所以,把迴圈看成是一種特殊的尾遞迴函式也是可以的。
尾遞迴是指,在函式返回的時候,呼叫自身本身,並且,return語句不能包含表示式。這樣,編譯器或者直譯器就可以把尾遞迴做優化,使遞迴本身無論呼叫多少次,都只佔用一個棧幀,不會出現棧溢位的情況。
上面的fact(n)
函式由於return n * fact(n - 1)
引入了乘法表達式,所以就不是尾遞迴了。要改成尾遞迴方式,需要多一點程式碼,主要是要把每一步的乘積傳入到遞迴函式中:
def fact(n): return fact_iter(n, 1)def fact_iter(num, product): if num == 1: return product return fact_iter(num - 1, num * product)
可以看到,return fact_iter(num - 1, num * product)
僅返回遞迴函式本身,num - 1
和num * product
在函式呼叫前就會被計算,不影響函式呼叫。
fact(5)
對應的fact_iter(5, 1)
的呼叫如下:
===> fact_iter(5, 1)===> fact_iter(4, 5)===> fact_iter(3, 20)===> fact_iter(2, 60)===> fact_iter(1, 120)===> 120
小結
使用遞迴函式的優點是邏輯簡單清晰,缺點是過深的呼叫會導致棧溢位。
針對尾遞迴優化的語言可以通過尾遞迴防止棧溢位。尾遞迴事實上和迴圈是等價的,沒有迴圈語句的程式語言只能通過尾遞迴實現迴圈。
Python標準的直譯器沒有針對尾遞迴做優化,任何遞迴函式都存在棧溢位的問題。