1. 程式人生 > 其它 >python入門-2.函式

python入門-2.函式

呼叫函式

Python內建了很多有用的函式,我們可以直接呼叫。

要呼叫一個函式,需要知道函式的名稱和引數,比如求絕對值的函式abs,只有一個引數。可以直接從Python的官方網站檢視文件:

http://docs.python.org/3/library/functions.html#abs

呼叫abs函式:

>>> abs(100)
100
>>> abs(-20)
20
>>> abs(12.34)
12.34

呼叫函式的時候,如果傳入的引數數量不對,會報TypeError的錯誤,並且Python會明確地告訴你:abs()有且僅有1個引數,但給出了兩個:

>>> abs(1, 2)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: abs() takes exactly one argument (2 given)

如果傳入的引數數量是對的,但引數型別不能被函式所接受,也會報TypeError的錯誤,並且給出錯誤資訊:str是錯誤的引數型別:

>>> abs('a')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: bad operand type for abs(): 'str'

max函式max()可以接收任意多個引數,並返回最大的那個:

>>> max(1, 2)
2
>>> max(2, 3, 1, -5)
3

資料型別轉換

Python內建的常用函式還包括資料型別轉換函式,比如int()函式可以把其他資料型別轉換為整數:

>>> int('123')
123
>>> int(12.34)
12
>>> float('12.34')
12.34
>>> str(1.23)
'1.23'
>>> str(100)
'100'
>>> bool(1)
True
>>> bool('')
False

函式名其實就是指向一個函式物件的引用,完全可以把函式名賦給一個變數,相當於給這個函式起了一個“別名”:

>>> a = abs # 變數a指向abs函式
>>> a(-1) # 所以也可以通過a呼叫abs函式
1

定義函式

在Python中,定義一個函式要使用def語句,依次寫出函式名、括號、括號中的引數和冒號:,然後,在縮排塊中編寫函式體,函式的返回值用return語句返回。

我們以自定義一個求絕對值的my_abs函式為例:

def my_abs(x):
    if x >= 0:
        return x
    else:
        return -x

請注意,函式體內部的語句在執行時,一旦執行到return時,函式就執行完畢,並將結果返回。因此,函式內部通過條件判斷和迴圈可以實現非常複雜的邏輯。

如果沒有return語句,函式執行完畢後也會返回結果,只是結果為Nonereturn None可以簡寫為return

如果你已經把my_abs()的函式定義儲存為abstest.py檔案了,那麼,可以在該檔案的當前目錄下啟動Python直譯器,用from abstest import my_abs來匯入my_abs()函式,注意abstest是檔名(不含.py副檔名):

空函式

如果想定義一個什麼事也不做的空函式,可以用pass語句:

def nop():
    pass

pass語句什麼都不做,那有什麼用?實際上pass可以用來作為佔位符,比如現在還沒想好怎麼寫函式的程式碼,就可以先放一個pass,讓程式碼能執行起來。

pass還可以用在其他語句裡,比如:

if age >= 18:    pass

缺少了pass,程式碼執行就會有語法錯誤。

引數檢查

呼叫函式時,如果引數個數不對,Python直譯器會自動檢查出來,並丟擲TypeError

>>> my_abs(1, 2)Traceback (most recent call last):  File "<stdin>", line 1, in <module>TypeError: my_abs() takes 1 positional argument but 2 were given

但是如果引數型別不對,Python直譯器就無法幫我們檢查。試試my_abs和內建函式abs的差別:

>>> my_abs('A')Traceback (most recent call last):  File "<stdin>", line 1, in <module>  File "<stdin>", line 2, in my_absTypeError: unorderable types: str() >= int()>>> abs('A')Traceback (most recent call last):  File "<stdin>", line 1, in <module>TypeError: bad operand type for abs(): 'str'

當傳入了不恰當的引數時,內建函式abs會檢查出引數錯誤,而我們定義的my_abs沒有引數檢查,會導致if語句出錯,出錯資訊和abs不一樣。所以,這個函式定義不夠完善。

讓我們修改一下my_abs的定義,對引數型別做檢查,只允許整數和浮點數型別的引數。資料型別檢查可以用內建函式isinstance()實現:

def my_abs(x):    if not isinstance(x, (int, float)):        raise TypeError('bad operand type')    if x >= 0:        return x    else:        return -x

添加了引數檢查後,如果傳入錯誤的引數型別,函式就可以丟擲一個錯誤:

>>> my_abs('A')Traceback (most recent call last):  File "<stdin>", line 1, in <module>  File "<stdin>", line 3, in my_absTypeError: bad operand type

返回多個值

函式可以返回多個值嗎?答案是肯定的。

比如在遊戲中經常需要從一個點移動到另一個點,給出座標、位移和角度,就可以計算出新的座標:

import mathdef move(x, y, step, angle=0):    nx = x + step * math.cos(angle)    ny = y - step * math.sin(angle)    return nx, ny

import math語句表示匯入math包,並允許後續程式碼引用math包裡的sincos等函式。

然後,我們就可以同時獲得返回值:

>>> x, y = move(100, 100, 60, math.pi / 6)>>> print(x, y)151.96152422706632 70.0

但其實這只是一種假象,Python函式返回的仍然是單一值:

>>> r = move(100, 100, 60, math.pi / 6)>>> print(r)(151.96152422706632, 70.0)

原來返回值是一個tuple!但是,在語法上,返回一個tuple可以省略括號,而多個變數可以同時接收一個tuple,按位置賦給對應的值,所以,Python的函式返回多值其實就是返回一個tuple,但寫起來更方便。

小結

定義函式時,需要確定函式名和引數個數;

如果有必要,可以先對引數的資料型別做檢查;

函式體內部可以用return隨時返回函式結果;

函式執行完畢也沒有return語句時,自動return None

函式可以同時返回多個值,但其實就是一個tuple。

練習

請定義一個函式quadratic(a, b, c),接收3個引數,返回一元二次方程 ax2+bx+c=0 的兩個解。

計算平方根可以呼叫math.sqrt()函式:

函式的引數

Python的函式定義非常簡單,但靈活度卻非常大。除了正常定義的必選引數外,還可以使用預設引數、可變引數和關鍵字引數,使得函式定義出來的介面,不但能處理複雜的引數,還可以簡化呼叫者的程式碼。

位置引數

我們先寫一個計算x2的函式:

def power(x):    return x * x

對於power(x)函式,引數x就是一個位置引數。

當我們呼叫power函式時,必須傳入有且僅有的一個引數x

>>> power(5)25>>> power(15)225

現在,如果我們要計算x3怎麼辦?可以再定義一個power3函式,但是如果要計算x4、x5……怎麼辦?我們不可能定義無限多個函式。

你也許想到了,可以把power(x)修改為power(x, n),用來計算xn,說幹就幹:

    s = 1    while n > 0:        n = n - 1        s = s * x    return s

對於這個修改後的power(x, n)函式,可以計算任意n次方:

>>> power(5, 2)25>>> power(5, 3)125

修改後的power(x, n)函式有兩個引數:xn,這兩個引數都是位置引數,呼叫函式時,傳入的兩個值按照位置順序依次賦給引數xn

預設引數

新的power(x, n)函式定義沒有問題,但是,舊的呼叫程式碼失敗了,原因是我們增加了一個引數,導致舊的程式碼因為缺少一個引數而無法正常呼叫:

>>> power(5)Traceback (most recent call last):  File "<stdin>", line 1, in <module>TypeError: power() missing 1 required positional argument: 'n'

這個時候,預設引數就排上用場了。由於我們經常計算x2,所以,完全可以把第二個引數n的預設值設定為2:

def power(x, n=2):    s = 1    while n > 0:        n = n - 1        s = s * x    return s

這樣,當我們呼叫power(5)時,相當於呼叫power(5, 2)

>>> power(5)25>>> power(5, 2)25

而對於n > 2的其他情況,就必須明確地傳入n,比如power(5, 3)

從上面的例子可以看出,預設引數可以簡化函式的呼叫。設定預設引數時,有幾點要注意:

一是必選引數在前,預設引數在後,否則Python的直譯器會報錯(思考一下為什麼預設引數不能放在必選引數前面);

二是如何設定預設引數。

當函式有多個引數時,把變化大的引數放前面,變化小的引數放後面。變化小的引數就可以作為預設引數。

使用預設引數有什麼好處?最大的好處是能降低呼叫函式的難度。

舉個例子,我們寫個一年級小學生註冊的函式,需要傳入namegender兩個引數:

def enroll(name, gender):    print('name:', name)    print('gender:', gender)

這樣,呼叫enroll()函式只需要傳入兩個引數:

>>> enroll('Sarah', 'F')name: Sarahgender: F

如果要繼續傳入年齡、城市等資訊怎麼辦?這樣會使得呼叫函式的複雜度大大增加。

我們可以把年齡和城市設為預設引數:

def enroll(name, gender, age=6, city='Beijing'):    print('name:', name)    print('gender:', gender)    print('age:', age)    print('city:', city)

這樣,大多數學生註冊時不需要提供年齡和城市,只提供必須的兩個引數:

>>> enroll('Sarah', 'F')name: Sarahgender: Fage: 6city: Beijing

只有與預設引數不符的學生才需要提供額外的資訊:

enroll('Bob', 'M', 7)enroll('Adam', 'M', city='Tianjin')

可見,預設引數降低了函式呼叫的難度,而一旦需要更復雜的呼叫時,又可以傳遞更多的引數來實現。無論是簡單呼叫還是複雜呼叫,函式只需要定義一個。

有多個預設引數時,呼叫的時候,既可以按順序提供預設引數,比如呼叫enroll('Bob', 'M', 7),意思是,除了namegender這兩個引數外,最後1個引數應用在引數age上,city引數由於沒有提供,仍然使用預設值。

也可以不按順序提供部分預設引數。當不按順序提供部分預設引數時,需要把引數名寫上。比如呼叫enroll('Adam', 'M', city='Tianjin'),意思是,city引數用傳進去的值,其他預設引數繼續使用預設值。

預設引數很有用,但使用不當,也會掉坑裡。預設引數有個最大的坑,演示如下:

先定義一個函式,傳入一個list,新增一個END再返回:

def add_end(L=[]):    L.append('END')    return L

當你正常呼叫時,結果似乎不錯:

>>> add_end([1, 2, 3])[1, 2, 3, 'END']>>> add_end(['x', 'y', 'z'])['x', 'y', 'z', 'END']

當你使用預設引數呼叫時,一開始結果也是對的:

>>> add_end()['END']

但是,再次呼叫add_end()時,結果就不對了:

>>> add_end()['END', 'END']>>> add_end()['END', 'END', 'END']

很多初學者很疑惑,預設引數是[],但是函式似乎每次都“記住了”上次添加了'END'後的list。

Python函式在定義的時候,預設引數L的值就被計算出來了,即[],因為預設引數L也是一個變數,它指向物件[],每次呼叫該函式,如果改變了L的內容,則下次呼叫時,預設引數的內容就變了,不再是函式定義時的[]了。

定義預設引數要牢記一點:預設引數必須指向不變物件!

要修改上面的例子,我們可以用None這個不變物件來實現:

def add_end(L=None):    if L is None:        L = []    L.append('END')    return L

現在,無論呼叫多少次,都不會有問題:

>>> add_end()['END']>>> add_end()['END']

為什麼要設計strNone這樣的不變物件呢?因為不變物件一旦建立,物件內部的資料就不能修改,這樣就減少了由於修改資料導致的錯誤。此外,由於物件不變,多工環境下同時讀取物件不需要加鎖,同時讀一點問題都沒有。我們在編寫程式時,如果可以設計一個不變物件,那就儘量設計成不變物件。

可變引數

在Python函式中,還可以定義可變引數。顧名思義,可變引數就是傳入的引數個數是可變的,可以是1個、2個到任意個,還可以是0個。

我們以數學題為例子,給定一組數字a,b,c……,請計算a2 + b2 + c2 + ……。

要定義出這個函式,我們必須確定輸入的引數。由於引數個數不確定,我們首先想到可以把a,b,c……作為一個list或tuple傳進來,這樣,函式可以定義如下:

def calc(numbers):    sum = 0    for n in numbers:        sum = sum + n * n    return sum

但是呼叫的時候,需要先組裝出一個list或tuple:

>>> calc([1, 2, 3])14>>> calc((1, 3, 5, 7))84

如果利用可變引數,呼叫函式的方式可以簡化成這樣:

>>> calc(1, 2, 3)14>>> calc(1, 3, 5, 7)84

所以,我們把函式的引數改為可變引數:

def calc(*numbers):    sum = 0    for n in numbers:        sum = sum + n * n    return sum

定義可變引數和定義一個list或tuple引數相比,僅僅在引數前面加了一個*號。在函式內部,引數numbers接收到的是一個tuple,因此,函式程式碼完全不變。但是,呼叫該函式時,可以傳入任意個引數,包括0個引數:

>>> calc(1, 2)5>>> calc()0

如果已經有一個list或者tuple,要呼叫一個可變引數怎麼辦?可以這樣做:

>>> nums = [1, 2, 3]>>> calc(nums[0], nums[1], nums[2])14

這種寫法當然是可行的,問題是太繁瑣,所以Python允許你在list或tuple前面加一個*號,把list或tuple的元素變成可變引數傳進去:

>>> nums = [1, 2, 3]>>> calc(*nums)14

關鍵字傳參

可變引數允許你傳入0個或任意個引數,這些可變引數在函式呼叫時自動組裝為一個tuple。而關鍵字引數允許你傳入0個或任意個含引數名的引數,這些關鍵字引數在函式內部自動組裝為一個dict。請看示例:

def person(name, age, **kw):    print('name:', name, 'age:', age, 'other:', kw)

函式person除了必選引數nameage外,還接受關鍵字引數kw。在呼叫該函式時,可以只傳入必選引數:

>>> person('Michael', 30)name: Michael age: 30 other: {}

也可以傳入任意個數的關鍵字引數:

>>> person('Bob', 35, city='Beijing')name: Bob age: 35 other: {'city': 'Beijing'}>>> person('Adam', 45, gender='M', job='Engineer')name: Adam age: 45 other: {'gender': 'M', 'job': 'Engineer'}

關鍵字引數有什麼用?它可以擴充套件函式的功能。比如,在person函式裡,我們保證能接收到nameage這兩個引數,但是,如果呼叫者願意提供更多的引數,我們也能收到。試想你正在做一個使用者註冊的功能,除了使用者名稱和年齡是必填項外,其他都是可選項,利用關鍵字引數來定義這個函式就能滿足註冊的需求。

和可變引數類似,也可以先組裝出一個dict,然後,把該dict轉換為關鍵字引數傳進去:

>>> extra = {'city': 'Beijing', 'job': 'Engineer'}>>> person('Jack', 24, city=extra['city'], job=extra['job'])name: Jack age: 24 other: {'city': 'Beijing', 'job': 'Engineer'}

當然,上面複雜的呼叫可以用簡化的寫法:

>>> extra = {'city': 'Beijing', 'job': 'Engineer'}>>> person('Jack', 24, **extra)name: Jack age: 24 other: {'city': 'Beijing', 'job': 'Engineer'}

**extra表示把extra這個dict的所有key-value用關鍵字引數傳入到函式的**kw引數,kw將獲得一個dict,注意kw獲得的dict是extra的一份拷貝,對kw的改動不會影響到函式外的extra

命名關鍵字引數

對於關鍵字引數,函式的呼叫者可以傳入任意不受限制的關鍵字引數。至於到底傳入了哪些,就需要在函式內部通過kw檢查。

仍以person()函式為例,我們希望檢查是否有cityjob引數:

def person(name, age, **kw):    if 'city' in kw:        # 有city引數        pass    if 'job' in kw:        # 有job引數        pass    print('name:', name, 'age:', age, 'other:', kw)

但是呼叫者仍可以傳入不受限制的關鍵字引數:

>>> person('Jack', 24, city='Beijing', addr='Chaoyang', zipcode=123456)

如果要限制關鍵字引數的名字,就可以用命名關鍵字引數,例如,只接收cityjob作為關鍵字引數。這種方式定義的函式如下:

def person(name, age, *, city, job):    print(name, age, city, job)

和關鍵字引數**kw不同,命名關鍵字引數需要一個特殊分隔符**後面的引數被視為命名關鍵字引數。

呼叫方式如下:

>>> person('Jack', 24, city='Beijing', job='Engineer')Jack 24 Beijing Engineer

如果函式定義中已經有了一個可變引數,後面跟著的命名關鍵字引數就不再需要一個特殊分隔符*了:

def person(name, age, *args, city, job):    print(name, age, args, city, job)

命名關鍵字引數必須傳入引數名,這和位置引數不同。如果沒有傳入引數名,呼叫將報錯:

>>> person('Jack', 24, 'Beijing', 'Engineer')Traceback (most recent call last):  File "<stdin>", line 1, in <module>TypeError: person() missing 2 required keyword-only arguments: 'city' and 'job'

由於呼叫時缺少引數名cityjob,Python直譯器把前兩個引數視為位置引數,後兩個引數傳給*args,但缺少命名關鍵字引數導致報錯。

命名關鍵字引數可以有預設值,從而簡化呼叫:

def person(name, age, *, city='Beijing', job):    print(name, age, city, job)

由於命名關鍵字引數city具有預設值,呼叫時,可不傳入city引數:

>>> person('Jack', 24, job='Engineer')Jack 24 Beijing Engineer

使用命名關鍵字引數時,要特別注意,如果沒有可變引數,就必須加一個*作為特殊分隔符。如果缺少*,Python直譯器將無法識別位置引數和命名關鍵字引數:

引數組合

在Python中定義函式,可以用必選引數、預設引數、可變引數、關鍵字引數和命名關鍵字引數,這5種引數都可以組合使用。但是請注意,引數定義的順序必須是:必選引數、預設引數、可變引數、命名關鍵字引數和關鍵字引數。

比如定義一個函式,包含上述若干種引數:

def f1(a, b, c=0, *args, **kw):    print('a =', a, 'b =', b, 'c =', c, 'args =', args, 'kw =', kw)def f2(a, b, c=0, *, d, **kw):    print('a =', a, 'b =', b, 'c =', c, 'd =', d, 'kw =', kw)
>>> f1(1, 2)a = 1 b = 2 c = 0 args = () kw = {}>>> f1(1, 2, c=3)a = 1 b = 2 c = 3 args = () kw = {}>>> f1(1, 2, 3, 'a', 'b')a = 1 b = 2 c = 3 args = ('a', 'b') kw = {}>>> f1(1, 2, 3, 'a', 'b', x=99)a = 1 b = 2 c = 3 args = ('a', 'b') kw = {'x': 99}>>> f2(1, 2, d=99, ext=None)a = 1 b = 2 c = 0 d = 99 kw = {'ext': None}

最神奇的是通過一個tuple和dict,你也可以呼叫上述函式:

>>> args = (1, 2, 3, 4)>>> kw = {'d': 99, 'x': '#'}>>> f1(*args, **kw)a = 1 b = 2 c = 3 args = (4,) kw = {'d': 99, 'x': '#'}>>> args = (1, 2, 3)>>> kw = {'d': 88, 'x': '#'}>>> f2(*args, **kw)a = 1 b = 2 c = 3 d = 88 kw = {'x': '#'}

所以,對於任意函式,都可以通過類似func(*args, **kw)的形式呼叫它,無論它的引數是如何定義的。

雖然可以組合多達5種引數,但不要同時使用太多的組合,否則函式介面的可理解性很差。

小結

Python的函式具有非常靈活的引數形態,既可以實現簡單的呼叫,又可以傳入非常複雜的引數。

預設引數一定要用不可變物件,如果是可變物件,程式執行時會有邏輯錯誤!

要注意定義可變引數和關鍵字引數的語法:

*args是可變引數,args接收的是一個tuple;

**kw是關鍵字引數,kw接收的是一個dict。

以及呼叫函式時如何傳入可變引數和關鍵字引數的語法:

可變引數既可以直接傳入:func(1, 2, 3),又可以先組裝list或tuple,再通過*args傳入:func(*(1, 2, 3))

關鍵字引數既可以直接傳入:func(a=1, b=2),又可以先組裝dict,再通過**kw傳入:func(**{'a': 1, 'b': 2})

使用*args**kw是Python的習慣寫法,當然也可以用其他引數名,但最好使用習慣用法。

命名的關鍵字引數是為了限制呼叫者可以傳入的引數名,同時可以提供預設值。

定義命名的關鍵字引數在沒有可變引數的情況下不要忘了寫分隔符*,否則定義的將是位置引數。

遞迴函式

在函式內部,可以呼叫其他函式。如果一個函式在內部呼叫自身本身,這個函式就是遞迴函式。

舉個例子,我們來計算階乘n! = 1 x 2 x 3 x ... x n,用函式fact(n)表示,可以看出:

fact(n)=n!=1\times2\times3\times\cdot\cdot\cdot\times(n-1)\times n=(n-1)!\times n=fact(n-1)\times nfac**t(n)=n!=1×2×3×⋅⋅⋅×(n−1)×n=(n−1)!×n=fac**t(n−1)×n

所以,fact(n)可以表示為n x fact(n-1),只有n=1時需要特殊處理。

於是,fact(n)用遞迴的方式寫出來就是:

def fact(n):    if n==1:        return 1    return n * fact(n - 1)
>>> fact(1)1>>> fact(5)120>>> fact(100)93326215443944152681699238856266700490715968264381621468592963895217599993229915608941463976156518286253697920827223758251185210916864000000000000000000000000

如果我們計算fact(5),可以根據函式定義看到計算過程如下:

===> fact(5)===> 5 * fact(4)===> 5 * (4 * fact(3))===> 5 * (4 * (3 * fact(2)))===> 5 * (4 * (3 * (2 * fact(1))))===> 5 * (4 * (3 * (2 * 1)))===> 5 * (4 * (3 * 2))===> 5 * (4 * 6)===> 5 * 24===> 120

遞迴函式的優點是定義簡單,邏輯清晰。理論上,所有的遞迴函式都可以寫成迴圈的方式,但迴圈的邏輯不如遞迴清晰。

使用遞迴函式需要注意防止棧溢位。在計算機中,函式呼叫是通過棧(stack)這種資料結構實現的,每當進入一個函式呼叫,棧就會加一層棧幀,每當函式返回,棧就會減一層棧幀。由於棧的大小不是無限的,所以,遞迴呼叫的次數過多,會導致棧溢位。可以試試fact(1000)

>>> fact(1000)Traceback (most recent call last):  File "<stdin>", line 1, in <module>  File "<stdin>", line 4, in fact  ...  File "<stdin>", line 4, in factRuntimeError: maximum recursion depth exceeded in comparison

解決遞迴呼叫棧溢位的方法是通過尾遞迴優化,事實上尾遞迴和迴圈的效果是一樣的,所以,把迴圈看成是一種特殊的尾遞迴函式也是可以的。

尾遞迴是指,在函式返回的時候,呼叫自身本身,並且,return語句不能包含表示式。這樣,編譯器或者直譯器就可以把尾遞迴做優化,使遞迴本身無論呼叫多少次,都只佔用一個棧幀,不會出現棧溢位的情況。

上面的fact(n)函式由於return n * fact(n - 1)引入了乘法表達式,所以就不是尾遞迴了。要改成尾遞迴方式,需要多一點程式碼,主要是要把每一步的乘積傳入到遞迴函式中:

def fact(n):    return fact_iter(n, 1)def fact_iter(num, product):    if num == 1:        return product    return fact_iter(num - 1, num * product)

可以看到,return fact_iter(num - 1, num * product)僅返回遞迴函式本身,num - 1num * product在函式呼叫前就會被計算,不影響函式呼叫。

fact(5)對應的fact_iter(5, 1)的呼叫如下:

===> fact_iter(5, 1)===> fact_iter(4, 5)===> fact_iter(3, 20)===> fact_iter(2, 60)===> fact_iter(1, 120)===> 120

小結

使用遞迴函式的優點是邏輯簡單清晰,缺點是過深的呼叫會導致棧溢位。

針對尾遞迴優化的語言可以通過尾遞迴防止棧溢位。尾遞迴事實上和迴圈是等價的,沒有迴圈語句的程式語言只能通過尾遞迴實現迴圈。

Python標準的直譯器沒有針對尾遞迴做優化,任何遞迴函式都存在棧溢位的問題。