1. 程式人生 > >Python 為什麼能支援任意的真值判斷?

Python 為什麼能支援任意的真值判斷?

> 本文出自“Python為什麼”系列,請檢視[全部文章](https://mp.weixin.qq.com/mp/appmsgalbum?__biz=MzUyOTk2MTcwNg==&action=getalbum&album_id=1338406397180084225&subscene=0&scenenote=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzUyOTk2MTcwNg%3D%3D%26mid%3D2247485945%26idx%3D1%26sn%3D02f1ac9a690f57accefeed7a1ea1247b%26chksm%3Dfa584e7ccd2fc76af5d45ebbc43c1e4d379a0fcfeee8ce70111a8a293c4b7efc8ac7a82dfd6a%26xtrack%3D1%26scene%3D0%26subscene%3D91%26sessionid%3D1596284425%26clicktime%3D1596284604%26enterid%3D1596284604%26ascene%3D7%26devicetype%3Dandroid-28%26version%3D2700103f%26nettype%3DWIFI%26abtest_cookie%3DAAACAA%253D%253D%26lang%3Dzh_CN%26exportkey%3DAa1rI96xIRQ8cDJChmQS9BU%253D%26pass_ticket%3DP%252BUyocSqsqUN5JuCQOyjZNpQH%252Fwm0bsN6NchdKKM9CFDDEu0ZPKsRpo8Utu4BBRc%26wx_header%3D1#wechat_redirect) Python 在涉及`真值判斷`([Truth Value Testing](https://docs.python.org/3/library/stdtypes.html#truth-value-testing))時,語法很簡便。 比如,在判斷某個物件是否不為 None 時,或者判斷容器物件是否不為空時,並不需要顯示地寫出判斷條件,只需要在 if 或 while 關鍵字後面直接寫上該物件即可。 下圖以列表為例,`if my_list` 這個簡短的寫法可以表達出兩層意思: ![](http://ww1.sinaimg.cn/large/68b02e3bgy1ghg8eb5c8wj20gh0c4t8v.jpg) 如果需要作出相反的判斷,即“如果為 None 或為空”,只需要寫成`if not my_list` 即可。 ## 與眾不同的真值判斷方式 通常而言,當一個值本身是布林型別時,寫成"if xxx"(如果真),在語義上就很好理解。如果 xxx 本身不是布林型別時,寫成“if xxx”(如果某東西),則在語義上並不好理解。 在 C/C++/Java 之類的`靜態語言`中,通常要先基於 xxx 作一個比較操作,比如“if (xxx == null)”,以此得到一個布林型別的值的結果,然後再進行真值判斷。否則的話,若“if xxx”中有非布林型別的值,則會報型別錯誤。 Python 這門`動態語言`在這種場景中表現出了一種靈活性,那麼,我們的問題來了:**為什麼 Python 不需要先做一次比較操作,直接就能對任意物件作真值判斷呢?** 先來看看[文件](https://docs.python.org/3/library/stdtypes.html#truth-value-testing) 中對真值判斷的描述: ![](http://ww1.sinaimg.cn/large/68b02e3bgy1ghga3usju9j20zf0d9abv.jpg) **簡單而言,Python 的任何物件都可以用在 if 或 while 或布林操作(and、or、not)中,預設情況下認為它是 true,除非它有\_\_bool\_\_() 方法返回`False` 或者有\_\_len\_\_() 方法返回`0` 。** 對於前面的例子,my_list 沒有\_\_bool\_\_() 方法,但是它有\_\_len\_\_() 方法,所以它是否為 true,取決於這個方法的返回值。 ## 真值判斷的位元組碼 接著,我們繼續刨根問底:**Python 為什麼可以支援如此寬泛的真值判斷呢?在執行`if xxx` 這樣的語句時,它到底在做些什麼?** 對於第一個問題,Python 有個內建的 bool() 型別,可以將任意物件轉化成布林值。那麼,這是否意味著 Python 在進行真值判斷時,會`隱式地` 呼叫 bool() 呢(即轉化成`if bool(xxx)`)?(答案為否,下文有分析) 對於第二個問題,可以先用`dis` 模組來檢視下: ![](http://ww1.sinaimg.cn/large/68b02e3bgy1ghgaujqpl5j20o50jeq3e.jpg) [`POP_JUMP_IF_FALSE`](https://docs.python.org/3/library/dis.html?highlight=pop_jump_if_false#opcode-POP_JUMP_IF_FALSE)指令對應的是 if 語句那行,它的含義是: > If TOS is false, sets the bytecode counter to *target*. TOS is popped. > > 如果棧頂元素為 false,則跳轉到目標位置。 這裡只有跳轉動作的描述,仍看不到一個普通物件是如何變成布林物件的。 Python 在直譯器中到底是如何實現真值判斷的呢? ## 真值判斷的原始碼實現 在微信群友 Jo 的幫助下,我找到了 CPython 的原始碼(檔案:ceval.c、object.c): ![](http://ww1.sinaimg.cn/large/68b02e3bgy1ghgbg1rtebj20k10ds74v.jpg) ![](http://ww1.sinaimg.cn/large/68b02e3bgy1ghgbg8br96j20n50gat9w.jpg) 可以看出,對於布林型別的物件(即 Py_True 和 Py_False),程式碼會進入到快速處理的分支;而對於其它物件,則會用 PyObject_IsTrue() 計算出一個 int 型別的值。 PyObject_IsTrue() 函式在計算過程中,依次會獲取 nb_bool、mp_length 和 sq_length 的值,對應的應該就是 \_\_bool\_\_() 和 \_\_len\_\_() 這兩個魔術方法的返回值。 這個過程就是前文中所引用的官方文件的描述,正是我們想要找的答案! 另外,對於內建的 bool(),它的核心實現邏輯正是上面的 PyObject_IsTrue() 函式,原始碼如下(boolobject.c): ![](http://ww1.sinaimg.cn/large/68b02e3bgy1ghgcgpjx0ij20mc0ar0t6.jpg) 所以,Python 在對普通物件作真值判斷時,並沒有隱式地呼叫 bool(),相反它呼叫了一個獨立的函式(PyObject_IsTrue()),而這個函式又被 bool() 所使用。 也就是說,**bool() 與 if/while 語句對普通物件的真值判斷,事實上是基本相同的處理邏輯。** 知道了原理,就會明白`if bool(xxx)` 這種寫法是多此一舉的了(我曾見到過)。 至此,我們已經回答了前文中提出的問題。 ## 驗證真值判斷的過程 接下來,有 3 個測試例子,可以作進一步的驗證: ![](http://ww1.sinaimg.cn/large/68b02e3bgy1ghhh3tblquj20h00dd3yl.jpg) 你可以暫停而思考下:`bool(Test1)` 與 `bool(Test1())` 各是什麼結果?然後依次判斷剩下的兩個類,結果又會是什麼? 揭曉答案: ```python bool(Test1) # True bool(Test2) # True bool(Test3) # True bool(Test1()) # True bool(Test2()) # False bool(Test3()) # True ``` 原因如下: - 類物件沒被例項化時,bool() 不會呼叫它的 \_\_bool\_\_() 或 \_\_len\_\_() 這兩個魔術方法 - 類物件被例項化後,若同時存在 \_\_bool\_\_() 或 \_\_len\_\_() 魔術方法,則 bool() 會先呼叫 \_\_bool\_\_() 方法(PS:這個方法要求返回值必須為 bool 型別,因此只要有它,就必然不需要再用\_\_len\_\_() 方法來判斷真假) ## 數字型別如何作真值判斷? 除了這 3 個例子,還有一種情況值得驗證,那就是**對於數字型別,它們是怎麼做真值判斷的呢?** 我們可以驗證一下數字型別是否擁有那兩個魔術方法: ```python hasattr(2020, "__bool__") hasattr(2020, "__len__") ``` 不難驗證出,數字擁有的是 \_\_bool\_\_() 魔術方法,並沒有\_\_len\_\_() 魔術方法,而且所有型別的數字其實被分成了兩類: - `__bool__()` 返回 False:所有表示 0 的數字,例如`0`, `0.0`, `0j`, `Decimal(0)`, `Fraction(0, 1)` - `__bool__()` 返回 True:所有其它非 0 的數字 ## 文章小結 Python 中`if xxx` 這種簡便的寫法,雖然是正規的真值判斷語法,並它但並不符合常規的語義。在 C/C++/Java 之類的語言中,要麼 xxx 本身是布林型別的值,要麼是一種可返回布林型別值的操作,但是在 Python 中,這個“xxx”竟然還可以是**任意的 Python 物件!** 本文通過對文件、位元組碼和 CPython 直譯器的原始碼逐步分析,發現了 Python 的真值判斷過程並不簡單,可以提煉出以下的幾個要點: - **if/while 是隱性的布林操作符:** 它們除了有“判斷”真假的作用,還具有隱式地將普通物件計算出布林結果的功能。實際的操作是直譯器根據“POP_JUMP_IF_FALSE”指令來完成的,其核心邏輯跟內建的 bool() 是共用了一個底層方法 - **真值判斷過程依賴兩個魔術方法:** 除非被判斷物件有\_\_bool\_\_() 方法返回`False` 或者有\_\_len\_\_() 方法返回`0` ,否則布林操作的結果都是 True。兩個魔術方法總是會先計算\_\_bool\_\_() - **數字型別也可做真值判斷:** 數字有\_\_bool\_\_() 魔術方法,但沒有\_\_len\_\_() 魔術方法,除了表示 0 的數字為 False,其它數字都為 True 如果你覺得本文分析得不錯,那你應該會喜歡這些文章: 1、[Python為什麼使用縮排來劃分程式碼塊?](https://mp.weixin.qq.com/s/byhJnKoKSDnhUNUE9WWopw) 2、[Python 的縮排是不是反人類的設計?](https://mp.weixin.qq.com/s/pi1x6lT88dMmfUUqcVet-A) 3、[Python 為什麼不用分號作語句終止符?](https://mp.weixin.qq.com/s/LZ2ocKBfYurJtllU4asP2Q) 4、[Python 為什麼沒有 main 函式?為什麼我不推薦寫 main 函式?](https://mp.weixin.qq.com/s/1ehySR5NH2v1U8WIlXflEQ) 5、[Python 為什麼推薦蛇形命名法?](https://mp.weixin.qq.com/s/U4n3aEhznPx7lJ8lj6rU_A) 6、[Python 為什麼不支援 i++ 自增語法,不提供 ++ 操作符?](https://mp.weixin.qq.com/s/Bdn5XPUkH9Ssz4UZc4NKvQ) 7、[Python 為什麼只需一條語句“a,b=b,a”,就能直接交換兩個變數?](https://mp.weixin.qq.com/s/VSLLuPwurNEsNLnYf7oGJg) 8、[Python 為什麼用 # 號作註釋符?](https://mp.weixin.qq.com/s/2mQBlGtI04HK7dSMd7kkkA) 9、[Python 為什麼要有 pass 語句?](https://mp.weixin.qq.com/s/GpBOO0MLsc6g_mNq85Zy0A) 10、[Python 為什麼會有個奇怪的“...”物件?](https://mp.weixin.qq.com/s/SOSN_p74eDHv3tJnSJIZfg) 本文屬於“Python為什麼”系列(Python貓出品),該系列主要關注 Python 的語法、設計和發展等話題,以一個個“為什麼”式的問題為切入點,試著展現 Python 的迷人魅力。所有文章將會歸檔在 Github 上,專案地址:[https://github.com/chinesehuazhou/python-whydo](https://github.com/chinesehuazhou/pytho