醒醒!Python已經支援中文變數名啦!
阿新 • • 發佈:2021-01-14
最近,我在翻閱兩本比較新的 Python 書籍時,發現它們都犯了一個嚴重的低階錯誤!
這兩本書分別是《Python程式設計:從入門到實踐》和《父與子的程式設計之旅》,它們都是暢銷書,都在 2020 年 10 月出了新版本,都使用 Python3.7+ 版本的語法。
![](http://ww1.sinaimg.cn/large/68b02e3bgy1gml9ase05oj211q0phdp1.jpg)
然而,在關於變數的命名規則部分,它們犯下了一樣的錯誤,即還在使用 Python2 時代的那套說辭,誤以為命名僅僅支援“字母、數字和下劃線”的組合。
![](http://ww1.sinaimg.cn/large/68b02e3bgy1gmlbgcnymuj23341qitqf.jpg)
事實上,Python3.x 已經支援全面 Unicode 編碼,比如支援使用中文作為變數名。
```python
>>> 姓名 ="Python貓"
>>> print(f"我是{姓名},歡迎關注!")
我是Python貓,歡迎關注!
```
由於我手頭上沒有其它樣本,所以,我不確定有多少新版的書籍還在使用老的規則。但是,翻譯類的書籍大概率都會有這樣的問題,另外,有些不嚴謹的國內書籍,也可能因為借鑑了過時的材料而犯錯。
如此一來,恐怕有些新接觸 Python 的同學,就會形成錯誤的認識。雖然這可能不會造成嚴重的問題,但是它終歸是一個應該避免而且很容易就能避免的問題。
因此,我覺得這個話題值得聊一聊。
在程式語言中有一個很常見的概念,即識別符號(identifier),通常又會稱之為名字(name),用於標識出變數、常量、函式、類、符號等實體的名字。
在定義識別符號時,有一些必須要考慮的基本規則:
- 它可以由哪些字元組成?
- 它是否區分大小寫?(即大小寫敏感)
- 它是否允許出現某些特殊的單詞?(即關鍵字/保留字)
對於第一個問題,大多數的程式語言**在早期版本**都遵循這條規則:**識別符號由字母、數字和下劃線組成,並且不能以數字為開頭。** 少數的程式語言有例外,還支援使用$、@、%等特殊符號(例如PHP、Ruby、Perl等等)。
Python 的早期版本,確切地說是 3.0 之前的版本,就遵循以上的命名規則。下面是官方文件中的描述:
```python
identifier ::= (letter|"_") (letter | digit | "_")*
letter ::= lowercase | uppercase
lowercase ::= "a"..."z"
uppercase ::= "A"..."Z"
digit ::= "0"..."9"
```
![](http://ww1.sinaimg.cn/large/68b02e3bgy1gml9uud390j20w20aat9i.jpg)
出處:https://docs.python.org/2.7/reference/lexical_analysis.html#identifiers
但是,這條規則從 3.0 版本起,就被打破了。最新的官方文件已經變成了這樣:
![](http://ww1.sinaimg.cn/large/68b02e3bgy1gml9pyum8yj211n0jrjts.jpg)
出處:https://docs.python.org/3/reference/lexical_analysis.html#identifiers
隨著網際網路的普及,各國語言進入了國際化的語境中,程式語言也與時俱進地增長了對國際化的訴求。
Unicode(譯作統一碼、萬國碼)編碼標準在 1994 年釋出,隨後逐步被主流的程式語言所接納。到目前為止,至少有 73 種程式語言支援 Unicode 變數名(資料依據:https://rosettacode.org/wiki/Unicode_variable_names)。
2007 年,當 Python 正在設計劃時代的 3.0 版本時,官方也考慮了對 Unicode 編碼的支援,於是,誕生了重要的《PEP 3131 -- Supporting Non-ASCII Identifiers》。
![](http://ww1.sinaimg.cn/large/68b02e3bgy1gml9pfigk9j20tp0cdt9i.jpg)
出處:https://www.python.org/dev/peps/pep-3131
事實上,除了我們最關心的中文,Unicode 字符集還包含非常非常多的內容。
在對變數命名時,下面這些用法都是可行的(謹慎使用,如若被打,本貓概不負責……):
```python
>>> ψ = 1
>>> Δ = 1
>>> ಠ_ಠ = "hello"
```
綜上所述,某些 Python 書籍中關於變數命名規則的內容已經過時了,不應該被其所誤導!
Python 3 作為一門面向現代化/國際化的語言,對於 Unicode 編碼有很好的支援。至於該不該在專案中使用中文給識別符號命名,那就是另外的問題