Python2和Python3的區別
這個世界並不是非黑即白的,Python也不是
有了前面的資料做支撐,我們不是應該學習Python 2嗎,為什麼Python 2和Python 3都要學呢?
首先,這個世界並不是非黑即白的,Python也不是。在學習Python 2和學習Python 3中間,其實有一個很好的平衡,那就是同時相容Python 2和Python 3。為了做到同時相容Python 2和Python 3,需要深用到Python的__future__庫。__future__庫裡面包含了不少從Python 3 backport 到Python 2的特性,充分使用__future__庫,可以很好的相容Python 2和Python 3。
其次,Python 2和Python 3確實有一些差異,但是,並沒有大家想象的那麼大,Python 2和Python 3之間的差異不到Python語法的10%,我們可以快速地瞭解哪些Python 2裡面的語法在Python 3中已經被棄用,在我們寫程式碼的過程中,規避掉這一部分語法即可。在Python的最佳實踐中,Python 3裡棄用的Python語法,在Python 2裡面也不推薦使用,不然也不會被棄用了。如果你知道並堅持Python的最佳實踐,那麼,對你來說,Python 2和Python 3的差異就更小了。
最後,我們可以參考優秀的開源軟體的做法,如OpenStack,努力做到程式碼同時相容Python 2和Python 3(Python3 - OpenStack),也可以藉助一些開軟的庫(如six)來同時相容。如果能夠做到同時相容Python 2和Python 3,我們的使用者將更廣泛,我們的程式碼也將更有價值。
拿Windows 來說,當 Windows 7 釋出的時候(我就不說 Vista 了),很多人依然抱著 XP 不放,當你問他們為什麼時,他們會一本正經地說,“新系統好卡啊”,或是“好多軟體都不相容啊”,或是“改變很大啊,好不習慣啊”,甚至是“ XP 已經是很好的系統了,微軟出個新系統就是為了坑錢”。
於是乎,春去春又來,送走了 Win 7 ,我們又迎來了 Win 8 ,但是這些人的想法依然沒有改變(我相信中國人中這種情況多一些)。如果這種人很多而且這種情況持續下去的話,最終的結局只會是微軟的狀況越來越差,最終人們毫無選擇,投降了Linux的懷抱(咦?怎麼有種心花怒放的感覺)。
當我在腦子裡把上面的 Win XP 換成 Python 2 、Win 7 換成 Python 3 甚至 Python 4 時,不禁感到一陣恐懼,我差點就和其他人合謀把 Python 給害死!試想一下,多年以後,Ruby 、Go 等語言都有了很多新的特性,雖然最新的 Python 也十分優秀,但因為一些人,不願改變,堅守著老版本,丟擲一些可笑的理由,最終 Python 因為使用者習慣而沒落了, Guido 和整個 Python 社群的努力都被這些人的習慣給無視了。
讓我們來看看這些可笑的理由(關於詳細的解釋,可以看一下知乎上的徐釀泉的答案,我在這簡單總結一下):
什麼?支援 Python 3 的庫太少?醒醒吧,這都6年了,最新都3.4.1了,現在還不支援 Python 3 的庫大多是常年無人維護的東西了。
什麼?新版本和舊版本相容性差?放心吧,以後的版本會越來越不相容,除非你打算死守 Python 2 一輩子。況且,為了新的特性,改變一下有那麼難嗎?
最後,那些還在堅守舊版本的人,你們的一堆理由和批評,真的不是在為自己的問題作辯護嗎?
stop talking, just do it
前面說了我對學習Python 2還是Python 3的一些觀點,希望能夠幫助大家少走彎路,另外,關於Python的版本問題,我這裡還有一些良心建議:
學習Python前,先了解在Python 3裡面已經棄用的Python 2語法,對這些部分簡單帶過不要花太多時間
使用Python 2,不要使用Python 2.7以前的版本
使用Python 3,不要使用Python 3.4以前的版本
多瞭解Python 2的__future__庫
對同一份程式碼,不要為Python 2和Python 3分別維護分支,努力在一套程式碼中相容Python 2和Python 3
這篇文章詳細的說明了為什麼要同時學習Python 2和Python 3,如何在Python 2和Python 3中找到一個平衡。但是,重要的不是糾結學習Python 3還是Python 2,而是“stop talking, just do it!”。
Python2與Python3的具體區別
除了引入import from future,瞭解一下兩者的區別也是很必要的
print函式:(Python3中print為一個函式,必須用括號括起來;Python2中print為class)
Python 2 的 print 宣告已經被 print() 函式取代了,這意味著我們必須包裝我們想列印在小括號中的物件。
Python 2
print 'Python', python_version()
print 'Hello, World!'
print('Hello, World!')
print "text", ; print 'print more text on the same line'
run result:
Python 2.7.6
Hello, World!
Hello, World!
text print more text on the same line
Python 3
print('Python', python_version())
print('Hello, World!')
print("some text,", end="")
print(' print more text on the same line')
run result:
Python 3.4.1
Hello, World!
some text, print more text on the same line
通過input()解析使用者的輸入:(Python3中input得到的為str;Python2的input的到的為int型,Python2的raw_input得到的為str型別)統一一下:Python3中用input,Python2中用row_input,都輸入為str
幸運的是,在 Python 3 中已經解決了把使用者的輸入儲存為一個 str 物件的問題。為了避免在 Python 2 中的讀取非字串型別的危險行為,我們不得不使用 raw_input() 代替。
Python 2
Python 2.7.6
[GCC 4.0.1 (Apple Inc. build 5493)] on darwin
Type “help”, “copyright”, “credits” or “license” for more information.
>>> my_input = input('enter a number: ')
enter a number: 123
>>> type(my_input)
<type 'int'>
>>> my_input = raw_input('enter a number: ')
enter a number: 123
>>> type(my_input)
<type 'str'>
Python 3
Python 3.4.1
[GCC 4.2.1 (Apple Inc. build 5577)] on darwin
Type “help”, “copyright”, “credits” or “license” for more information.
>>> my_input = input('enter a number: ')
enter a number: 123
>>> type(my_input)
<class 'str'>
整除:(沒有太大影響)(Python3中/表示真除,%表示取餘,//表示地板除(結果取整);Python2中/表示根據除數被除數小數點位得到結果,//同樣表示地板除)統一一下:Python3中/表示真除,%表示取餘,//結果取整;Python2中帶上小數點/表示真除,%表示取餘,//結果取整
Python 2
print 'Python', python_version()
print '3 / 2 =', 3 / 2
print '3 // 2 =', 3 // 2
print '3 / 2.0 =', 3 / 2.0
print '3 // 2.0 =', 3 // 2.0
run result:
Python 2.7.6
3 / 2 = 1
3 // 2 = 1
3 / 2.0 = 1.5
3 // 2.0 = 1.0
Python 3
print('Python', python_version())
print('3 / 2 =', 3 / 2)
print('3 // 2 =', 3 // 2)
print('3 / 2.0 =', 3 / 2.0)
print('3 // 2.0 =', 3 // 2.0)
run result:
Python 3.4.1
3 / 2 = 1.5
3 // 2 = 1
3 / 2.0 = 1.5
3 // 2.0 = 1.0
xrange模組:
在 Python 3 中,range() 是像 xrange() 那樣實現以至於一個專門的 xrange() 函式都不再存在(在 Python 3 中xrange() 會丟擲命名異常)。
在 Python 2 中 xrange() 建立迭代物件的用法是非常流行的。比如: for 迴圈或者是列表/集合/字典推導式。
這個表現十分像生成器(比如。“惰性求值”)。但是這個 xrange-iterable 是無窮的,意味著你可以無限遍歷。
由於它的惰性求值,如果你不得僅僅不遍歷它一次,xrange() 函式 比 range() 更快(比如 for 迴圈)。儘管如此,對比迭代一次,不建議你重複迭代多次,因為生成器每次都從頭開始。
比如說,香港天域國際,香港本土伺服器供應公司,業界領先的核心優化和熱補丁技術,快速修復宿主機/雲主機核心,針對底層硬體,尤其是記憶體,記憶體是硬體宕機故障的大頭,則通過核心技術把記憶體硬體故障給隔離開,避免它引發宕機。同時,伺服器放開頻寬給使用者使用,給使用者極致的體驗。伺服器採用雙上聯網路架構,即使某臺交換機出現異常,雲伺服器也能正常工作。超高的服務水平,極致的合理定價,7x24小時使用者至上的服務標準。訪問http://iis3.com/server/獲取。
python 2.4 與 python 3.0 的比較
一、 print 從語句變為函式
原: print 1, 2+3
改為: print ( 1, 2+3 )
二、range 與 xrange
原 : range( 0, 4 ) 結果 是 列表 [0,1,2,3 ]
改為:list( range(0,4) )
原 : xrange( 0, 4 ) 適用於 for 迴圈的變數控制
改為:range(0,4)
三、字串
原: 字串以 8-bit 字串儲存
改為: 字串以 16-bit Unicode 字串儲存
四、try except 語句的變化
原: try:
......
except Exception, e :
......
改為
try:
......
except Exception as e :
......
五、開啟檔案
原: file( ..... )
或 open(.....)
改為:
只能用 open(.....)
六、從鍵盤錄入一個字串
原: raw_input( "提示資訊" )
改為: input( "提示資訊" )
七、bytes 資料型別
A bytes object is an immutable array. The items are 8-bit bytes, represented by integers in the range 0 <= x < 256.
bytes 可以看成是“位元組陣列”物件,每個元素是 8-bit 的位元組,取值範圍 0~255。
由於在 python 3.0中字串以 unicode 編碼儲存,當寫入二進位制檔案時,字串無法直接寫入(或讀取),必須以某種方式的編碼為位元組序列後,方可寫入。
(一)字串編碼(encode) 為 bytes
例: s = "張三abc12"
b = s.encode( 編碼方式)
# b 就是 bytes 型別的資料
# 常用的編碼方式為 : "uft-16" , "utf-8", "gbk", "gb2312", "ascii" , "latin1" 等
# 注 : 當字串不能編碼為指定的“編碼方式”時,會引發異常
(二) bytes 解碼(decode)為字串
s = "張三abc12"
b = s.encode( "gbk") # 字串 s 編碼為 gbk 格式的位元組序列
s1 = b.decode("gbk") # 將位元組序列 b以gbk格式 解碼為字串
# 說明,當位元組序列不能以指定的編碼格式解碼時會引發異常
(三)使用方法舉例
#coding=gbk
f = open("c:\\1234.txt", "wb")
s = "張三李四abcd1234"
# -------------------------------
# 在 python2.4 中我們可以這樣寫:
# f.write( s )
# 但在 python 3.0中會引發異常
# -------------------------------
b = s.encode("gbk")
f.write( b )
f.close()
input("?")
讀取該檔案的例子:
#coding=gbk
f = open("c:\\1234.txt", "rb")
f.seek(0,2) #定位至檔案尾
n = f.tell() #讀取檔案的位元組數
f.seek(0,0) #重新定位至檔案開始處
b = f.read( n )
# ------------------------------
# 在 python 2.4 中 b 是字串型別
# 要 python 3.0 中 b 是 bytes 型別
# 因此需要按指定的編碼方式確碼
# ------------------------------
s = b.decode("gbk")
print ( s )
# ------------------------------
# 在 python 2.4 中 可以寫作 print s 或 print ( s )
# 要 python 3.0 中 必須寫作 print ( s )
# ------------------------------
f.close()
input("?")
執行後應顯示:
張三李四abcd1234
(四) bytes序列,一但形成,其內容是不可變的
例:
s="ABCD"
b=s.encode("gbk")
print b[0] # 顯示 65
b[0] = 66
# 執行該句,出現異常: 'bytes' object does not support item assignment
八、 chr( K ) 與 ord( c )
python 2.4.2以前
chr( K ) 將編碼K 轉為字元,K的範圍是 0 ~ 255
ord( c ) 取單個字元的編碼, 返回值的範圍: 0 ~ 255
python 3.0
chr( K ) 將編碼K 轉為字元,K的範圍是 0 ~ 65535
ord( c ) 取單個字元的編碼, 返回值的範圍: 0 ~ 65535
九、 除法運算子
python 2.4.2以前
10/3 結果為 3
python 3.0
10 / 3 結果為 3.3333333333333335
10 // 3 結果為 3
十、位元組陣列物件 --- 新增
(一) 初始化
a = bytearray( 10 )
# a 是一個由十個位元組組成的陣列,其每個元素是一個位元組,型別借用 int
# 此時,每個元素初始值為 0
(二) 位元組陣列 是可變的
a = bytearray( 10 )
a[0] = 25
# 可以用賦值語句更改其元素,但所賦的值必須在 0 ~ 255 之間
(三) 位元組陣列的切片仍是位元組陣列
(四) 字串轉化為位元組陣列
#coding=gbk
s ="你好"
b = s.encode( "gbk") # 先將字串按某種“GBK”編碼方式轉化為 bytes
c = bytearray( b ) #再將 bytes 轉化為 位元組陣列
也可以寫作
c = bytearray( "你好", "gbk")
(五) 位元組陣列轉化為字串
c = bytearray( 4 )
c[0] = 65 ; c[1]=66; c[2]= 67; c[3]= 68
s = c.decode( "gbk" )
print ( s )
# 應顯示: ABCD
(六) 位元組陣列可用於寫入文字檔案
#coding=gbk
f = open("c:\\1234.txt", "wb")
s = "張三李四abcd1234"
# -------------------------------
# 在 python2.4 中我們可以這樣寫:
# f.write( s )
# 但在 python 3.0中會引發異常
# -------------------------------
b = s.encode("gbk")
f.write( b )
c=bytearray( "王五","gbk")
f.write( c )
f.close()
input("?")