1. 程式人生 > >困擾多年的問題,Python到底是語言,還是工具,哈佛教授完美詮釋

困擾多年的問題,Python到底是語言,還是工具,哈佛教授完美詮釋

hashset 編譯型 block 解釋器 bit asc 一個 至少 都是

技術分享圖片

然而,這是一句非常模棱兩可的話。這裏的"Python"到底指的是什麽? 是Python的抽象接口嗎?是Python的通用實現CPython嗎(不要把CPython跟Cython搞混了)?亦或者指的完全是其他的東西呢?可能我另外指的是Jython,或者IronPython,或者是PyPy。也或者轉而談論的又是RPython或者RubyPython(這兩者是完全不同的東西)。

上面提到的那些技術經常被提起和引用, 它們的使用目的和場景是完全不一樣的(至少,它們的操作方式是完全不一樣的)

自從我使用Python工作以來,我已經用過了各種各樣的.*ython工具了。但是直到最近我才花時間去理解到底它們是幹嘛的,它們是怎樣工作的,為什麽它們是不可或缺的。

在這篇文章裏面,我會介紹各種Python的實現,最後以對PyPy的介紹結尾, 因為我個人認為它是Python的未來。

所有的都從理解什麽是"Python"開始。

如果你對機器碼,虛擬機之類的很熟了,你可以跳過開頭,直接從 "即時編譯: PyPy和它的未來" 這部分開始看起。

Python是解釋型的還是編譯型的?

這是個Python新人都會迷惑的問題。

首先需要明了的是Python只是一個接口。有一個關於Python應該做什麽以及怎麽做的具體說明(就像其他任何接口一樣 ),並且對應的有很多具體的實現(也像其他接口一樣)。

其次需要知道的是“解釋型”和“編譯型”是具體實現的特性,而不是接口的特性。

所以,這個問題本身就沒有組織好。

Python是解釋型還是編譯型的?這個問題真的沒有組織好。

對使用最廣泛的實現(CPython:用C實現的,通常簡單的說成Python,若你不知道我所說的這些,那很肯能你在使用的就是CPython)而言,這個問題的答案是:解釋型,但帶有一些編譯型特征。CPython把Python源碼編譯*成字節碼,之後再解釋這些字節碼,執行之。

*註意:這個編譯不是通常意義上的編譯。通常我們說的編譯,是指把高級語言代碼轉換成機器碼。但這裏的編譯實際上是另一種意義上的編譯。(譯者,這句話不是很懂,原文是it is a ‘compilation’ of sorts,不知作何解,求教各位讀者。)

再詳細看下上面的答案吧,這有助於我們理解本文中後面會講到的幾個概念。

字節碼 vs. 機器碼

了解字節碼和機器碼(或者native code)的區別是很重要的,最好的辦法或許是看看例子:

C代碼被編譯成機器碼,將在處理器上直接執行。每一條指令控制CPU工作。
Java代碼被編譯成字節碼,將在Java虛擬機(JVM)這個抽象的計算機上執行。每一條指令由JVM處理,JVM同計算機本身之間交互。
簡而言之:機器碼快的多,但字節碼更易遷移,也更安全。

機器碼隨機器的變化而變化,但字節碼在所有的機器上都是一樣的。有人可能會認為機器碼是對特定環境優化了的。

回到CPython,工具鏈的執行過程如下:
CPython編譯你的Python源代碼,生成字節碼。
字節碼隨後在CPython虛擬機上執行。

初學者常常因為看到.pyc文件而假設Python是編譯型的。這也有一些合理性:.pyc文件正式之後要解釋的字節碼文件。所以,你若之前運行過你的Python代碼,生成了.pyc文件,再次運行時就要快得多,因為不需要再次編譯生成字節碼了。

可選的虛擬機:Jython,IronPython等

正如我之前所述,Python有很多實現。前面也提到,CPython是最通用的。這是一個用C實現的,被認為是”默認“的實現。

但其他的呢?其中最顯赫的之一就是Jython,一個用Java實現的采用了JVM的實現。CPython生成在CPython虛擬機上運行的字節碼,而Jython生成在JVM上運行的java字節碼(這同編譯Java程序生成java字節碼的過程是一樣的)。

技術分享圖片
”為啥你要用其他的實現?”,你可能會如此發問。好吧,對開發者而言,不同的實現對不同的技術難題的支持程度不一樣。

CPython中很容易為你的Python代碼寫C擴展,因為最終都是由C解釋器執行的。另一方面,Jython則使得和其他java程序共同工作很容易:無需其他工作,你就可導入任何Java類,在你的Jython程序中使用其他Java類。(題外話,若你沒有認真思考,這一段會很難。此時我們已經在討論把不同語言的代碼混在一起,並編譯成同一程序。(Rostin 提出混合Fortran和C代碼編程已經有一段時間了。所以,這並不新鮮,但仍然很酷。))

下面是一個例子,一段合法的Jython代碼:

[Java HotSpot(TM) 64-Bit Server VM (Apple Inc.)] on java1.6.0_51

>> from java.util import HashSet

>> s = HashSet(5)

>> s.add("Foo")

>> s.add("Bar")

>> s

[Foo, Bar]

IronPython是另一很流行的Python 實現,完全用C#實現,針對.NET平臺。她運行在可以叫做.NET虛擬機的平臺上,這是微軟的 Common Language Runtime (CLR),同JVM相對應。

你可能會說,Jython:Java::IronPython:C#。它們各自運行在相同的虛擬機上,你能從你的IronPython中導入C#的類,從你寫的Jython代碼中帶入Java類,等等

你完全可以不用任何非CPython的實現就能完成你手上的任何工作。但是使用這些技術也是有很多的好處的,大部分取決於你現在所使用的技術棧。 你使用了很多基於JVM的語言?Jython就是為你準備的。使用的都是.NET世界的語言?那麽你應該試試IronPython了(或許你已經在用了)

技術分享圖片
順便說一下(盡管這不是使用不同的實現的理由),註意Python的各種實現在對待你的Python源碼的時候所做的處理方式是完全不一樣的。然後這些差異是很小的,由於這些實現都在不停的發展改進中,隨著時間的推移,這些差異會慢慢融合和兼容。比如,IronPython默認情況下使用Unicode字符串,但是在2.x版本的CPython中默認是ASCII字符串(如果使用了非ASCII字符串,會拋出一個UnicodeEncodeError錯誤),但是在3.x版本裏面CPythong已經默認支持Unicode字符串了。

即時編譯: PyPy和它的未來

我們已經有了一個使用C寫的Python實現,一個用Java寫的,一個用C#寫的。接下來就是:用Python寫的Python實現(有心人可能會註意這句話有點問題,是個死循環,^_^)

接下來我們看下什麽地方容易搞混淆。首先,我們討論下即時編譯器JIT

JIT: 為什麽會有這個?它的原理是什麽?

大家都知道本地機器碼的速度比字節碼的速度快很多。那麽,如果我們能將一些字節碼直接編譯成本地機器碼再去運行它會怎樣呢?我們必須花費一些代價(比如時間)在編譯字節碼到本地機器碼上,如果最終的運行時間更快,那麽這個代價就是值得的。這就是JIT編譯器的動機,一種混合了解釋器和編譯器好處的技術。簡單來講,JIT就是想通過編譯技術提升腳本解釋器系統的速度

喜歡這篇文章的話,轉發+評論哦!讓大家看看你獨特的見解哦!

好了給大家送上這一篇文的福利 加我QQ群:836962007 即可獲取哦!

技術分享圖片

困擾多年的問題,Python到底是語言,還是工具,哈佛教授完美詮釋