1. 程式人生 > >Python import機制詳解

Python import機制詳解

 module
通常模組為一個檔案,直接使用import來匯入就好了。可以作為module的檔案型別有".py"".pyo"".pyc"".pyd"".so"".dll"

 package
通常包總是一個目錄,可以使用import匯入包,或者from + import來匯入包中的部分模組。包目錄下為首的一個檔案便是 __init__.py。然後是一些模組檔案和子目錄,假如子目錄中也有__init__.py那麼它就是這個包的子包了。

模組你可以使用import語句將一個原始碼檔案作為模組匯入.例如:

# file : spam.py
a = 37                    

一個變數def foo:                  一個函式print"I'm foo"class bar:                一個類def grok(self):
        
print"I'm bar.grok"
b = bar()                 
建立一個例項

使用import spam 語句就可以將這個檔案作為模組匯入。系統在匯入模組時,要做以下三件事:
1.
為原始碼檔案中定義的物件建立一個名字空間,通過這個名字空間可以訪問到模組中定義的函式及變數。

2.在新建立的名字空間裡執行原始碼檔案.

3.建立一個名為原始碼檔案的物件,該物件引用模組的名字空間,這樣就可以通過這個物件訪問模組中的函式及變數,如:

import spam           匯入並執行模組 spam
print spam.a          訪問模組 spam 的屬性 spam.foo()
 c = spam.bar()
 ...

用逗號分割模組名稱就可以同時匯入多個模組:
import socket, os, regex
模組匯入時可以使用 as關鍵字來改變模組的引用物件名字:

import os as system
import socket as net, thread as threads
system.chdir(
"..")
net.gethostname()

使用from語句可以將模組中的物件直接匯入到當前的名字空間

. from語句不建立一個到模組名字空間的引用物件,而是把被匯入模組的一個或多個物件直接放入當前的名字空間:

from socket import gethostname
                               
gethostname放如當前名字空間print gethostname()            直接呼叫socket.gethostname()           引發異常NameError: socket

from語句支援逗號分割的物件,也可以使用星號(*)代表模組中除下劃線開頭的所有物件

from socket import gethostname, socket
from socket import *   載入所有物件到當前名字空間

不過,如果一個模組如果定義有列表__all__,則from module import *語句只能匯入__all__列表中存在的物件。

# module: foo.py
__all__ = [ 'bar''spam' ]     定義使用 `*` 可以匯入的物件

另外, as 也可以和 from聯合使用:

from socket import gethostname as hostname
h = hostname()

import 語句可以在程式的任何位置使用,你可以在程式中多次匯入同一個模組,但模組中的程式碼*僅僅*在該模組被首次匯入時執行。後面的import語句只是簡單的建立一個到模組名字空間的引用而已。sys.modules字典中儲存著所有被匯入模組的模組名到模組物件的對映。這個字典用來決定是否需要使用import語句來匯入一個模組的最新拷貝.
from module import * 
語句只能用於一個模組的最頂層.*特別注意*:由於存在作用域衝突,不允許在函式中使用from語句。每個模組都擁有 __name__屬性,它是一個內容為模組名字的字串。最頂層的模組名稱是__main__ .命令列或是互動模式下程式都執行在__main__模組內部利用__name__屬性,我們可以讓同一個程式在不同的場合(單獨執行或被匯入)具有不同的行為,象下面這樣做:

檢查是單獨執行還是被匯入

if__name__ == '__main__':
      
# Yes
      statements
else:
      
# No (可能被作為模組匯入)
      statements 

模組搜尋路徑匯入模組時,直譯器會搜尋sys.path列表,這個列表中儲存著一系列目錄。一個典型的sys.path列表的值:

Linux:
[
'''/usr/local/lib/python2.0',
     
'/usr/local/lib/python2.0/plat-sunos5',
     
'/usr/local/lib/python2.0/lib-tk',
     
'/usr/local/lib/python2.0/lib-dynload',
     
'/usr/local/lib/python2.0/site-packages']
Windows:
[
'''C:\\WINDOWS\\system32\\python24.zip''C:\\Documents and Settings\\weizhong''C:\\Python24\\DLLs''C:\\Python24\\lib''C:\\Python24\\lib\\plat-win''C:\\Python24\\lib\\lib-tk''C:\\Python24\\Lib\\site-packages\\pythonwin''C:\\Python24''C:\\Python24\\lib\\site-packages''C:\\Python24\\lib\\site-packages\\win32''C:\\Python24\\lib\\site-packages\\win32\\lib''C:\\Python24\\lib\\site-packages\\wx-2.6-msw-unicode']

空字串代表當前目錄要加入新的搜尋路徑,只需要將這個路徑加入到這個列表

模組匯入和彙編到現在為止,本章介紹的模組都是包含Python原始碼的文字檔案.不過模組不限於此,可以被import語句匯入的模組共有以下四類
使用Python寫的程式( .py檔案)

•CC++擴充套件(已編譯為共享庫或DLL檔案)

(包含多個模組)

內建模組(使用C編寫並已連結到Python直譯器內)

當查詢模組 foo ,直譯器按照 sys.path列表中目錄順序來查詢以下檔案(目錄也是檔案的一種):
1.
定義為一個包的目錄 foo

2.foo.so, foomodule.so, foomodule.sl, foomodule.dll (已編譯擴充套件)

3.foo.pyo (只在使用 -O -OO 選項時)

4.foo.pyc

5.foo.py

對於.py檔案,當一個模組第一次被匯入時,它就被彙編為位元組程式碼,並將位元組碼寫入一個同名的.pyc檔案.後來的匯入操作會直接讀取.pyc檔案而不是.py檔案.(除非.py檔案的修改日期更新,這種情況會重新生成.pyc檔案)在直譯器使用 -O 選項時,副檔名為.pyo的同名檔案被使用. pyo檔案的內容雖去掉行號,斷言,及其他除錯資訊的位元組碼,體積更小,執行速度更快.如果使用-OO選項代替-O,則文件字串也會在建立.pyo檔案時也被忽略.
如果在sys.path提供的所有路徑均查詢失敗,直譯器會繼續在內建模組中尋找,如果再次失敗,則引發 ImportError 異常.
.pyc
.pyo檔案的彙編,當且僅當import語句執行時進行
 import 語句搜尋檔案時,檔名是大小寫敏感的。即使在檔案系統大小寫不敏感的系統上也是如此(Windows).這樣, import foo 只會匯入檔案foo.py而不會是FOO.PY.

重新匯入模組如果更新了一個已經用import語句匯入的模組,內建函式reload()可以重新匯入並執行更新後的模組程式碼.它需要一個模組物件做為引數.例如:
import foo
... some code ...
reload(foo)          # 
重新匯入 foo

reload()執行之後的針對模組的操作都會使用新匯入程式碼,不過reload()並不會更新使用舊模組建立的物件,因此有可能出現新舊版本物件共存的情況。 *注意使用CC++編譯的模組不能通過 reload() 函式來重新匯入。記住一個原則,除非是在除錯和開發過程中,否則不要使用reload()函式.

多個關係密切的模組應該組織成一個包,以便於維護和使用。這項技術能有效避免名字空間衝突。建立一個名字為包名字的資料夾並在該資料夾下建立一個__init__.py檔案就定義了一個包。你可以根據需要在該資料夾下存放資原始檔、已編譯擴充套件及子包。舉例來說,一個包可能有以下結構:

Graphics/
      
__init__.py
      Primitive/
         
__init__.py
         lines.py
         fill.py
         text.py
         ...
      Graph2d/
         
__init__.py
         plot2d.py
         ...
      Graph3d/
         
__init__.py
         plot3d.py
         ...
      Formats/
         
__init__.py
         gif.py
         png.py
         tiff.py
         jpeg.py

import語句使用以下幾種方式匯入包中的模組:
* import Graphics.Primitive.fill 
匯入模組Graphics.Primitive.fill,只能以全名訪問模組屬性,例如 Graphics.Primitive.fill.floodfill(img,x,y,color). 
* from Graphics.Primitive import fill 
匯入模組fill ,只能以 fill.屬性名這種方式訪問模組屬性,例如 fill.floodfill(img,x,y,color). 
* from Graphics.Primitive.fill import floodfill 
匯入模組fill ,並將函式floodfill放入當前名稱空間,直接訪問被匯入的屬性,例如 floodfill(img,x,y,color).

無論一個包的哪個部分被匯入在檔案__init__.py中的程式碼都會執行.這個檔案的內容允許為空,不過通常情況下它用來存放包的初始化程式碼。匯入過程遇到的所有 __init__.py檔案都被執行.因此 import Graphics.Primitive.fill語句會順序執行 Graphics Primitive 資料夾下的__init__.py檔案.

下邊這個語句具有歧義
from Graphics.Primitive import * 
這個語句的原意圖是想將Graphics.Primitive包下的所有模組匯入到當前的名稱空間.然而,由於不同平臺間檔名規則不同(比如大小寫敏感問題), Python不能正確判定哪些模組要被匯入.這個語句只會順序執行 Graphics Primitive 資料夾下的__init__.py檔案.要解決這個問題,應該在Primitive資料夾下面的__init__.py中定義一個名字all的列表,例如:
# Graphics/Primitive/__init__.py
__all__ = ["lines","text","fill",...]

這樣,上邊的語句就可以匯入列表中所有模組.

下面這個語句只會執行Graphics目錄下的__init__.py檔案,而不會匯入任何模組:
import Graphics
Graphics.Primitive.fill.floodfill(img,x,y,color)  # 
失敗!

不過既然 import Graphics語句會執行 Graphics 目錄下的 __init__..py檔案,我們就可以採取下面的手段來解決這個問題:
# Graphics/__init__.py
import Primitive, Graph2d, Graph3d

# Graphics/Primitive/__init__.py
import lines, fill, text, ...

這樣import Graphics語句就可以匯入所有的子模組(只能用全名來訪問這些模組的屬性).

 sys.path sys.modules

sys.path包含了module的查詢路徑;

sys.modules包含了當前所load的所有的modulesdict(其中包含了builtinmodules);