1. 程式人生 > >Python3 pyc 檔案詳解

Python3 pyc 檔案詳解

什麼是pyc檔案

pyc是一種二進位制檔案,是由py檔案經過編譯後,生成的檔案,是一種byte code,py檔案變成pyc檔案後,載入的速度有所提高,而且pyc是一種跨平臺的位元組碼,是由python的虛擬機器來執行的,這個是類似於JAVA或者.NET的虛擬機器的概念。pyc的內容,是跟python的版本相關的,不同版本編譯後的pyc檔案是不同的,2.5編譯的pyc檔案,2.4版本的python是無法執行的。

為什麼需要pyc檔案

這個需求太明顯了,因為py檔案是可以直接看到原始碼的,如果你是開發商業軟體的話,不可能把原始碼也洩漏出去吧?所以就需要編譯為pyc後,再發布出去。當然,pyc檔案也是可以反編譯的,不同版本編譯後的pyc檔案是不同的,根據python原始碼中提供的opcode,可以根據pyc檔案反編譯出py檔案原始碼,網上可以找到一個反編譯python2.3版本的pyc檔案的工具,不過該工具從python2.4開始就要收費了,如果需要反編譯出新版本的pyc檔案的話,就需要自己動手了(俺暫時還沒這能力^--^),不過你可以自己修改python的原始碼中的opcode檔案,重新編譯python,從而防止不法分子的破解。

生成pyc

一、引入模組、包生成

如果模組或包被其他的模組引入後,執行引入模組就會生成pyc檔案(被動生成,如果是python2,會在本級目錄生,如果是python3的話就在本級目錄新建一個__pycache__檔案,然後在__pycache__中生成pyc檔案)

二、程式碼編譯生成

1. 單個檔案

python就是個好東西,它提供了內建的類庫來實現把py檔案編譯為pyc檔案,這個模組就是 py_compile 模組。

使用方法非常簡單,如下所示,直接在idle中,就可以把一個py檔案編譯為pyc檔案了。

>>> import py_compile
>>> py_compile.compile(r'/Users/zhangyi/Downloads/md5.py')
'/Users/zhangyi/Downloads/__pycache__/md5.cpython-37.pyc'
>>> 

Geek-Mac:__pycache__ zhangyi$ ls
md5.cpython-37.pyc

compile函式原型:

compile(file[, cfile[, dfile[, doraise]]])

  • file 表示需要編譯的py檔案的路徑
  • cfile 表示編譯後的pyc檔名稱和路徑,預設為直接在file檔名後加c 或者 o,o表示優化的位元組碼
  • dfile 這個引數英文看不明白,請各位大大賜教。(鄙視下自己)原文:it is used as the name of the source file in error messages instead of file
  • doraise 可以是兩個值,True或者False,如果為True,則會引發一個PyCompileError,否則如果編譯檔案出錯,則會有一個錯誤,預設顯示在sys.stderr中,而不會引發異常

2. 多個檔案

一般來說,我們的工程都是在一個目錄下的,一般不會說僅僅編譯一個py檔案而已,而是需要把整個資料夾下的py檔案都編譯為pyc檔案,python又為了我們提供了另一個模組:compileall 。使用方法如下:

>>> import compileall
>>> compileall.compile_dir(r'/Users/zhangyi/Downloads/MainText')
Listing '/Users/zhangyi/Downloads/MainText'...
Listing '/Users/zhangyi/Downloads/MainText/.idea'...
Listing '/Users/zhangyi/Downloads/MainText/.idea/inspectionProfiles'...
Compiling '/Users/zhangyi/Downloads/MainText/Api.py'...
Compiling '/Users/zhangyi/Downloads/MainText/Block.py'...
Compiling '/Users/zhangyi/Downloads/MainText/JieBa.py'...
Compiling '/Users/zhangyi/Downloads/MainText/Login.py'...
Compiling '/Users/zhangyi/Downloads/MainText/Lxml.py'...
Compiling '/Users/zhangyi/Downloads/MainText/Mat.py'...
Compiling '/Users/zhangyi/Downloads/MainText/Myre.py'...
Compiling '/Users/zhangyi/Downloads/MainText/NLP.py'...
Compiling '/Users/zhangyi/Downloads/MainText/Post.py'...
Compiling '/Users/zhangyi/Downloads/MainText/Text.py'...
Compiling '/Users/zhangyi/Downloads/MainText/get_project_url.py'...
Compiling '/Users/zhangyi/Downloads/MainText/headless_chrome_Test1.py'...
Compiling '/Users/zhangyi/Downloads/MainText/headless_chrome_Test2.py'...
Compiling '/Users/zhangyi/Downloads/MainText/learning.py'...
Compiling '/Users/zhangyi/Downloads/MainText/nsfc.py'...
Compiling '/Users/zhangyi/Downloads/MainText/re.py'...
Compiling '/Users/zhangyi/Downloads/MainText/spider_image.py'...
Compiling '/Users/zhangyi/Downloads/MainText/unit.py'...
True
>>> 

Geek-Mac:__pycache__ zhangyi$ pwd
/Users/zhangyi/Downloads/MainText/__pycache__
Geek-Mac:__pycache__ zhangyi$ ls
Api.cpython-37.pyc			Text.cpython-37.pyc
Block.cpython-37.pyc			get_project_url.cpython-37.pyc
JieBa.cpython-37.pyc			headless_chrome_Test1.cpython-37.pyc
Login.cpython-37.pyc			headless_chrome_Test2.cpython-37.pyc
Lxml.cpython-37.pyc			learning.cpython-37.pyc
Mat.cpython-37.pyc			nsfc.cpython-37.pyc
Myre.cpython-37.pyc			re.cpython-37.pyc
NLP.cpython-37.pyc			spider_image.cpython-37.pyc
Post.cpython-37.pyc			unit.cpython-37.pyc
Geek-Mac:__pycache__ zhangyi$ 

這樣就把MainText目錄,以及其子目錄下的py檔案編譯為pyc檔案了。嘿嘿,夠方便吧。來看下compile_dir函式的說明:

compile_dir(dir[, maxlevels[, ddir[, force[, rx[, quiet]]]]])

  • dir 表示需要編譯的資料夾位置
  • maxlevels 表示需要遞迴編譯的子目錄的層數,預設是10層,即預設會把10層子目錄中的py檔案編譯為pyc
  • ddir 英文沒明白,原文:it is used as the base path from which the filenames used in error messages will be generated。
  • force 如果為True,則會強制編譯為pyc,即使現在的pyc檔案是最新的,還會強制編譯一次,pyc檔案中包含有時間戳,python編譯器會根據時間來決定,是否需要重新生成一次pyc檔案
  • rx 表示一個正則表示式,比如可以排除掉不想要的目錄,或者只有符合條件的目錄才進行編譯
  • quiet 如果為True,則編譯後,不會在標準輸出中,打印出資訊
三、通過 Python Shell 命令生成

直接通過命令來執行,可以看到下面的命令中並沒有用到compile()函式, 這是因為py_compile模組的main()函式中呼叫了compile().

python3 -m py_compile md5.py

python3 -O -m py_compile md5.py

  • -O 優化成位元組碼
  • -m 表示把後面的模組當成指令碼執行
  • -OO 表示優化的同時刪除文件字串

如果你想看compile(), compile_dir(), compile_path()具體每個引數是幹嗎用的,可以使用print py_compile.compile().__doc__來檢視,或者直接開啟py_compile.py,compileall.py檔案來看。

執行pyc檔案

直接執行即可!

Geek-Mac:__pycache__ zhangyi$ python3 md5.pyc 
tokenKey ==>  696f6d1af498db3c54ffa572a2723cb7
timeStamp ==>  1530954550
find ==>  100
Geek-Mac:__pycache__ zhangyi$ 

總結

通過上面的方法,可以方便的把py檔案編譯為pyc檔案了,從而可以實現部分的原始碼隱藏,保證了python做商業化軟體時,保證了部分的安全性吧,繼續學習下,看怎麼修改opcode。