1. 程式人生 > >Python 解壓縮文件詳解

Python 解壓縮文件詳解

分享圖片 pat 實現 .get 參數 join rac zip byte

zipfile模塊及相關方法介紹:

1 壓縮

1.1 創建zipfile對象

zipfile.ZipFile(file, mode=‘r‘, compression=0, allowZip64=True, compresslevel=None)

創建Zipfile對象,主要參數:

1>file壓縮包名稱;
2>mode:讀‘r‘或者寫‘w‘模式;
3>compression:設置壓縮格式;
4>compresslevel:壓縮等級;

壓縮格式分類:

格式 說明 對應compresslevel
ZIP_STORED 不壓縮 無效
ZIP_DEFLATED 需要zlib支持 0~9
ZIP_BZIP2 需要bz2支持 0~9
ZIP_LZMA 需要lzma支持 無效

1.2 添加壓縮文件

zipobj.write(self, filename, arcname=None, compress_type=None, compresslevel=None)

參數說明:

1>fiename:添加文件路徑;
2>arcname:歸檔文件路徑與名稱;

1.3 添加壓縮數據

zipobj.writestr(zinfo_or_arcname, data, compress_type=None, compresslevel=None)

參數說明:

1>zinfo_or_arcname:歸檔文件名稱;

2>data:壓縮數據str或者byte,如果數據為str,需要先進行Utf-8編碼;

1.4 關閉

關閉壓縮文件:

zipobj.close()

1.5 一個例子:

壓縮目錄如下:
技術分享圖片

代碼實現:

import zipfile
logdir = ‘/home/linux/logs‘
zipname = ‘/home/linux/logs.zip‘
#創建zip對象,
fzip = zipfile.ZipFile(zipname, ‘w‘, zipfile.ZIP_DEFLATED)
#遍歷要壓縮目錄
flist = os.listdir(logdir)
for name in flist:
    fpath = os.path.join(logdir, name)
    #寫入要壓縮文件
    fzip.write(fpath)
#關閉
fzip.close()

進入目錄解壓,文件路徑如下:
技術分享圖片
可以看到,我們將整個目錄添加到壓縮文件中,其實我們更想做的是logs/*.log;
對代碼進行修改:

logdir = ‘/home/linux/logs‘
zipname = ‘/home/linux/logs.zip‘
import zipfile
#創建zip對象,
fzip = zipfile.ZipFile(zipname, ‘w‘, zipfile.ZIP_DEFLATED)
#遍歷要壓縮目錄
flist = os.listdir(logdir)
#獲取壓縮目錄名稱
basename = os.path.basename(logdir)
for name in flist:
    fpath = os.path.join(logdir, name)
    arcname = os.path.join(basename, name)
    #寫入要壓縮文件,並添加歸檔文件名稱
    fzip.write(fpath, arcname=arcname)
#關閉
fzip.close()

壓縮之後,解壓縮內容:
技術分享圖片
這個才是我們想要的。

2.獲取壓縮包信息

打開壓縮包:
frzip = zipfile.ZipFile(zipname, ‘r‘, zipfile.ZIP_DEFLATED):只讀方式打開;

frzip.printdir(),顯示壓縮包文件信息

File Name                                             Modified             Size
logs/1003.log                                  2019-04-09 10:00:10           17
logs/1001.log                                  2019-04-09 10:00:06           17
logs/1004.log                                  2019-04-09 10:00:12           17
logs/1002.log                                  2019-04-09 10:00:08           17
logs/1000.log                                  2019-04-09 10:00:04           17

frzip.filelist:記錄壓縮包文件信息,與printdir類似,內容如下:

[<ZipInfo filename=‘logs/1003.log‘ compress_type=deflate filemode=‘-rw-r--r--‘ file_size=17 compress_size=17>,
 <ZipInfo filename=‘logs/1001.log‘ compress_type=deflate filemode=‘-rw-r--r--‘ file_size=17 compress_size=17>,
 <ZipInfo filename=‘logs/1004.log‘ compress_type=deflate filemode=‘-rw-r--r--‘ file_size=17 compress_size=17>,
 <ZipInfo filename=‘logs/1002.log‘ compress_type=deflate filemode=‘-rw-r--r--‘ file_size=17 compress_size=17>,
 <ZipInfo filename=‘logs/1000.log‘ compress_type=deflate filemode=‘-rw-r--r--‘ file_size=17 compress_size=17>]

frzip.getinfo(name):獲取指定arcname的信息:

frzip.getinfo(‘logs/1003.log‘)
#輸出結果:
<ZipInfo filename=‘logs/1003.log‘ compress_type=deflate filemode=‘-rw-r--r--‘ file_size=17 compress_size=17>

frzip.namelist():獲取壓縮文件列表

[‘logs/1003.log‘,
 ‘logs/1001.log‘,
 ‘logs/1004.log‘,
 ‘logs/1002.log‘,
 ‘logs/1000.log‘]

3 解壓壓縮包

frzip.extract(member, path=None, pwd=None):解壓縮一個文件到指定目錄;
參數:
member:壓縮包中文件;
path:解壓縮到指定目錄,默認解壓到當前目錄;

frzip.extractall(path=None, members=None, pwd=None):解壓縮多個文件到指定目錄;
參數:
path:指定的解壓目錄;
members:指定解壓文件,默認解壓全部;

解壓指定文件到指定目錄:

#可以自己定義路徑
zipname = ‘/home/linux/logs.zip‘
extractpath =  ‘/home/linux/1‘
#註意壓縮格式選擇
frzip = zipfile.ZipFile(zipname, ‘r‘, zipfile.ZIP_DEFLATED)
extractfile = frzip.namelist()
if len(extractfile):
    extname = extractfile[0]
    print(‘extract file:‘, extname)
    frzip.extract(extractfile[0], extractpath)
frzip.close()

輸出結果:extract file: logs/1003.log,在extractpath目錄下有log文件;

使用frzip.extractall將所有文件解壓到指定目錄:

#可以自己定義路徑
zipname = ‘/home/linux/logs.zip‘
extractpath =  ‘/home/linux/1‘
#註意壓縮格式選擇
frzip = zipfile.ZipFile(zipname, ‘r‘, zipfile.ZIP_DEFLATED)
#將所有文件加壓縮到指定目錄
frzip.extractall(extractpath)
frzip.close()

除了zipfile還有其它模塊:
import gzip;
import tarfile;
這些模塊使用方式都類似,後面文章中我們在詳解講解。

Python 解壓縮文件詳解