python zip檔案 壓縮

來源:互聯網
上載者:User

從簡單的角度來看的話,zip格式會是個不錯的選擇,而且python對zip格式的支援夠簡單,夠好用。
1)簡單應用
如果你僅僅是希望用python來做壓縮和解壓縮,那麼就不用去翻文檔了,這裡提供一個簡單的用法,讓你一看就能明白。
import zipfile
f = zipfile.ZipFile('filename.zip', 'w' ,zipfile.ZIP_DEFLATED)
f.write('file1.txt')
f.write('file2.doc')
f.write('file3.rar')
f.close()
f.zipfile.ZipFile('filename')
f.extractall()
f.close()
不知道上面的例子是不是足夠簡單呢?
1.1 zipfile.ZipFile(fileName[, mode[, compression[, allowZip64]]])
fileName是沒有什麼疑問的了。
mode和一般的檔案操作一樣,'r'表示開啟一個存在的唯讀ZIP檔案;'w'表示清空並開啟一個唯寫的ZIP檔案,或建立一個唯寫的ZIP檔案;'a'表示開啟一個ZIP檔案,並新增內容。
compression表示壓縮格式,可選的壓縮格式只有2個:ZIP_STORE;ZIP_DEFLATED。ZIP_STORE是預設的,表示不壓縮;ZIP_DEFLATED表示壓縮,如果你不知道什麼是Deflated,那麼建議你去補補課。
allowZip64為True時,表示支援64位的壓縮,一般而言,在所壓縮的檔案大於2G時,會用到這個選項;預設情況下,該值為False,因為Unix系統不支援。
1.2 zipfile.close()
說真的,這個沒什麼可說的,如果有的話,那就是你寫入的任何檔案在關閉之前不會真正寫入磁碟。
1.3 zipfile.write(filename[, arcname[, compress_type]])
acrname是壓縮檔中該檔案的名字,預設情況下和filename一樣
compress_type的存在是因為zip檔案允許被壓縮的檔案可以有不同的壓縮類型。
1.4 zipfile.extractall([path[, member[, password]]])
path解壓縮目錄,沒什麼可說的
member需要解壓縮的檔案名稱兒列表
password當zip檔案有密碼時需要該選項
對於簡單的應用,這麼多就夠了。
2)進階應用程式
2.1 zipfile.is_zipfile(filename)
判斷一個檔案是不是壓縮檔
2.2 ZipFile.namelist()
返迴文件列表
2.3 ZipFile.open(name[, mode[, password]])
開啟壓縮文檔中的某個檔案
2.4 ZipFile.infolist()
2.5 ZipFile.getinfo(name)
上述檔案返回ZipInfo對象,只不過一個返回的是列表,一個返回的是一個ZipInfo
ZipInfo類
2.6 ZipInfo.filename
2.7 ZipInfo.date_time
傳回值的格式為(year,month,date,hour,minute,second)
2.8 ZipInfo.compress_type
2.9 ZipInfo.comment
2.10ZipInfo.extra
2.11ZipInfo.create_system
2.12ZipInfo.extract_version
2.13ZipInfo.reserved 總是0
2.14ZipInfo.flag_bits
2.15ZipInfo.volume
2.16ZipInfo.internal_attr
2.17ZipInfo.external_attr
2.18ZipInfo.header_offset
2.19ZipInfo.CRC
2.20ZipInfo.file_size
2.21ZipInfo.compress_size
2.22ZipFile.testzip()
檢查每個檔案和它對應的CRC,如果有錯誤返回對應的檔案清單
2.23ZipFile.setpassword(password)
2.24ZipFile.read(name[,password])
返回對應的檔案
2.25ZipFile.printdir()
列印壓縮檔夾的資訊
2.26ZipFile.writestr(zipinfo_or_arcname, bytes)
PyZipFile類
zipfile.PyZipFile除了上面的方法和屬性之外,還有一個特殊的方法
2.27PyZipFile.writepy(pathname,basename)
一般情況下,僅僅壓縮.pyc和.pyo檔案,不壓縮.py檔案
----------------------------------------------------------------------
zip檔案格式資訊
一個 ZIP 檔案由三個部分組成:壓縮源檔案資料區+壓縮源檔案目錄區+壓縮源檔案目錄結束標誌
1)壓縮源檔案資料區
在這個資料區中每一個壓縮的源檔案/目錄都是一條記錄,記錄的格式如下: [檔案頭+ 檔案資料 + 資料描述符]
   a、檔案頭結構
   組成 長度
   檔案頭標記 4 bytes (0x04034b50)
   解壓檔案所需 pkware 版本 2 bytes
   全域方式位標記 2 bytes
   壓縮方式 2 bytes
   最後修改檔案時間 2 bytes
   最後修改檔案日期 2 bytes
   CRC-32校正 4 bytes
   壓縮後尺寸 4 bytes
   未壓縮尺寸 4 bytes
   檔案名稱長度 2 bytes
   擴充記錄長度 2 bytes
   檔案名稱 (不定長度)
   擴充欄位 (不定長度)
  
   b、檔案資料
  
   c、資料描述符
  組成 長度
   CRC-32校正 4 bytes
   壓縮後尺寸 4 bytes
   未壓縮尺寸 4 bytes
   這個資料描述符只在全域方式位標記的第3位設為1時才存在(見後詳解),緊接在壓縮資料的最後一個位元組後。這個資料描述符只用在不能對輸出的 ZIP 檔案進行檢索時使用。例如:在一個不能檢索的磁碟機(如:磁帶機上)上的 ZIP 檔案中。如果是磁碟上的ZIP檔案一般沒有這個資料描述符。
  
2)壓縮源檔案目錄區
   在這個資料區中每一條紀錄對應在壓縮源檔案資料區中的一條資料
   組成 長度
   目錄中檔案檔案頭標記 4 bytes (0x02014b50)
   壓縮使用的pkware 版本 2 bytes
   解壓檔案所需 pkware 版本 2 bytes
   全域方式位標記 2 bytes
   壓縮方式 2 bytes
   最後修改檔案時間 2 bytes
   最後修改檔案日期 2 bytes
   CRC-32校正 4 bytes
   壓縮後尺寸 4 bytes
   未壓縮尺寸 4 bytes
   檔案名稱長度 2 bytes
   擴充欄位長度 2 bytes
   檔案注釋長度 2 bytes
   磁碟開始號 2 bytes
   內部檔案屬性 2 bytes
   外部檔案屬性 4 bytes
   局部頭部位移量 4 bytes
   檔案名稱 (不定長度)
   擴充欄位 (不定長度)
   檔案注釋 (不定長度)
  
3)壓縮源檔案目錄結束標誌
   組成 長度
   目錄結束標記 4 bytes (0x02014b50)
   當前磁碟編號 2 bytes
   目錄區開始磁碟編號 2 bytes
   本磁碟上紀錄總數 2 bytes
   目錄區中紀錄總數 2 bytes
   目錄區尺寸大小 4 bytes
   目錄區對第一張磁碟的位移量 4 bytes
   ZIP 檔案注釋長度 2 bytes
   ZIP 檔案注釋 (不定長度)
相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.