目录

了解

zipfile


了解

        zip是一种数据压缩和文档存储的文件格式,后缀名为.zip,MIME类型为application/zip,在python中的内置模块zipfile提供了来操作zip文件类型,相关的学习实现类为zipfile.ZipFile和zipfile.ZipInfo。
        个人了解较少,暂不深入了解,了解相关用法即可。

zipfile

(1) 以下为创建实例对象
         ZipFile(file, mode, [compression] [allowZip64],[compresslevel], [strict_timestamps])
         file,*.zip文件路径
         mode,文件模式
         compression:压缩方式
         allowZip64:是否允许ZIP64扩展格式(2) 以下为zipfile.ZipFile实例的相关方法:
         filename:获取文件名。
         namelist:获取目录下的子文件名称列表。
         getinfo(name):获取单个文件ZipInfo对象,注意name为中文是仍然需要用gbk编码再用cp437解码才能正确获取。
         filelist/infolist():获取目录下的子文件ZipInfo对象列表,注意,子文件名称解码字符集为cp437,同样需要用cp437编码再使用gbk解码才能正确显示中文名称。
         extractall():提取zip文件目录下的所有文件到指定目录(解压),该方式若文件名称存中文名称则解压后的文件名称将出现乱码(不推荐使用)。
         extract(name/ZipInfo):获取单个文件ZipInfo对象,可以结合infolist()遍历ZipInfo,然后对每个文件名进行编解码,解决中文乱码 (推荐)。
         open(name/ZipInfo,mode,[pwd]):允许我们打开压缩中的某个文件进行操作,注意只支持w/r模式,注意这个直接打开zip中的文件需要编解码操作,可以看一下真实存储的文件名:zip_file.namelist()。如果打开目录文件,要以“/”结尾,例如:'myfile/';读取具体文件,以文件类型后缀结尾,例如:'myfile/test1.txt'。
         read(name):等价于open(name,mode='r')。
         write(filename,arc_name):把某个外部文件内容全部写入到zip文件中的某个文件中。
         testzip():zip文件是否损坏,返回None则为未损坏。
         comment:文件注释内容。


    
(3) 以下为zipfile.ZipInfo实例的相关方法:

filename:获取文件名称,默认解码cp437。
         file_size:获取文件大小,单位为字节(bytes)。
         compress_type:压缩类型,可选值参考如下。
         0(ZIP_STORE ):未压缩的存储
                 8(ZIP_DEFLATED): 标准的DEFLATE压缩                12(BZIP2): BZIP2压缩
                 14(ZIP_LZMA): LZMA压缩
                 15(ZIP_XZ): XZ压缩
                 99(ZIP_AES): AES压缩
                 comment:注释内容
                 date_time:文件修改日期时间


        
        
(4) 以下为代码示例:

# 创建实例zip 
import zipfile

zip_file = zipfile.ZipFile('test.zip')

# 提取所有文件到指定路径下
for zip_info in zip_file.infolist():
    zip_info.filename = zip_info.filename.encode('cp437').decode('gbk')
    zip_file.extract(zip_info, './get_files/', pwd=None)

# 关闭文件流
zip_file.close()

# 打开某个文件进行写入(会覆盖已存在的文件)
with zipfile.ZipFile("./test.zip") as zipf:
    with zipf.open('测试1.txt'.encode('gbk').decode('cp437'), mode='w') as f:
        f.write('你好,Joden'.encode('utf-8'))