python文件读写(二)-rar, zip,tar, gz压缩,解压缩文件

1.概述

  • 在平时自动化测试工作中,经常会用python对一些文件进行读写操作。其中使用最多的文件格式,就是txt, log, json, csv, xml, zip, tar, gz, rar, excel,这十种文件格式。
  • rar, zip,tar, gz这四种格式,需要使用python的第三方库进行操作。
  • gz: 即gzip,通常只能压缩一个文件。与tar结合起来就可以实现先打包,再压缩。
  • tar: linux系统下的打包工具,只打包,不压缩
  • tgz:即tar.gz。先用tar打包,然后再用gz压缩得到的文件
  • zip: 不同于gzip,虽然使用相似的算法,可以打包压缩多个文件,不过分别压缩文件,压缩率低于tar。
  • rar:打包压缩文件,最初用于DOS,基于window操作系统。压缩率比zip高,但速度慢,随机访问的速度也慢
  • 3.tar, gz

    import os, tarfile
    #一次性打包整个根目录。空子目录会被打包。
    #如果只打包不压缩,将"w:gz"参数改为"w:"或"w"即可。
    def make_targz(output_filename, source_dir):
      with tarfile.open(output_filename, "w:gz") as tar:
        tar.add(source_dir, arcname=os.path.basename(source_dir))
    #逐个添加文件打包,未打包空子目录。可过滤文件。
    #如果只打包不压缩,将"w:gz"参数改为"w:"或"w"即可。
    def make_targz_one_by_one(output_filename, source_dir):
      tar = tarfile.open(output_filename,"w:gz")
      for root,dir,files in os.walk(source_dir):
        for file in files:
          pathfile = os.path.join(root, file)
          tar.add(pathfile)
      tar.close()
    make_targz('test.tar.gz',"E:\python_sample\libs")
    make_targz_one_by_one('test01.tgz',"E:\python_sample\libs")
    
    import gzip
    import os
    def un_gz(file_name):
        """ungz zip file"""
        f_name = file_name.replace(".gz", "")
        #获取文件的名称,去掉
        g_file = gzip.GzipFile(file_name)
        #创建gzip对象
        open(f_name, "wb+").write(g_file.read())
        #gzip对象用read()打开后,写入open()建立的文件里。
        g_file.close() #关闭gzip对象
    import tarfile
    def un_tar(file_name):
        #untar zip file
        tar = tarfile.open(file_name)
        names = tar.getnames()
        if os.path.isdir(file_name + "_files"):
        else:
            os.mkdir(file_name + "_files")
        #由于解压后是许多文件,预先建立同名文件夹
        for name in names:
            tar.extract(name, file_name + "_files/")
        tar.close()
    un_gz("test.tar.gz")
    un_tar("test.tar")
    

    4.zip

    import os, zipfile
    #打包目录为zip文件(未压缩)
    def make_zip(source_dir, output_filename):
        zipf = zipfile.ZipFile(output_filename, 'w')
        pre_len = len(os.path.dirname(source_dir))
        for parent, dirnames, filenames in os.walk(source_dir):
            for filename in filenames:
                print(filename)
                pathfile = os.path.join(parent, filename)
                arcname = pathfile[pre_len:].strip(os.path.sep)   #相对路径
                zipf.write(pathfile, arcname)
            print()
        zipf.close()
    make_zip(r"E:\python_sample\libs\test_tar_files\libs","test.zip")
    
    import os,zipfile
    def un_zip(file_name):
        """unzip zip file"""
        zip_file = zipfile.ZipFile(file_name)
        if os.path.isdir(file_name + "_files"):
        else:
            os.mkdir(file_name + "_files")
        for names in zip_file.namelist():
            zip_file.extract(names,file_name + "_files/")
        zip_file.close()
    un_zip("test.zip")
    

    5.rar

    #rarfile不支持创建rar压缩卷,请用zip/7z
    import rarfile
    def unrar(rar_file, dir_name):