colab中zipfile模块解压zip文件出现——BadZipFile: zipfiles that span multiple disks are not supported 2020-12-15 22:46:39

在google的colab环境中,使用zipfile模块解压zip文件提示如下error:
BadZipFile: zipfiles that span multiple disks are not supported

可以借助以下命令进行解压:

!apt-get install p7zip-full # 安装所需软件,colab中应该默认已经安装
!7za e ZipFileName          # 解压zip文件到当前目录
!apt-get install p7zip-full	# 安装所需软件,colab中应该默认已经安装
!7za x ZipFileName			# 保持zip文件目录结构的前提下解压zip文件到当前目录,

【解释】
假设当前目录为C盘,C盘一个zip文件dataset.zip包含1.txt和2.txt两个文件,即目录结构如下:
C:\
     dataset.zip

[1] 使用 !7za e dataset.zip,解压之后,目录结构如下:
C:\
     dataset.zip
     1.txt
     2.txt

[2] 使用 !7za x dataset.zip,解压之后,目录结构如下:
C:\
     dataset.zip
     dataset
          1.txt
          2.txt

问题:在执行import tensorflow和import gensim时候出现如下错误: Traceback (most recent call last): File "D:\Anaconda\lib\site-packages\IPython\core\interactiveshell.py", line 2963, in run_code exec(code_obj, sel... 今天才发现可以用Google的Colaboratory可以训练pytorch神经网络,真的太高兴了,这样就可以决我渣渣的电脑没有GPU,无法训练大型神经网络的问题了。 但是由于需要上传本地训练数据,很不方便,所以我就打算把本地数据打zip包上传到Google云盘,然后再在colab上用命令行下载过来训练,找了半天才找到办法,这里记录一下吧,主要代码如下: # 首先安装googledrivedownloader pip install googledrivedownloader #接着下载 """Read and write ZIP files.XXX references to utf-8 need further investigation."""importioimportosimportreimportimportlib.utilimportsysimporttimeimportstatimportshutilimportstructimportbinasciitry:imp... """Read and write ZIP files.XXX references to utf-8 need further investigation."""importioimportosimportreimportimportlib.utilimportsysimporttimeimportstatimportshutilimportstructimportbinasciitry:imp... zip_file = zipfile.ZipFile(zip_file),zip_file.extract()里面文件时报错如下 zipfile.BadZipFile: File name in directory '╡Ñ╥╗└┤╘┤▓╔╣║╜ß╣√╣½╕µ.doc' and h 决方法 修改zipfile.py源码, 搜索cp437,分别在1327行,1510行 使用google colab的时候,使用命令unzip xxx.zip时,log显示我已经unzip成功,但是对应文件夹里没有操作记录及文件。 尝试决1: 修改路径名为英文,未决问题 尝试决2:我在drive下unzip的,将zip文件mv到/content下在unzip,之后将文件mv到对应文件夹下,决问题!!并且,在/content下文件特别快,drive下两个多小时的这... 已决Archive: /content/drive/MyDrive/colab/mmdetection/data/coco.zip warning [/content/drive/MyDrive/colab/mmdetection/data/coco.zip]:22568649454 extra bytes at beginning or within zipfile (attempting to process anyway) error [/content/drive/MyDrive/colab/mm 这样我们就可以了。代码如下: !unzip "/content/drive/MyDrive/colab/缩包名字.zip" -d "/content/drive/MyDrive/后的目录名称。。。。