事情是这样的,从 pytorch=3.0.0 换了个版本到 pytorch=3.0.1 的时候,conda update完就报这个运行时错误了。
原因是PyTorch用 cudnn=7.0.5 编译的,但是在这个环境中只找到了版本为 7.1.3 cudnn ,版本错误改了好久,大部分是说把7.1.3的环境从 $PATH 变量中删除就好了,可服务器上好几个环境怎么都没找到7.0.5的,不知道删了之后该链接到哪儿。问题截图如下:
在这里插入图片描述

解决方案:

安装 cudnn=7.0.5 ,并将 libcudnn.so 链接到7.0.5版本上。

1. 查看cuda版本:

cat /usr/local/cuda/version.txt , 这里我的cuda是9.0.176。

2. 下载对应的cudnn

路径: https://developer.nvidia.com/rdp/cudnn-archive ,这里我在服务器上配置的,所以下载的Linux版本的。
在这里插入图片描述
下载完是后缀为 solitairetheme8 的文件~
在这里插入图片描述

3. 解压

cp cudnn-9.0-linux-x64-v7.solitairetheme8 cudnn-9.0-linux-x64-v7.0.5.tgz
tar -zxvf cudnn-9.0-linux-x64-v7.0.5.tgz

4. 复制到工作目录下

这里建议查一下当前版本7103在什么位置,看到网上好多是放在/usr/local/cuda/lib64下,刚开始我也放在这个底下了,可还是没有用。后来通过find ./ -name *cudnn*在当前用户根目录下查了下包含cudnn的都有哪些,才发现在anaconda3/envs/sanra123/lib下包含了cudnn=7.1.3的版本(这里sanra123是自己的conda下的环境名哦),实际工作时会在这个目录下去找。所以下一步把cudnn=7.0.5的版本复制到这个目录下,配置一下环境变量。

sudo cp cuda/include/cudnn.h /home/root/anaconda3/envs/sanra123/include 
sudo cp cuda/lib64/libcudnn* /home/root/anaconda3/envs/sanra123/lib
sudo chmod a+r /home/root/anaconda3/envs/sanra123/include/cudnn.h /home/root/anaconda3/envs/sanra123/lib/libcudnn*

5. 配置环境变量

设置环境变量有两个位置,/etc/profile和自己用户名下的~/.bashrc。服务器上就在自己的用户名下进行了配置。这段我其实忘了有没有用了(大概率是没用的),因为之前其实在/etc/profile下已经找到这个环境变量了,也是指到lib64下。后面是自己改了下.bashrc设错了,就又设了下。不过,记一下备忘吧,其实是不需要这步了的。

export PATH=/usr/local/cuda-9.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH
export PATH=/home/root/anaconda3/bin:$PATH

6. 设置软链接

进入/home/root/anaconda3/envs/sanra123/lib目录(即刚刚找到的工作目录),查看有关cudnn的文件,可以看到,虽然将7.0.5移动到了这里,但实际链接到的还是7.1.3,所以这里需要改一下软链接指向啦。
在这里插入图片描述

sudo ln -sf libcudnn.so.7.0.5 libcudnn.so
sudo ln -sf libcudnn.so.7.0.5 libcudnn.so.7

7.测试输出

改好了,到python中测一下。输出为7005的cudnn版本证明我们终于改好这个问题啦!真棒,夸夸~

import torch
print(torch.backends.cudnn.version())

参考:
cudnn官方(5-6页)
cudnn安装步骤看的这里啦,不过配置那步感觉要改一下的
谢谢这里的链接提示

Pytorch-cuDNN version mismatch: PyTorch was compiled against 7005 but linked against 7103 事情是这样的,从pytorch=3.0.0换了个版本到pytorch=3.0.1的时候,conda update完就报这个运行时错误了。原因是PyTorch用cudnn=7.0.5编译的,但是在这个环境中只找到了版本为7.1.3的cudnn,版本错误改了好久,大部分是说把7.1.3的环境从$PATH变量中删除就好了,可服务器上好几个环境怎么都没找到7.0.5的,不知道删了之后该链接到哪儿。问题截... 为了能够进行练习,您将需要一台装有Miniconda(Anaconda的最小版本)和几个Python软件包的笔记本电脑。 以下说明适用于Mac或Ubuntu Linux用户,Windows用户需要在终端中安装和使用。 下载并安装Miniconda 请访问。 为您的操作系统下载并安装适用于Python 3.7的最新Miniconda版本。 wget < http> sh < miniconda> 通过练习检出git存储库 一旦Miniconda准备就绪,请签出课程资料库并继续设置环境: git clone https://github.com/Atcold/pytorch-Deep-Learning 创建隔离的Miniconda环境 将目录( cd )更改为课程文件夹,然后键入: # cd pytorch-Deep-Learning conda env c
报错:RuntimeError: cuDNN version mismatch: PyTorch was compiled against 7102 but linked against 7301 解决办法:conda install cudnn=7.1.2 计算单个模型的内存使用量 Model Sequential : params: 0.450304M Model Sequential : intermedite variables: 336.089600 M (without backward) Model Sequential : intermedite variables: 672.179200 M (with backward) 跟踪GPU内存使用量 # 30-Apr-21-20:25:29-gpu_mem_track.txt 该存储库包含一些用于语义分割的模型以及在PyTorch中实现的训练和测试模型的管道 Vanilla FCN:分别为VGG,ResNet和DenseNet版本的FCN32,FCN16,FCN8( ) U-Net( ) SegNet( ) PSPNet() GCN() DUC,HDC() PyTorch 0.2.0 PyTorch的TensorBoard。 安装 其他一些库(在运行代码时查找丢失的内容:-P) 转到models目录并在config.py中设置预训练模型的路径 转到数据集目录并按照自述文件进行操作 DeepLab v3
RuntimeError: cuDNN version mismatch: PyTorch was compiled against 7102 but linked against 7102 是 cudnn 7.1.2 的意思 7605 是cudnn 7.6.5 的意思 重新安装一个cudnn就好了 这边就安装cudnn7.1.2
1、为什么会出现这个问题呢, 因为要运行pytorch做模型训练,自己安装了9.0的cuda和7.0.5的cudda,本以为ok了,运行程序出现标题字样的错误 2、首先翻译为Cudnn版本不兼容:PyTorch是针对7005编译的,但与6021链接 经过一顿百度,怀疑安装了dudda python import torch...
由于遇到了不能使用两块 k80GPU, 和pycharm 远程连接服务器的时候不能调试的问题:ImportError: dlopen: cannot load any more object with static TLS然后 conda install 的 pytorch 使用的 cudnn 版本的6的,使用 torch.backends.cudnn.version()来查看使用的 cunn
Gitee Pages(国内): ://apachecn.gitee.io/pytorch-doc-zh 第三方站长[网站] pytorch中文文档: ://www.bookstack.cn/search/result?wd pytorch 地址A:xxx(欢迎留言,我们完善补充) PyTorch官方入口 中文文档: :
克隆此仓库并运行代码 $ git clone https://github.com/KaiyangZhou/pytorch-center-loss $ cd pytorch-center-loss $ python main.py --eval-freq 1 --gpu 0 --save-dir log/ --plot 您将在终端中看到以下信息 Currently using GPU: 0 Creating dataset: mnist Creating model: cnn == > Epoch
1.faster-rcnn训练报错 Loaded runtime CuDNN library: 7600 (compatibility version 7600) but source was compiled with 7004; Check failed: stream->parent()->GetConvolveAlgorithms( conv_parameters.
目录文章简介Issues环境配置Ref-Reasoning数据集格式train(val)_expression.jsontrain(val)_sgs.jsontrain(val)_sg_seqs.json Graph-Structured Referring Expressions Reasoning in The Wild Issues 在作者代码的README中,有环境配置的步骤,不过python2.7+pytorch0.4.0支持的cuda版本和本机显卡支持的cuda版本
UnavailableInvalidChannel: HTTP 404 NOT FOUND for channel pytorch-lightning <https://conda.anaconda.org/pytorch-lightning> The channel is not accessible or is invalid. You will need to adjust your conda configuration to proceed. Use `conda config --show channels` to view your configuration's current state, and use `conda config --show-sources` to view config file locations.
这个错误提示是在使用 conda 安装 pytorch-lightning 时发生的。出现这个错误可能有以下原因: 1. pytorch-lightning 这个 channel 确实不存在或不可用。 2. conda 配置中缺少 pytorch-lightning 这个 channel。 3. conda 配置中 pytorch-lightning 这个 channel 的优先级低于其他 channel。 你可以尝试使用以下命令来添加 pytorch-lightning 这个 channel: conda config --add channels pytorch-lightning 然后再尝试安装 pytorch-lightning,看看是否还会报错。如果还有问题,建议查看一下 conda 配置中其它 channel 的优先级,看是否与 pytorch-lightning 冲突。
secureCRT登录`No compatible key-exchange method. The server supports these methods: diffie-hellman` 42071