文章目录

4. 我的解决

在这里插入图片描述
其实不难发现,我报错的位置基本都是从 gpu cpu 转换的时候出现的问题。

后续发现其实是某张卡有问题,

1. 错误描述

例行吐槽,第一次遇到这个错误,我是非常无语的。以前是不报错的,和以前相比,不同的地方有

  1. 数据变多了,从80例变成了100例
  2. 换了个docker镜像,可能pytorch版本和cuda版本上有些问题
  3. 检查了代码,没有发生修改

2. 自我尝试

2.1 减小batch_size

感觉上可能会和显存有点关系吧

第一次报错

在这里插入图片描述

在这里插入图片描述

按照这个思路继续把 batch_size 调小(8→5),又换了个位置报错。。
在这里插入图片描述

2.2 换卡改代码

换思路

3. 调研情况

报错信息是CUDA丢出来的一个运行时错误,发生了非法内存访问。网上关于这个问题的讨论也很多,但是并没有发现有找到真正原因的。

很多都是靠感觉的

参考:

TransUNet:Transformers Make Strong Encoders for Medical Image Segmentation用于医疗图像分割的transformers编码器详解 2023年12月6日 MAMBA介绍:一种新的可能超过Transformer的AI架构 2023年12月20日 WAVE SUMMIT 2022深度学习开发者峰会 2023年8月3日 YOLOv7 pytorch,支持剪枝【附代码】 2023年6月12日 Windows10+Intel显卡+CPU本地部署stable-diffusion-webui项目 2023年8月23日 【ChatGPT】ChatGPT国内镜像网站集合 2023年5月21日 【人工智能数学基础(一)】线性代数 2022年1月18日 推荐九大类实用的AI工具网站 | 最实用的AI工具网站推荐大全(建议收藏!!!) 2023年6月20日 【pytorch】(十一)循环神经网络(RNN) 2022年5月9日 华为云ModelArts初体验-飞机识别 2022年1月19日 yolov3模型训练并部署到K210(零基础也可) 2023年6月15日 将时间序列转成图像——马尔可夫转移场方法 Matlab实现 2023年3月4日 当ChatGPT遇见stable-diffusion,你不敢相信的创意艺术之旅! 2023年6月7日 图像聚类算法 2022年5月30日