导语:同一个镜像在不同的显卡驱动的机器上无法使用gpu 。报错Error 803: system has unsupported display driver / cuda driver combination

查看2个镜像对应的cuda driver

同镜像tag ge2206300210 宿主机驱动465.27 镜像cuda driver是465.27

同镜像 tag ge2206300210宿主机驱动470.63 镜像cuda driver是465.27

这里宿主机的driver挂进去自己修改了软链。

令一个镜像 tag only_cta220630宿主机驱动465.27 镜像cuda driver是470.63

这里宿主机的cuda driver挂载进去了 但是并没有替换镜像里的driver。

令一个镜像 tag only_cta220630宿主机驱动470.63 镜像cuda driver是470.63

也是没问题的。

打开宿主机上/etc/nvidia-container-runtime/config.toml中的debug开关,启动容器,就会看到启动日志(/var/log/nvidia-container-toolkit.log)

[nvidia-container-cli]
debug = "/var/log/nvidia-container-toolkit.log"
log-level = "debug"

确实会mount宿主机上的相关cuda so包。这里已经把对应的libcuda.so.465.27做到镜像里了 所以可能没有对应的挂载日志

这里估计选择了最新的

对于这条做了测试

镜像中存在libcuda.so.465.27 和 libcuda.so.470.63.01时 nvidia-docker会将软链指到libcuda.so.470.63.01

造成这个的原因我认为是低版本的driver不会覆盖镜像中高版本的driver导致,详细可以参考如下图片和链接。

https://zhuanlan.zhihu.com/p/361545761

打开宿主机上/etc/nvidia-container-runtime/config.toml中的debug开关,启动容器,就会看到启动日志(/var/log/nvidia-container-toolkit.log)这里已经把对应的libcuda.so.465.27做到镜像里了 所以可能没有对应的挂载日志。造成这个的原因我认为是低版本的driver不会覆盖镜像中高版本的driver导致,详细可以参考如下图片和链接。这里宿主机的cuda driver挂载进去了 但是并没有替换镜像里的driver。 export PATH=/usr/local/cuda-10.2/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64:$LD_LIBRARY_PATH $source .. 克隆项目并运行服务器 git clone git://github.com/docpad/html5-boilerplate.docpad.git cd html5-boilerplate.docpad npm install docpad run 通过修改src目录开始破解 使用,将这个框架设置为 ,因此,在发布网站之前,应在此处和LICENSE.md文件中放置所需的许可证。 如果您想开源您的网站,建议您使用作为内容,而使用作为代码。 在这种情况下,您可能希望使用以下内容作为许可证: Unless stated otherwise, all content is licensed under the [Creative Commons Attribution License](http://creativecommons.o 添加对支持,以使用编写模板 约定: .anything.php|phtml 注意:此插件为 PHP 提供模板数据,但您将无法调用模板助手,因为 php 没有简单的方法与 javascript(这是 DocPad 构建的内容)进行通信,因此,您可能需要改为使用。 docpad install php 您可以在History.md文件中发现历史记录
修补Sur兼容性 Patched Sur很快将显示一个屏幕,解释每个Mac的兼容性。 但是,该数据必须来自某个地方,因此这就是该回购存在的原因。 在这里,您可以查看或贡献任何Mac与Patched Sur(或常规修补程序)配合使用的效果的列表。 我该如何贡献? 之前没有人提交过我的模型 如果您不熟悉GitHub , 并用以下信息填充它: 您拥有的Mac,应该以两种形式出现: Mac类型(屏幕尺寸,部分年) 如果您的Mac没有屏幕,则不包括屏幕尺寸。 示例:MacBook Pro(13英寸,2012年中) 可以直接从此Mac屏幕上删除。 MacTypeX,Y Patched Sur在“关于此Mac”屏幕的后安装应用程序中显示了此信息,或者您可以在终端中运行sysctl -n hw.model 示例:MacBookPro9,2 哪些有效,哪些无效,下面列出了一些内容(请查找“
proxies : ' /some/path ' : ' http://some-proxy.com ' ' /another/path ' : ' http://another-proxy.com ' 前往CONTRIBUTING.md文件,了解如何做出贡献。 这些了不起的人正在维护这个项目: 本杰明 Lupton b@lupton.cc ( https://github.com/balupton ) 尼克克罗恩 nick@meltmedia.com ( https://github.com/ncrohn ) 暂无赞助商! 你会是第一个吗? 删除旧驱动:sudo apt-get purge nvidia* 打开禁用列表: sudo gedit /etc/modprobe.d/blacklist.conf 在禁用列表中添加: blacklist nouveau options nouveau modeset=0 更新:sudo update-initramfs -u |——报错: W: Possible mi...
RuntimeError: cuda runtime error (30) 之前一直被这个莫名其妙的错误困扰,已经准备重新安装驱动和cuda的时候突然意识到了这个问题的根源。 事情是这样的,每次我想跑个程序然后回去休息,第二天回来查看,大失所望,程序没跑多久就报这个错误了,而且每次这个错误出现后再运行程序一样行不通,只有简单粗暴的电脑重启才能暂时解决问题。但后来发现如果我白天一直在使用电脑,程序就自然跑到结束,完全不会报出此类错误。 所以所以!确实是cuda,gpu的问题,但不是因为它们出现bug了,而是因
RuntimeError: CUDA error: no kernel image is available for execution on the device 一般为出现原因为GPU与CUDA以及Pytorch版本对应有误,先采用以下语句测试 torch.cuda.is_available() #True a=torch.Tensor([1,2]) a=a.cuda() 若以上语句出现问题则需要查看,pytorch与cuda对应版本和GPU是否匹配 若以上语句测试均无问题则要考虑是否为其他框架导
服务器重启后 服务运行报错,查看日志是Nvidia 驱动出了问题 system has unsupported display driver / cuda driver combination. 系统具有不受支持的显示驱动程序/cuda驱动程序组合。 看来是驱动版本匹配出了问题 sudo /usr/bin/nvidia-uninstall 提示自动重装 选择yes
1.GPU RuntimeError: CUDA error: invalid device ordinal 解决办法:可能是在程序的多个地方都定义了使用的cuda编号,即使编号是一样的也会报这样的错误。解决办法是只保留一个 2.使用os.environ['CUDA_VISIBLE_DEVICES'] = 'x'指定使用的GPU编号后,实际使用时还是0号GPU 解决办法:把这个语句用到所有需要加载参数、数据的语句前,最方便的就是在import各种包时顺便用os.environ[‘CUDA_VISIBLE_D