首发于 研究ing

RuntimeError: CUDA error: device-side assert triggered

先上问题!

RuntimeError: CUDA error: device-side assert triggered

CUDA kernel errors might be asynchronously reported at some other API call,so the stacktrace below might be incorrect.

For debugging consider passing CUDA_LAUNCH_BLOCKING=1.

最近在做图神经网络同一个问题遇到两次,查找了许多就久解说各不相同:

1、输出值不在[0,1]区间。

2、数组越界。

3、神经网络输出预测类别与所给类别数量不符合网络。

总结:

遇到bug主要还是认真看报错,我遇到的是输出值不在[0,1]之间,改算法不是个好的选择,源头还是在给的数据有问题。

第一次遇到这个问题,纠结老久,其实是特征矩阵的维数太小,可以将邻接矩阵拼接到特征矩阵上。

第二次,不出意外,不是特征矩阵的问题,熬了两天,终于在邻接矩阵上出来问题,矩阵对角线必须为1,节点自己必须为1。

这个问题根据算法而定,所有解决方案不止一个!

发布于 2022-11-02 21:55

文章被以下专栏收录