讲解CUDA error: an illegal memory access was encountered开发者社区

讲解CUDA error: an illegal memory access was encountered

原创

pythonCopy code
import cv2
import numpy as np
import pycuda.autoinit
import pycuda.driver as cuda
from pycuda.compiler import SourceModule
# CUDA核函数：对图像进行平滑处理
mod = SourceModule("""
    __global__ void smooth_image(float* input, float* output, int width, int height) {
        int col = blockIdx.x * blockDim.x + threadIdx.x;
        int row = blockIdx.y * blockDim.y + threadIdx.y;
        if (col < width && row < height) {
            int index = row * width + col;
            // 平滑处理（简单示例：对周围像素的平均值）
            float sum = input[index];
            int count = 1;
            if (col > 0) {
                sum += input[index - 1];
                count++;
            if (col < width - 1) {
                sum += input[index + 1];
                count++;
            if (row > 0) {
                sum += input[index - width];
                count++;
            if (row < height - 1) {
                sum += input[index + width];
                count++;
            output[index] = sum / count;
# 获取输入图像并转换为浮点数类型
image = cv2.imread('input.jpg', 0).astype(np.float32)
width, height = image.shape[1], image.shape[0]
# 定义GPU内存空间
input_gpu = cuda.to_device(image)
output_gpu = cuda.mem_alloc(image.nbytes)
# 调用CUDA核函数对图像进行平滑处理
block_size = (16, 16)
grid_size = ((width + block_size[0] - 1) // block_size[0], (height + block_size[1] - 1) // block_size[1])
smooth_image = mod.get_function("smooth_image")
smooth_image(input_gpu, output_gpu, np.int32(width), np.int32(height), block=block_size, grid=grid_size)
# 将处理后的图像从GPU内存复制回主机内存

讲解CUDA error: an illegal memory access was encountered

讲解CUDA error: an illegal memory access was encountered

讲解CUDA error: an illegal memory access was encountered

错误定位和排查

解决方法和预防措施

解决方法

预防措施