相关文章推荐

体贴的仙人掌 · qt中用treewidget创建横向表格，实 ...· 1 月前 ·

大力的砖头 · python onvif搜索 ip - ...· 1 月前 ·

重感情的红酒 · 支持向量机回归预测SVR——MATLAB超详 ...· 9 月前 ·

玩命的吐司 · 基于SVM-支持向量机解决波士顿房价预测回归 ...· 9 月前 ·

失眠的番茄 · 机器学习有很多关于核函数的说法，核函数的定义 ...· 1 年前 ·

长情的豆腐 · ESPCN神经网络-CSDN博客· 2 月前 ·

风流的消防车 · 复选框隐藏行-腾讯云开发者社区-腾讯云· 3 月前 ·

聪明伶俐的水龙头 · python 等待函数 ...· 12 月前 ·

有胆有识的玉米 · java 长度为2 ...· 1 年前 ·

小胡子的木瓜 · 数据库系统设计_银行业务管理系统 - ...· 1 年前 ·

登录注册写文章

CUDA编程——核函数参数传递与GPU内存分配与调用

CUDA编程——核函数参数传递与GPU内存分配与调用

在程序中可以将CPU程序中的参数传递给核函数。

__global__ void add(int a,int b,int *c) {

*c = a + b;

}

int main(void) {

int c;

int *dev_c;

//在分配GPU的内存

cudaMalloc((void**)&dev_c, sizeof(int));

//调用核函数

add <<<1, 1 >>> (2, 7, dev_c);

//将GPU运算结果传递给主机

cudaMemcpy(&c, dev_c, sizeof(int), cudaMemcpyDeviceToHost);

printf("2 + 7 = %d\n", c);

//释放GPU指针内存

cudaFree(dev_c);

return 0;

}

其中参数的传递是在核函数的尖括号后面，而且需要注意设备执行任何有用的操作都需要分配内存。其中cudaMalloc()是分配GPU中内存的函数，第一个参数是一个指针，用于保存新分配内存地址的变量，第二个参数是分配内存的大小。

可以将cudMalloc()分配的指针传递给在设备上执行的函数。设备中的代码中使用cudaMalloc()分配的指针进行内存读/写操作。将cudaMalloc()分配的指针传递给主机上执行的函数。指针用完后，需要调用cudaFree()释放指针内存。cudaMemcpy()函数是访问设备内存的最常见的方法，其中cudaMemcpyToHost参数表明运行时源指针时一个设备指针，目标指针时一个主机指针，而cudaMemcpyHostToDevice表明与cudaMemcpyToHost相反的含义，还可以填写cudaMemcpyDeviceToDevice表明两个指针都位于设备上，如果源指针和目标指针都位于主机上，直接调用标准C的memcpy()函数。

推荐文章

体贴的仙人掌 · qt中用treewidget创建横向表格，实现两个treewidget能相互拖动item，并且只能拖动到到根节点的子节点同级节点 - CSDN文库

1 月前

大力的砖头 · python onvif搜索 ip - CSDN文库

1 月前

重感情的红酒 · 支持向量机回归预测SVR——MATLAB超详细代码实现过程_matlab支持向量机回归预测-CSDN博客

9 月前

玩命的吐司 · 基于SVM-支持向量机解决波士顿房价预测回归问题-阿里云开发者社区

9 月前

失眠的番茄 · 机器学习有很多关于核函数的说法，核函数的定义和作用是什么？ - 知乎

1 年前

长情的豆腐 · ESPCN神经网络-CSDN博客

2 月前

风流的消防车 · 复选框隐藏行-腾讯云开发者社区-腾讯云

3 月前

聪明伶俐的水龙头 · python 等待函数 python中等待一秒的语句_mob6454cc7d4112的技术博客_51CTO博客

12 月前

有胆有识的玉米 · java 长度为2 for循环只循环了一次_51CTO博客_java判断for循环最后一次

1 年前

小胡子的木瓜 · 数据库系统设计_银行业务管理系统 - Mr.Open - 博客园

1 年前

今天看啥 · Py中国 · codingpro · 藏经阁 · 小百科 · link之家 · 卧龙AI搜索

删除内容请联系邮箱 2879853325@qq.com

Code - 代码工具平台

© 2024 ~ 沪ICP备11025650号