OpenCL
OpenCL 概述及运行时
OpenCL异构计算模型
OpenCL 运行时API基础用法
上下文
队列
设备管理
OpenCL C 编程抽象
线程模型
工作项与工作组的分布策略
内存模型优化方法
主机与设备协作的数据传输和事件机制
矩阵加法示例理解并行编程
OpenCL C 算子开发及优化(基础语法)
OpenCL C语法
数据类型
内存限定符
函数限定符
内置函数
结合调试方法和优化技巧掌握内核代码编写规范
OpenCL C 算子开发及优化(优化方法)
向量化计算
局部内存优化
并行规约
排序
动态查询设备进行性能调优
OpenCL C 算子开发以及优化(算子实现)
实现矩阵乘法和Softmax 算子
从基础到优化
算子性能分析 与 核心算子开发
评论(0)
暂无评论