kizumi_header_banner_img

夜晚 未来 永远 恐惧 梦见 终结

加载中

文章导读

CUDA学习


avatar
Gouki 2025年11月10日 106

并行计算基础知识和应用场景

计算机体系结构

延迟带宽

多级存储架构

并行计算

CUDA 入门编程

CUDA基础知识

CPU GPU差异

异构编程模型

cuda常用函数

向量相加 向量规约

CUDA 优化 MatMul

简单分块策略

矩阵乘法性能瓶颈和优化手段

cudnn封装库函数性能对比

CUDA 优化 Softmax

一维向量数据分配

高维向量线程块设置

block reduce 和 warp reduce 使用

 

算子测试框架搭建

基于pybind11 搭建简单算子测试框架

手写算子性能和精度

pytorch 调用算子过程

CMake 搭建不同平台算则测试框架

 



评论(0)

查看评论列表

暂无评论


发表评论

个人信息

avatar

面向kpi编程,python的狗。

15
文章
0
评论
1
用户

分类

最新评论

    广告 10-11