深度神经网络加速:cuDNN 与 TensorRT(点击可折叠)
-
第00章 开班仪式
- 1:cuda开课仪式.pdf
- 2-1:【视频】CUDA & TensorRT 保姆级安装教程.vip
- 2-2:CUDA & TensorRT 保姆级安装教程.pdf
- 2-3:Ubuntu下环境配置手册.pdf
- 2-4:【视频】如何获得免费的GPU服务器资源.vip
-
第01章 CUDA C编程及GPU基本知识
-
第01节 GPU基本架构及特点
- 3-1:【课件】CUDA C编程及GPU基本知识.pdf
- 3-2:【视频】CPU与GPU的基础知识.vip
-
第02节 CUDA C编程基本知识
- 4:【视频】CUDA编程的重要概念.vip
-
第03节 并行计算向量相加
- 5:【视频】并行计算向量相加.vip
-
第04节 实践
- 6-1:【代码】Demo I.zip
- 6-2:【视频】实践向量相加.vip
- 6-3:【作业】第一章1.png
- 6-3:【作业】第一章2.png
- 6-4:【作业讲解】作业1思路讲解.docx
-
-
第02章 CUDA C编程:矩阵乘法
-
第01节 为什么矩阵乘法适合GPU实现
- 7-1:【课件】CUDA C编程:矩阵乘法.pdf
- 7-2:【视频】为什么矩阵乘法适合GPU实现.vip
-
第02节 矩阵乘法的GPU基础实现
- 8:【视频】矩阵算法GPU实现.vip
-
第03节 矩阵乘法GPU进阶实现
- 9:【视频】矩阵乘法的GPU进阶实现.vip
-
第04节 代码实践
- 10-1:【代码】MatrixMultiple.rar
- 10-2:【视频】CUDA矩阵乘法实践.vip
-
第05节 作业题目
- 11-1:【视频】作业题目.vip
- 11:【作业讲解】作业2思路讲解.docx
-
-
第03章 cuda stream 和 Event
-
第01节 CUDA Stream介绍
- 12-1:【课件】CUDA C编程:cuda stream and envet.pdf
- 12-2:【视频】CUDA Stream介绍.vip
-
第02节 CUDA Stream为什么有效
- 13:【视频】CUDA Stream为什么有效.vip
-
第03节 CUDA Stream 默认流的表现
- 14:【视频】CUDA Stream默认流的表现.vip
-
第04节 CUDA Event
- 15:【视频】CUDA Event.vip
-
第05节 CUDA 同步操作
- 16:【视频】CUDA 同步操作.vip
-
第06节 NVVP工具演示
- 17:【视频】NVVP.vip
-
-
第04章 cuDNN与cuBLAS
-
第01节 课程回顾
- 18:【资料】BERT学习资料.pdf
- 19-1:【课件】CUDA C编程:卷积实现与cudnn、cublas.pdf
- 19-2:【视频】课程回顾.vip
-
第02节 cuBLAS
- 20:【视频】cuBLAS.vip
-
第03节 cuDNN
- 21-1:【代码】conv_cudnn.zip
- 21-2:【视频】cuDNN.vip
-
第04节 实践
- 22:【视频】实践卷积神经网络.vip
-
-
第05章 TensorRT介绍
-
第01节 TensorRT是什么
- 23-1:【课件】TensorRT介绍.pdf
- 23-2:【视频】TensorRT是什么.vip
-
第02节 TensorRT整体工作流程与优化策略
- 24:【视频】TensorRT优化策略.vip
-
第03节 TensorRT的组成与基本使用流程
- 25:【视频】TensorRT使用的基本流程.vip
-
第04节 TensorRT demo:SampleMNIST
- 26:【视频】demo.vip
-
第05节 TensorRT进阶
- 27:【视频】TensorRT进阶.vip
-
第06节 Demo演示
- 28:【视频】Demo演示.vip
-
-
第07节 作业实践(建议学完第6章再完成)
- 29-1:【作业】第五章.zip
- 29-2:第五章作业思路.docx
- 29-3:【视频】如何获得免费的GPU资源.vip
-
第06章 TensorRT 转换 ONNX模型
-
第01节 ONNX 介绍
- 30-1:L6 TensorRT 转换 ONNX模型 v2.0.pdf
- 30-2:【视频】ONNX介绍.vip
-
第02节 背景知识
- 31-1:【视频】背景知识 lower概念.vip
- 31-2: 【视频】背景知识 Myelin.vip
-
第03节 TRT转换模型的主要痛点
- 32:【视频】TRT转换模型的主要痛点.vip
-
第04节 onnx-parser & onnx-graphsurgen
- 33:【视频】onnx-parser & onnx-graphsurgen.vip
-
第5节 实践
- 34-1:【视频】实践上:Transformer模型优化 解决不支持的算子.vip
- 34-2:【视频】 实践下:Transformer模型优化 合并LayerNorm算子.vip
-
第6节 polygraphy
- 35:【视频】 polygraphy.vip
-
-
第07章 TensorRT plugin用法
-
第01节 Plugin介绍
- 36-1:【课件】TensorRT plugin用法.pdf
- 36-2:【视频】plugin介绍.vip
-
第02节 Static Shape Plugin
- 37:【视频】Static Shape Plugin API & Demo.vip
-
第03节 Dynamic Shape Plugin
- 38:【视频】Dynamic Shape Plugin API & Demo.vip
-
第04节 PluginCreator注册
- 39:【视频】PluginCreator注册.vip
-
第05节 延伸:TensorRT如何debug
- 40:【视频】Debug Plugin经验.vip
-
第06节 实践作业
- 41-1:【作业】第六章.pdf
- 41-2:【代码】作业代码.zip
- 41-3:第六章作业思路.docx
-
-
第08章 TensorRT量化加速
-
第01节 TRT FP16优化
- 42-1:【课件】TensorRT INT8量化加速.zip
- 42-2:【视频】TRT FP16优化.vip
-
第02节 TRT INT8量化算法
- 43-1:【视频】TRT INT8量化算法(上).vip
- 43-2:【视频】TensorRT INT8量化算法(下).vip
-
第03节 TRT大规模上线经验
- 44-1:【视频】TRT大规模上线.vip
- 44-2:【作业】第七章.pdf
- 44-3:第七章作业思路提示docx.docx
- 45-1:六七章思路提示-详细文档.zip
- 45-2:【视频】六七章BERT方向作业代码讲解.vip
- 45-3:【视频】6,7章作业(ViT方向)代码梳理.vip
-
-
第09章 模型推理经验
-
第01节 转换方式比较
- 46-1:【课件】模型推理经验.pdf
- 46-2:【视频】转换方式比较.vip
-
第02节 TRT如何测试并调优
- 47:TRT如何测试并调优.vip
-
第03节 CUDA与TRT的调试建议
- 48-1:【视频】CUDA与TRT的调试建议.vip
- 48-2:【视频】CUDA与TRT的调试建议 并行思维锻炼.vip
-
第04节 模型可以加速到什么程度
- 49:【视频】模型可以加速到什么程度.vip
-
-
第10章 补充知识
- 50-1:【视频】实践上:Transformer模型优化 解决不支持的算子.vip
- 50-2:【视频】 实践下:Transformer模型优化 合并LayerNorm算子.vip
-
第11章 直播答疑
- 51:【视频】12月10日直播答疑.vip
主题授权提示:请在后台主题设置-主题授权-激活主题的正版授权,授权购买:RiTheme官网
本站所有资料均来源与网络以及用户发布,如对资源有争议请联系微信客服我们可以安排下架!