教学优势
曙海教育的课程培养了大批受企业欢迎的工程师。大批企业和曙海
建立了良好的合作关系。曙海教育的课程在业内有着响亮的知名度。
本课程,秉承19年积累的教学品质,以项目实现为导向,老师将会与您分享设计的全流程以及工具的综合使用经验、技巧。
课程简介:
GPU与深度学习加速计算培训
课程大纲
【培训内容】
课程目标:
1、掌握GPU CUDA的Windows/Linux环境搭建实操
2、掌握深度学习Tensorflow、Pytorch框架的GPU加速环境实操
3、掌握GPU CUDA与深度学习技术的关系
4、掌握并行算法的基础知识
5、掌握深度学习调用GPU进行网络训练加速的技术
6、掌握GPU CUDA线程组织结构
7、掌握GPU CUDA内存组织结构
8、掌握GPU CUDA 内核算法的编写逻辑
9、掌握Python调用GPU CUDA的底层逻辑
10、掌握CUDA内核运行检测工具的实操
11、掌握一个初级GPU CUDA并行算法的设计实现过程
12、掌握一个初级深度学习算法的GPU加速设计实现过程
课程大纲:
主题 |
内容 |
初识、需求分析、环境搭建 |
1、 GPU CUDA的选择与安装 2、 深度学习框架的选择与安装 3、 GPU CUDA 简介 4、 GPU CUDA与深度学习技术的关系 |
并行计算相关知识 |
1、 并行算法基础知识 2、 加速比、并行层次 3、 GPU的硬件特征 4、 GPU第一个CUDA程序 |
GPU CUDA相关知识 |
1、 GPU CUDA线程组织结构 l 线程块、线程Grid 2、 GPU CUDA内存组织结构 l 局部、全局、共享内存 3、 GPU CUDA 内核编写逻辑
|
GPU CUDA相关知识 |
1、 CUDA Atomic操作 2、 CUDA 流 3、 CUDA内核函数优化技术 4、 CUDA内核运行检测工具
|
GPU CUDA并行算法实测 |
1. 实际编写CUDA内核实现计算加速 2. 对比CUDA内核优化策略实现不同加速效果 3. 一个完整的GPU CUDA并行计算、不同加速比的程序 |
GPU CUDA深度学习技术加速实测 |
1. Python调用CUDA的底层逻辑 2. 深度学习Tensorflow与GPU加速实测 3. 一个完整的实现GPU加速训练的程序 |
练习
答疑