共计 1216 个字符,预计需要花费 4 分钟才能阅读完成。
前言
本系列为 CUDA 入门的学习笔记,调整和优化一些知识点秩序使得其更加容易浏览和学习。
本系列次要面向领有本人的 Nvidia CUDA 开发环境,并致力于高性能计算工作的人群。
本文倡议环境 GPU:1060 >CUDA toolkit:10.0+;
本文测试环境 GPU:Laptop 3060 >CUDA toolkit:11.6;
(TODO: 在代码中减少架构属性查看以便解决这方面问题 )
在此感激参考书籍和参考我的项目的作者,本我的项目仅供学习应用,转载请注明出处。
目录
- CUDA Basic
- CUDA Memory Management
- CUDA Kernel
- CUDA Kernel Exection and Optimization
- CUDA Debug and Profile
- CUDA Libraries
- Deep Learning in CUDA
- Embedded CUDA
目录阐明:
1. CUDA Basic: 装置开发环境,测试 CMake 编译环境,编写第一个 CUDA 的程序
2. CUDA Memory Management: 探讨 CUDA 根底元素,CUDA 内存分类
4. CUDA Kernel Exection and Optimization: 探讨 CUDA Kernel 执行调度优化。
5. CUDA Debug and Profile: 探讨如何 Debug 和计算 CUDA 代码的性能指标
6. CUDA Libraries:探讨 CUDA 相干库
7. Deep Learning in CUDA:探讨应用 CuBlas,CuDNN 和 TensorRT 的数据科学分析及深度学习
8. Embedded CUDA:探讨嵌入式 CUDA 环境,次要指 Jetson(视我能买到什么 Jetson 而定)
这些目录并没有齐全蕴含 CUDA 的方方面面,进一步学习能够从相干资源的书籍和官网文档中学习。也十分倡议在浏览相干章节时,以相干官网文档作为参考, 本系列专栏只是开胃大餐前的小甜点 。
相干资源
书籍
以下书籍都能够在 library.lol 找到
- 《Jaegeun Han, Bharatkumar Sharma – Learn CUDA Programming_ A beginner’s guide to GPU programming and parallel computing with CUDA 10.x and C_C++-Packt Publishing (2019)》
- 《Richard Ansorge – Programming in Parallel with CUDA_ A Practical Guide-Cambridge University Press (2022)》
我的项目
- cuda-sample
链接
- Nvidia CUDA Toolkit Documentation
- CUDA C++ Programming Guide
- CUDA C++ Best Practices Guide
- NVIDIA-developer-blog
更新日志
2023-04-20 创立 入门学习笔记目录
本文参加了 SegmentFault 思否写作挑战赛,欢送正在浏览的你也退出。