前言

本系列为CUDA入门的学习笔记,调整和优化一些知识点秩序使得其更加容易浏览和学习。

本系列次要面向领有本人的Nvidia CUDA 开发环境,并致力于高性能计算工作的人群。

本文倡议环境GPU:1060 >CUDA toolkit:10.0+;
本文测试环境GPU:Laptop 3060 >CUDA toolkit:11.6;
(TODO: 在代码中减少架构属性查看以便解决这方面问题)

在此感激参考书籍和参考我的项目的作者,本我的项目仅供学习应用,转载请注明出处。

目录

  1. CUDA Basic
  2. CUDA Memory Management
  3. CUDA Kernel
  4. CUDA Kernel Exection and Optimization
  5. CUDA Debug and Profile
  6. CUDA Libraries
  7. Deep Learning in CUDA
  8. Embedded CUDA

目录阐明:
1. CUDA Basic:装置开发环境,测试CMake编译环境,编写第一个CUDA的程序
2. CUDA Memory Management:探讨CUDA根底元素,CUDA内存分类
4. CUDA Kernel Exection and Optimization:探讨CUDA Kernel执行调度优化。
5. CUDA Debug and Profile:探讨如何Debug和计算CUDA代码的性能指标
6. CUDA Libraries:探讨CUDA相干库
7. Deep Learning in CUDA:探讨应用CuBlas,CuDNN 和 TensorRT的数据科学分析及深度学习
8. Embedded CUDA:探讨嵌入式CUDA环境,次要指Jetson(视我能买到什么Jetson而定)

这些目录并没有齐全蕴含CUDA的方方面面,进一步学习能够从相干资源的书籍和官网文档中学习。也十分倡议在浏览相干章节时,以相干官网文档作为参考,本系列专栏只是开胃大餐前的小甜点

相干资源

书籍

以下书籍都能够在library.lol 找到

  • 《Jaegeun Han, Bharatkumar Sharma - Learn CUDA Programming_ A beginner's guide to GPU programming and parallel computing with CUDA 10.x and C_C++-Packt Publishing (2019)》
  • 《Richard Ansorge - Programming in Parallel with CUDA_ A Practical Guide-Cambridge University Press (2022)》

我的项目

  • cuda-sample

链接

  • Nvidia CUDA Toolkit Documentation
  • CUDA C++ Programming Guide
  • CUDA C++ Best Practices Guide
  • NVIDIA-developer-blog

更新日志

2023-04-20 创立 入门学习笔记目录

本文参加了SegmentFault 思否写作挑战赛,欢送正在浏览的你也退出。