关于challenge:CUDA入门学习笔记

37次阅读

共计 1216 个字符,预计需要花费 4 分钟才能阅读完成。

前言

本系列为 CUDA 入门的学习笔记,调整和优化一些知识点秩序使得其更加容易浏览和学习。

本系列次要面向领有本人的 Nvidia CUDA 开发环境,并致力于高性能计算工作的人群。

本文倡议环境 GPU:1060 >CUDA toolkit:10.0+;
本文测试环境 GPU:Laptop 3060 >CUDA toolkit:11.6;
(TODO: 在代码中减少架构属性查看以便解决这方面问题 )

在此感激参考书籍和参考我的项目的作者,本我的项目仅供学习应用,转载请注明出处。

目录

  1. CUDA Basic
  2. CUDA Memory Management
  3. CUDA Kernel
  4. CUDA Kernel Exection and Optimization
  5. CUDA Debug and Profile
  6. CUDA Libraries
  7. Deep Learning in CUDA
  8. Embedded CUDA

目录阐明:
1. CUDA Basic: 装置开发环境,测试 CMake 编译环境,编写第一个 CUDA 的程序
2. CUDA Memory Management: 探讨 CUDA 根底元素,CUDA 内存分类
4. CUDA Kernel Exection and Optimization: 探讨 CUDA Kernel 执行调度优化。
5. CUDA Debug and Profile: 探讨如何 Debug 和计算 CUDA 代码的性能指标
6. CUDA Libraries:探讨 CUDA 相干库
7. Deep Learning in CUDA:探讨应用 CuBlas,CuDNN 和 TensorRT 的数据科学分析及深度学习
8. Embedded CUDA:探讨嵌入式 CUDA 环境,次要指 Jetson(视我能买到什么 Jetson 而定)

这些目录并没有齐全蕴含 CUDA 的方方面面,进一步学习能够从相干资源的书籍和官网文档中学习。也十分倡议在浏览相干章节时,以相干官网文档作为参考, 本系列专栏只是开胃大餐前的小甜点

相干资源

书籍

以下书籍都能够在 library.lol 找到

  • 《Jaegeun Han, Bharatkumar Sharma – Learn CUDA Programming_ A beginner’s guide to GPU programming and parallel computing with CUDA 10.x and C_C++-Packt Publishing (2019)》
  • 《Richard Ansorge – Programming in Parallel with CUDA_ A Practical Guide-Cambridge University Press (2022)》

我的项目

  • cuda-sample

链接

  • Nvidia CUDA Toolkit Documentation
  • CUDA C++ Programming Guide
  • CUDA C++ Best Practices Guide
  • NVIDIA-developer-blog

更新日志

2023-04-20 创立 入门学习笔记目录

本文参加了 SegmentFault 思否写作挑战赛,欢送正在浏览的你也退出。

正文完
 0