分类: cuda
-
关于cuda:nv-显卡安装驱动以及周边日志
cuda toolkit 和驱动版本的对应关系: [链接]查看 cuda toolkit 历史版本:[链接]n…
-
关于cuda:DeepRoute-Lab-CUDA算子优化转置篇
转置是深度模型中利用最宽泛的算子之一。各种深度学习框架崛起的明天,它被“隔离”到了框架的底层,不再显式的沉闷于…
-
关于cuda:ubuntu1804搭建yolov5环境
装置minianaconda创立虚拟环境 {代码…} 激活与退出环境 {代码…} 装置pytorch抉…
-
关于cuda:CUDA优化之PReLU性能调优
撰文|郑泽康InsightFace模型里大量应用了PReLU激活函数,而PReLU的工作模式有两种:PReLU…
-
关于cuda:深入理解混合精度训练从-Tensor-Core-到-CUDA-编程
近年来,主动混合精度(Auto Mixed-Precision,AMP)技术在各大深度学习训练框架中作为一种应…
-
关于cuda:CUDA-矩阵乘法终极优化指南
单精度矩阵乘法(SGEMM)简直是每一位学习 CUDA 的同学绕不开的案例,这个经典的计算密集型案例能够很好地…
-
关于cuda:30系显卡tensorflow-115安装教程python36-or-38CUDA-11tf115离线适用
太长不看版python3.8 (必须应用ubuntu 2004)看前一篇文章。python3.6 (ubunt…
-
关于cuda:算子性能可达-cudnn-80以上-深度解析-TensorCore-卷积算子实现原理
2020 年 5 月 Nvidia 公布了新一代的 GPU 架构安培(Ampere)。其中和深度学习关系最亲密…