1. 高端GPU禁售传闻声起,BAT们遭逢缓和时刻
互联网企业成为此次制裁波及的次要对象。行业人士指出,互联网厂商出于对性能等因素思考,对国产CPU、GPU广泛接收度不高,此次事件应为互联网厂商预警,减速CPU、GPU等外围芯片的国产代替应受到重视,心愿有助于互联网厂商减速推动服务器外围芯片国产代替的导入和验证,晋升自主可控能力。
链接:
https://www.laoyaoba.com/html…
2. 陈天奇CMU新课程线上免费听,分析DL框架底层原理
9月13日开课,线上收费注册参加,次要面向高年级本科到博士在读阶段的学生。须要参与者有根本的数学背景,对机器学习有肯定的理解,把握零碎编程(Python和C/C++ )和线性代数。
链接:https://zhuanlan.zhihu.com/p/…
3. 旷视天元MegEngine开源CUDA INT4量化源码实现
为了推动低比特量化技术的倒退,旷视天元MegEngine 团队开源了INT4的源码实现,这也让MegEngine成为首个开源CUDA INT4源码实现的深度学习框架。MegEngine采纳平均线性量化计划,实现了非对称量化和对称量化两种INT4的数据类型,同时通过算子交融优化、kernel优化等办法,使得量化后的模型能够仍然放弃较高的精度以及良好的运行速度。同样以ResNet-50为例,INT4相比INT8有1.3倍的减速。
链接:https://mp.weixin.qq.com/s/zJ…
4. OneFlow源码解析:Tensor类型体系与Local Tensor
tensor和op是神经网络模型最根本的组件:op是模型的节点,tensor是连贯节点的边。然而,构建一个tensor并不仅仅是结构一个对象那么简略,至多要思考以下问题:要反对节点本地的local tensor,以及分布式的global tensor;要反对eager和lazy执行模式;要反对不同的数据类型,包含float、double、int等;要反对不同设施。
链接:https://mp.weixin.qq.com/s/eB…
5. 深刻理解MindSpore训练推理框架设计
作者将围绕MindSpore的Model类的相干代码,对MindSpore的训练流程设计和推理流程设计进行深刻的解读,并且联合相应的代码,以宰割工作为例,介绍如何应用Model.train和Model.eval构建简单工作的训练测试流程设计。
链接:https://zhuanlan.zhihu.com/p/…
6. 从Core Dump中提取CUDA的报错信息
近期,Meta AI团队在生产PyTorch AI模型时遇到了一个难题。这一问题由CUDA非法内存拜访引起,号称集结了Meta全公司最牛的AI工程师才搞定,这篇博客记录了他们应用CUDA的core dump来确定报错地位所应用的技巧和实际。
链接:https://mp.weixin.qq.com/s/Ok…
7. 简略谈谈CUDA的访存合并
学习CUDA的人必定会常常听到“访存合并”这个词,作者次要从根底概念、向量化的错误做法导致的未合并访存进行介绍。
链接:https://zhuanlan.zhihu.com/p/…
8. MLIR-Playground: 摸索下一代编译软件栈工程的新范式
MLIR中国社区的一些开发者利用集体业余时间,开发了MLIR-Playground,一个能够间接在浏览器里利用MLIR开发编译逻辑的云端利用。此举次要是受到了设计软件Figma是如何利用Web技术从新定义了UI设计合作,以及OpenAI是如何利用简略的网页Playground大幅升高了超大AI模型尝试门槛的启发。
链接:https://zhuanlan.zhihu.com/p/…
9. TVM入门学习指南
作者联合TVM Unify相干的形象以及之前的一些积攒从新梳理一下TVM的整体流程。他从前端,中端(图优化Pass机制),代码生成(Schedule),Runtime,开发工具几个角度进行了介绍。本文将尽量避免波及到底层C++代码的细枝末节,而是从较为宏观的视角来讲分明目前TVM的架构,心愿对入门TVM的读者有帮忙。
链接:https://zhuanlan.zhihu.com/p/…
10. 通用多模态根底模型BEiT-3:引领文本、图像、多模态预训练迈向“大一统”
微软亚洲研究院联结微软图灵团队推出了最新降级的BEiT-3预训练模型,在宽泛的视觉及视觉-语言工作上,包含指标检测(COCO)、实例宰割(COCO)、语义宰割(ADE20K)、图像分类(ImageNet)、视觉推理(NLVR2)、视觉问答(VQAv2)、图片形容生成(COCO)和跨模态检索(Flickr30K,COCO)等,实现了SOTA的迁徙性能。BEiT-3翻新的设计和杰出的体现为多模态钻研关上了新思路,也预示着 AI 大一统渐露曙光。
链接:https://mp.weixin.qq.com/s/PI…
11. 扩散模型背地数学太难了?谷歌用对立视角讲明确了
很多研究者认为,基于扩散模型的文本图像生成模型岂但参数量小,生成的图像品质却更高,大有要取代GAN的势头。不过,扩散模型背地的数学公式让许多研究者望而生畏,泛滥研究者认为,其比VAE、GAN要难了解得多。
近日,来自 Google Research 的研究者撰文《 Understanding Diffusion Models: A Unified Perspective 》,本文以极其具体的形式展现了扩散模型背地的数学原理,目标是让其余研究者能够追随并理解扩散模型是什么以及它们是如何工作的。
链接:https://mp.weixin.qq.com/s/v1…
12. 深势科技联手阿里云,AI蛋白质预测再下一城
深势科技与阿里云机器学习PAI团队联手,通过全新的蛋白质构造预测推理减速计划FoldAcc,联合深势Uni-Fold最新模型代码和参数,将单次预测能反对的最大氨基酸序列长度晋升至6.6k,笼罩99.992%已知的蛋白序列,同时推理速度显著晋升,达到目前已知的最佳推理优化成果,将为AI预测蛋白质构造落地利用提供重要助力。
链接:https://mp.weixin.qq.com/s/oS…
13. 线上流动报名 | AI思享会:中国AI根底软件倒退探讨
工夫:9月8日(本周四)14:30
TensorFlow和PyTorch等曾经被广泛应用,但随着AI技术的进一步倒退,在分布式训练、高性能计算和高效编译等方面都有了新的需要,AI根底软件的倒退也有了新的要求和方向。
本期AI思享会邀请了几位从事AI根底软件钻研和守业的清华校友和老师等,分享各自在AI根底软件方面的成绩和停顿,及独特探讨和瞻望新一代AI根底软件倒退的状况。
链接:https://mp.weixin.qq.com/s/WU…
题图源自Dimitris Vetsikas, Pixabay
欢送下载体验 OneFlow v0.8.0 最新版本:https://github.com/Oneflow-In…
发表回复