关于人工智能:32篇年度最佳AI论文Python编译器Codon开源ChatGPT的前世今生

1. 2022年最佳AI论文32篇：DALL·E 2、Stable Diffusion、ChatGPT等入选

大模型和文生图、跨模态是往年毫无疑问的热点，此外也有多篇GAN等视觉畛域的文章。GitHub上还有这些论文的短视频和文字解读、代码链接等。

从论文的次要奉献机构来看（有些机构尽管有奉献但排名较后有挂名嫌疑的，都被忽略不计了），仿佛能够反映出各公司在AI畛域的江湖位置：第一档：Google 8篇，Meta 6篇雄踞前二名，OpenAI 3篇但有两篇影响力微小的（DALL·E 2和ChatGPT），如果按代表作评估，可能不会输给两巨头。第二档：NVIDIA有2.5篇。第三档：国内腾讯、百度、微软（出自亚研院）各1篇。国外有三星、迪士尼各1篇。Snap、Adobe都是0.5篇。

高校总共5.5篇，不如两巨头一家，相比之下要逊色很多。其中：特拉维夫有1.5篇位居第一，但慕尼黑的Stable Diffusion影响微小，应该视为第一档；CMU、南洋理工各1篇，第二档；南加大和伯克利各0.5篇，第三档。

链接：
https://github.com/louisfb01/…
https://hub.baai.ac.cn/view/2…

2. 吴恩达的2022年初盘点：生成式AI、ViT、大模型

在过来的一年，生成式AI迎来爆发式增长，由人工智能生成的图片在社交平台疯狂流传，引发大量争议的同时也推动了投资；视觉 Transformer(ViT) 的工作也呈现爆炸性增长，在过来一年中，钻研人员共计发表超过 17,000 篇 ViT 论文；AlphaCode、Codex 等的推出便当了开发者，大受欢迎；与此同时，钻研人员也在一直拓宽语言模型的边界，在解决可信度、偏见和实时性等问题方面做出继续一直的致力。

链接：
https://mp.weixin.qq.com/s/na…

3. 2022出圈的ML钻研：爆火的Stable Diffusion、通才智能体Gato，LeCun转推

今日，ML & NLP 研究者、Meta AI 技术产品营销经理、DAIR.AI 创始人 Elvis S. 对 2022 年热度很高的 12 篇机器学习论文进行了汇总。帖子很火，还失去了图灵奖得主 Yann LeCun 的转推。

链接：
https://mp.weixin.qq.com/s/zd…

4. ChatGPT进化的机密

ChatGPT 是怎么变得这么强的？它的各种弱小的能力到底从何而来？在这篇文章中，作者试图分析 ChatGPT 的突现能力（Emergent Ability），追溯这些能力的起源，心愿可能给出一个全面的技术路线图，来阐明 GPT-3.5 模型系列以及相干的大型语言模型是如何一步步进化成目前的弱小状态。作者心愿这篇文章可能促成大型语言模型的透明度，成为开源社区共同努力复现 GPT-3.5 的路线图。

链接：
https://mp.weixin.qq.com/s/dP…

5. 狂揽两千星，速度百倍晋升，高性能Python编译器Codon开源

作为高性能 Python 编译器，Codon 可将 Python 代码编译为本机机器代码，而无需任何运行时开销。在单线程上，Python 的典型减速大概为 10-100 倍或更多。Codon 的性能通常与 C/C++ 的性能相当。与 Python 不同，Codon 反对本机多线程，这能够使速度进步很多倍。Codon 可通过插件根底构造进行扩大，它容许用户合并新的库、编译器优化甚至关键字。

Codon 框架是齐全模块化和可扩大的，容许无缝集成新模块、编译器优化、畛域特定语言等，并踊跃为生物信息学和量化金融等多个畛域开发新的 Codon 扩大。

链接：
https://mp.weixin.qq.com/s/p2…

6. xNN：支付宝端侧深度学习框架

2017 年是支付宝第一次引入 AR 实景扫福，通过扫描任意“福”字帮忙大家去集收集福卡。过后的福字辨认模型抉择服务端服务部署的技术计划，为了在流动期间辨认福字，须要调用大量的服务端部署资源来部署辨认模型；另一方面，DL 在云端则意味着数据必须上传。即便不思考计算压力，从网络延时、流量、隐衷爱护等角度，也给用户体验带来种种限度。因而，对相当多的利用来说，DL 模型前移到挪动端部署能够看作是一种刚需。

链接：
https://mp.weixin.qq.com/s/ca…

7. OneFlow源码解析：主动微分机制

深度学习框架个别通过主动微分（autograd）机制计算梯度并反向流传。本文尝试通过一个简略的例子，浅显地察看一下OneFlow的autograd的实现机制。

链接：
https://mp.weixin.qq.com/s/Em…

8. CUDA笔记（一）：解析OneFlow Element-Wise算子实现

Elemet-Wise算子指的是针对输出Tensor进行逐元素操作，比方ReLU就是针对输出Tensor的每个值进行判断是否大于0，大于0的话输入就是输出否则就是0。

链接：
https://mp.weixin.qq.com/s/_p…

9. Meta千亿参数大模型OPT-IML「升级版」来了，残缺模型和代码颁布

往年五月，MetaAI官宣公布了基于1750亿参数的超大模型OPT-175B，还对所有社区收费凋谢。12月22日，该模型的更新版本OPT-IML（Open Pre-trained Transformer）正式上线，Meta称其「对2000个语言工作进行了微调，蕴含1750 亿个参数」，还将为非商业钻研用处收费凋谢。

链接：
https://mp.weixin.qq.com/s/LE…

10. 一块RTX 3090减速训练YOLOv5s，工夫缩小11个小时，速度晋升20%

凭借对YOLOv5的性能剖析以及几个简略的优化，OneFlow团队将单RTX 3090 FP32 YOLOv5s的训练速度晋升了近20%。对于须要迭代300个Epoch的COCO数据集来说，One-YOLOv5相比Ultralytics/YOLOv5缩短了11.35个小时的训练工夫。本文将分享所有优化技术，如果你是一名PyTorch和OneFlow的使用者，尤其日常和检测模型打交道但资源绝对受限，那么本文的优化办法将对你有所帮忙。

链接：
https://mp.weixin.qq.com/s/Lj…

11. YOLOv5全面解析教程①：网络结构逐行代码解读

本教程也同样实用于 Ultralytics/YOLOv5，因为 One-YOLOv5 仅仅是换了一个运行时后端而已，计算逻辑和代码相比 Ultralytics/YOLOv5 没有做任何扭转，欢送 star 。

链接：
https://mp.weixin.qq.com/s/qf…

12. Stable Diffusion 2.0 相比 1.5 是倒退吗？Prompt 试验给你假相

SD 2.0 在 Reddit 上招来群嘲，人们埋怨，SD 旧版本的 prompt，在 2.0 下不仅不再管用，甚至成果显著有倒退，生物体构造扭曲错乱，质感奇怪。拿来跟讨巧又低门槛的 Midjourney v4 一比拟，几乎是场噩梦。

作者对 SD2 的第一印象也跟社区差不多，不小的挫败和悲观。过来收藏的prompt 跑完能看的不多。但摈弃旧思路，通过几组的 prompt 试验后，他又信念大振，发现了 Stable Diffusion 2.0 的很多亮点和劣势。

链接：
https://mp.weixin.qq.com/s/oC…

13. OneFormer：一个Transformer统治通用图像宰割

论文提出了OneFormer，这是第一个基于transformer的多任务通用图像宰割框架，该框架只须要应用单个通用架构、单个模型和单个数据集进行一次训练，就能够在语义、实例和全景宰割工作上胜过现有框架，只管后者须要应用屡次资源在每个工作上独自训练。

链接：
https://mp.weixin.qq.com/s/X1…

14. Vision Transformer这两年

在NLP畛域获得巨大成功后，Transformer架构在计算机视觉方面的作用日渐凸显，成为越来越广泛的CV工具。自2020年10月Vision Transformer模型推出以来，人们开始高度关注Transformer模型在计算机视觉上的利用。

恰逢Vision Transformer推出两周年之际，借此机会咱们对其稍作介绍，并探讨这两年来倒退出的多种Vision Transformer模型变体以及Transformer在计算机视觉利用方面面临的各种挑战。

链接：
https://mp.weixin.qq.com/s/GW…

欢送 Star、试用 OneFlow 最新版本：https://github.com/Oneflow-In…

关于人工智能:32篇年度最佳AI论文Python编译器Codon开源ChatGPT的前世今生

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于人工智能:32篇年度最佳AI论文Python编译器Codon开源ChatGPT的前世今生

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复