关于人工智能:2022-年度盘点-更成熟的-AI更破圈的技术狂欢

内容一览：2022 年 AI 畛域倒退一直提速，新技术成绩纷纷落地，模型迭代减速降级。本文总结了 2022 年 AI 畛域各大公司的技术成就。
关键词：年初盘点大厂技术创新

2022 年在此起彼伏的咳嗽声中靠近序幕，这一年，AIGC 成为人工智能畛域最大黑马，ScienceAI 有了更多理论落地的利用，这一年咱们经验了各大厂商缩减估算、裁撤员工，也体验了逢凶化吉的技术狂欢……

明天，咱们将通过这篇文章，与各位同行独特回顾 2022 年那些人工智能畛域具备突破性意义的研发成绩。

data2vec

语音、视觉及文本自监督学习的通用框架
公布机构：Meta AI
公布工夫：2022 年 1 月
我的项目地址：https://github.com/facebookre…

data2vec 是一个大一统的多模态自监督学习模型，能够以较高的性能解决图像、文本、语音等工作。12 月 16 日 data2vec 2.0 公布，与现有的计算机视觉自监督算法相比，雷同精度下速度快了 16 倍。

data2vec 2.0 原理简介

AlphaCode

比赛级别代码生成 AI
公布机构：DeepMind
公布工夫：2022 年 2 月
我的项目地址：https://github.com/deepmind/c…

借助大型语言模型，根据问题的语言形容构建代码。在 Codeforces 挑战赛中，AlphaCode 击败了 46% 的参赛者。该钻研不仅登上了 Science 封面，还被该杂志评入年度十大迷信冲破。

AlphaCode 概览

Dall·E 2

文本到图像的生成工具
公布机构：OpenAI
公布工夫：2022 年 4 月
我的项目地址：https://openai.com/dall-e-2/

Dall·E 2 根据文本形容，能够创立更加具备现实主义色调的艺术图像。与 OpenAI 2021 年公布的 Dall·E 相比，Dall·E 2 能够生成更实在、更精确的图像，且分辨率进步了 4 倍。

An astronaut riding a horse in a photorealistic style
Dall·E 2 生成的图像示例

Gato

全能型智能体
公布机构：DeepMind
公布工夫：2022 年 5 月
我的项目地址：https://www.deepmind.com/blog…

Gato 是一个全能型智能体，能够玩雅达利游戏、对图像进行形容、聊天以及依据上下文决定输入文本、关节扭力或其余 token。这种通用模型解决所有工作相似人工智能，最终或超过特定于专门畛域的模型。

ESM Fold

蛋白质构造预测模型
公布机构：Meta AI
公布工夫：2022 年 7 月
我的项目地址：https://github.com/facebookre…

ESM Fold 是一个预测蛋白质序列的模型，可能间接进行高准确度、端对端、原子层级构造预测。它仅应用单个输出序列，只需查看单个蛋白质序列，这极大放慢了推理速度。

用 ESM Fold 进行单序列构造预测

Make-A-Video

根据文本生成视频的 AI 零碎
公布机构：MetaAI
公布工夫：2022 年 9 月
我的项目地址：https://makeavideo.studio/

Make-A-Video 是一个文本-视频生成模型，它通过带有文字描述的图像，来学习罕用的形容形式，同时应用无标签视频，理解和学习挪动形式。Make-A-Video 生成的视频格调多样，对文本还原度高，是生成短视频方面的 SOTA 模型。

AlphaTensor

根据文本形容生成视频的局部示例改良矩阵乘法，晋升计算速度
公布机构：DeepMind
公布工夫：2022 年 10 月
我的项目地址：https://github.com/deepmind/a…

AlphaTensor 改良了目前最优的 4*4 矩阵乘法，并且进一步晋升了其余 70 余种不同大小矩阵乘法计算速度。该成绩登上了 Nature 封面，被 Scinece 杂志评入年度十大迷信冲破。

AlphaTensor 架构一览

Magic 3D text-to-3D content 创立工具

公布机构：NVIDIA
公布工夫：2022 年 11 月
我的项目地址：https://deepimagination.cc/Ma…

NVIDIA 入局 AIGC，凭文字描述就可生成 3D Mesh 模型。它联合 image conditioning 技术以及基于文本提醒的编辑办法，提供了一个管制 3D 合成的新思路，使得创立高质量 3D Mesh 模型成为可能。

Magic 3D 通过两个阶段创立 text-to-3D content

ChatGPT

超级对话模型
公布机构：OpenAI
公布工夫：2022 年 11 月
我的项目地址：https://openai.com/blog/chatgpt/

ChatGPT 的训练应用了 RLHF (Reinforcement Learning from Human Feedback)，与 InstructGPT 应用的办法雷同，仅在数据收集设置上有细微差别。ChatGPT 能够像人类一样聊天交换，实现撰写邮件、视频脚本、文案、翻译及代码等工作。自上线以来，引起了海内外有数开发者的争相试用和热烈探讨，堪称 2022 年开发人员参与度最高的技术我的项目。

ChatGPT 训练过程概览

Point·E

根据文本形容生成 3D 点云
公布机构：OpenAI
公布工夫：2022 年 12 月
我的项目地址：https://github.com/openai/poi…

用 Point·E 根据文本提醒生成 3D 点云的过程分为三个步骤：1、根据文本提醒，生成一个合成视图 (synthetic view)2、根据合成视图，生成 coarse point cloud (1024 point)3、基于低分辨率点云和合成视图，生成 fine point cloud (4096 Point)利用 Point·E 单卡 1 分钟生成 3D 点云，text-to 3D 辞别高算力耗费时代。

冬去春来，畅想 2023

2022 行将画上句点，2023 注定是充斥未知的一年，AIGC 畛域会有哪些新成绩？ScienceAI 将如何应答基础科学与 AI 穿插带来的挑战？芯片研发、国产操作系统，又会产生哪些新冲破？你对 2023 年人工智能畛域的技术和利用有哪些预判，欢送留言交换探讨~

关于人工智能:2022-年度盘点-更成熟的-AI更破圈的技术狂欢

data2vec

AlphaCode

Dall·E 2

Gato

ESM Fold

Make-A-Video

AlphaTensor

Magic 3D text-to-3D content 创立工具

ChatGPT

Point·E

冬去春来，畅想 2023

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于人工智能:2022-年度盘点-更成熟的-AI更破圈的技术狂欢

data2vec

AlphaCode

Dall·E 2

Gato

ESM Fold

Make-A-Video

AlphaTensor

Magic 3D text-to-3D content 创立工具

ChatGPT

Point·E

冬去春来，畅想 2023

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复