关于人工智能:OpenAI-文本转视频大模型-Sora-引爆科技圈人类离-AGI-真的不远了吗

一年前 AI 智能涌现的场景又重现。

2 月 16 日，OpenAI 公布了最新的视频生成模型 Sora。它可能依据用户输出的提醒词、文本指令或动态图像，生成长达一分钟的视频。

这一行动无疑轰动了整个科技圈，从目前 Open AI 展现的信息来看，Sora 实现了 AIGC 畛域的里程碑式停顿。从仅通过输出一句话，生成文本，再到图片，到当初可生成与好莱坞画面相媲美的视频，且长度最多可达 1 分钟，这让不少科技大佬折服。

Sora 到底有多强？

在官网更新的 48 个视频中，Sora 不仅能精确出现细节，还能够依据提醒、静止图像填补现有视频中的缺失帧来生成视频。其中既能实现多角度镜头的天然切换，还蕴含简单的场景和活泼的角色表情，且故事的逻辑性和连贯性极佳。

来看看官网更新的其中一个文本生成的视频：

AI 文本提醒：一位时尚的女人走在东京的街道上，街道上到处都是和煦的发光霓虹灯和动画城市标记。她身穿彩色皮夹克，红色长裙，彩色靴子，背着一个彩色钱包。她戴着墨镜，涂着红色口红。她自信而随便地走路。街道湿润而反光，营造出五光十色的灯光的镜面成果。许多行人到处走动。

在这段仅继续一分钟的视频里，一位衣着娇艳红裙的女士散步在繁华都市、五彩缤纷的霓虹灯下。视频的出现格调极为真切，画面切换天然晦涩，但最令人震惊的，无疑是女主角那细致入微的面部特写。从毛孔的轻微张开，到斑点与痘印的实在展示，每一个皮肤细节都栩栩如生，好像咱们能间接触摸到她的肌肤质感。而那种粉底微脱、妆容稍许不整的成果，显得更加实在！

除了对人物写实，Sora 还可能模仿事实中的动物与环境以及非写实的创意动画等等，其生成成果让网友开始放心起了各行业人士的饭碗。

Sora 的技术原理其实跟 ChatGPT 相似，都是拼接大量的数据和训练，建设起大模型，而后利用弱小的算力疾速生成内容。

目前支流大模型都是建设在微小的参数量和运算量之上的，对算力提出了极高的要求，Sora 的横空出世，推动算力需要的继续低落。训练一个模型须要大量 GPU 服务器。为了进步企业 AI 利用产品的衰弱疾速落地，撑持企业低成本疾速应用 AI 算力资源。Finovy Cloud 提供寰球先进算力产品和服务引擎，高性能云主机，致力于为企业提供先进的 AI 算力，助企业在 AI 行业中取得倒退红利，协力迎接一个更加高效、智能的 AI 新时代到来。

关于人工智能:OpenAI-文本转视频大模型-Sora-引爆科技圈人类离-AGI-真的不远了吗

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于人工智能:OpenAI-文本转视频大模型-Sora-引爆科技圈人类离-AGI-真的不远了吗

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复