关于人工智能:OpenAI-文本转视频大模型-Sora-引爆科技圈人类离-AGI-真的不远了吗

92次阅读

共计 946 个字符,预计需要花费 3 分钟才能阅读完成。

一年前 AI 智能涌现的场景又重现。

2 月 16 日,OpenAI 公布了最新的视频生成模型 Sora。它可能依据用户输出的提醒词、文本指令或动态图像,生成长达一分钟的视频。

这一行动无疑轰动了整个科技圈,从目前 Open AI 展现的信息来看,Sora 实现了 AIGC 畛域的里程碑式停顿。从仅通过输出一句话,生成文本,再到图片,到当初可生成与好莱坞画面相媲美的视频,且长度最多可达 1 分钟,这让不少科技大佬折服。

Sora 到底有多强?

在官网更新的 48 个视频中,Sora 不仅能精确出现细节,还能够依据提醒、静止图像填补现有视频中的缺失帧来生成视频。其中既能实现多角度镜头的天然切换,还蕴含简单的场景和活泼的角色表情,且故事的逻辑性和连贯性极佳。

来看看官网更新的其中一个文本生成的视频:

AI 文本提醒:一位时尚的女人走在东京的街道上,街道上到处都是和煦的发光霓虹灯和动画城市标记。她身穿彩色皮夹克,红色长裙,彩色靴子,背着一个彩色钱包。她戴着墨镜,涂着红色口红。她自信而随便地走路。街道湿润而反光,营造出五光十色的灯光的镜面成果。许多行人到处走动。

在这段仅继续一分钟的视频里,一位衣着娇艳红裙的女士散步在繁华都市、五彩缤纷的霓虹灯下。视频的出现格调极为真切,画面切换天然晦涩,但最令人震惊的,无疑是女主角那细致入微的面部特写。从毛孔的轻微张开,到斑点与痘印的实在展示,每一个皮肤细节都栩栩如生,好像咱们能间接触摸到她的肌肤质感。而那种粉底微脱、妆容稍许不整的成果,显得更加实在!

除了对人物写实,Sora 还可能模仿事实中的动物与环境以及非写实的创意动画等等,其生成成果让网友开始放心起了各行业人士的饭碗。

Sora 的技术原理其实跟 ChatGPT 相似,都是拼接大量的数据和训练,建设起大模型,而后利用弱小的算力疾速生成内容。

目前支流大模型都是建设在微小的参数量和运算量之上的,对算力提出了极高的要求,Sora 的横空出世,推动算力需要的继续低落。训练一个模型须要大量 GPU 服务器。为了进步企业 AI 利用产品的衰弱疾速落地,撑持企业低成本疾速应用 AI 算力资源。Finovy Cloud 提供寰球先进算力产品和服务引擎,高性能云主机,致力于为企业提供先进的 AI 算力,助企业在 AI 行业中取得倒退红利,协力迎接一个更加高效、智能的 AI 新时代到来。

正文完
 0