共计 5308 个字符,预计需要花费 14 分钟才能阅读完成。
Sora 是什么?
2024 年 2 月 16 日,OpenAI 在其官网下面正式发表推出文本生成视频的大模型 Sora:
https://openai.com/sora
(PS:目前 openai 官网还未凋谢 sora 灰度,不过依据文生图模型 DALL·E 案例,肯定是先给 ChatGPT Plus 付费用户应用,须要注册或者降级 GPT Plus 能够看这个教程: 降级 ChatGPT Plus 的教程,一分钟实现降级
Sora 可能依据简略的文本形容,生成高达 60 秒的高质量视频,使得视频创作变得前所未有的简略和高效。
本文将为您提供对于如何应用 Sora 的最新具体教程。
2. Sora 视频案例
Sora 的利用范畴十分宽泛,从教育教学、产品演示到内容营销等,都能够通过 Sora 来实现高质量的视频内容创作。
上面是 OpenAI 官网公布的利用案例:
1.Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
翻译:一位时尚的女性走在东京街头,四周是和煦闪亮的霓虹灯和生机四射的城市标识。她衣着一件彩色皮夹克,一条长长的红色连衣裙,搭配彩色靴子,并背着一个彩色手提包。她戴着墨镜,涂着红色口红。她步履自信,悠然自得地走着。街道湿润而反光,呈现出丰富多彩的灯光的镜面成果。许多行人在街上走动。
2.Prompt: Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance creates a warm glow, the low camera view is stunning capturing the large furry mammal with beautiful photography, depth of field.
翻译:几只微小的长毛猛犸象踏过一片银白的草地,它们长长的毛发在大风中微微飘动着,远处笼罩着雪的树木和宏伟的雪山,午后的光线下有些薄云,太阳高悬在远方,营造出和煦的光辉。低角度的摄影视角令人惊叹,捕捉到了这些大型毛茸茸的哺乳动物,画面景深感强烈。
3.Prompt: Historical footage of California during the gold rush.
翻译:加利福尼亚淘金热期间的历史影像。
4.Prompt: A close up view of a glass sphere that has a zen garden within it. There is a small dwarf in the sphere who is raking the zen garden and creating patterns in the sand.
翻译:放大观看一个玻璃球,外面有一个禅宗花园。球内有一个小矮人,他正在用耙子整顿禅宗花园,并在沙地上发明出图案。
5.Prompt: A cartoon kangaroo disco dances.
翻译:一只卡通袋鼠在迪斯科舞厅跳舞。
6.Prompt: The camera follows behind a white vintage SUV with a black roof rack as it speeds up a steep dirt road surrounded by pine trees on a steep mountain slope, dust kicks up from it’s tires, the sunlight shines on the SUV as it speeds along the dirt road, casting a warm glow over the scene. The dirt road curves gently into the distance, with no other cars or vehicles in sight. The trees on either side of the road are redwoods, with patches of greenery scattered throughout. The car is seen from the rear following the curve with ease, making it seem as if it is on a rugged drive through the rugged terrain. The dirt road itself is surrounded by steep hills and mountains, with a clear blue sky above with wispy clouds.
翻译:摄像机追随一辆红色老式 SUV,顶部有彩色行李架,它减速通过一条平缓的土路,四周是松树,地势平缓,车轮卷起了尘土,阳光照耀在 SUV 上,它沿着土路飞驰,给场景削减了和煦的光辉。土路在远处微微蜿蜒,看不到其余车辆。路边的树是红杉,绿色的动物装点其中。汽车从前方的镜头中轻松地跟随着曲线,使其看起来如同在起伏的地形中轻松驾驶。土路四周是平缓的山丘和山脉,天空晴朗,偶有薄云飘过。
7.Prompt: Reflections in the window of a train traveling through the Tokyo suburbs.
翻译:一辆列车穿梭东京市区时,窗户上的倒影。
8.Prompt: Tour of an art gallery with many beautiful works of art in different styles.
翻译:参观一个艺术画廊,展现了许多不同格调的精美艺术品。
9.Prompt: A grandmother with neatly combed grey hair stands behind a colorful birthday cake with numerous candles at a wood dining room table, expression is one of pure joy and happiness, with a happy glow in her eye. She leans forward and blows out the candles with a gentle puff, the cake has pink frosting and sprinkles and the candles cease to flicker, the grandmother wears a light blue blouse adorned with floral patterns, several happy friends and family sitting at the table can be seen celebrating, out of focus. The scene is beautifully captured, cinematic, showing a 3/4 view of the grandmother and the dining room. Warm color tones and soft lighting enhance the mood.
翻译:一位头发参差梳理的祖母站在木制餐桌前面,桌上摆放着一个五彩缤纷的生日蛋糕,下面点着许多蜡烛,她的表情洋溢着纯正的喜悦和幸福,眼中闪烁着高兴的光辉。她向前倾身,微微吹灭了蜡烛,蛋糕上涂着粉红色的糖霜和黑白糖粒,蜡烛的火焰也燃烧了,祖母衣着一件淡蓝色的上衣,下面点缀着花卉图案,能够看到几位高兴的敌人和家人坐在餐桌旁庆贺,然而他们处于焦点之外。这个场景被漂亮地拍摄下来,有电影般的感觉,展现了祖母和餐厅的三分之四视角。和煦的色调和柔和的光线加强了气氛。
10.Prompt: A Chinese Lunar New Year celebration video with Chinese Dragon.
翻译:一个有中国龙的中国农历新年庆贺视频。
3. Sora 怎么应用
(PS:目前 openai 官网还未凋谢 sora 灰度,不过依据文生图模型 DALL·E 案例,肯定是先给 ChatGPT Plus 付费用户应用,须要注册或者降级 GPT Plus 能够看这个教程: 降级 ChatGPT Plus 的教程,一分钟实现降级
3.1 应用 Sora 前的筹备工作
在开始之前,确保您曾经领有了 OpenAI 账目,并取得了 Sora 的拜访权限。筹备好您想要转化成视频的文本形容,记住越具体越好。
3.2 Sora 应用步骤一:文本形容
登录您的 OpenAI 账户,找到 Sora 的应用界面。在指定区域输入您的文本形容,能够是一个故事概述、场景形容或是具体的动作指令。
3.3 Sora 应用步骤二:生成视频
实现文本形容和自定义设置后,点击“生成视频”按钮。Sora 将开始解决您的申请,这可能须要几分钟工夫。实现后,您能够预览生成的视频。
** 须要留神的是,截止 2024 年 2 月 18 日,OpenAI 只向局部业余用户凋谢了 Sora 的拜访权限。普通用户只能观看其公布的演示视频。
4. Sora 常见问题
OpenAI 的 Sora 开启了视频创作的新纪元,无论是专业人士还是爱好者,都能够轻松创作出高质量的视频内容。只管仍有一些限度,但随着技术的不断进步,置信这些问题将会逐步被解决。立刻尝试 Sora,开启您的 AI 视频创作之旅吧
5. Sora 技术原理
OpenAI 近日公布了一项重要的里程碑技术——Sora,它是基于文本生成视频的 AI 模型。通过简略的文本形容,Sora 可能生成连贯的长达 1 分钟的视频。那么,Sora 是如何实现这一壮举的呢?咱们来揭开它的技术原理。
基于 Transformer 架构
Sora 模型与 GPT 模型相似,都基于 Transformer 架构,这使得 Sora 具备极强的扩展性。Transformer 是一种基于自注意力机制的神经网络架构,它可能同时解决输出文本中的所有地位信息,使得模型可能捕捉到全局的上下文信息。这样的架构使得 Sora 在生成视频时可能更好地了解文本形容。
扩散模型和训练稳定性
Sora 模型采纳了扩散模型的办法,与传统的 GAN 模型相比,具备更好的生成多样性和训练稳定性。扩散模型通过逐渐打消噪声来生成视频,这样能够无效地进步生成的视频品质。同时,通过采纳扩散模型,Sora 还可能生成更加真切的视频场景。
生成视频的数据处理和压缩
生成视频须要解决大量的数据,对于这一问题,Sora 模型采纳了数据处理和压缩的技术。通过对视频数据进行解决和压缩,Sora 可能在放弃视频品质的同时,缩小存储空间的占用。
视频品质和逼真度
Sora 模型在生成视频的过程中,重视放弃视频品质和逼真度。通过采纳 Transformer 架构和扩散模型的办法,Sora 可能生成更加连贯、且具备很高逼真度的视频场景。这使得 Sora 在应用领域具备宽泛的后劲,比方能够用于影视制作、游戏开发等方面。
参考链接:https://www.openai.com/research/sora/
6. openai sora 如何应用的常见问答 Q &A
问题:Sora 是什么?
- Sora 是由 OpenAI 开发的 AI 视频生成模型。
- Sora 能够依据用户提供的描述性文字生成长达 60 秒的高质量视频。
Sora 的视频蕴含精密简单的场景、活泼的角色表情和简单的镜头静止。
问题:Sora 怎么应用?
- 登录 OpenAI 账户并找到 Sora 的应用界面。
- 在指定区域输入您的文本形容,能够是一个故事概述、场景形容或是具体的动作指令。
点击生成按钮,OpenAI Sora 会依据您的文本形容生成视频。
问题:Sora 的劣势有哪些?
- Sora 具备极强的扩展性,基于 Transformer 架构,能够利用于各种场景。
- Sora 可能生成高质量、高清的视频,展示简单场景的光影关系、物体的物理遮挡和碰撞关系。
- Sora 能够发明出蕴含多个角色、特定动作类型以及与主题和背景相符的具体场景。
问题:Sora 的训练原理是什么?
- Sora 的训练分为两个阶段。首先,应用一个标注模型为训练集中的视频生成详细描述。
- 标注模型生成的形容可能更好地领导 Sora 生成视频。
- Sora 利用稳固扩散(Stable Diffusion)技术将动态噪声转换为连贯图像。
- Sora 模型采纳初步的扩散模型生成视频长度,并逐渐打消噪声实现视频。
申明: 本站所有文章,如无非凡阐明或标注,均为本站原创公布。任何集体或组织,在未征得本站批准时,禁止复制、盗用、采集、公布本站内容到任何网站、书籍等各类媒体平台。如若本站内容进犯了原著者的合法权益,可分割咱们进行解决。
本文由 mdnice 多平台公布