共计 6057 个字符,预计需要花费 16 分钟才能阅读完成。
OpenAI Sora 超强文生视频如何应用:最新具体教程 - 小白教程
1.Sora 是什么
仅仅凭借文字就能够生成一段视频!近日,OpenAI 的一款新产品又火出圈了。当地工夫周四(2 月 15 日),OpenAI 公布了首个文生视频模型 Sora。
2024 年 2 月 16 日,OpenAI 在官网上正式发表推出 文本生成视频 的大模型 Sora,该工具能够通过应用文本迅速制作出一段长达 60 秒的视频,视频中能够出现多个角色、特定动作、以及简单场景。OpenAI 的官网上现已更新了 48 个视频案例,能够说是成果真切,能展示鲜艳的色调,出现精确的细节,连人物角色都是表情丰富。
随后在周六(2 月 17 日),负责 Sora 我的项目的钻研科学家 Bill Peebles 在社交媒体 X 上分享了 Sora 的一项新性能——能够一次性就同样场景生成多个视角的多段视频。
Peebles 强调,“并不是咱们把五个视频拼接在一起,是 Sora 决定同时将五个不同的视角联合在一起的!”
接下来将为您提供对于小白如何动手 Sora)的最新具体教程,来让你疾速上手。
2.Sora 的利用案例
Sora 的利用范畴十分宽泛,从教育教学、产品演示到内容营销等,都能够通过 Sora 来实现高质量的视频内容创作。上面是 OpenAI 官网公布的利用案例:
2.1 长达 60s 超长的长度
在一堆 AI 视频,还在 4s 连贯性的边缘挣扎,OpenAI 间接向人工智能这个陆地扔下了一篇超级炸弹,不装了,我摊牌了,间接说到:我能生成 60s 视频,闪开,我能打十个。
1.Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
翻译:一位时尚的女性走在东京街头,四周是和煦闪亮的霓虹灯和生机四射的城市标识。她衣着一件彩色皮夹克,一条长长的红色连衣裙,搭配彩色靴子,并背着一个彩色手提包。她戴着墨镜,涂着红色口红。她步履自信,悠然自得地走着。街道湿润而反光,呈现出丰富多彩的灯光的镜面成果。许多行人在街上走动。
我齐全不晓得是如何能实现进去的,官网的解释是:
只能先等他们的技术文档,再来具体看看了。
2.2 单视频多角度镜头
古代的 AI 工作流程曾经实现了令人难以置信的冲破,,可能在单个视频中 seamlessly integrate 多角度镜头,同时放弃主体的完满一致性,这在过来简直是难以想象的。OpenAI 只通过简略的提醒语,就能在一分钟视频内实现多角度的镜头切换,并且令人惊叹的是,物体的一致性 j 竟然失去了完满放弃。
2.Prompt:A beautiful silhouette animation shows a wolf howling at the moon,feeling lonely,until it finds its pack.
提醒:一个漂亮的掠影动画展现了一只狼对着月亮嚎叫,感到孤单,直到它找到狼群。
此时,一匹狼孤单地对着月光长啸,其声悲凉,彰显着它的孤独,直至它终于找到了属于本人的族群。
孤单——这一主题,在视频中就这样被完满得体现进去。
以多角度的镜头切换,每一幕都如同精心设计进去的一样,展示了制作的精密思考,就像超电磁炮个别直击人们的心田
2.3 世界模型
3Prompt: Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance creates a warm glow, the low camera view is stunning capturing the large furry mammal with beautiful photography, depth of field.
翻译:几只微小的长毛猛犸象踏过一片银白的草地,它们长长的毛发在大风中微微飘动着,远处笼罩着雪的树木和宏伟的雪山,午后的光线下有些薄云,太阳高悬在远方,营造出和煦的光辉。低角度的摄影视角令人惊叹,捕捉到了这些大型毛茸茸的哺乳动物,画面景深感强烈。
4.Prompt: Historical footage of California during the gold rush.
翻译:加利福尼亚淘金热期间的历史影像。
5.Prompt: A close up view of a glass sphere that has a zen garden within it. There is a small dwarf in the sphere who is raking the zen garden and creating patterns in the sand.
翻译:放大观看一个玻璃球,外面有一个禅宗花园。球内有一个小矮人,他正在用耙子整顿禅宗花园,并在沙地上发明出图案。
A cartoon kangaroo disco dances.
翻译:一只卡通袋鼠在迪斯科舞厅跳舞。
7.Prompt: The camera follows behind a white vintage SUV with a black roof rack as it speeds up a steep dirt road surrounded by pine trees on a steep mountain slope, dust kicks up from it’s tires, the sunlight shines on the SUV as it speeds along the dirt road, casting a warm glow over the scene. The dirt road curves gently into the distance, with no other cars or vehicles in sight. The trees on either side of the road are redwoods, with patches of greenery scattered throughout. The car is seen from the rear following the curve with ease, making it seem as if it is on a rugged drive through the rugged terrain. The dirt road itself is surrounded by steep hills and mountains, with a clear blue sky above with wispy clouds.
翻译:摄像机追随一辆红色老式 SUV,顶部有彩色行李架,它减速通过一条平缓的土路,四周是松树,地势平缓,车轮卷起了尘土,阳光照耀在 SUV 上,它沿着土路飞驰,给场景削减了和煦的光辉。土路在远处微微蜿蜒,看不到其余车辆。路边的树是红杉,绿色的动物装点其中。汽车从前方的镜头中轻松地跟随着曲线,使其看起来如同在起伏的地形中轻松驾驶。土路四周是平缓的山丘和山脉,天空晴朗,偶有薄云飘过。
8.Prompt: Reflections in the window of a train traveling through the Tokyo suburbs.
翻译:一辆列车穿梭东京市区时,窗户上的倒影。
9.Prompt: Tour of an art gallery with many beautiful works of art in different styles.
翻译:参观一个艺术画廊,展现了许多不同格调的精美艺术品。
10.Prompt: A grandmother with neatly combed grey hair stands behind a colorful birthday cake with numerous candles at a wood dining room table, expression is one of pure joy and happiness, with a happy glow in her eye. She leans forward and blows out the candles with a gentle puff, the cake has pink frosting and sprinkles and the candles cease to flicker, the grandmother wears a light blue blouse adorned with floral patterns, several happy friends and family sitting at the table can be seen celebrating, out of focus. The scene is beautifully captured, cinematic, showing a 3/4 view of the grandmother and the dining room. Warm color tones and soft lighting enhance the mood.
翻译:一位头发参差梳理的祖母站在木制餐桌前面,桌上摆放着一个五彩缤纷的生日蛋糕,下面点着许多蜡烛,她的表情洋溢着纯正的喜悦和幸福,眼中闪烁着高兴的光辉。她向前倾身,微微吹灭了蜡烛,蛋糕上涂着粉红色的糖霜和黑白糖粒,蜡烛的火焰也燃烧了,祖母衣着一件淡蓝色的上衣,下面点缀着花卉图案,能够看到几位高兴的敌人和家人坐在餐桌旁庆贺,然而他们处于焦点之外。这个场景被漂亮地拍摄下来,有电影般的感觉,展现了祖母和餐厅的三分之四视角。和煦的色调和柔和的光线加强了气氛。
11.Prompt: A Chinese Lunar New Year celebration video with Chinese Dragon.
翻译:一个有中国龙的中国农历新年庆贺视频。
3.Sora 的弱点
Sora 以后存在的弱点,OpenAI 也是间接指出它可能 难以精确模仿简单场景的物理原理,并且可能无奈了解因果关系。
比方“五只灰狼幼崽在一条偏远的碎石路上相互嬉戏、追赶”,狼的数量会变动,一些凭空出现或隐没。
该模型有会可能 混同提醒的空间细节 ,例如混同左右,可能 难以准确形容随着时间推移产生的事件,例:遵循特定的相机轨迹。
4.Sora AI 如何用
1. 首先登录您的 OpenAI 账户,找到 Sora 的应用界面。在指定区域输入您的文本形容,能够是一个故事概述、场景形容或是具体的动作指令。
(PS: 不过 Sora 是 Openai 刚刚官宣不久的模型,目前并没有向所有的用户凋谢,只是邀请行业内一些人员,艺术家等体验,然而依照以往 Open ai Chatgpt 新性能的凋谢速度,应该会很快就全员凋谢!
Sora 是文本生成视频的模型,openai 上面还有超级火爆的 ChatGPT, AI 对话,以及文本生图的弱小性能,能够间接应用:
以下是 ChatGPT 的应用例子,你能够依据特定的畛域向他发问,他会给你相应的思路,并且答复问题,应用办法是领有一个 ChatGPT 账号,还没有注册的敌人能够点击 2024 年 2 月最新, 手把手教你如何为 ChatGPT4.0 充值,降级及应用技巧(订阅指南 + 图文教程) | AI 教程
ChatGPT4.0 能够给你图文联合的答复:
5. Sora 是否平安?
就像面对任何新兴的人工智能技术一样,人们对于 Sora 能产生什么样的内容持有肯定的放心。为了应答这些担心,OpenAI 正致力于寻找解决方案。
除了与可能辨认危险和潜在问题的“红队成员”单干之外,OpenAI 还在开发新的工具,以帮忙辨认误导性内容。其中一个工具是“检测分类器”,可能分别出哪些视频是由 Sora 制作的。
对于文本内容,OpenAI 有一个文本分类器工具,它会审查用户的输出提醒,并回绝那些违反应用政策的内容,比方含有极其暴力、色情、怨恨信息、名人形象或进犯别人知识产权的申请。
OpenAI 还打算与世界各地的政策制定者、教育者和艺术家单干,这样他们不仅能听到这些群体的担心,还能发现这项新技术的踊跃利用形式。
6. 以后怎么用 Sora?
目前,Sora 平台的应用被限定于一个特定的用户群体,这次要包含被称作“红队成员”的专家。这些专家有能力评估危险、辨认潜在的问题,如错误信息、偏见和怨恨舆论。
同时,Sora 也对一些视觉艺术家、设计师和电影制作者凋谢,以便收集他们的反馈,进一步优化平台,让它更加合乎创意行业专业人士的需要。这部分用户可能提前体验模型,并且在以后阶段,他们能够收费应用 Sora。
对于个别用户来说,因为 OpenAI 还没有公开 Sora 对公众的凋谢时间表和具体应用条款,因而他们临时无奈通过 Sora 平台生成视频。
7. 将如何影响将来,以及哪些群体可能因而面临待业挑战?
在技术提高的浪潮中,咱们面临着既充满希望又不无忧愁的将来。对于许多人来说,人工智能的疾速倒退既是激动人心的提高,也可能是对现有工作的威逼。
特地是在影视行业内,视频剪辑师和后期制作人员等岗位可能最先感触到这种变动。随着像 Sora 这样的视频模型可能主动或半自动地生成视频,传统视频制作和编辑工作的需要可能会逐步缩小。剪辑、特效和音效等后期制作环节,也可能通过 AI 技术变得更加自动化。
然而,在这个疾速变动的时代,Sora 的呈现不仅仅是技术的一个跳跃,它也向咱们展现了人工智能潜在的、简直是有限的可能性。到了 2024 年,咱们曾经站在了一个新的历史节点上,它向咱们展现的是心愿多于失望。这并不意味着咱们将面临一场无奈防止的就业危机。相同,这项技术可能会激发视频行业走向更高的技术水平和更多的翻新门路。
在这个过程中,咱们须要共情和了解——了解技术如何扭转咱们的工作和生存,以及如何适应这些变动,找到新的时机。咱们独特的工作是摸索如何让技术提高惠及每一个人,确保在将来的世界里,每个人都能找到本人的地位。
8. 对 Sora 的疑难解答
划重点
1. 因为 Sora 目前还未正式对外上线。后续预计先在 GPT Plus 笼罩。
2. 截止 2024 年 2 月 16 日,OpenAI 只向局部业余用户凋谢了 Sora 的拜访权限。普通用户只能观看其公布的演示视频。
- 视频类岗位是不是很危险?
尽管从目前来看视频类岗位可能会有一些危险,但机会与倒退空间并存
9. 结语
OpenAI 的 Sora 开启了视频创作的新纪元,无论是专业人士还是爱好者,都能够轻松创作出高质量的视频内容。只管仍有一些限度,但随着技术的不断进步,置信这些问题将会逐步被解决。立刻尝试 Sora,开启您的 AI 视频创作之旅吧!