共计 4280 个字符,预计需要花费 11 分钟才能阅读完成。
IMMENSE、36 氪|作者
01“将来是属于 AI 的”
3 月 2 日,内容创作圈大地震。
就在 3 月 2 日凌晨,OpenAI 发表凋谢 ChatGPT 本体模型 API,其价格为 1k tokens/$0.002。也就是说,从这一天开始,任何企业都能让 ChatGPT 为本人打工,而价格仅仅是 每输入 100 万个单词 18 元人民币(2.7 美元)。
如果对这个价格没有概念的话,举个例子。往年,河南省鹤壁市淇县某机动车培修店招聘文案编辑,店里开出的最低薪酬是 2000 元 / 月,学历不限。
图片方面,早在 ChatGPT 走红之前,AI 绘画早已引发了艺术圈的一场大地震。
去年 9 月,一幅由 AI 创作的绘画作品 《太空歌剧院》 取得美国科罗拉多州艺术博览会数字艺术类别冠军,简直标记着 AI 作画的“AlphaGo 时刻”。
《太空歌剧院》(Théâtre D’opéra Spatial)
这幅作品是基于 AI 生成的画作加上人类画师的前期绘制,这一点被业内人士大为诟病,指摘作者以 AI 为噱头,实际上仍旧须要人类加工。
这些质疑 AI 作画能力的人疏忽了一个重要因素——进化。
人们往往极大低估了 AI 大模型的学习与提高能力。仅仅在几年之前,人工智能还是被戏称为“人工智障”的存在。人们时常拿间或呈现的“翻车”案例证实 AI 与人类的差距,却疏忽了这项技术在最近数年间突飞猛进的进化能力。
在知乎“AI 绘画半年了,到目前为止,AI 绘画让多少画师就业了?将来又会有多少?”的这条问题底下,3202 人点赞了同一条答复:
“AI 对美术行业的冲击是微小的,这个效应会在将来两三年随着显卡降级大暴发,美术行业会变的卷中卷,50% 的人可能面临转行。”
“……我只是在做劝退而已,我心愿新人不要跳火坑了,将来是属于 AI 的。”
兴许有人认为,文字与图片都是高度结构化的信息,可能被轻易代替无可非议。然而,视频内容信息量大、非结构性数据多,是 AI 尚未攻克的坚硬堡垒,也是内容创作者最初一块自留地。
事实并非如此。
早些年 DeepFake 换脸带来的恐慌暂且不管,近年间,谷歌、Meta(Facebook)陆续公布 Phenaki、Imagen Video、Make-A-Video AI 视频主动生成模型,其成果有时足以以假乱真。
没有创作者可能和这样的力量抗争。
02“没有人的文化,毫无意义”
在 ChatGPT 刚火起来那阵子,网上流传过一个笑话:
“快进到 10 年当前,乙方计划全副由 ChatGPT 生成,甲方计划全副由 ChatGPT 审核。单方单干大半年,一点工作没干过。”
这个笑话引人发笑的荒诞之处不言而喻——单方的工作都没有意义。
如果更进一步思考,什么是意义?
独一无二,在今年春节档爆款电影《漂泊地球 2》中,一句广为流传的台词给出了答案:“没有人的文化,毫无意义。”
是的,ChatGPT 实质上仍旧是为人类所设计、制作、应用的工具,认为这项技术将会代替人类文明实际上是一种轻重倒置。
就像历史上其他人认为狐疑自我存在意义的时刻一样,在工业革命之后,电视、计算机、手机、互联网、云计算,这种种新兴科技产品都曾在不同时间段引发过人们的恐慌。
人工智能也不例外。早在 1997 年,IBM 的深蓝计算机就已在国际象棋较量中战胜了世界冠军卡斯帕罗夫。寰球在深蓝博得较量之后陷入了兴奋与恐慌,“机器将会在将来取代人类,霸占地球”的舆论层出不穷。
可事实上,20 多年过来了,现在咱们每一个人的智能手机算力都足以与当年的深蓝相匹敌,但人类文明并没有因而而终结。
正如美国政治记者与作家诺曼·卡曾斯在其 1935~1974 年所撰写的《人的抉择》一书中所载:文化的建设,靠的不是机器,而是思维。
21 世纪的明天,机器霸占人类文明的事件岂但没有产生,科技、工业、自动化的提高反而让边远山区通水通电,让大规模生产日用品的价格低到人人可享,让每一个人的生存都比咱们两个世纪以前最优渥的先人都要更便捷、更丰腴、更自在。
即使是现在引发大量恐慌的 ChatGPT 类 AIGC 技术,也在一直被使用于 普惠人类、升高服务门槛 的中央。
比方,基于 人口统计学、相干的病史或流行病学危险因素,Glass.health AI 可能辅助医生更疾速、更精确地诊断病人;
而基于AI 文档剖析技术,Humata.ai 可能疾速帮忙用户提取文档中的有价值信息,升高技术文档、法律文档等业余文件的浏览难度,让不足相干训练的普罗公众可能更好地爱护本身利益;
基于AI 文本摘要和 TTS 技术生成的口播文案,AI 绘画生成的贴纸、特效等一直利用在短视频生产畛域,进一步升高了短视频生产门槛,越来越多的内容创作者搭上了短视频的“慢车”。
其余对于 AI 写作、AI 绘画、AI 视频等的 AI 创作工具 则更是层出不穷。小到脚本错别字查看,大到分镜设计与画面排版,已经困难重重的内容创作环节被一直拆解重构,升高入门门槛。
而 AI 与 AI 使用者的关系,也在这一次次的工具迭代之中,被时代所一直解构、重组、赋予了新的外延。
举个例子,2021 年 5 月,安徽的一名小伙子忽然在网络上走红。
此前的几年间,通过 AI 技术,他累计帮忙了超过 500 人“复活”了亲人们的老照片。那些泛黄含糊的照片通过他一顿操作,不仅变得更清晰亮堂,还能朝着电脑前的亲人眨眼、微笑、摆头。
看着本人 6 岁时就逝世的父亲从新在电脑屏幕上“活过来”,那些哭得情难自禁的情景,兴许才是 AI 与文化的实在意义。
03 是颠覆者,更是解放者
在祛除了对 AI 的盲目崇拜与自觉恐怖之后,咱们终于能够略微感性地对待 AIGC 这回事。
始终以来,在内容创作的过程中,都存在着大量的反复动作,它们繁琐、冗余、耗时极长却又实质上与创作无关。
比方,文稿校对者为了找出错别字,一次又一次地反复浏览一篇文章,读得眼睛都发酸、发胀。
再比方,画家灵感爆发,在画布上挥毫而就一幅巨作,而后花上十倍的工夫对整幅画面的每一处细节反复勾线、加暗影、卡灵通、勾线、加暗影、卡灵通……
视频制作则更是重灾区。视频拍摄的原始素材动辄长达几十、甚至几百小时,前期剪辑师不仅要用肉眼逐个观看,还要一而再再而三地对其进行反复辨认、筛选、剪辑切割,在 AI 呈现之前还要用耳朵一遍遍听原片内容,手动增加字幕。
这些过程既无趣,又简短,而且与真正的人类创造力简直毫无关系。创作者们的大量精力都被扩散到了这些反复环节,真正用来创作的局部少之又少。
AIGC 对于内容创作者的意义,正是将他们解放出来,让创作者的精力更好地用于摸索创意极限,而反复、繁杂的工作交给 AIGC,让创作者的产能不再受到制约,让优质内容可能爆炸式增长。
听起来这一天仿佛很边远,但实际上,由 AI 辅助生成的创意内容曾经来到了咱们身边。
去年冬奥期间,央视体育新媒体和总台技术团队联结阿里云视频云、达摩院, 打造了“AI 云智剪”智能视频剪辑工具。
基于阿里 AI 视频了解技术 EMC2 与阿里云弱小的流媒体解决能力,AI 云智剪可能实时解析并提取赛事视频中的运动员信息、精彩动作、镜头类型、赛程信息、运动员特点等,并主动生成多种类型的集锦视频,大规模解放剪辑师压力。
去年整个冬奥期间,阿里 AI 云智剪共生产出 39878 段素材,时长超过 200 小时,笼罩超 200 场较量。
除了 AI 视频生成之外,通过和云计算联合,AIGC 还可能从本源上颠覆电视台与演播室的工作流程,将本来宏大、简单、低廉的演播环节,全副集成在一台一般的手机上。
比方,在间断多届的全国两会期间,人民日报新媒体记者的手机里就装进了一款内容创作增效“神器”:两会“AI 编辑部”挪动版。
这是基于 阿里云视频云的“AI 编辑部” 衍生而来的定制化智能媒体生产产品。通过“AI 编辑部”,记者所拍摄的现场视频素材既能由 5G 网络同步回传前方,也能由记者在后方即时剪辑。从发现线索、获取素材,到拍摄制作、审核签发,以及发动直播、连麦访谈等系列动作,都能通过一部手机实时实现。
在以后的 AIGC 畛域,AI 全自动生成的文字与图片,在不少时刻都简直能达到“以假乱真”的成果。在视频制作畛域,比照文字、图片,视频的信息量最大、非结构化数据最多,AI 须要对于视频内人物、物品、场景、关系等高阶信息进行了解,加之视频制作自身对于审美、节奏、画面、BGM 的极高要求……
AI 全自动生成过程尽管略显漫长,但并不是那么天方夜谭的将来。
冬奥会的 AI 云智剪,面向特定的赛事场景,限定了素材集的范畴,套用成熟的编排模式,由 AI 负责素材的预处理,并按预设模版进行编排,这是 AIGC 的序曲,实现了视频全智能生产的第一个阶段。
AIGC 的第二个阶段,AI 除了负责素材的预处理,还能实现本属于视频创意环节的编排工作,从而实现智能批量混剪。
第三阶段,面向特定场景和特定要求的成品,由 AI 依据已有成片反向解构分镜头,负责素材的搜寻、筛选、解决、编排,并最终制作合成。
第四阶段,面向特定场景,AI 负责了解场景的要求,包含素材的搜寻、筛选(以及局部素材生成)、解决、编排,并最终制作合成。
AIGC 视频生成的终极阶段,由 AI 开掘视频制作的趣味点及创意点,并实现相应的制作。
当然,在此之前,AI 视频制作仍旧面临着一个火烧眉毛的挑战——算力。
一段文字、一张图片、一段视频,解决它们所须要的算力级别呈指数型爆炸回升。
这道题,云计算成了惟一的答案。
目前,云计算和人工智能的联合正处于技术冲破和倒退的关键时期,生成式 AI 正在产生颠覆性冲破,阿里巴巴将全力构建本人的 AI 预训练大模型,并为市场上风起云涌的模型和利用提供好算力的撑持,阿里董事会主席兼首席执行官张勇在往年 2 月的财报会上示意。
04 结语
早在 1956 年,以约翰·麦卡锡、马文·明斯基、克劳德·香农等为代表的科学家们就在美国达特茅斯组织了一场为期两个月的人工智能冬季研讨会,开启了人工智能技术的摸索之路。
半个多世纪后的明天,在云计算、深度学习、万亿级参数大模型等相干技术的倒退之下,AIGC 才第一次真正走进咱们的生存,它在绘画、作曲、视频等创作畛域简直完满地代替了反复人工,进而将 成为革命性意义的新时代生产力工具。
3 月 15 日凌晨,OpenAI 正式上线了新一代人工智能大模型 GPT-4。与它的上一代相比,这款多模态模型不仅能够承受文本输出,甚至曾经能够承受图像等其余模态的信息输出,离真正的通用型人工智能又近了一步。
不要温和地走进这场 AIGC。
当人类优渥于一种状态,总有想象力来冲破均衡。Cloud Imagine《云想之力》是阿里云联结 36 氪独特打造的系列报道,旨在摸索云计算大背景下暴发的利用场景和新兴技术,以设想的高维碰撞之力,窥探“云”上的有限空间。从蒸汽机到人工智能,所有生产力工具都是为了将人类从繁冗的劳动中解放出来,将工夫与精力留给创意与设想的破界。