关于云计算:借AI之势打破创意与想象的边界

IMMENSE、36氪｜作者

01 “将来是属于AI的”

3月2日，内容创作圈大地震。

就在3月2日凌晨，OpenAI发表凋谢ChatGPT本体模型API，其价格为1k tokens/$0.002。也就是说，从这一天开始，任何企业都能让ChatGPT为本人打工，而价格仅仅是每输入100万个单词18元人民币（2.7美元） 。

如果对这个价格没有概念的话，举个例子。往年，河南省鹤壁市淇县某机动车培修店招聘文案编辑，店里开出的最低薪酬是2000元/月，学历不限。

图片方面，早在ChatGPT走红之前，AI绘画早已引发了艺术圈的一场大地震。

去年9月，一幅由AI创作的绘画作品 《太空歌剧院》 取得美国科罗拉多州艺术博览会数字艺术类别冠军，简直标记着AI作画的“AlphaGo时刻”。

《太空歌剧院》（Théâtre D'opéra Spatial）

这幅作品是基于AI生成的画作加上人类画师的前期绘制，这一点被业内人士大为诟病，指摘作者以AI为噱头，实际上仍旧须要人类加工。

这些质疑AI作画能力的人疏忽了一个重要因素——进化。

人们往往极大低估了AI大模型的学习与提高能力。仅仅在几年之前，人工智能还是被戏称为“人工智障”的存在。人们时常拿间或呈现的“翻车”案例证实AI与人类的差距，却疏忽了这项技术在最近数年间突飞猛进的进化能力。

在知乎“AI绘画半年了，到目前为止，AI绘画让多少画师就业了？将来又会有多少?”的这条问题底下，3202人点赞了同一条答复：

“AI对美术行业的冲击是微小的，这个效应会在将来两三年随着显卡降级大暴发，美术行业会变的卷中卷，50%的人可能面临转行。”

“……我只是在做劝退而已，我心愿新人不要跳火坑了，将来是属于AI的。”

兴许有人认为，文字与图片都是高度结构化的信息，可能被轻易代替无可非议。然而，视频内容信息量大、非结构性数据多，是AI尚未攻克的坚硬堡垒，也是内容创作者最初一块自留地。

事实并非如此。

早些年DeepFake换脸带来的恐慌暂且不管，近年间，谷歌、Meta（Facebook）陆续公布Phenaki、Imagen Video、Make-A-Video AI视频主动生成模型，其成果有时足以以假乱真。

没有创作者可能和这样的力量抗争。

02 “没有人的文化，毫无意义”

在ChatGPT刚火起来那阵子，网上流传过一个笑话：

“快进到10年当前，乙方计划全副由ChatGPT生成，甲方计划全副由ChatGPT审核。单方单干大半年，一点工作没干过。”

这个笑话引人发笑的荒诞之处不言而喻——单方的工作都没有意义。

如果更进一步思考，什么是意义？

独一无二，在今年春节档爆款电影《漂泊地球2》中，一句广为流传的台词给出了答案：“没有人的文化，毫无意义。 ”

是的，ChatGPT实质上仍旧是为人类所设计、制作、应用的工具，认为这项技术将会代替人类文明实际上是一种轻重倒置。

就像历史上其他人认为狐疑自我存在意义的时刻一样，在工业革命之后，电视、计算机、手机、互联网、云计算，这种种新兴科技产品都曾在不同时间段引发过人们的恐慌。

人工智能也不例外。早在1997年，IBM的深蓝计算机就已在国际象棋较量中战胜了世界冠军卡斯帕罗夫。寰球在深蓝博得较量之后陷入了兴奋与恐慌，“机器将会在将来取代人类，霸占地球”的舆论层出不穷。

可事实上，20多年过来了，现在咱们每一个人的智能手机算力都足以与当年的深蓝相匹敌，但人类文明并没有因而而终结。

正如美国政治记者与作家诺曼·卡曾斯在其1935～1974年所撰写的《人的抉择》一书中所载：文化的建设，靠的不是机器，而是思维。

21世纪的明天，机器霸占人类文明的事件岂但没有产生，科技、工业、自动化的提高反而让边远山区通水通电，让大规模生产日用品的价格低到人人可享，让每一个人的生存都比咱们两个世纪以前最优渥的先人都要更便捷、更丰腴、更自在。

即使是现在引发大量恐慌的ChatGPT类AIGC技术，也在一直被使用于普惠人类、升高服务门槛的中央。

比方，基于人口统计学、相干的病史或流行病学危险因素，Glass.health AI可能辅助医生更疾速、更精确地诊断病人；

而基于AI文档剖析技术，Humata.ai可能疾速帮忙用户提取文档中的有价值信息，升高技术文档、法律文档等业余文件的浏览难度，让不足相干训练的普罗公众可能更好地爱护本身利益；

基于AI文本摘要和TTS技术生成的口播文案，AI绘画生成的贴纸、特效等一直利用在短视频生产畛域，进一步升高了短视频生产门槛，越来越多的内容创作者搭上了短视频的“慢车”。

其余对于AI写作、AI绘画、AI视频等的AI创作工具则更是层出不穷。小到脚本错别字查看，大到分镜设计与画面排版，已经困难重重的内容创作环节被一直拆解重构，升高入门门槛。

而AI与AI使用者的关系，也在这一次次的工具迭代之中，被时代所一直解构、重组、赋予了新的外延。

举个例子，2021年5月，安徽的一名小伙子忽然在网络上走红。

此前的几年间，通过AI技术，他累计帮忙了超过500人“复活”了亲人们的老照片。那些泛黄含糊的照片通过他一顿操作，不仅变得更清晰亮堂，还能朝着电脑前的亲人眨眼、微笑、摆头。

看着本人6岁时就逝世的父亲从新在电脑屏幕上“活过来”，那些哭得情难自禁的情景，兴许才是AI与文化的实在意义。

03 是颠覆者，更是解放者

在祛除了对AI的盲目崇拜与自觉恐怖之后，咱们终于能够略微感性地对待AIGC这回事。

始终以来，在内容创作的过程中，都存在着大量的反复动作，它们繁琐、冗余、耗时极长却又实质上与创作无关。

比方，文稿校对者为了找出错别字，一次又一次地反复浏览一篇文章，读得眼睛都发酸、发胀。

再比方，画家灵感爆发，在画布上挥毫而就一幅巨作，而后花上十倍的工夫对整幅画面的每一处细节反复勾线、加暗影、卡灵通、勾线、加暗影、卡灵通……

视频制作则更是重灾区。视频拍摄的原始素材动辄长达几十、甚至几百小时，前期剪辑师不仅要用肉眼逐个观看，还要一而再再而三地对其进行反复辨认、筛选、剪辑切割，在AI呈现之前还要用耳朵一遍遍听原片内容，手动增加字幕。

这些过程既无趣，又简短，而且与真正的人类创造力简直毫无关系。创作者们的大量精力都被扩散到了这些反复环节，真正用来创作的局部少之又少。

AIGC对于内容创作者的意义，正是将他们解放出来，让创作者的精力更好地用于摸索创意极限，而反复、繁杂的工作交给AIGC，让创作者的产能不再受到制约，让优质内容可能爆炸式增长。

听起来这一天仿佛很边远，但实际上，由AI辅助生成的创意内容曾经来到了咱们身边。

去年冬奥期间，央视体育新媒体和总台技术团队联结阿里云视频云、达摩院,打造了“AI云智剪”智能视频剪辑工具。

基于阿里AI视频了解技术EMC2与阿里云弱小的流媒体解决能力，AI云智剪可能实时解析并提取赛事视频中的运动员信息、精彩动作、镜头类型、赛程信息、运动员特点等，并主动生成多种类型的集锦视频，大规模解放剪辑师压力。

去年整个冬奥期间，阿里AI云智剪共生产出39878段素材，时长超过200小时，笼罩超200场较量。

除了AI视频生成之外，通过和云计算联合，AIGC还可能从本源上颠覆电视台与演播室的工作流程，将本来宏大、简单、低廉的演播环节，全副集成在一台一般的手机上。

比方，在间断多届的全国两会期间，人民日报新媒体记者的手机里就装进了一款内容创作增效“神器”：两会“AI编辑部”挪动版。

这是基于阿里云视频云的“AI编辑部” 衍生而来的定制化智能媒体生产产品。通过“AI编辑部”，记者所拍摄的现场视频素材既能由5G网络同步回传前方，也能由记者在后方即时剪辑。从发现线索、获取素材，到拍摄制作、审核签发，以及发动直播、连麦访谈等系列动作，都能通过一部手机实时实现。

在以后的AIGC畛域，AI全自动生成的文字与图片，在不少时刻都简直能达到“以假乱真”的成果。在视频制作畛域，比照文字、图片，视频的信息量最大、非结构化数据最多，AI须要对于视频内人物、物品、场景、关系等高阶信息进行了解，加之视频制作自身对于审美、节奏、画面、BGM的极高要求……

AI全自动生成过程尽管略显漫长，但并不是那么天方夜谭的将来。

冬奥会的AI云智剪，面向特定的赛事场景，限定了素材集的范畴，套用成熟的编排模式，由AI负责素材的预处理，并按预设模版进行编排，这是AIGC的序曲，实现了视频全智能生产的第一个阶段。

AIGC的第二个阶段，AI除了负责素材的预处理，还能实现本属于视频创意环节的编排工作，从而实现智能批量混剪。

第三阶段，面向特定场景和特定要求的成品，由AI依据已有成片反向解构分镜头，负责素材的搜寻、筛选、解决、编排，并最终制作合成。

第四阶段，面向特定场景，AI负责了解场景的要求，包含素材的搜寻、筛选（以及局部素材生成）、解决、编排，并最终制作合成。

AIGC视频生成的终极阶段，由AI开掘视频制作的趣味点及创意点，并实现相应的制作。

当然，在此之前，AI视频制作仍旧面临着一个火烧眉毛的挑战——算力。

一段文字、一张图片、一段视频，解决它们所须要的算力级别呈指数型爆炸回升。

这道题，云计算成了惟一的答案。

目前，云计算和人工智能的联合正处于技术冲破和倒退的关键时期，生成式AI正在产生颠覆性冲破，阿里巴巴将全力构建本人的AI预训练大模型，并为市场上风起云涌的模型和利用提供好算力的撑持，阿里董事会主席兼首席执行官张勇在往年2月的财报会上示意。

04 结语

早在1956年，以约翰·麦卡锡、马文·明斯基、克劳德·香农等为代表的科学家们就在美国达特茅斯组织了一场为期两个月的人工智能冬季研讨会，开启了人工智能技术的摸索之路。

半个多世纪后的明天，在云计算、深度学习、万亿级参数大模型等相干技术的倒退之下，AIGC才第一次真正走进咱们的生存，它在绘画、作曲、视频等创作畛域简直完满地代替了反复人工，进而将成为革命性意义的新时代生产力工具。

3月15日凌晨，OpenAI正式上线了新一代人工智能大模型 GPT-4。与它的上一代相比，这款多模态模型不仅能够承受文本输出，甚至曾经能够承受图像等其余模态的信息输出，离真正的通用型人工智能又近了一步。

不要温和地走进这场AIGC。

当人类优渥于一种状态，总有想象力来冲破均衡。Cloud Imagine《云想之力》是阿里云联结36氪独特打造的系列报道，旨在摸索云计算大背景下暴发的利用场景和新兴技术，以设想的高维碰撞之力，窥探“云”上的有限空间。从蒸汽机到人工智能，所有生产力工具都是为了将人类从繁冗的劳动中解放出来，将工夫与精力留给创意与设想的破界。