共计 3242 个字符,预计需要花费 9 分钟才能阅读完成。
本文中,咱们将聚焦 ToB 畛域,关上 AIGC 在 C 端社交泛娱乐之外的另一个切面,摸索 B 端叙事的新变动。关注【融云 RongCloud】,理解协同办公平台更多干货。
过来两年,对于互联网大厂最多的音讯当属裁员和关停非短期商业化我的项目了,但最近的舆论主基调则是“大模型战事”。
大模型,能够说是所有大厂都无奈舍弃的互联网最初一个真命题,也是资本市场在新能源车之外为数不多的高回报机会。
这造成的间接后果是,厂商“不惜成本、加大投入”,从大模型参数“卷”到人才储备、研发投入及生态建设。最新一集的剧情则是,11 家大模型通过了《生成式人工智能服务治理暂行办法》备案。
依据媒体统计,他们是:
北京 5 家:百度(文心一言)、抖音(云雀)、百川智能(百川大模型)、智谱(智谱清言)、中科院(紫东太初);
上海 3 家:商汤(日日新大模型)、上海人工智能实验室(书生大模型)、Minimax(ABAB 大模型);
广东 2 家:腾讯(混元大模型)、华为(盘古大模型);
安徽 1 家:科大讯飞(星火大模型)。
备案意味着产品能够间接面向社会公众提供服务了,也意味着此前被克制的产品扩散桎梏解除,必将促使更多厂商调整步调和放慢步调。
比赛还没有完结,而是关上了一个高难度正本。
大模型的终极猜测
科技部《中国人工智能大模型地图钻研报告》显示,截至 2023 年 5 月底,国内 10 亿级参数规模以上根底大模型至多已公布 79 个。
而依据赛迪参谋的统计,截至 7 月底,国产大模型累计公布数量达到了 130 个。假如两个统计口径相差不大,那大模型显著进入了减速通道。要晓得,过来两年里,国内全年推出的大模型数量也不过 30 款左右。
那么问题来了,这么多大模型,到底能做什么用?除了吟诗作画说俏皮话,还有什么呢?
2021 年,斯坦福大学多位学者联结撰写的论文将通过大规模数据预训练的模型定义为根底模型,它们能够通过自然语言提醒(prompts)适配到特定工作上,在大多数工作上获得了不错的成果。
如下图示,根底模型能够集中各种模态数据,而后适配各类上游工作。
图源:On the Opportunities and Risks of Foundation Models
这也就是目前咱们常说的通用大模型,个别反对文字和语音输入,能够生成文字、图片等 AIGC 内容。具体到 B 端,它们能够利用在 营销、办公、编程、制订打算、客服 等方面,辅助用户输入 邮件、纲要、代码、布局 等。
依据市场钻研公司 SparkToro 与数据管理公司 Datos 的调研:ChatGPT 用户应用最多的场景是 编程 (占所有问答的 29.14%), 教育 是第二大应用场景,内容创作 是第三大应用场景。
图源:Datos & SparkToro
然而,对于通用大模型,是不是笼罩场景越广越好?训练参数越大越好?随着行业的倒退,人们的一些认知开始扭转。
比方,大模型预训练数据量的比拼并不一定是好用与否的评判准则,暴力美学带来的涌现能力肯定以惊人的老本为根底,但并不一定以更高的效率为后果。
所以,相比大模型,中模型、小模型或者才是更好的抉择。
小冰 CEO 李笛在媒体采访中做了一个简略划分:小模型参数量在 130 亿以下;中模型须要小几百亿参数;大模型则至多 650 亿参数。
他同时示意,在通用、泛化能力达到 ROI 均衡的状况下,模型越小越好。“一个 130 亿以下的模型,能够跑在 A100 单卡上,不必做分布式,不会呈现大量问题。”老本更优的状况下,中模型、小模型能够提供人类能承受的响应提早,这更合乎经济学。
场景方面也是这样——实用任何场景是有价值的,也是有代价的。通用大模型可能会不足行业深度,无奈保证数据隐衷和平安。
GPT 等通用大模型极具颠覆性,但也有着不低的应用门槛。想要生成高质量内容,把握办法进步提醒词的精准度对用户来说是必须付出的学习老本。这就给有场景积淀的行业模型提供了机会,开发者能够在通用模型根底上进行微调,以适配更具体的场景。
营销内容创作工具 Jasper 就抓住这一需要,成为了一时风头无两的明星独角兽。其创始人是营销服务出身,把握大量业余数据,并且曾经建设了巩固的用户社群。Jasper 因而得以在用户反馈中疾速迭代,通过各类实用模板升高了应用门槛,做出了产品差异化。
图源:Jasper
当初比拟成熟的解决方案是,在通用大模型底座之上开发行业大模型。
互联网大厂每年研发投入资金高达百亿元,在大模型赛道上是当之无愧的“第一梯队”玩家。此外,商汤科技、科大讯飞、同花顺、孩子王等 AI 及行业公司也发力这个赛道。而他们的劣势,就是在细分畛域的积攒。
依据钛媒体的梳理,在商务写作方面,科大讯飞的星⽕大模型问题更优异。
图源:钛媒体
当然,评测或多或少有点应试教育的滋味,打分和刷榜也不是大模型比拼的外围,只能提供无限的决策参考。
何况,在理论应用中,各行业的需要并不相同。一些对 AI 能力要求不高的企业,能够间接调用行业甚至通用大模型的能力;而要求特地简单的企业,须要专属大模型。
比方,麦肯锡的“Lilli”让员工能够更轻松地拜访他们多年积攒下来的宏大知识库。其底层来自麦肯锡合作伙伴 Cohere 公司开发的大语言模型,利用麦肯锡的 10 万份外部文档和访谈记录训练而成。
领有专属知识库和语料库的企业都能够打造属于本人的专属大模型,而相应地,每个人都领有一个定制化集体大模型也是顺其自然的将来畅想。
这样,大模型的形成至多包含 通用大模型 、 行业大模型 及面向 B 端的 企业大模型 和面向 C 端的 集体大模型。
不过,无论是哪种大模型,事不宜迟都是找到符合的场景和商业化客户。
大模型的 B 端业务浸透门路
咱们在文章 AIGC,你看我还有机会吗?中对 AIGC 各层级的商业机会和倒退逻辑进行了分享,援用了投资机构 a16z 对 AI 产业的划分:底层是算力基础设施,中间层是根底大模型,下层则是 AI 利用。
图源:a16z
国内互联网大厂向来喜爱既做“裁判”又当“运动员”,希图击穿底层算力、中层模型和下层利用,做“全栈”选手。
然而,如何将大模型的能力与行业场景无效联合永远是一道难题。
到达实际场景的门路,绝不是一条直线。
行业大模型的根底是场景化、企业专属大模型的根底是定制化,这与企业的数字化转型一样,要在通用能力根底上具备行业积攒和企业实际。
对千行百业都具备粗浅的认知很难,领有研发和微调能力的大模型厂商 须要在提供通用模型的根底上,与 把握上游垂直、细分场景的行业生态 协同共创,一起建设行业和企业大模型。
这样看,大模型进入 B 端业务,与 融云作为平安、可信的数智化技术服务商 的门路一样。
早在 2018 年,融云便以通信中台能力与搭档合作赋能政企协同工作场景,次要交付形式是作为通信模块被集成于办公等各种零碎中。
这种宽泛集成能力须要背靠弱小的产品服务能力。依据艾瑞征询《2023 年寰球互联网通信云行业钻研报告》,融云 IM 间断多年稳居行业占有率第一。
图源:《2023 年寰球互联网通信云行业钻研报告》
融云通信服务被市场公认的劣势之一便是“SDK / API 接口丰盛且灵便”,领有欠缺的 IM 产品矩阵和弱小的音讯散发机制,不便二次开发集成。
与此同时,基于具体的业务场景,融云作为 PaaS 服务商,可提供组件化、模块化服务,具备灵便的下层诠释能力,与合作伙伴一起深刻客户业务,一起寻求解决方案。
就是在这个过程中,融云以办公产品中的通信能力为触角,摸索和积淀了政企办公在不同场景的业务能力。
在此基础上,融云基于亿级通信技术打造了数智办公平台,为 政府及企事业单位、公安军工、金融保险、交通、能源 等行业客户提供 高并发、高可用,组件灵便,平安可信 的数智办公解决方案。
图源:2023 中国数字经济翻新倒退大会
深刻场景、了解业务,能力更好地服务 B 端客户。大模型最终落地场景,还是须要走入更垂直、更凋谢的业务交互中。
从这个层面上来看,中国走过多年的数字化产业降级路线,能够为大模型赛道提供肯定的借鉴意义。
AIGC 常看常新,咱们也在学习中整顿了一些颇有助益的行业报告、论文。感兴趣的敌人,敬请移步 融云寰球互联网通信云 微信公众号,在对话框里发送“AIGC”即可取得这些材料。