报告编委
黄勇
爱剖析合伙人 & 首席分析师
文鸿伟
爱剖析高级分析师
目录
1. 钻研范畴定义
- 市场洞察
- 厂商全景地图
- 市场剖析与厂商评估
- 入选厂商列表
1. 钻研范畴定义
钻研范畴
2021 年 3 月,十四五布局中首次提及元宇宙,指出须要增强元宇宙底层核心技术根底能力的前瞻研发,推动深入感知交互的新型终端研制和系统化的虚构内容建设,摸索行业利用。2022 年,北京、上海、浙江、广东等 31 个省市颁布了元宇宙相干的支持性政策,元宇宙热度继续攀升。
元宇宙是数字化倒退到高级阶段后,事实世界与虚拟世界的一种深度交融的产物,是虚拟世界实在化、真实世界虚拟化的交汇载体。数字孪生、数字原生与虚实共生是元宇宙的三大倒退阶段,目前,我国元宇宙倒退正处于数字孪生初期。
随着传统互联网向 Web3.0 的跃进、数字化程度的进步以及 XR、人机交互等硬科技设施的不断涌现,元宇宙的构建变得更加趋于可行。将来,元宇宙将不仅仅利用于游戏畛域,还将广泛应用于金融、教育、工业、娱乐、能源等多个行业当中。
图 1:元宇宙市场全景地图
本次报告爱剖析将元宇宙全景地图分为四局部:
其一,基础设施层。在元宇宙晚期倒退阶段,建设和倒退基础设施是重点,包含网络、存储、云计算等计算资源、区块链以及隐衷计算等去中心化技术。这些底层技术与基础设施不仅可能保障用户的稳固染指以及全域笼罩,还可能反对海量用户并行应用,稳固存储爆发式增长的数据。
其二,元宇宙引擎层。引擎是搭建元宇宙的外围,开发者通过三维图形图像引擎、3D 建模软件、数字人开发平台、AIGC 等多种工具调动图像、声音等资源,构建虚拟世界。
其三,交互入口层。该层是元宇宙的入口,XR 技术是连贯虚拟世界与事实世界的桥梁,VR 眼镜、手持设施、传感器等终端设备是产生用户交互的要害,而 XR PaaS 平台则向 XR 硬件设施企业提供平台化软件与技术服务,升高了设施企业投入与应用的门槛。
其四,应用层。元宇宙搭建实现后,不仅会吸引 C 端用户进行社交、娱乐、游戏等操作,还会广泛应用于工业、政务、通信等行业与智慧园区、数字城市、数字文旅等畛域。
爱剖析综合思考企业关注度、行业落地停顿等因素,选取其中 2 个特定市场进行重点剖析,别离是三维图形图像引擎和 AIGC。
本报告次要面向组织的产研部门和业务部门,通过对各特定市场的需要定义和代表厂商能力解读,为企业搭建与利用元宇宙提供厂商选型参考。
厂商入选规范:
本次入选报告的厂商需同时合乎以下条件:
厂商的产品服务满足各市场定义的厂商能力要求;
近一年厂商须要具备肯定数量以上的企业付费客户(参考第 4 章市场剖析局部);
近一年厂商在特定市场的营业支出达到指标要求(参考第 4 章市场剖析局部)。
(注:“近一年”指 2022 年 Q1 至 2022 年 Q4)
- 市场洞察
从内容状态的维度,元宇宙将带来更高维的信息密度和数据价值
元宇宙作为下一代互联网的典型代表,很可能将是人类数字化生存的终极状态。从内容状态的维度看,人类社会的信息传递与交互,经验了从文字、图片到视频的倒退历程,次要围绕二维信息开展。而元宇宙的诞生和利用,将人类进行信息传递和交互的维度彻底带入三维空间。这种升维,不仅带来的是全沉迷式交互体验的晋升,更多的是在单位工夫及空间内融合了事实世界和数字原生世界的信息,因而,极大晋升了信息密度。
以元宇宙营销场景为例,元宇宙不仅能够捕捉到用户的停留时长等传统根本信息,还能对用户关注的信息提供更细颗粒度更精准的刻画。以汽车行业为例,在元宇宙场景下,企业可能采集到客户试看汽车时的三维动线,以及停留时长最多的座舱大屏、座椅皮质、空调出风口地位设置,甚至察看的先后顺序等这些传统线下门店、传统互联网很难捕捉到的数据,进而反向撑持产品优化与研发、营销转化。
图 2:元宇宙对甲方企业(to C 为例)的价值示意
元宇宙将放弃稳步发展,产业奇点尚未到来
元宇宙,实质上是数字化倒退到高级阶段后,事实世界与虚拟世界的一种深度交融的产物,技术支撑体系十分庞杂,须要 5G/6G、人工智能、云计算、区块链、物联网、三维建模与渲染等技术的深度交融,甚至还须要全息显示、脑机接口等技术做撑持。
从木桶效应角度来看,因为各条技术线倒退的成熟度存在差别,因而,从供应侧来看,元宇宙作为技术“集大成”的利用状态,其倒退势必须要一个绝对长期的过程。同时,从需要侧来看,任何一个技术的暴发,离不开需要侧的利用价值切实落地并以此驱动供应侧,造成良性循环已推动产业衰弱可继续倒退。目前来看,元宇宙次要集中在游戏、工业园宇宙、虚拟化流动、数字文旅等无限场景,需要端推动力仍绝对较弱。
与此同时,上海、北京、重庆、杭州、无锡市等地政府已纷纷出台元宇宙专项政策,大力支持元宇宙的倒退落地。
值得一提的是,目前由 ChatGPT 引爆的 AIGC,尽管从资本、社会关注度角度给元宇宙带来了肯定的短期冲击,但 AIGC 作为元宇宙引擎层的一项重要工具,可极大促成元宇宙高质量内容的生成,长期来看,反而将继续甚至减速推动元宇宙的倒退过程。元宇宙产业的整体利用价值还须要通过供应侧的“技术 - 产品 - 场景”大循环首先进行冲破,而后带动需要,进而质变引起量变,实现元宇宙利用价值的加深拓宽。
数字人作为元宇宙的入口级利用,须要进一步冲破场景
数字人既能够连贯 C 端,又能够赋能 B 端,是元宇宙中的入口级利用。但目前国内数字人行业倒退尚处于晚期,尤其是高价值、可规模化的利用场景稀缺,是企业用户和数字人厂商都面临的问题。
依据爱剖析调研,目前,数字人的利用场景次要集中在直播播报、游戏主播、品牌宣传、政务服务、客户服务等场景,整体场景还绝对较窄,智能交互体验还有待进一步晋升,还没有齐全脱离“数字”工具属性,走向助手、搭档等“人”的属性,用户粘性还不短缺,制约了场景的宽泛、深度利用和价值开释。
另一方面,在特定利用场景下,数字人从前端的 IP 打造、角色创作、智能交互到后端的经营等,目前的老本还十分昂扬,还未达到让大多数人、机构规模化利用的程度,须要在数字人的生产侧、经营侧寻求老本的实质性冲破,才无望让数字人“飞入寻常百姓家”。
轻量元宇宙可能成为突破口
一方面,联合以后的倒退状况以及利用难度来看,咱们认为国内元宇宙的倒退门路,将整体呈现出由泛娱乐(C:游戏社交娱乐等)向产业利用(B:金融、工业、医疗、教育、文旅、营销等)减速浸透的互联网经典倒退门路。
另一方面,因为元宇宙技术体系宏大,落地利用简单,整体开发和部署属于“重度”级别,但过程绝对迟缓。因而,借助手机等现有终端进行随时随地接入的轻量元宇宙,将无望可能通过撬动需要端,汇集充沛的流量,根本解决用户起源问题,反向拉动生产端,进而促成整体生态的逐渐正向循环。
- 厂商全景地图
爱剖析基于对甲方企业和典型厂商的调研以及桌面钻研,遴选出元宇宙市场中在三维图形图像引擎、AIGC、3D 建模软件、虚拟化流动、工业元宇宙方面具备成熟解决方案和落地能力的入选厂商。其余市场,爱剖析将在后续的元宇宙系列报告中视状况予以笼罩。
- 市场剖析与厂商评估
爱剖析对本次元宇宙我的项目重点钻研的特定市场剖析如下。
三维图形图像引擎
市场定义:
三维图形图像引擎,指面向组织疾速进行 3D 数字内容生成与渲染的需要,将图形、图像、交互等畛域的简单常识算法化后进行封装,向组织产研部门、业务部门提供建模、交互、可视化等要害能力的平台化软件,便于组织晋升数字内容生产效率,升高 3D 数字内容创作的技术门槛、制作周期和制作老本。
甲方终端用户:
传媒、教育、医疗、互联网、游戏、汽车制作、建筑工程等行业组织的产研、业务部门
甲方外围需要:
随着 XR、元宇宙、数字孪生、虚构仿真、NFT 等市场的一直遍及,将来社会对 3D 数字内容在品质和数量层面的需要,都越来越高。三维图形图像引擎是是实现元宇宙场景利用的最底层根技术,被称为“软芯片”,从虚构 / 加强事实、数字孪生、工业软件等热门技术及利用来看,均统一指向实时三维图形图像技术,凸显出三维图形图像引擎的重要性。作为业余软件,产品的性能、易用性、兼容性都非常要害。在以后的国际竞争大背景之下,技术的自主可控也异样重要。具体如下:
在产品性能方面,企业须要引擎具备高成熟度、杰出的利用能力,可能满足物理世界和数字世界深度交融的需要,赋能元宇宙等更多凋谢场域的内容生产,实现所见即所得的实时广播级渲染与可视化交互。一方面,三维图形图像引擎是进行数字内容创作的外围工具之一,须要面向各行业,笼罩 3D 建模、实时渲染、交互设计、可视化等全流程,因而必须通过长时间、大范畴的验证和算法优化,造成成熟产品,无效撑持泛行业 3D 数字内容创作和产业数字化;另一方面,虚实交融是大势所趋,传统繁多的图形引擎很难撑持,面向未来的下一代三维图形图像引擎必须具备图形技术 + 图像技术的综合能力、具备超大规模实时渲染能力,确保所见及所得,并反对可视化交互,晋升数字内容制作效率。
在易用性方面,企业须要绝对低门槛的引擎,让业余和非专业团队均能不便、随需、疾速建模和批改,晋升整体创作效率。随着数字孪生、元宇宙等巨量、有限场景的继续、疾速到来,三维图形图像的生成将有更多的利用场景,内容及创意也须要随时继续疾速调整,传统通过代码编写构建数字内容的形式,因为业余门槛高,仅适宜极少数业余开发者,但整体团队规模反而更加宏大,开发 - 测试 - 调优周期长,二次批改难,且次要集中在游戏、影视、广告特效、汽车制作、建筑工程等有边界、交付型的我的项目。数字媒体、数字孪生、元宇宙等凋谢场域的内容的创作主体不再局限于业余开发者,同时,创意还将一直调整、内容需继续更新,因而企业须要更加灵便、易用、保护老本更低的 3D 引擎,赋能非专业开发者,使得数字内容大规模、疾速生产、疾速分享成为可能。
在兼容性方面,企业须要三维图形图像引擎可能与各类 2D、3D 业余设计工具高效协同,在确保成果的前提下,谋求数字内容创作的最高效率。数字内容大多数状况下是多模态的,可能包含图片、音频、视频等多种内容格局;很多内容创作者放弃着应用 3ds MAX、CAD 等传统经典设计工具的工作习惯且一时难以扭转,因而,为确保协同创作效率,企业须要三维图形图像引擎可能与国内外支流设计软件晦涩对接。
在技术的自主可控方面,企业须要三维图形图像引擎服务商具备齐全自主可控的技术能力,确保不会因为国际形势渐变而面临的封停、断供危险。三维图形图像引擎是包含元宇宙在内的下一代互联网的核心技术设施之一,因为其至关重要,加之进入壁垒、开发周期、资金要求都很高,且底层算法引擎技术需长时间积攒和验证,长期以来始终被国外企业所垄断,很多国内厂商也是基于国外的引擎底层技术开发本身的下层引擎,随着国际形势的日趋简单,技术断供危险加剧,若作为技术底座的引擎被制裁、封停、断供,处于下层的商业工具将无奈应用或降级,如果不能实现国产化,将对我国数字内容产业的倒退和平安造成重大制约,随时面临“卡脖子”危险。
厂商能力要求
厂商需同时具备以下能力,以帮忙甲方便捷、高效、平安地进行数字内容生产:
厂商须要有经各行业客户实际验证、具备高成熟度的产品,在渲染、跟踪等方面,具备国内程度。一方面,厂商的引擎产品须要通过大量客户的测验,并基于客户反馈、行业教训、算法积攒等进行迭代优化,确保产品具备高可靠性,笼罩数字内容生产全流程;另一方面,为适应以元宇宙为代表的事实世界数字化向虚实交融的混合世界拓展升维的大趋势,厂商的引擎产品须要同时具备图形、图像综合能力。
在易用性方面,厂商须要将外围能力工具化、组件化,便于业务人员、设计人员间接上手,方便快捷地实现开发与交付。厂商须要升高本身引擎产品的利用门槛,将底层引擎能力共享给开发者,为客户提供集成了底层能力的短缺、高效的各类组件,甚至提供低代码、无代码编程能力,让客户方可能通过简略培训,即可纯熟操作,进而为创意的继续调整提供无力保障,升高客户的数字内容创作全周期老本。
在兼容性方面,厂商的引擎产品须要兼容常见内容格局和支流设计软件,无效保障客户的整体创作效率。数字内容生产是一个绝对简单的过程和作业体系,厂商的引擎产品须要可能辨认和交融、解决文本、音视频等物理世界全因素数据,同时还须要兼容支流设计软件设计模型、BIM 模型、工业模型等相干文件格式,实现无缝对接,晋升整体创作效率。
在自主可控方面,厂商须要实现从底层技术到图像工具、文件格式、利用规范的自主可控。三维图形图像引擎厂商,须要着眼久远,保持建模、渲染、交互、可视化等核心技术自研,从底层技术、利用工具、文件格式方面实现全链条的自主可控,甚至随着技术、利用能力的继续疾速晋升,未来主导利用规范的制订。
入选规范阐明:
- 合乎三维图形图像引擎市场定义的厂商能力要求;
- 近一年在三维图形图像引擎平台市场中付费客户数 10 家以上;
- 近一年该市场相干营业支出规模在 500 万元以上。
代表厂商评估:
(注:以下代表厂商评估均按厂商简称首字音序排序)
艾迪普
厂商介绍:
艾迪普科技股份有限公司(以下简称“艾迪普”),次要从事计算机图形图像实时渲染、跟踪、辨认、解决外围算法技术的研发,专一为客户提供广电级、专业级、生产级的数字媒体、AR/VR、数字孪生等无边界内容生产平台与工具。
产品服务介绍:
艾迪普专一实时三维图形图像引擎技术研发与利用,面向传媒、教育、医疗、工业等泛滥行业,为客户提供元宇宙、虚构 / 加强事实、虚构仿真、数字孪生等产业翻新利用的数字内容生产及三维信息可视化的平台与工具组件、解决方案。具体来看,艾迪普可为客户提供实时三维图形图像引擎、数字内容生产的全链路工具集、数字图形资产云平台等“全栈式”服务,以“引擎驱动、工具赋能、资产催化”,服务千行百业数字化转型与降本增效。
厂商评估:
综合而言,艾迪普在技术自主可控、引擎能力、易用性、兼容性等四方面具备显著劣势,具体如下:
在自主可控方面,艾迪普在计算机图形图像畛域有多年技术积淀与锻炼,打造了具备齐全自主知识产权的 IDP Engine 实时三维图形图像引擎。
一方面,艾迪普自 2003 年创建即专一图形图像畛域,于 2008 年组建团队,专一国产自主“实时三维图形图像引擎”自研,领有 20 年技术积淀,历经十余年锻炼打磨和上亿资金研发投入,打造了领有 100% 齐全自主知识产权的 IDP Engine 实时三维图形图像引擎,填补了国内在该技术畛域空白,核心技术获国内专利,防止了国内数字内容生产底层技术的断供危险。
另一方面,经十多年积淀及算法积攒,艾迪普已造成专属自有格局 MSD,可无效避免文件所蕴含的全链路信息的泄露及平安危险,从源头保障内容平安。
在引擎能力方面,艾迪普三维图形图像引擎具备图形 + 图像引擎双能力,在图形图像实时渲染、跟踪、辨认、解决等方面技术指标,已达到国内一流程度。
首先,艾迪普实时三维图形图像引擎不仅领有图形图像双能力,无效克服了繁多引擎无奈实现物理世界同数字世界深度交融的弊病;同时,艾迪普实时三维图形图像引擎还具备行业稀缺的内部数据实时处理能力,可能实现物理世界与虚拟世界之间的映射、重构、交互交融,进行剖析、模仿、推演,可对物理世界更好的感知、试错、预测、升高危险、优化与反控,实现“数”与“实”深度交融。
其次,艾迪一般过国家级 + 省级我的项目及超万家重点客户洽购利用与性能迭代,联合本身多年算法模组与行业 Know-How 积淀和能力打磨,产品成熟度高,造成了实时渲染、跟踪、辨认、解决等四大子引擎,可实现所见即所得的广播级高品质实时渲染、3D 内容的实时可视化交互,克服了传统游戏引擎在游戏、影视动漫、汽车制作等“有边界我的项目”内容生产中存在的定制化工程量大、架构灵活性有余等导致的行业扩大利用“断代性”问题,可无力撑持元宇宙为代表的“无边界”内容创意的继续调整,更适宜泛行业 3D 数字内容创作和产业数字化的疾速落地。
最初,艾迪普实时三维图形图像引擎可将图片、视频、3D 模型等多模态数字内容进行实时联动与交融解决,是输入超高分辨率各种通用和专用格局的三维图形图像算法零碎,提供高沉迷感、高拟真度、大规模实时交互的超级数字场景自主可控的底层能力。
在易用性方面,艾迪普具备杰出的引擎封装及商用能力,极大升高数字内容创作门槛,有助于大幅晋升创作效率。
艾迪普将引擎外围能力进行封装,提供 3D 建模、实时渲染、编辑合成、交互设计到可视化的全链路工具集,针对不同行业畛域、利用场景,已抽取出 2000+ 算法模组,客户可通过 SDK 或 API 疾速集成和间接调用艾迪普引擎层核心技术能力。
同时,通过当先的无代码编程能力,艾迪普提供节点编辑性能,让客户“搭积木”式实现逻辑运算、触控操作、动画触发、与外围设备交互等成果,简洁高效地“拼”出专业级水准的数字内容利用。
此外,艾迪普各工具中均内置 CG SaaS 一站式数字资产服务平台,超万名创客入驻,提供 10W+ 近 400 类商用版权素材且每日更新,便于客户随用随取,大幅晋升创作效率。
图 3:艾迪普数字内容生产线示意
在兼容性方面,艾迪普宽泛兼容多种模态内容及支流设计软件源档文件,并有杰出的自适应能力。
艾迪普实时三维图形图像引擎反对多种图片、音频、视频,兼容支流 2D、3D 设计软件源档文件,可保障客户安稳进行国产化代替,并通过产品间的无缝协同,实现最优产出效率。目前其工具集曾经买通 Adobe PS/PR/AE、Autodesk 3ds Max/ Maya、BIM、NVIDIA Omniverse 等各类设计软件平台。
此外,艾迪普实时三维图形图像引擎还反对 DirectX11、DirectX12、OpenGL、Vulkan 等多种渲染引擎插件,并可主动依据操作系统抉择不同引擎达到最大性能。
典型客户:
地方广播电视总台、光明网、中国传媒大学、用友网络、嘉实基金
AIGC
市场定义:
AIGC,指利用自然语言解决技术(NLP)、深度神经网络技术(DNN)等人工智能技术,基于与人类交互所确定的主题,由 AI 算法模型齐全自主、主动生成内容,从而帮忙传媒、电商、影视、娱乐等行业进行文本、图像、音视频、代码、策略等多模态内容的繁多或跨模态生成,以晋升内容生产效率与多样性。
甲方终端用户:
金融、传媒、元宇宙等行业组织的产研与业务部门、政府部门
甲方外围需要:
AIGC 最外围的能力,就是内容生成。经过训练的 AI 算法模型,可能超过人类创意、效率,绝对高质量地规模化生成海量数字化内容。一方面,AIGC 可升高海量数字内容的生成老本,将人类从简略且反复、基础性工作中解放出来,聚焦更具创造性的方面;一方面,在人类进行内容创作的过程中,AIGC 可能疾速生成大量相干内容,帮忙人类裁减、寻找创作灵感,或者基于所提供的信息,夯实创作根底。
比方,在传媒畛域,局部新闻内容的主动抓取与生成、题目或摘要的自动化生成;在营销畛域更具智能的客服机器人,可能更温和、人性化的答复客户常见问题甚至跳跃性问题及非常规问题;在元宇宙畛域,可基于智能算法和常识图谱,让数字人更加智能的与人类进行交互。
作为人工智能利用的重大突破,AIGC 正在扭转甚至颠覆数字内容的生产与生产形式,在 Web 3 的大背景下,无望成为继 PGC、UGC 之后的次要内容创作起源。但国内的 AIGC 整体上还处于绝对晚期的阶段,不同细分畛域的技术及利用落地进度不尽相同。如何基于预训练大模型造成面向不同行业的、可落地的产品及解决方案,是以后 AIGC 畛域倒退的要害。具体如下:
在大模型能力方面,企业须要通过调优的垂直化行业大模型,以很好地撑持下层垂直化利用。GPT-3、BERT、Florence、DALL·E 2 等通用预训练大模型尽管领有巨量参数,并领有良好的泛化能力,但在面对不同行业、畛域的具体利用场景时,因为不足具体行业的行业语料集,并且未面向特定行业的利用场景对模型做进一步调优,因而,其模型对特定行业利用场景的性能指标很可能并不现实。因而,通过行业化调优和行业语料训练的大模型,能力更好的撑持甲方的具体下层利用。
在落地利用方面,企业须要端到端的 AI 落地应用服务,确保大模型可能在具体业务场景下,可产生合乎预期的理论利用价值,进步组织在特定场景中的生产效力。一方面,AI 六十余年的倒退历程曾经证实,从模型到高质量的生产与实际,AI 工程化能力十分重要。但大多数企业往往并不具备从需要的原点登程,到模型的设计、数据标注与模型训练、模型部署及迭代优化的 AI 闭环落地能力,无奈确保大模型真正贴合本身利用场景,实现价值落地;另一方面,很多企业同样也不具备基于大模型进行下层利用开发的能力,预训练大模型虽曾经过设计和训练,但因为还须要行业化的二次优化与训练,并且须要联合利用场景进行理论业务利用开发,因而仍旧对企业的 AI 闭环能力提出了肯定要求。
除此之外,甲方还有以下冀望需要:
在底层能力方面,企业须要生成算法、预训练大模型的迭代更新,以提供更优的底层算法撑持。预训练模型是人工智能科技巨头在 GAN、Transformer、Diffusion、CLIP 等根底生成算法的根底上,进行交融、扩大、训练而来的,新一代的根底生成算法在模型架构、精准度方面往往体现更优,例如 Diffusion 代替 GAN 成为图像生成畛域的支流算法。预训练模型的迭代与冲破,在参数量、算力要求、模型成果方面可能会获得更优的综合效力,例如 Open AI GPT 模型 1.0-3.5 的继续迭代,抑或是 LLaMA 以更小体量获得了可能比 GPT3 更好的模型体现。根底生成算法、预训练大模型的迭代,尽管可能会引发算法成果的量变,但因为须要宏大的人才队伍、巨量资金反对以及长时间积攒,往往是只有国内外科技巨头可能笼罩。
厂商能力要求
厂商需同时具备以下能力,以帮忙各行业组织实现具体场景的利用落地:
厂商具备基于开源预训练模型,联合行业语料及 NLP 等技术针对性优化出具备优良可控性的特定畛域大模型的能力。一方面,厂商须要能利用行业 know how,联合本身在 AI 畛域的技术积攒,微调通用预训练大模型。另一方面,可能充沛利用自身在特定行业的数据和语料积攒,在微调后的大模型根底上,联合行业化、场景化数据进行进一步训练,以晋升大模型针对特定行业及利用场景的模型体现,生成合乎肯定要求和规范的内容,训练出真正适宜特定行业及利用场景的业余大模型。
厂商须要具备杰出的 AI 工程化能力及行业服务教训,可能 AI 落地全链路服务,灵便适配用户需要。厂商须要丰盛的行业教训,可能进行场景形象和数据筹备,在此基础上进行算法设计、模型训练、模型评估与调优、模型部署的全链路能力,并且须要在模型部署上线后,依据行业利用场景的实际,一直进行模型优化,确保模型后果可控,从而让 AI 大模型的“生成能力”一直靠近利用要求,产生真正的业务价值。
针对甲方的冀望需要,厂商还应具备以下可选能力:
厂商须要有根底生成算法、预训练大模型的迭代和冲破能力,可能为中层的大模型行业化、下层的行业利用提供撑持。厂商须要在本身的技术积攒的根底上,对现有 Transformer、CLIP 等根底生成算法、GPT、BERT、Florence、DALL·E 2 等各模态预训练大模型进行深刻拆解与思考,提出新的改良思路和方向并进行验证、训练,或者更适宜某种语言类型的大模型,以便在模型成果上进行继续冲破,进而给行业模型、下层利用提供更多更好的抉择,帮忙改良模型的利用价值与成果。
入选规范阐明:
- 合乎 AIGC 市场定义的厂商能力要求;
- 近一年在 AIGC 市场中付费客户数 5 家以上;
- 近一年该市场相干营业支出规模在 100 万元以上。
代表厂商评估:
(注:以下代表厂商评估均按厂商简称首字音序排序)
拓尔思
厂商介绍:
拓尔思信息技术股份有限公司(以下简称“拓尔思”),以人工智能和大数据技术助力政府和企业的数字化转型为愿景,致力于成为语义智能技术领导者,自主研发相干人工智能和大数据技术,外围业务涵盖大数据、人工智能、内容治理、网络安全和数字营销等畛域。
产品服务介绍:
拓尔思目前以语义智能为倒退主线,以平台和行业利用产品、云和数据服务相结合的产品 + 服务策略,实现公司核心技术在泛滥垂直行业的利用落地,赋能中高端企业级客户的数字化和智慧化转型。在元宇宙畛域,拓尔思以服务型数字人为突破口,通过 NLP 等技术,造成各行业场景的专业知识图谱,助力服务型数字人联合常识图谱与大数据进行内容的主动剖析、智能创作、虚构播报,赋能客户数字人的智能问答、内容播报两大要害场景,为金融、传媒、政府、营销等行业客户的数字人提供“智慧大脑”。
厂商评估:
综合而言,拓尔思在通用大模型调优、行业数据库积攒、利用落地能力等三方面具备较为突出的劣势,具体如下:
在通用大模型调优方面,拓尔思具备丰盛且当先的深度学习、NLP 技术积攒,具备杰出的大模型“垂直化”调优能力,可赋能数字人智能问答与虚构播报等典型元宇宙利用场景。
拓尔思长期聚焦常识图谱、自然语言解决(NLP)等语义智能核心技术,将通用预训练大模型与传统 NLP 技术相结合,利用行业 Know-How,依据不同场景,通过对通用大模型进行调整和优化(Fine-tuning)来适配不同指标,取得不同行业客户偏重的准确率、召回率、综合 F1 值等指标,造成行业化的“业余大模型”,进一步优化后果可控性,更好地服务于用户的具体场景和需要。
例如,在元宇宙畛域,拓尔思保持为交互入口层的数字人提供“智慧大脑”的根本定位,基于语音语义辨认、自图谱构建到经营的全链路常识图谱能力及丰盛行业教训,让数字人具备常识储备、语义了解、推理剖析、自主决策和交互表白的智能驱动能力,赋能智能问答、内容播报两大方向,在各具体畛域表演具备专业知识的多种角色,服务各行各业——在金融畛域可负责智能客服,也可实现合同智能审批等工作;在政务畛域,可进行智能政务问答、知识产权智能审核等;在传媒畛域,可进行主动写作或智能写稿并进行内容播报等;在营销畛域,可进行直播带货等。
在行业数据库方面,拓尔思具备媒体、金融、政务等多行业服务教训及丰盛行业语料,可针对各行业训练出具备行业常识壁垒的高质量大模型。
一方面,拓尔思专一于劣势行业业余大模型的研发,在调优后的业余大模型根底上,依靠近 30 年服务媒体、金融、政府等行业一万余家用户所造成的丰盛畛域常识数据,进一步训练出具备行业常识壁垒的行业大模型,大幅晋升通用预训练大模型对行业利用的适配性。
另一方面,拓尔思积攒了丰盛的各场景行业术语及 2000 余台服务器数据造成的各行业常识图谱,造成了显著的训练语料等数据劣势,在利用场景下可优先起跑,通过反馈 + 强化学习,减速飞轮效应,继续晋升业余大模型的“可控性”与“安全性”。
在利用落地方面,拓尔思具备自模型设计、训练、优化、部署等在内的一站式 AI 工程化能力,提供端到端的 AI 利用落地服务。
一方面,拓尔思具备智能数据标注、模型设计、训练、优化、评估、部署等一站式 AI 工程化落地服务能力,有助于业余大模型贴合用户场景进行疾速落地,产生业务价值。
另一方面,拓尔思秉承“开源 + 自研模型”的基本思路打造“智创”AIGC 平台,通过 API 接口或解决方案模式,更好撑持下层利用,将优先关注元宇宙、传媒、金融畛域、政务服务、通用行业和云服务等细分市场。其中,在 AIGC“文本生成”畛域,拓尔思实现自卑模型到下层利用的一体化买通;在视觉、多模态畛域,拓尔思将依靠开源平台进行研发,并重前端利用。拓尔思在 AIGC 畛域已相继打造出一批实际案例。
例如,在文本生成畛域,为经济日报、浙江日报、重庆日报等近 20 家新闻媒体单位提供机器写稿服务,为冶金工业信息规范研究院、南方电网、新华网、教育出版社等提供研报主动生成服务;此外,拓尔思还将与某权威新闻机构单干,将该机构的新闻数据库和历史材料录入大模型做预训练,基于高针对性交互,造成权威且高效的内容输入,造成供该机构外部应用的知识型搜索引擎,供该单位的内容创作者进行再创作时做参考,实现辅助创作。
图 4:拓尔思智创 AIGC 平台架构示意
- 入选厂商列表