华为开发者大会 2023(Cloud)7 月 7 日在中国东莞正式揭开帷幕,并同时在寰球 10 余个国家、中国 30 多个城市设有分会场,邀请寰球开发者共聚一堂,就 AI 浪潮之下的产业新机会和技术新实际发展交换分享。
在 7 日下午举办的大会主题演讲中,华为常务董事、华为云 CEO 张安全重磅公布盘古大模型 3.0 和昇腾 AI 云服务。其中,盘古大模型 3.0 围绕“行业重塑”“技术扎根”“凋谢同飞”三大翻新方向,继续打造外围竞争力,为行业客户、搭档及开发者提供更好的服务。昇腾 AI 云服务单集群提供 2000P Flops 算力,千卡训练 30 天长稳率达到 90%,为业界提供稳固牢靠的 AI 算力,让大模型触手可及。
张安全示意:“盘古大模型要让每个行业、每个企业、每个人都领有本人的专家助手,让工作更高效更轻松。咱们始终保持 AI for Industries 的策略,在深耕行业的路线上一直前行。我深信大模型将重塑千行百业,而每一个开发者,都将是扭转世界的英雄。”
盘古大模型 3.0:重塑千行百业
华为云盘古大模型从一开始就聚焦为行业服务,本次大会公布的盘古大模型 3.0 也是一个面向行业的大模型系列,包含“5+N+X”三层架构:
L0 层包含自然语言、视觉、多模态、预测、科学计算五个根底大模型,提供满足行业场景中的多种技能需要。盘古 3.0 为客户提供 100 亿参数、380 亿参数、710 亿参数和 1000 亿参数的系列化根底大模型,匹配客户不同场景、不同时延、不同响应速度的行业多样化需要。同时提供全新能力集,包含 NLP 大模型的常识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像了解等能力,这些技能都能够供客户和搭档企业间接调用。无论多大参数规模的大模型,盘古提供统一的能力集。
L1 层是 N 个行业大模型,华为云既能够提供应用行业公开数据训练的行业通用大模型,包含政务,金融,制作,矿山,气象等大模型;也能够基于行业客户的自有数据,在盘古大模型的 L0 和 L1 层上,为客户训练本人的专有大模型。
L2 层为客户提供了更多细化场景的模型,更加专一于政务热线、网点助手、先导药物筛选、传送带异物检测、台风门路预测等具体行业利用或特定业务场景,为客户提供“开箱即用”的模型服务。
盘古大模型采纳齐全的分层解耦设计,能够疾速适配、疾速满足行业的多变需要。客户既能够为本人的大模型加载独立的数据集,也能够独自降级根底模型,也能够独自降级能力集。在 L0 和 L1 大模型的根底上,华为云还为客户提供了大模型行业开发套件,通过对客户自有数据的二次训练,客户就能够领有本人的专属行业大模型。同时,依据客户不同的数据安全与合规诉求,盘古大模型还提供了专用云、大模型云专区、混合云多样化的部署状态。
“盘古为行业而生,就要为行业着想,更好地服务千行百业的客户”,张安全示意。现在,盘古大模型已在金融、金融、制作、医药研发、煤矿、铁路等诸多行业施展着微小价值。
在政务畛域,华为云携手深圳市福田区政务服务数据管理局,上线了基于盘古政务大模型的福田政务智慧助手小福,可能精准了解民众征询用意,改变传统的一网通办模式,把老百姓的话语转化为政府办事的语言,让城市更有爱。盘古政务大模型对超过 20 万条政务数据进行精调,包含 12345 热线、政策文件、政务百科等,把握了丰盛的法律法规、办事流程等行业常识。基于盘古政务大模型的小福,在一网通办业务中体现出行业性、专业性、当先性和惠民性。
在煤矿畛域,盘古矿山大模型曾经在全国 8 个矿井规模应用,一个大模型能够笼罩煤矿的采、掘、机、运、通、洗选等业务流程下的 1000 多个细分场景,让更多的煤矿工人可能在高空上作业,不仅能让煤矿工人的工作环境更加舒服,而且能够极大地缩小安全事故。
在铁路畛域,盘古铁路大模型能精准辨认现网运行的 67 种货车、430 多种故障,无故障图片筛除率高达 95%,成为货运列检员身边无力的数字助手,将列检员从每日数百万张的“图海”检测中解放出来。
在气象畛域,盘古气象大模型是首个精度超过传统数值预报办法的 AI 预测模型,同时预测速度也有大幅晋升。原来预测一个台风将来 10 天的门路,须要在 3000 台服务器的高性能计算机集群上破费 5 小时进行仿真。当初基于预训练的盘古气象大模型,通过 AI 推理的形式,研究者只需单台服务器上单卡配置,10 秒内就能够取得更准确的预测后果。
在金融畛域,盘古金融大模型能够对银行的各种操作、政策、案例文档进行预训练,能依据客户的问题,为柜台工作人员主动生成流程和操作领导,将原来须要均匀 5 次的操作升高为 1 次,办结工夫缩短 5 分钟以上。盘古大模型让数十万网点柜员都领有本人的智慧助手。
在制作畛域,过来单产线制订器件调配打算,往往要花费 3 个小时以上能力做齐 1 天的生产打算。盘古制作大模型学习了华为产线上各种器件数据、业务流程及规定当前,可能对业务需要进行精确的用意了解,并调用天筹 AI 求解器插件,1 分钟即可做出将来 3 天的生产打算。
在药物研发畛域,原来一款新药研发均匀须要 10 年工夫、破费 10 亿美金。盘古药物分子大模型助力西安交通大学第一从属医院刘冰传授团队发现寰球 40 年来首个新靶点、新类别的抗生素,并将先导药物研发周期缩短至 1 个月、研发老本升高 70%。
技术扎根、极致效力,打造世界 AI 另一极
大模型的翻新不仅仅是模型本身的翻新,更依赖于 AI 的各项根技术创新。华为在最底层构建了以鲲鹏和昇腾为根底的 AI 算力云平台,以及异构计算架构 CANN、全场景 AI 框架昇思 MindSpore,AI 开发生产线 ModelArts 等,为大模型开发和运行提供分布式并行减速,算子和编译优化、集群级通信优化等要害能力。基于华为的 AI 根技术,大模型训练效力能够调优到业界支流 GPU 的 1.1 倍。
算力是训练大模型的根底。在本次大会上,张安全发表单集群 2000P Flops 算力的昇腾 AI 云服务在华为云的乌兰察布和贵安 AI 算力核心同时上线。昇腾 AI 云服务除了反对华为全场景 AI 框架昇思 MindSpore 外,还反对 Pytorch、Tensorflow 等支流 AI 框架。同时,这些框架中 90% 的算子,都能够通过华为端到端的迁徙工具平滑迁徙到昇腾平台。例如,美图仅用 30 天就将 70 个模型迁徙到了昇腾,同时华为云和美图团队一起进行了 30 多个算子的优化以及流程的并行减速,AI 性能较原有计划晋升了 30%。
此外,在大模型训练过程中常常会遇到 GPU 故障,研发人员不得不常常重启训练,工夫长,代价大。昇腾 AI 云服务能够提供更长稳的 AI 算力服务,千卡训练 30 天长稳率达到 90%,断点复原时长不超过 10 分钟。
“为了帮忙寰球客户、搭档、开发者训练和应用大模型,咱们致力于为寰球客户打造世界 AI 另一极,为所有 AI 开发者提供新的抉择”,张安全示意。
深度交融,盘古大模型重构产品翻新
除了在千行百业的落地实际,华为云盘古大模型也深度融入了华为云的产品服务,重构产品翻新。
例如,在材料服务中,通过盘古大模型的文案生成和代码生成技术,可能晋升材料撰写和前端代码编写效率,将新产品上市、赋能周期大为缩短。在云客服,通过嵌入行业知识库和用意开掘能力的对话问答,实现全流程 AI 优先作答,晋升客服工作效率 30%。在 BI,通过 NL2SQL 和 AutoGraph 智能路由,实现 SQL 到可视化图表的主动举荐,通过多轮自然语言交互,让人人都能便捷地从数据中洞察业务细节。在云搜寻,通过多模态 Embedding 和 NL2API 技术,实现视频、文本、图谱等宽泛场景搜寻,借助弱小的语义了解和泛化能力,让搜寻准确率进步 15%。
同时,华为云将 CodeArts 研发工具与盘古大模型相结合,正式公布了面向开发者的智能编程助手 CodeArts Snap。该工具训练了 760 亿行精选代码、1300 万篇技术文档,具备智能生成、智能问答、智能协同三大外围性能,能够实现一句对话让代码生成、一次点击即可主动正文和生成测试用例,一条指令即可智能部署,让每个软件开发者都有本人的编程助手。
此外,为了让企业在 AI 时代构筑更强的内容创新能力,华为云通过盘古根底大模型赋能 MetaStudio 数字内容生产线,打造了盘古数字人大模型,提供模型生成和模型驱动两大服务,并曾经应用了 20 万小时音视频数据进行了预训练。基于这两大服务,开发者能够疾速生成和驱动数字人模型,赋能在线教育、娱乐直播、企业会议等行业利用,让每个企业员工实现“数字人自在”。例如,用户只需在华为云 MetaStudio 的服务页面上传 20 秒的集体视频,就能够疾速生成个性化的数字人解说视频,过来 3 个研发人员 3 天实现的工作,当初只须要 3 分钟就能够实现。
凋谢同飞,携手客户搭档共赢大模型生态
华为云致力于构建以开发者为外围的、凋谢共赢的寰球生态体系。目前,华为云寰球开发者数量已超过 460 万,云商店上架的商品已达 10000 多个。华为云提供了易用牢靠的大模型工具套件、汇聚海量多行业场景 API 的开天 aPaaS,以及蕴含丰盛优质课程和技术认证的大模型专属社区,心愿与开发者及搭档一起,独特摸索盘古大模型与行业联合的翻新门路。
大模型的倒退离不开高质量数据的继续输出。华为云联结中国公共关系协会、文化大数据产业委员会、以及多家搭档单位,独特倡导成立大模型高质量数据联盟。联盟将汇聚来自各成员单位的凋谢数据,打造笼罩千行百业的高质量数据集,促成行业大模型的蓬勃发展。
开发者是推动数字翻新的外围力量。本次大会上,主题为“创想有限”的 2023 华为开发者大赛正式启动。作为华为 ICT 畛域的顶级赛事,华为开发者大赛开设云底座和产业两大赛道,笼罩中国、亚太、欧洲、北非、拉美五大赛区,让开发者在人工智能畛域大展身手,实现创新性利用开发。