乐趣区

关于人工智能:2600亿全球最大中文单体模型鹏城百度文心发布

作为以后人工智能倒退的重要方向,预训练大模型已成为 AI 畛域的技术新高地。

12 月 8 日,鹏城实验室与百度联结召开发布会,正式公布单方独特研发的寰球首个常识加强千亿大模型——鹏城 - 百度·文心(模型版本号:ERNIE 3.0 Titan)。该模型参数规模达到 2600 亿,是目前寰球最大中文单体模型,在 60 多项工作上获得最好成果。同时,百度产业级常识加强大模型“文心”全景图首次亮相,从技术自主翻新和减速产业利用两方面,推动中国 AI 倒退更进一步。

现场,中国工程院院士、鹏城实验室主任高文,百度首席技术官、深度学习技术及利用国家工程实验室主任王海峰独特启动公布典礼。

中国工程院院士、鹏城实验室主任高文(左)百度首席技术官王海峰(右)联结公布鹏城 - 百度·文心

高文院士在致辞中示意,“预训练模型对整个迷信的倒退、社会的倒退、翻新的倒退都是十分重要的工具。使用这个工具,能够帮忙做很多人工智能的赋能,不局限于某个畛域,这对人工智能的倒退都是一个福音。”

王海峰介绍,百度常识加强大模型从大规模常识和海量数据中交融学习,效率更高、成果更好、具备良好的可解释性。从 2019 年 3 月公布文心 ERNIE 1.0,到最新的产业级常识加强大模型文心全景图,既蕴含根底通用的大模型,也蕴含面向重点畛域、重点工作的大模型,以及丰盛的工具与平台,有助于促成技术创新和产业倒退。

此次重磅公布的鹏城 - 百度·文心是“寰球首个常识加强千亿大模型”,在机器浏览了解、文本分类、语义类似度计算等 60 多项工作获得最好成果,并在 30 余项小样本和零样本工作上刷新基准。

鹏城 - 百度·文心胜利公布的背地,得益于鹏城实验室的算力零碎“鹏城云脑Ⅱ”和飞桨深度学习平台的强强联手,解决了超大模型训练的多个公认技术难题,使鹏城 - 百度·文心训练效率大幅晋升,模型成果更优。“鹏城云脑Ⅱ”是国产自主的首个 E 级 AI 算力平台,曾在多个国内性能测试上取得冠军。飞桨是我国首个自主研发的深度学习开源开放平台,研制了端到端自适应分布式训练框架,实现多硬件反对,并行效率高达 90%,无效反对鹏城 - 百度·文心千亿大模型高效、稳固地训练。

为解决大模型利用落地难题,百度团队独创大模型在线蒸馏技术,模型参数压缩率可达 99.98%。压缩版模型仅保留 0.02% 参数规模就能与原有模型成果相当,为产业大规模利用关上新窗口。

为促成产学研协“多轮驱动”,鹏城实验室与百度成立了鹏城 - 百度自然语言解决联结实验室,并以此为依靠,资源共享、优势互补,在自然语言解决前沿钻研和翻新利用方面协同攻关,助力打造国家策略科技力量。本次联结公布的鹏城 - 百度·文心将进一步解决 AI 技术在产业利用中不足畛域和场景化数据等要害难题。该模型将依靠鹏城云脑Ⅱ对外开放,踊跃联结“产学研协”各方,充沛开掘 AI 大模型的赋能能力,助力科技翻新,推动产业倒退。

目前,百度文心通过百度飞桨平台陆续对外开源凋谢,并已大规模利用于百度搜寻、信息流、智能音箱等互联网产品,同时通过百度智能云赋能工业、能源、金融、通信、媒体、教育等各行各业。在金融畛域,基于百度文心实现了合同智能解析,可能在 1 分钟内实现对相干合同条款文本的解析辨认,速度是之前的几十倍,大大晋升了工作效率。百度智能云的智能客服也基于百度文心晋升了服务的精准性,目前曾经在中国联通、浦发银行等企业应用,拓展到全国各地。

从 AI 核心技术到 AI 根底平台,从技术创新到实际落地再到凋谢生态,多年来,以百度为代表的中国 AI 企业保持自主翻新、开源凋谢,增强产学研协单干,一直升高 AI 技术开发和利用的门槛,为各行各业提供高质量倒退新动能。

百度 AI 开发者社区 https://ai.baidu.com/forum?&h…,为全国各地开发者提供一个交换、分享、答疑解惑的平台,让开发者在研发路上不再“孤军奋战”,通过一直地交换与探讨找出更好的技术解决方案。如果你想尝试各种人工智能技术、开辟利用场景,赶快退出百度 AI 社区,你对 AI 的所有畅想,在这里都能够实现!

​【投稿赢大奖】——奇思妙想 +AI 技术 =?

🌟奇思妙想与 AI 技术碰撞会产生什么样的火花?

🌟独特、新鲜的思路会与 AI 技术会产生什么样的化学反应?

🌟参加流动有机会赢大奖,更有机会成为 AI 开发者联盟成员!

一起来解锁开发者联盟更多福利吧

大奖在这里👇👇👇👇👇👇

加入流动电竞级耳机、京东卡、爱奇艺年卡、百度定制大礼等你来拿!

立刻参加:https://ai.baidu.com/forum/to…

扫描下方二维码,增加小助手微信「京东卡、小度定制周边、神秘礼盒、行李箱」等更多福利你来拿~

退出移动版