关于paddle:AI-电力大模型主题师资培训落地飞桨持续赋能AI人才培养

随着数字浪潮袭来,人工智能的倒退声势浩大,高校人工智能业余建设以及AI的人才培养曾经提上日程。如何夯实产教交融,放慢人工智能钻研翻新,造就具备AI零碎能力和电力行业常识的拔尖人才,是推动电力产业智能化降级的迫切课题。 7月7日-9日,全国人工智能师资培训班(以下简称“师资培训”)在江苏南京举办,此次师资培训建设“AI+电力|大模型”主题,基于人工智能和电力等特色实际,由中国自动化学会、机械工业出版社、南京邮电大学及百度公司独特承办,南京邮电大学自动化学院、人工智能学院党委书记张翼,中国自动化学会理事、江苏省自动化学会理事长、东南大学传授李世华,南京理工大学计算机学院党委书记陆建峰,国电南瑞科技股份有限公司南瑞研究院智能技术研究部副经理张斌,南京邮电大学副教授尹海涛,机械工业出版社计算机分社高等教育图书策划部主任郝建伟,百度飞桨教育生态高校经营负责人雷晓洋等嘉宾缺席。 培训整体学员留影 南京邮电大学自动化学院、人工智能学院党委书记张翼在致辞中提到,2021年,基于百度与南京邮电大学多年的单干积攒和将来倒退愿景,学校与百度建设策略单干关系,共建南邮-飞桨人工智能产业学院,两年来,校企单方围绕国家和中央人工智能畛域的人才培养和产业倒退基础设施,积极参与建设,翻新产学研单干,发展了富有成效的工作。这其中包含,单干申请并获批首批江苏省产教交融业余,启动了6轮产教交融课程改革,联结举办高水平师资培训等,将来校企单方还将重点关注AI+电力畛域,施展各自的劣势和影响力,推动人工智能技术在电力畛域的利用,助力行业的倒退。 南京邮电大学自动化学院、人工智能学院党委书记 张翼 中国自动化学会理事、江苏省自动化学会理事长、东南大学传授李世华在致辞中提到,数字经济作为科技改革和产业改革倒退的助推剂,人工智能、大数据等技术是数字化转型的重要驱动力、重要策略资源。数字时代是最好的时代也是充斥挑战的时代,人工智能赋能新型的电力系统,如新能源发电、变电、配管、安检、营销、企业治理等各个环节都有业务智能化的利用,能无效推动新型数字基础设施建设,助力新型电力系统的智能化倒退。 中国自动化学会理事、江苏省自动化学会理事长、东南大学传授 李世华南京理工大学计算机学院党委书记陆建峰在现场分享《利用常识加强大模型成果的前沿技术停顿》时提到,在大语言模型中训练语料数量和模型参数量都显著减少的同时,也涌现出一系列新能力,如few-shot性能极大晋升,给出上下文和极少的问题样例后,模型输入的品质取得晋升;如CoT(Chain-of-Thought,思维链)能力呈现,通过命令模型生成(或手动输出)解决问题的过程,能够进步模型的准确率。 南京理工大学计算机学院党委书记 陆建峰 国电南瑞科技股份有限公司南瑞研究院智能技术研究部副经理张斌分享特邀报告《电力机器人关键技术钻研与瞻望》时分享了电力机器人的基本概念、特点以及在发电、输电、变电、配电、用电等生产生存环节中的利用场景,并介绍了国内外电力机器人的倒退历程, 国电南瑞科技股份有限公司南瑞研究院智能技术研究部副经理 张斌 百度飞桨教育生态高校经营负责人雷晓洋在分享《大模型驱动AI产业利用减速倒退》时提到,深度学习和大模型作为AI前沿技术和基础设施,联结优化,相互促进,迎来倒退黄金期。百度积攒了深厚的AI研发和工程化能力,国内最早自研深度学习平台飞桨,撑持文心大模型高效开发训练和推理部署,使其成果更好、效率更高、性能更强。产业变局带动人才培养降级。直面智能化时代的新需要、新挑战,百度基于飞桨和文心大模型,携手产学研共建产教交融的人工智能教育生态,放慢造就助力社会经济高质量倒退的复合型AI人才。 百度飞桨教育生态高校经营负责人 雷晓洋 南京邮电大学副教授尹海涛在分享《百度飞桨赋能高校-以南邮为例》时,对本人在南京邮电大学的飞桨课程教学实际、率领学生加入比赛、松果基金等贵重教训进行了激情分享,对百度飞桨在南京邮电大学如何全方位助推高校教学服务体系构建进行了深刻的案例分析。 南京邮电大学副教授 尹海涛 培训第一天下午,南京邮电大学副教授吴飞以《如何使用AI思维剖析行业问题》、《人工智能次要技术概览》等为题,从计算机视觉、语音、自然语言解决等维度登程,活泼形象地介绍了人工智能技术是如何使得计算机可能像人类一样口头与思考的。 南京邮电大学副教授 吴飞培训第二天,百度飞桨布道师赵佳琦以《居民水表盘提取》、《PaddleHub与大模型利用》等为题率领现场老师相熟人工智能学习与实训社区AI Studio,并实现如居民水表盘提取、智慧停车场车辆识别系统设计等经典模型利用实战。培训最初一天,百度飞桨布道师赵佳琦以《人工智能方法论与能源畛域实际利用》等为题介绍了AI技术在能源、电力行业中的利用现状及场景,并率领现场老师实现多类别电表读数辨认我的项目实际。 百度飞桨布道师 赵佳琦 在为期3天的培训中,参训老师发展了大模型与深度学习的相干学习,并在讲师的率领下学习实操了“模型抉择与人脸关键点检测”“智慧停车场车辆识别系统设计”“AI电力”等多个我的项目。通过这次培训,老师们不仅把握了AI在电力畛域利用的入门上手、代码解析、我的项目实操等基本知识,而且理解了大模型和深度学习在电力场景的劣势。参培老师们示意,这次培训让他们在实际能力和理论知识方面播种很大,也加强了他们对人工智能教育信念。 参培老师探讨我的项目在政策和行业倒退的驱动下,人工智能人才将领有广大的空间,百度将紧密结合高校科研人才与企业应用人才培养,反对以产业和技术倒退的新需要,继续建设特色校企单干,开掘重点行业特色我的项目,持续推动高校人才培养改革,为社会造就人工智能人才。 百度飞桨长期以来从教学资源、工具与平台、反对与服务三个层面,围绕学习、实际、待业等环节,为高校师生提供丰盛多样的资源反对。针对时下热门的大模型畛域,也在继续打造相干课程及内容建设。将来,百度飞桨将持续保持对AI人才教育的投入,推动产教深度交融翻新,期待为国内人工智能畛域的倒退注入新生机、新动力。

July 13, 2023 · 1 min · jiezi

关于paddle:首个AI开发者创作激励计划开启有成长有收入

各种视频网站都有什么创作激励!那什么时候有专属于AI开发者的创作激励?好!那AI开发者的福利来了!!既能潜心进行模型开发,又能晋升技术能力,还能领一份创作金!!飞桨AI Studio全新公布首个面向AI开发者的创作激励期待继续与你相伴AI之路,见证彼此的成长 什么是创作激励体系飞桨AI Studio创立至今,已会集430万+开发者,创作4万+精品我的项目,累计公布60+AI利用…… 这都是平台开发者的精彩创作! 为激励更多创作者继续创作、共建开源生态 飞桨AI Studio推出了 “ 1:1现金处分” 的激励打算,并制订推出残缺的创作工作体系! 蕴含「模型奉献」「精品我的项目」「AI利用」「模型复现」四大模块将来一年,咱们将通过欠缺的等级权利、专项现金处分、流量搀扶,让AI创作者真正实现 “有支出”“有流量”“有成长”“有成就” 。 模型奉献激励全面建设飞桨AI Studio模型库: 只有你奉献的模型是模型库里没有的!合乎模型规范,即可取得20-200元处分。 激励详情 https://aistudio.baidu.com/aistudio/projectdetail/6229078 我的项目创作激励精品我的项目数据化梯度处分: 我的项目被加精即得20元/40元奖励金,我的项目综合数据越高,处分越高,单我的项目最高可达1000元。 激励详情 https://aistudio.baidu.com/aistudio/activitydetail/1503019244 利用创作激励AI利用工作制订级处分: 应用Gradio创作AI利用,实现对应的利用工作即可取得处分,单利用最高可取得1200元。 激励详情 https://aistudio.baidu.com/aistudio/activitydetail/1503019245 模型复现激励模型复现工作制高额奖金: 实现模型复现工作,校验通过后即可取得1000元-5000元。 激励详情 https://aistudio.baidu.com/aistudio/activitydetail/1503019247 1:1现金奖励金阐明奖励金总和=模型奉献处分+我的项目处分+利用处分+模型复现处分处分结算:奖励金为实时结算,实现一项工作后立刻取得;所有奖励金可累加于12月31日前一起兑换。处分兑换:奖励金仅可用于兑换,可兑换为100元-5000元等多个面值的京东卡备注:1元人民币=1元奖励金(创作金)感兴趣的创作者们可扫码退出创作激励群 飞桨AI Studio开发者力作【AI艺术二维码】 https://aistudio.baidu.com/aistudio/application/center

July 13, 2023 · 1 min · jiezi

关于paddle:极客欢聚燃动夏日开发者嘉年华等你来

开发者的一天是什么样的?或者会苦思冥想  为了一点点成果的晋升重复调整代码;或者会踌躇满志  筹备最新利用的PPT,去争取投资人的关注;或者会紧锣密鼓  上传最初的作品demo,期待不久后获奖的光荣;或者会激流勇进  与小伙伴们一起优化我的项目,来一场黑客马拉松;或者会欢声笑语  与别人交换,碰撞出新的创意,取得新的感触……不管以何种形式,开发者的一天总是高昂的、分享的、先进的。而7月15日这天,对于咱们的开发者来说,无疑也是特地的一天。往年7月15日,在这个专属于程序员的夏日里,百度飞桨联手文心大模型,以 “极客欢聚” 为主题,筹备了一场专属于开发者们的惊喜盛会 “开发者嘉年华” 。百度飞桨将同开发者们一起,度过一个高兴而又空虚的嘉年华!来一场说走就走的AI之旅! 在计算机的发展史上,以0/1为代表的二进制世界里,程序员们正以极客精力,在热AI的路上,为蓬勃发展的人工智能奉献本人的力量。对于活在铺天盖地技术创新横流里的极客们,只有在互联网上冲浪,总能看到诸如“冲击”“机会”等各种各样对于人工智能行业的评论。然而,对于在网络上时常聊天,社区里常常单干,课程里有时追寻的更多极客们,咱们却总是知之甚少。当初机会来了,让你零距离接触社区里的搭档们。此次开发者嘉年华将分为上下午两个会场。 框架开源 MEET UP 作为中国最早开源的深度学习框架,飞桨( PaddlePaddle )深度践行开源理念,凋谢拥抱社区,器重生态构建,与开发者和生态搭档共成长,已成为国内综合竞争力第一的产业级深度学习平台。飞桨开源社区汇聚了框架开发者、算法研究者、硬件开发者和利用开发者等各角色成员,各个角色在自运行的生态中参加开源共建,造成微小的生态力量,此次「开发者嘉年华」邀请百度飞桨团队,聚焦飞桨生态,洞见前沿技术和将来时机,与开发者零距离交换,并诚挚邀请英特尔 AI 软件工程师杨亦诚解读 OpenVINO™+ 飞桨开源单干,洞察开源理念,还汇聚了一批酷爱飞桨、酷爱开源的开发者,解说本人参加飞桨框架建设,与飞桨独特成长的经验。 AI大模型 MEET UP 生成式 AI 正以惊人的势头扭转着咱们的世界,新的浪潮席卷着寰球各个行业和畛域,颠覆了很多人的工作、生存范式。只有你有想法和发明的激情,大模型都能帮忙你暴发出微小能量。处于这个新范式的重要拐点,只有具备 AI 思维的人,能力登上科技之巅。越来越多的开发者成为推动大模型生态建设的重要力量。此次开发者嘉年华,为宽广开发者们提供畅所欲言的交流平台,由开发者负责配角,讲述本人人工智呢产业落地的进阶历程和 AI 创意利用,让更多 AI 开发者理解和学习前沿技术!不止技术,在开发者嘉年华的现场,还设置了 workshop 环节,开发者们将带着本人的AI利用,大礼拿到手软。咱们邀请创意满满的你纵情展现!如果想要让本人的创意利用更多人看到,欢送扫码报名,不仅有机会取得交通补贴,直通会场,更有可能取得神秘大奖。诚挚邀请宽广开发者在这个酷夏相聚于 “开发者嘉年华” ,您能够在该流动中理解到与框架开源和AI大模型无关的最新 insights ,也能够在圆桌探讨中纵情抒发己见,让不同的 idea 互相碰撞! 更多惊喜彩蛋期待你现场解锁! 如何加入? 诚挚邀请宽广开发者在这个酷夏相聚于上海~ 您能够在该流动中理解到与框架开源和AI大模型无关的最新 insights ,也能够在圆桌会议中纵情抒发己见,让不同的 idea 互相碰撞! 流动工夫 7月15日 流动地点 上海·飞桨赋能核心 赶快点击下方链接报名吧! https://paddle.wjx.cn/vm/tU4OIej.aspx

July 12, 2023 · 1 min · jiezi

关于paddle:2023IKCEST-一带一路-国际大数据竞赛重磅启动

2023IKCEST第五届“一带一路”国内大数据比赛暨第九届百度&西安交大大数据比赛,由联合国教科文组织国内工程科技知识核心(IKCEST)、中国工程科技知识核心(CKCEST)、百度及西安交通大学独特主办,旨在放眼“一带一路”倡导沿线国家,通过比赛形式开掘寰球大数据人工智能尖端人才,实现政府—产业—高校合力推动大数据产业钻研、利用、倒退的指标。比赛间断举办9年,笼罩五大洲21个国家,近600个高校,累计16000支队伍参赛! 往年,赛题给选手们提出更高的挑战:“社交网络中多模态虚伪媒体内容核查”,用AI技术打假造谣,聚焦多模态、NLP、CV、信息检索等技术,激励选手们应用大模型解决难题。 快来大显神通,试试吧! 7月14日(周五)16:00, 比赛启动典礼将在飞桨B站号进行, 届时你能够理解到: 历年比赛回顾重磅嘉宾寄语赛题解析阐明往届选手分享2023IKCEST第五届“一带一路”国内大数据比赛 赶快进入比赛官网报名吧! https://www.ikcest.org/bigdata2023https://aistudio.baidu.com/aistudio/competition/detail/1030/0...

July 12, 2023 · 1 min · jiezi

关于paddle:飞桨出海百度飞桨携手联合国教科文组织共促全球高等教育数字化进程

百度飞桨响应联合国教科文组织,踊跃践行“共商、共建、共享”的寰球单干理念,紧跟寰球教育翻新的步调,推出面向寰球高校教学人员的微认证英文课程——《AI科普与零代码实际》。百度基于丰富的人工智能技术积淀打造了本系列课程,携手联合国教科文组织高等教育翻新核心独特推动寰球高校教师数字化能力的倒退,也期待世界各地更多的高校师生踊跃共享翻新实践经验,独特推动寰球教育的数字化过程。 IIOE高等教育老师数字能力微证书我的项目发布会 引领教育数字化转型百度与联合国教科文组织的共建之路 百度飞桨为寰球高校教学人员打造的《AI科普与零代码实际》微认证英文课程,由43节课形成,旨在帮忙老师了解并利用人工智能。课程内容全面,涵盖人工智能的历史倒退、外围定义以及将来的瞻望。 人工智能的定义 同时,课程侧重于技术根底的解说,如图像识别、自然语言解决、语音解决等主题,结合实际场景帮忙老师了解大模型的训练和最终可达到的成果。此外,课程融入了数学统计学公式,帮忙老师了解模型底层的逻辑原理。 计算机视觉技术的根底解说 在课程中,百度飞桨特别强调了人工智能在医疗、农业、质检等畛域的理论利用,并通过百度飞桨 EasyDL 平台为老师们展现如何训练不同场景下的模型。课程还提供了具体步骤疏导老师用本人的数据在 EasyDL 平台上训练出本人的模型。课程框架的正当设计,不仅帮忙老师们深度了解和把握人工智能的利用,也通过实操我的项目更好地推动不同畛域的数字化转型。 训练出在药品质检的AI 微认证英文课程向寰球范畴的学习者传播 AI 的实用性和通用性,尤其对于那些偏僻或资源匮乏的地区,AI 技术的遍及和利用有助于推动当地的经济倒退。通过应用本地数据和环境个性来训练 AI 模型,百度飞桨能够发明出更具本土化特色的 AI ,这对于晋升 AI 在特定环境中的效力具备关键性的作用。比方,通过应用当地X光照片、城市图片或农作物图片来训练 AI 模型,能够训练出更适宜本地环境的 AI 模型,更精准地服务于当地的需要。 应用X光图像训练骨龄检测 AI 本我的项目由合作伙伴高校和企业多方认证,促成资源共享,具备权威性,不仅推动老师数字化能力倒退,更提供寰球视线和本地化实践经验,惠及世界各地开发者的AI技术能力倒退,这在全球化和数字化的时代具备微小的价值。 《AI科普与零代码实际》微认证英文课程正式公布 《AI科普与零代码实际》微认证英文课程现已正式公布,并将与联合国教科文组织高等教育翻新核心独特推广至寰球。期待每一个参与者都能在学习过程中播种常识和技能,更期待他们能将所学使用到理论工作中,独特推动寰球的数字化过程。同时,也欢送寰球的高校搭档分享他们在教育数字化转型路线上的翻新实际,一起推动寰球范畴内的教训分享和推广。 将来,百度飞桨将持续与寰球搭档共同努力,为推动教育数字化倒退,造福寰球老师和学生奉献本人的一份力量。微认证系列课程也将持续更新,在将来的学习旅程中携手寰球搭档大学、企业独特摸索 AI 的边界,实现技术的深度利用,独特迈向高等教育数字化转型的新篇章。 课程链接 https://www.iioe.org/#/home/more/layout/isbranch676ba244-0661... 联合国教科文组织推文 https://mp.weixin.qq.com/s/Wnmf2FKXoqvwLaXxFR6E0A

July 10, 2023 · 1 min · jiezi

关于paddle:王海峰最新发声

7月6日,2023世界人工智能大会(WAIC)在上海世博核心揭幕,泛滥专家学者、科技领军人才、企业代表独特探讨人工智能赋能产业倒退的全新变动,瞻望技术新趋势。百度首席技术官、深度学习技术及利用国家工程钻研核心主任王海峰解读文心大模型3.5版核心技术,公布飞桨生态最新进展,论述人工智能产业模式,为人工智能技术及产业最新发声。 飞桨已凝聚750万名开发者,文心3.5成果晋升50%,推理速度晋升30倍以后,以大语言模型为代表的人工智能技术在寰球掀起科技和产业翻新浪潮,减速产业降级和经济增长,各行各业都将产生巨大变化。IT技术栈产生根本性扭转,从芯片、操作系统和利用三层架构,转变为芯片、框架、模型、利用四层架构。深度学习框架和大模型形成了产业智能化基座,将撑持各行各业的利用智能化重构,促成经济高质量倒退。据理解,百度在人工智能四层技术栈均有布局和当先的自研技术,尤其在位于四层架构外围的框架层和模型层。文心大模型的最新成绩,也得益于飞桨深度学习平台和文心的联结优化。飞桨是我国第一个自主研发的产业级深度学习开源开放平台,在中国深度学习平台综合市场份额上间断两年位居第一。王海峰现场走漏,截至目前飞桨已凝聚750万名开发者,这也是百度2023年以来首次对外披露飞桨生态最新数据。 百度自2019年3月文心大模型公布1.0版后,历经四年技术深耕和研发迭代,现已降级到文心大模型3.5。王海峰示意,文心大模型3.5成果、性能、性能全面晋升,实现了根底模型降级、精调技术创新、知识点加强、逻辑推理加强等,模型成果晋升50%,训练速度晋升2倍,推理速度晋升30倍。 核心技术继续冲破,成果和效率齐跃升往年3月,百度在寰球大型科技公司中第一个公布了大语言模型文心一言。文心一言是常识加强的大语言模型,首先从数万亿数据和数千亿常识中交融学习失去预训练大模型,在此基础上采纳有监督精调、人类反馈的强化学习和提醒等技术,并具备常识加强、检索加强和对话加强等技术劣势。 王海峰解读了文心大模型3.5的外围技术创新,在根底模型训练上,采纳了飞桨最先进的自适应混合并行训练技术及混合精度计算策略,并采纳多种策略优化数据源及数据分布,放慢了模型迭代速度,显著晋升了模型成果和安全性。同时,翻新了多类型多阶段有监督精调、多层次多粒度处分模型、多损失函数混合优化策略、双飞轮联合的模型优化等技术,进一步晋升模型成果及场景适配能力。在常识加强和检索加强根底上,文心大模型3.5提出了“知识点加强技术”,对用户输出的查问、问题等进行剖析了解,解析出生成答案所须要的相干知识点,之后使用常识图谱和搜索引擎为这些知识点找到相应答案,最初再用这些知识点结构输出给大模型的提醒,为大模型注入更具体、更具体、更业余的知识点,显著晋升大模型对世界常识的把握和使用。在推理方面,通过大规模逻辑数据构建、逻辑常识建模、多粒度语义常识组合以及符号神经网络技术,晋升文心大模型3.5在逻辑推理、数学计算及代码生成等工作上的体现。 新增插件机制,拓展大模型能力边界文心大模型3.5新增了插件机制,文心一言曾经于6月17日对外公布官网插件百度搜寻和ChatFile。百度搜寻是默认的内置插件,使得文心一言具备生成实时精确信息的能力。ChatFile是长文本摘要和问答插件,反对超长文本输出。王海峰示意,文心一言将公布更多优质的百度官网和第三方插件,让用户可能更好地应用文心大模型,同时也将逐渐凋谢插件生态,帮忙开发者基于文心大模型打造本人的利用。 广泛应用于各类场景,减速产业智能化降级现场王海峰展示了文心一言在办公、会议、编码等场景的利用,文心一言成为工作中的“超级助理”,帮忙总结工作沟通要点,实时记录会议内容,造成会议议题、摘要及总结等要害信息,能够通过各类插件实现指令工作,包含查问日程、创立会议、设置待办、申请休假等,也能够在工程师编码过程中主动举荐和生成代码。据悉,目前这些性能已通过智能工作平台“如流”利用于百度的工作流程中,帮忙晋升工作效率,进步决策品质。王海峰示意,但凡要跟语言文字或程序代码打交道的利用场景,都可能有文心一言的用武之地。曾经有很多在踊跃应用文心一言的场景,例如能源、金融、教育、办公、媒体,等等。在文心一言这类大模型产业落地的过程中,能够采纳“集约化生产,平台化利用”的模式,即具备算法、算力和数据综合劣势的企业将模型生产的简单过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务。

July 7, 2023 · 1 min · jiezi

关于paddle:AI-for-Science交流会来了科学计算前沿邀您共同探讨

随着深度学习一直驱动技术创新,人工智能科学计算迈向高质量倒退路线。百度飞桨作为科学计算的动摇支持者,打算于7月13日举办飞桨科学计算线下交流会。本次交流会以百度飞桨深度学习框架为基座,宽泛联动人工智能科学计算畛域头部专家学者、高等院校、科研机构和开发者,搭建科学计算从业者宽泛交换、深度交融的平台,探讨行业动态、科研成果、开源建设等多种议题,全力推动 AI for Science 建设与倒退。 在这次交流会上,咱们将向大家介绍飞桨 PaddleScience v1.0 版本。赛桨PaddleScience 是一个利用于科研畛域的端到端科学计算工具组件,利用飞桨深度学习框架的主动(高阶)微分机制和高层API,解决物理、化学、气象等畛域的问题。反对物理机理驱动、数据驱动、数理交融三种求解形式,并提供了根底 API 和详尽文档供用户应用与二次开发。 流动详情流动主题 AI for Science—人工智能减速迷信发现与科学计算 流动工夫 7月13日 14:00-17:00 流动地点 上海 · 百度飞桨赋能核心 报名要求 欢送从事计算机/人工智能或各畛域科学计算方向的钻研人员踊跃报名 报告主题本次线下交流会咱们邀请到国内外优良的科研人员分享他们在相干畛域的常识和研究成果,为大家提供一个学习和深入探讨的机会。 主题一:飞桨科学计算产品报告 主讲人:张艳博,飞桨高级技术产品经理 演讲主题:《飞桨AI for Science畛域摸索与产品建设现状》 报告简介:介绍飞桨AI for Science整体产品建设状况 主讲人:何森森,飞桨工程师 演讲主题:《飞桨PaddleScience V1.0性能介绍及使用指南》 报告简介:介绍飞桨AI for Science整体产品建设状况 主题二:AI for Science学术报告 主讲人:孟旭博,2017年博士毕业于华中科技大学能源与能源工程学院;2018年-2022年美国布朗大学利用数学系从事博士后钻研工作, 单干导师为美国工程院院士George Em Karniadakis传授;2022年3月至今任华中科技大学数学与统计学院数学与利用学科穿插翻新研究院副教授。次要钻研方向为科学计算中的深度学习办法。截至目前已在JCP、CMAME、SIAM Review等期刊发表SCI论文20余篇,谷歌学术总援用2600余次,4篇论文入选ESI高被引论文,1篇论文为热点论文;负责JCP、SISC、CMAME、Nat. Comput. Sci .等期刊审稿人。 演讲主题:《科学计算:交融多保真数据的复合神经网络》 报告简介:机器学习的最新倒退也影响了物理零碎的计算建模,例如地球科学和工程学。通常,简单物理零碎的优化须要大量高保真数据集,这可能导致计算成本过高。另一方面,不充沛的高保真数据会导致不精确的近似值和可能的谬误设计。多保真度建模已被证实能够通过利用低保真度和高保真度数据在不同利用中实现高精度。在本次演讲中,我将介绍一种新开发的用于多保真度数据交融的深度学习算法及其在函数迫近和逆 PDE 问题中的利用。 主讲人:王韫博,上海交通大学助理传授,清华大学博士,CCF优博,国家自然科学基金原创摸索我的项目负责人。次要从事机器学习与计算机视觉的钻研,专一于可微物理模仿、有模型强化学习等方向,在TPAMI、NeurIPS、ICML、CVPR等CCF-A类期刊和会议上发表论文20余篇,2020年入选上海市青年科技扬帆打算。 演讲主题:《世界模型:直觉物理推理与决策》 报告简介:世界模型,是指智能体通过与环境交互,或通过观察物理世界的视觉表观演变,摸索和推断其外部动力学模型,构建物理世界的可微分模拟器。近十年间,J. Tenenbaum、J. Schmidhuber、Y. LeCun等人别离从贝叶斯认知实践、视觉环境决策、自监督学习的角度给出了世界模型的不同表达形式。然而,如何在简单的视觉场景中建设无效的世界模型依然是一项凋谢课题。本次报告围绕世界模型的“察看”与“交互”两个方面,别离介绍“3D逆图形学物理推断”和“基于世界模型的强化学习”办法,相干工作别离发表于2022年的ICML和NeurIPS(Spotlight)。前者为流体动力学模仿提供了一种新思路,后者利用于DeepMind Control机械臂视觉管制工作和CARLA主动驾驶工作,为以后最佳基线模型之一。 主讲人:Madeleine Martinsen, Head of R&D Hoist & Underground Mining at ABB Service. More than 34 years of wide competences from engineering, internal auditing, controlling to management positions within both the Power and Automation Industry at ABB. Including abroad assignments in Germany, Ecuador, USA and Denmark. A trouble-shooter with successful experience from “turning around” businesses. As a person enthusiastic, she is open minded, optimistic, curios, analytic, structured and result oriented. Her driving force is best used within an organisation where daily operational excellence is at focus as for serving customers. Currently focusing on finalizing her PhD with the title ‘Monitoring of airflow and airborne particles, to provide early warning of irrespirable atmospherics conditions’. ...

July 6, 2023 · 2 min · jiezi

关于paddle:如何用大模型-Prompt-解决行业场景问题大厂中文教程来了

科技爆炸,大模型奋勇当先生成式 AI 正以惊人的势头扭转着咱们的世界,新的浪潮席卷着寰球各个行业和畛域,颠覆了很多人的工作、生存范式。自 PGC、UGC 之后,AIGC 俨然成为煊赫一时的内容生产模式。只有你有想法和发明的激情,大模型都能帮忙你暴发出微小能量。处于这个新范式的重要拐点,只有具备 AI 思维的人,能力登上科技之巅。 工具缭乱,「Prompt」自成一家「言出法随」,不再是古代人对于超能力的畅想,更是现代科技赋予每个人的「登山杖」。「Prompt」正是登山的疾速缆车,在不远的将来,应用「Prompt」技能会像应用手机一样广泛。相比起简单的算法,艰涩的代码,利用「Prompt」生成内容,只须要学会根底的应用技巧,就能迅速上手,为本人的工作、生存按上加速器。 品质错落,学习门路亟待摸索以后 AI 工具层出不穷,大模型的能力总是能超出设想。然而即便是同一个大模型,给予不同的「Prompt」,生成的后果也有可能天壤之别。如何写出优质的 Prompt,仍在摸索过程中。只有具备创作优质Prompt的能力,能力开释出大规模语言模型技术弱小的能力,与大模型高效沟通。因而咱们推出了《基于大模型的优质 Prompt 开发课·二期》,面向有内容生产需要的所有用户,无论是何行业,有无技术根底,都能够通过本次课程,把握这项必备技能。 课程详情直播课程解说理论难题 在五月《基于大模型的优质 Prompt 开发课》课程中,咱们学习了 Prompt 的通用技巧,8000+学员学习了优质 Prompt 根底构建形式、丰盛的优化技巧、针对具体场景利用做优化等实用常识。在各行各业,大模型都能为咱们所用,为咱们提效,然而聚焦到个体,面临的问题是形形色色的。重复性工作让人不堪其扰,科班出身难跨行,网络信息乱花迷人眼……为了帮忙大家解决理论行业场景中的问题,7月11日,《基于大模型的优质 Prompt 开发课·二期》行将起航,全面降级。 新降级的课程中,咱们将笼罩大量Prompt开发的密钥,基于大模型技术趋势和利用场景洞察,为你梳理文案工作、求职、软件开发等各个场景中的⼤模型提醒词的应用技巧。 《大模型利用明码— Prompt 的一千种打开方式》优质 Prompt 是驱动大模型进行生产的密钥,学会 Prompt 无论是对于打工人,还是创业者,都能够为咱们带来微小的收益。 《超高产文本生成机、传媒营销人必备神器》帮忙拉出繁杂枯燥的文案泥潭,是所有文字工作者最迫切需要解决的问题。而生成式大模型在内容品质上晋升显著,给各行各业都带来了新机遇,营销行业重视创意,传媒行业重视准确性和时效性,只需几秒,大模型就能帮你组织一个不错的答案,文学创作、文档写作也不在话下。本节课将教会你如何利用好这个文字工作者的神器。 《求职人之光,零门槛利用大模型斩获指标offer》“内卷”时代,想要寻求职场上的冲破并非易事,从寻找求职信息到投递简历再到面试谈 offer,每一步都是膂力和心力的微小耗费。如何优化简历、打磨自我介绍?面试的黄金八问,又应该怎么答复?这些求职人心中的迷雾,归根结底都是文字问题,大模型能帮他们敲开新工作大门。本节课将从求职全流程讲起,为你介绍如何利用大模型斩获指标 offer。 《大模型帮你写代码,小白也能做程序》大模型在引发“人工智能取代工作”恐慌的同时,也带来了大量新的时机,大模型行业的待业前景无疑是广大的,他将给公众更多机会,接触更为艰深的畛域。本节课将带你从软件开发的角度来看大模型,业务代码生成,文档、Icon 等物料生成,信息整合,提供智能化能力反对……帮你找到近道,助力小白成长为“代码大神”,实操大模型从 0 生产软件。 《只需3步,优质Prompt秒变应用软件》生成式 AI 正以惊人的势头扭转着咱们的世界,处于这个新范式的重要拐点,只有具备 AI 思维的人,能力利用 AI,在本人的畛域有更高的效率和产出,取得更多创意性启发,发明出更多有价值的利用。本节课将帮忙所有 AI 原住民,通过 Prompt 把本人的AI创意转化成具体可用的利用,助力踏上AI守业之旅的第一步。 实际操作助力疾速上手 同时,本课将提供零根底可用的大模型提醒词、利用实战平台,助你轻松通过大模型解决理论问题。申请形式请见海报。 课程详情 收费直播 实时互动答疑 本期课程采纳直播课模式,全程实时互动,针对性解答你的问题。从训练到实战,欠缺的课程体系让你轻松即学即用。 学践联合 礼品拿到手软 大模型利用时代,实际出真知:学习课程、入手写优质Prompt、甚至开发本人的程序或利用,即可取得丰盛礼品和助学奖金!能力和大奖双赢!优质 Prompt 奖:提交原创优质 Prompt,实现 lesson1 课后作业且总成绩进入 Top20,即可取得 一等奖/总成绩前3名:300元奖学金 + 纸质证书二等奖/总成绩4-10名:200元奖学金 + 纸质证书三等奖/总成绩11-20名:100元奖学金 + 纸质证书锦鲤奖:作业符合要求的学员中抽取30位锦鲤,取得 50元奖学金 + 纸质证书阳光普照奖:实现所有课时学习 且 lesson1 均达到及格分,即可取得课程官网结业证书 + AI Studio 大模型社区的特邀权限利用开发奖:lesson5 作业通过官网验收且问题进入 Top10,即可取得100元奖学金报名形式 ...

July 6, 2023 · 1 min · jiezi

关于paddle:2023年CCF百度松果基金课题申报持续进行中截至7月24日

延期布告因为学期末工作安顿影响,局部专家反馈课题申报工夫缓和。为保障更多高质量课题申报材料顺利提交,经CCF-百度松果基金项目组决定,特将课题申报截止日期延期至2023年7月24日24:00(北京工夫) 。 欢送国内外高校与科研院所的钻研人员和团队踊跃投递,关注前沿课题,促成产学研成绩转化。 对于CCF-百度松果基金松果基金于2020年由CCF与百度独特发动,是目前国内惟一基于中国首个自主研发、开源凋谢、功能丰富的产业级深度学习平台飞桨设立的科研基金。松果基金通过为期一年的课题我的项目,提供数百万课题基金,以及价值千万的平台、数据、技术等多维度反对,为寰球AI翻新人才搭建产教交融及学术交流的平台。作为百度“500万AI人才培养”打算的重要组成部分,松果基金自成立以来备受学界关注。 2023年CCF-百度松果基金2023年度基金七大课题方向为:深度学习基础理论和技术、深度学习框架技术、大语言模型、计算机视觉、AI+科学计算、推理部署关键技术钻研与开源实现、跨模态大模型技术及AIGC利用。松果基金在命题方向的一大特点——将根底技术实践与前沿科研方向紧密结合。 申请条件 申请者是1983年1月1日(含)之后出世的高校/科研院所退职的全职老师或钻研人员;具备高级业余技术职务(职称)或具备博士学位;具备独立进行钻研工作的能力,能率领学生团队独特参加课题钻研。申报形式 申请者请拜访:http://campus.baidu.com/keyan.html#/ 下载并浏览“申报指南”“申报主题”等文档;填写并提交《我的项目申报表》至 pinecone@baidu.com申报截止工夫 2023年7月24日24:00(北京工夫) 申报阐明 每位申请人每年限提交一份申请;申请人在申报前需确认所在高校/科研院所能够作为我的项目依靠单位签订科研单干协定,申请人自己能够作为我的项目负责人签订我的项目窃密协定等相干承诺文件;任何针对我的项目申报的问题,请分割基金项目组,电子邮箱:pinecone@baidu.com更多我的项目信息,欢送拜访百度松果学堂官网:http://campus.baidu.com 

July 5, 2023 · 1 min · jiezi

关于paddle:山东大学高校专区入驻飞桨AI-Studio优质教育资源等你来学

近日,山东大学高校专区在飞桨人工智能学习与实训社区 AI Studio 上线,单方将携手搭建人工智能教学实训平台专区,会集优质教学实训资源,校企独特培养复合型 AI 人才,为国家输送高质量人才,促成国家智能化过程。 学校简介山东大学是一所历史悠久、学科齐全、实力雄厚、特色显明的教育部直属重点综合性大学,在国内外具备重要影响,2017年顺利迈入世界一流大学建设高校(A类)行列。 学校总占地面积8000余亩,造成了一校三地(济南、威海、青岛)的办学格局,是中国目前学科门类最齐全的大学之一,在综合性大学中具备代表性,领有博士学位受权一级学科44个,博士学位受权二级学科1个,硕士学位受权一级学科51个,本科招生业余93个,博士后科研流动站42个,涵盖除军事学以外的所有学科门类。学校现有在校生近7万人,专任教师4600余人,其中,中国科学院和工程院院士(含双聘)21人,长江学者特聘传授42人、长江青年13人,国家杰出青年科学基金获得者55人、优秀青年科学基金获得者42人,国家特支打算领军人才32人、青年拔尖人才16人,国家百千万人才工程入选者39人;国家级各类平台基地26个,教育部人文社会科学重点钻研基地4个,部委级平台51个,另有少量省级重点实验室和工程技术钻研核心;领有多家直属从属医院;与30多个国家和地区的200余所学校签订了校际单干协定。 山东大学 & 百度飞桨2023年3月山东大学-飞桨人工智能教育翻新核心正式挂牌,聚焦“服务山东高校,链接山东产业”,致力于摸索区域产教交融新范式,造就复合型 AI 人才,助推山东产业经济倒退。将来,核心将以飞桨深度学习平台为根底,联合山东大学在 AI 畛域的学科劣势、钻研团队,交融教学场景和产业需要,发展前沿教育和科研工作。聚焦教育、医疗、生产、静止保健、电子商务、批发六大特色畛域,为产业输送 AI 算法工程、智能化我的项目征询两类产业级外围人才,并联动飞桨人工智能产业赋能核心,让 AI 在更多企业一线生产场景落地,助力山东产业智能化降级。该教育翻新核心成为飞桨赋能山东 AI 人才教育的重要一环。 图:左一百度AI技术生态总经理马艳军 右一山东大学团委书记姜炳刚 同时,由山东大学发动人工智能教育公益我的项目“引航打算”,联结百度、中科曙光、海尔·海纳云等国内驰名企业,并联结中国海洋大学、中国石油大学(华东)、济南大学、山东师范大学等27所高校,独特为人工智能教育提供一个涵盖课程资源、教学科研平台、师资培训在内的解决方案。单方独特建设满足学生实践学习和实际需要的人工智能教学科研平台,百度提供收费的一站式线上教学平台(含GPU资源),能满足开设网课、在线编程、作业管理、主动考试、主动较量等教学需要。独特打造并凋谢优质丰盛的人工智能公益课程资源,学生每修完一门课,都将收费取得一份山东大学与百度联结颁发的课程证书;修满六门课程(共21个学分)能够收费取得山东大学“人工智能”微业余证书。 图:山东大学与百度联结颁发课程证书 截至目前,已有超过10位老师基于飞桨人工智能学习与实训社区 AI Studio 开设课程,蕴含《AI工程实际》《山东大学-2022春-Python精品课》《Python疾速入门》《引航打算_人工智能通识课》《引航-2022春-深度学习根底》等,累计造就64045名 AI 学子。2022年,山东大学加入了百度飞桨的各类比赛,共有257名同学报名,12支队伍获奖,较量包含:全国大学生智能汽车比赛、中国大学生计算机设计大赛等较量。 飞桨与山东大学老师发展科研单干《面向视频流多模态检索的指标动作位钻研》我的项目取得百度松果基金反对,共探AI在前沿科技的有限可能。 接下来的7月到8月,山东大学国家大学科技园、百度飞桨、济南市市中区科技协会将独特主办《2023年全国高校公益人工智能老师暑期师资培训营》,培训工夫共四期,将分智能驾驶方向和人工智能大模型方向两个方向进行,独特造就高校教师的人工智能教学能力和推动高校的人工智能教学工作。 为更好地分享优质学习资源,特地在人工智能学习与实训社区 AI Studio 平台开设了【山东大学高校专区】,集高校课程、优质我的项目、精品课程、国赛、师生流动等为一体,赋能师生进行人工智能学习实训。 山东大学高校专区 https://aistudio.baidu.com/aistudio/cooperate/ShandongUnivers... 同时,欢送更多高校入驻 AI Studio 高校专区,面向400万以上AI学子共享优质课程资源,产学研协同育人。点击下方链接,即可报名。 https://aistudio.baidu.com/aistudio/activitydetail/1502020238

July 5, 2023 · 1 min · jiezi

关于paddle:大模型加速学科升级飞桨赋能北邮X大模型特色小学期

在人工智能时代,设计师与产品经理比以往更加须要关注一个事实:那就是如何利用人工智能和数据分析技术,打造让用户心动的信息交互产品和用户体验,开释人-机协同共创的微小潜能,是决定设计产能和竞争力的要害。 在产业的巨变之下,北京邮电大学侯文军传授联结百度飞桨团队,独特设计了《从情节到交互:UX+AI,打造多模态信息交互产品》特色工作坊,在这个为期一周的工作坊中,在飞桨Jungle老师团队的率领下,同学们通过学习多模态数据分析与大模型技术,以影视片为多模态信息源,逐渐从图像、声音和文本中发展数据驱动的设计剖析,最终将电影的多模态信息转化为引人入胜的多通道交互产品,产出实在我的项目。 课程培养目标多模态人工智能技术了解与利用能力 理解多模态人工智能技术的原理、算法和利用,把握如何利用这些AI技术来剖析电影中的文本、图像和声音等多模态信息,并联合飞桨和大模型工具,转化为交互式利用的设计素材与流程。 数据分析与翻新思维 学会应用多样化的数据分析工具和办法,从电影数据中提取有价值的信息和洞见。造就翻新思维和以用户为核心的设计理念,挖掘电影的被动式参观与主动式交互利用之间的结合点,从电影情节中,策动产品的独特性能价值和交互流程。 交互设计能力 利用多模态的设计能力,在视觉、听觉和触觉等方面,设计直观且吸引人的多感官界面,将电影元素与界面设计相结合,发明出令人印象粗浅的交互式利用设计,提供良好用户体验,无效和舒服地传播信息和故事。 团队合作与项目管理能力 与其余参与者组成团队,独特合作开发一个电影交互式APP原型。学会无效的团队合作,包含任务分配、沟通和协调。取得项目管理的实践经验,学会布局、执行和监控我的项目停顿。 局部课程内容小学期主题及实际工作解析人工智能技术现状、多模态人工智能技术与设计的联合多模态与智能交互设计交融系列课程我的项目课题:基于电影多模态信息的多通道交互产品设计局部我的项目成绩为期5天的工作坊,工夫非常缓和。在这么短的工夫内,要求同学们不仅要学习和消化全副的课程内容,还须要高质量实现课题我的项目——这对他们的学习力、创造力,特地是爆发力,都提出了微小的考验。工作坊的57名大三同学,均来自享誉全国的北邮智能交互设计业余,该业余依靠北京邮电大学的信息科技劣势,立足“新工科”造就理念,造就“人工智能+交互设计”的复合型精英人才。57名同学,通过互相组队,最终产出了25个内容饱满的我的项目。 我的项目示例一杨闪、孙沛然和车皓远同学,选取电影《爱乐之城》发展多模态信息开掘与产品设计。他们通过 K-Means 聚类办法,剖析和提取了象征不同节令和情感阶段的主题色,以及代表不同情绪格调的音效,将其作为交互产品的设计素材。 在影片中,男女配角载歌载舞,洋溢着生机与优雅,此时此刻,三位同学提出了一个问题:对不会跳舞的人,他们如何能享受歌舞所带来的高兴?借助 PP-TinyPose,产品能够将特定的用户照片,转化为电影中经典舞蹈的视频进行复刻,让用户也能像电影中的角色,载歌载舞! 我的项目示例二朱芃宇、范星兰和程力昊同学,摸索的电影是《天使爱美丽》。他们基于故事情节、画面和声音等多模态信息,打造了全新的照片社交产品——Moment。 该产品旨在驱动身在不同时空的用户,为彼此拍摄一张将实体明信片与周围环境进行合影的照片,使用户感到明信片与四周风光,都是专门为他们而拍摄的。以此通过强调该照片的独特性和定制性,让用户在收到照片时感触到被特地器重和关注,并从此与陌生人建设一种美好的时空关联。 借助文心跨模态大模型 ERNIE-ViLG 的参考图模式,用户照片能够被产品进行风格化,这样既防止了个人信息的泄露,又失去了更多的艺术可能性;在社交网络数据提取及用户匹配方面,团队抉择 ERNIE-UIE 模型,能更精准地提取和匹配地理位置、机构、修建等信息,辅助用户找到“远方的敌人”;在明信片内容辅助生产方面,产品则是利用飞桨版 SAM,从摄影照片失去语义内容,并作为 ERNIE-BOT 的文本提醒词,从而帮忙用户更快地产出明信片设计与文字稿。 相干链接 “宰割所有”大模型SAM、超轻量PP-MobileSeg、工业质检工具、全景宰割计划,PaddleSeg全新版本等你来体验!通用信息抽取技术UIE公布!我的项目示例三侯家祺、徐瑞宁和秦一硕同学,选取的电影是《佛罗里达乐园》。通过图像与音频聚类,提取主题色和具备代表性的音效,而这些梦幻的色调和冷落的声音,精确反映了孩子们视听世界的特色。 三位同学的产品定位,则是通过 AR 交互式虚构恶作剧,来帮忙用户进入到《弗罗里达乐园》的世界,以第一视角体验各类恶作剧,取得解压。 这款多模态 AR 实景交互 AR 游戏,具备极强的电影内容关联性,借助 PaddleSeg 的能力,许多事实元素可能被主动拆散和提取,并融入到剧情,在用户与其交互过程中,产生更深层次的剧情体验。 我的项目示例四徐茗和陳珮雯同学,则是基于电影《浪矢解忧杂货店》多模态信息,打造了一款事实版 AI 浪矢爷爷。他们将电影海报中的“杂货店”,通过 ERINE-ViLG 进行了“翻新”;并提取了浪矢爷爷的回信文本,作为小样本数据集,在 AI Studio 大模型社区打造了雷同“话风”、同样可能进行回信的“AI浪矢爷爷”。 我的项目示例五杨若望、杜尧和刘先胜同学,从电影《阿凡达》中,提取了“冥想”的设计理念和独特的色调模式。利用文心跨模态大模型 ERNIE-ViLG ,团队的三位男生,通过简略的 prompt,就能为本人生成特定主题且具备肯定连续性的系列设计素材,成为本人产品中的要害元素减速了产品的创意表白。 因为篇幅无限,还有很多同样优良精彩的团队我的项目没有介绍,置信在将来,咱们将有更多的机会和场合进行分享。 北京邮电大学侯文军传授示意,大模型正在真真切切地驱动企业与产品的代际改革,并在理论落地的过程中,产生实在的价值。大模型+设计,将带来企业与产品改革的全新势能,这次校企交融的实际课程,让同学们发展前沿科技的利用摸索,产生丰硕的成绩,大家都获益匪浅。以后面向新一轮产业改革,更多的任何学科和产业,都将在大模型技术的推动下,迎来本人的“iPhone”时刻。 期待你的退出! 方才的我的项目,和“创意”很相干。说起“创意”,这里,咱们要显著地做一个广告了:欢送创意有限的你,带着幻想与技术,加入中国高校计算机大赛人工智能创意赛! 报名链接https://aistudio.baidu.com/aistudio/competition/detail/1026/0... ...

July 4, 2023 · 1 min · jiezi

关于paddle:基于多尺度图神经网络的流场预测实现精度与速度的平衡

我的项目简介本我的项目来源于飞桨AI for Science共创打算的论文复现赛题,复现论文为《AMGNET: multi-scale graph neural networks for flow field prediction》。该论文次要采纳图神经网络,因为在计算流体力学中计算域被网格离散化,这与图构造人造符合。论文中通过训练 CFD 仿真数据,构建一种数据驱动模型进行流场预测。本文将与大家分享基于飞桨实现该论文的复现过程,欢送大家一起沟通学习。 论文链接https://doi.org/10.1080/09540091.2022.2131737 原文代码https://github.com/baoshiaijhin/amgnet、 飞桨AI Studio - AI for Science 共创打算 AMGNET 论文复现https://aistudio.baidu.com/aistudio/competition/detail/1026/0... 硬件与框架本我的项目须要的硬件环境与框架要求如下所示: GPU Memory >= 8GB飞桨== 2.4.0Python ==3.7.4PGL == 2.2.4Matplotlib == 3.5.3pyamg == 4.2.3scipy本地装置通过以下指令实现飞桨以及各个库的装置。 conda create -n paddle_env python=3.7  conda install paddlepaddle-gpu==2.4.0 cudatoolkit=11.6 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/Paddle/ -c conda-forge   pip install pgl==2.2.4  pip install matplotlib==3.5.3  pip install pyamg==4.2.3  pip install scipy模型介绍模型框架AMGNET 是一种基于图神经网络的 CFD 计算模型,该模型能够预测在不同物理参数下的流场。图3.1为模型的网络结构图,该模型的基本原理就是将网格构造转化为图构造,而后通过网格中节点的物理信息、地位信息以及节点类型对图中的节点和边进行编码。接着对失去的图神经网络应用基于代数多重网格算法( Olson and Schroder, 2018 )的粗化层进行粗化,将所有节点分类为粗节点集和细节点集,其中粗节点集是细节点集的子集。粗图的节点汇合就是粗节点集,于是实现了图的粗化,放大了图的规模。粗化实现后通过设计的图神经网络信息传递块( GN )来总结和提取图的特色。之后图复原层采纳反向操作,应用空间插值法( Qi et al.,2017 )对图进行上采样。例如要对节点i插值,则在粗图中找到间隔节点i最近的k个节点,而后通过公式计算失去节点i的特色。最初,通过解码器失去每个节点的速度与压力信息。 图3.1 网络结构图 论文源码原文的代码总体上能够分为4个局部,别离是数据预处理、图粗化层、图卷积块和图复原层。如图3.2所示。 图3.2 原文代码构造原文 代码的关键技术要点如下: 编码节点的特色和边的特色:(进而将原始网格数据变换为图构造的数据。 应用代数多重网格算法进行图粗化,这个过程中存在大量的稠密矩阵乘法,例如:其中,A示意图的邻接矩阵。 在图复原层中,源代码采纳空间插值法进行上采样:其中,ri示意要复原的节点i的特色,wij示意节点i和节点j之间间隔的倒数。 飞桨复现的技术要点在模型中咱们须要应用图神经网络模仿网格,基于图这种数据结构模仿物理场的状态,于是咱们调用了飞桨的 PGL 库。因为模型进行图数据的粗化时进行了大量的稠密矩阵运算,为了进步运算效率,缩小运算工夫,咱们须要对图进行合并。然而 PGL 是以列表的模式存储图,所以在图数据进入模型之前须要预处理,如下: def forward(self, graphs):      batch = MyCopy(graphs[0])      for index, graph in enumerate(graphs):          if index > 0:              batch = Myadd(batch, graph)        latent_graph = self.encoder(batch)      x,p= self.processor(latent_graph)      node_features=self.spa_compute(x,p)      pred_field = self.decoder(node_features)        return pred_field 在基于代数多重网格的图粗化层中,咱们将图粗化到不同的尺度,而后应用 GN 块通过消息传递来总结和提取图的特色。与基于代数多重网格的图粗化层相比,图复原层采纳反向操作。在图复原层中,咱们应用空间插值办法对图进行上采样,空间插值法的实现如下: def knn_interpolate(features, coarse_nodes, fine_nodes):      coarse_nodes_input = paddle.repeat_interleave(coarse_nodes.unsqueeze(0), fine_nodes.shape[0], 0)       fine_nodes_input = paddle.repeat_interleave(fine_nodes.unsqueeze(1), coarse_nodes.shape[0], 1)       dist_w = 1.0 / (paddle.norm(x=coarse_nodes_input - fine_nodes_input, p=2, axis=-1) + 1e-9)        knn_value, knn_index = paddle.topk(dist_w, k=3, largest=True)       weight = knn_value.unsqueeze(-2)      features_input = features[knn_index]      output = paddle.bmm(weight, features_input).squeeze(-2) / paddle.sum(knn_value, axis=-1, keepdim=True)      return output   应用代数多重网格算法对图进行粗化时,波及大量的稠密矩阵乘法,于是咱们调用了 scipy.sparse 库。然而 scipy.sparse 库中的.dot 办法和现在大部分深度学习框架中的稠密矩阵乘法不同,后者会保留一些0,而前者只存非零值。这种差别会导致数据维度不统一,进而影响之后的操作。针对这个问题,咱们提出了两种解决方案,第一种是采纳填充的办法保持数据维度,第二种是采纳编码器与解码器将特色维度进行压缩。其中第一种办法与代数多重网格算法保持一致,精度较高。第二种办法进步了约20倍的训练速度,然而均方根误差会略高。两种计划的代码如下: ...

July 3, 2023 · 1 min · jiezi

关于paddle:科创中国大湾区青年百人会论坛成功举办

2023年6月28日,“科创中国”大湾区青年百人会论坛在香港科技大学(广州)胜利举办。多位大湾区卓越的青年学者齐聚现场,独特分享和研究大湾区科研成果和发展趋势,线上线下共吸引了数千人次参加盛会。本次论坛以“湾”通世界、青年领航为主题,由“科创中国”青年百人会、广东省科学技术协会、广州市委人才办领导,广州市科学技术协会、“科创中国”大湾区青年百人会主办,深圳市科学技术协会、珠海市科学技术协会、京港学术交流核心、澳门科学技术协进会、中山市科学技术协会、东莞市科学技术协会、佛山市科学技术协会、肇庆市科学技术协会、江门市科学技术协会协办,香港科技大学(广州)、粤港澳大湾区科技协同翻新联盟等作为反对单位,广州科奥信息技术有限公司、北京百度网讯科技有限公司、广州趣丸网络科技有限公司等作为技术支持单位。 汇聚青年智慧,“科创中国”大湾区青年百人会正式成立开幕式上,广东省科学技术协会党组书记、副主席郑庆顺现场致辞,“科创中国”青年百人会主席团成员兼秘书长、中国科学技术协会科学技术流传核心副主任陈锐发表视频致辞,对本次论坛的顺利召开表示祝贺。 广东省科学技术协会党组书记、副主席郑庆顺现场致辞 “科创中国”青年百人会主席团成员兼秘书长、中国科学技术协会科学技术流传核心副主任陈锐视频致辞 随后,“科创中国”大湾区青年百人会揭牌典礼隆重举行。广东省科学技术协会党组书记郑庆顺、广州市科学技术协会党组书记徐柳、深圳市科学技术协会副主席石兴中、珠海市科学技术协会党组书记、主席刘治民、 “科创中国”青年百人会助理秘书长、世界工程组织联合会中委会副秘书长杜新峰、中共广州市委组织部人才一处处长董博、京港学术交流核心总裁徐海山、澳门科学技术协进会副理事长崔天佑、湾区青百会轮值主席袁玉宇等独特为“科创中国”大湾区青年百人会揭牌,并为大湾区青百会会员颁发了证书。 “科创中国”大湾区青年百人会揭牌典礼 据悉,“科创中国”大湾区青年百人会(下称“大湾区青百会”)是首家区域性分割服务青年科技工作者的翻新组织,将踊跃助力大湾区高质量倒退。“科创中国”青年百人会秉承“科技扭转世界、青年引领将来”的核心理念,致力于构建更加平面、凋谢、鲜活的青年价值共同体,为各地科技经济交融倒退提供青年组织人才撑持。“科创中国”大湾区青年百人会的正式成立,将无效助力推动大湾区高质量协同倒退。开幕式上还举办了“科创中国”翻新基地授牌典礼、穗港澳青年科技人才托举我的项目启动典礼、广州市最新科技、人才等政策推介等精彩环节。 “科创中国”翻新基地授牌典礼 穗港澳青年科技人才托举我的项目启动典礼 激荡学术火花,主题圆桌论坛精彩纷呈在论坛宗旨报告环节,全国人大代表、广州迈普再生医学科技股份有限公司创始人、董事长,粤港澳大湾区高性能医疗器械翻新核心主任袁玉宇,香港特别行政区立法会议员、香港人工智能州实验室董事局成员执行董事尚海龙,香港科技大学(广州)协理副校长伍楷舜缺席并别离作宗旨报告。 全国人大代表、广州迈普再生医学科技股份有限公司创始人、董事长,粤港澳大湾区高性能医疗器械翻新核心主任袁玉宇 香港人工智能州实验室董事局成员执行董事尚海龙 香港科技大学(广州)协理副校长伍楷舜 圆桌论坛环节从“翻新攻关”“湾区协同”“智能涌现”三个主题研究方向登程,与会专家学者代表从各自业余畛域的角度,为推动守正翻新、建设科技强国建言献策,分享远见卓识,激荡翻新思维,进行了精彩的学术讨论。 本次“科创中国”大湾区青年百人会论坛的胜利召开,为大湾区青年学者大搭建了一个内容丰盛的、高水平、国际化的学术交流平台,有助于施展大湾区青年人才汇集劣势,打造粤港澳大湾区高水平人才培养洼地,对粤港澳大湾区的高水平人才培养、科技与经济高质量倒退起到无力的促进作用。

July 2, 2023 · 1 min · jiezi

关于paddle:98位企业技术高管入学百度AICA-大模型带来AI人才三大能力要求

2023年6月30日,由深度学习技术及利用国家工程钻研核心与百度联结开办的 AICA 首席AI架构师造就打算,迎来第7期开学典礼。98位企业 CTO、科学家以及技术高管学员从500多位报名者中怀才不遇,将发展为期半年的人工智能前沿技术与利用的学习实际,成为各行业畛域大模型产业落地的领军人才。 AICA 首席AI架构师造就打算第7期开学典礼开学典礼上,百度团体副总裁、深度学习技术及利用国家工程钻研核心副主任吴甜在致辞时示意,人工智能技术的强通用性让其可能赋能千行百业,而产业智能化的要害是各行业中原有的各业余技术人才,在人工智能和实体经济交融的大势中可能成为借助AI技术解决业务理论问题的新型复合型人才。AICA首席AI架构师造就打算就是在为行业造就输送这类人才,同时还为人才提供了趁手的利器,包含飞桨深度学习平台和文心大模型系列,特地是大语言模型文心一言能了解、能写作、有逻辑、有情感,也将在与行业深度联合的过程中充分发挥逻辑思维、推理决策等劣势能力,带来新的价值设想空间。据介绍,文心已对外提供37个大模型,涵盖自然语言解决大模型、视觉大模型、跨模态大模型、生物计算大模型等。基于飞桨与文心大模型联结优化,文心大模型已迭代至3.5版本,与3月份的3.0版本相比,训练速度晋升了2倍,推理速度晋升了17倍,模型成果累计晋升超过50% 百度团体副总裁、深度学习技术及利用国家工程钻研核心副主任吴甜AICA 我的项目自2019年首期启动以来,已向业界输送了322位AI架构师。第7期堪称大模型时代的首期AI架构师培训班,从学员背景与学员课题上可窥见大模型影响水平之深。一方面,大模型已成为产业智能化新引擎,撬动智能化技术与实体经济深度交融。7期班学员的背景教训和研究课题向着更利用化、工程化方向的穿插交融扩大。另一方面,大语言模型、多模态大模型以及行业大模型的课题大量涌现,如何将大模型技术红利转化为市场竞争力成为企业的迫切课题。AICA 7期学员有71%来自国家电网、三峡团体、工行、农行等央国企,以及壳牌、海尔、美的、招行等上市公司,还首次录取了21家行业外围一级利用服务商。学员行业笼罩能源、智能制作、金融之外,新增大量汽车交通、企业服务畛域头部企业,如公众、宝马、吉利、比亚迪、南航、用友网络、莱顿汽车等。学员中企业 CTO 与科学家等高级技术管理者占比达到93.2%,创 AICA 新高。据理解,在学制方面,百度为 AICA 学员设置了“专家授课、全程助教、小组探讨”的三师教学模式,第7期又首次增设了“特聘专家团”,首批12位特聘专家包含行业首领、出名学者、高校专家,以及在特定畛域有着卓越成就的专家,不仅在人工智能学科知识上具备高水平,而且在行业中享有很高的名誉和影响力。他们将为学员提供独特的行业洞察、实践经验和最新的技术趋势解读。这将有助于晋升学员的业余素养和竞争力,为他们在职业倒退中打下松软的根底。 产业智能化浪潮下,行业专家的远见卓识愈发重要。作为特聘专家团成员代表,华北电力大学副校长房方在开学典礼现场分享了能源行业对于人工智能技术的需要,华北电力大学与百度在AI人才培养方面的单干,以及面向未来基于大模型的一些探索性思考,引起现场电力行业背景学员的共鸣。开学典礼上还有来自北京电信、中国财产再保险、信雅达、中国电子、软通能源、NI中国仪器等12位 AICA 往期优良学员成为“航行助教”,将为 AICA 7期班学员提供帮忙,独特推动AI新倒退。大模型减速产业智能化,对复合型AI人才提出了更高、更新的要求。百度AI技术生态总经理马艳军在主题分享时提出,AI架构师要具备业务、算法和架构三方面的能力,现在将围绕利用重构、大模型技术、大模型套件三大外围因素进行能力晋升。一是将大模型与本身业务联合,更好的做利用重构,施展大模型能力;二是把握大模型背地的预训练、精调等关键技术,知其然更知其所以然;三是把握更好用、更晦涩、更高效的工具,实现大模型的数据处理、精调、压缩、部署、场景化等工作,把大模型真正落地用起来。流动最初,百度飞桨总架构师于佃海为学员们带来 AICA 开学第一课《深度学习再意识》。他从AI技术的历史演进、大模型新范式、业务利用落地等三个视角深刻解说了深度学习技术的实质,并指出须要用AI原生思维驱动技术产品的改革,重构技术架构和产品体系。由大模型驱动的全球性AI再造正在更广维度、更深层次上席卷各行各业。在这场前所未有的生产力改革中,百度 AICA 首席AI架构师造就打算致力于帮忙个体成为人才,帮忙企业造就、汇聚人才,以人才激活中国企业,紧抓大模型时代红利,继续发明不可估量的增量价值。

July 2, 2023 · 1 min · jiezi

关于paddle:用AI抽丝剥茧让法律监督提质增效守护社会和谐安宁

人工智能时代下,检察官用什么工具能更好地晋升办案品质和效率,为依法治国奉献检察力量?这个问题,嘉诚信息正在与其所服务的人民检察院一起交出答卷。作为国家的法律监督机关,人民检察院对司法机关、国家工作人员职务犯罪和公民违法犯罪行为进行监督。随着社会倒退,检察机关法律监督工作面临更高的要求。2021年6月党中央印发《中共中央对于增强新时代检察机关法律监督工作的意见》,明确要求“全面晋升法律监督品质和成果”。在此领导意见下,最高检于2022年推动施行“数字检察策略”, 强调数字技术和检察工作深度交融,放慢推动法律监督模式重塑改革,推动溯源治理,实现从个案办理到类案监督再到零碎治理,让法律监督更好地服务社会治理。嘉诚信息,一家致力于通过大数据、人工智能等技术助力客户实现数智化转型的公司,依靠本身大数据积攒劣势与粗浅的行业了解洞察,应用飞桨自然语言解决模型库PaddleNLP和基于文心大模型的通用信息抽取模型ERNIE-UIE,以“法律文书非结构化数据挖掘”为切入点,研发大数据法律监督解决方案继续服务全国检察机关,独特实际走通了以“数字反动”驱动新时代法律监督整体提质增效之路。 实现溯源治理,找到“结构化数据”是要害溯源治理,是指在法律监督过程中追溯源头,不仅仅是办理眼前的一个案子,更要发现同类型案件法则,“从个案到类案”,从而针对性地制发检察倡议,从制度和流程上推动类型案件深层起因的解决,助推社会治理现代化。习近平总书记强调:“法治建设既要抓末端、治已病,更要抓前端、治未病。”因而溯源治理尤为重要。 从个案到类案,践行溯源治理 如何实现从个案到类案的转变?检察机关工作人员首先面临的难题是怎么从浩如烟海的各类法律文书中发现有价值的案件监督线索。 “大量的案件材料通常以文本文书的形式存在于外部或公开信息中,这些非结构化的材料当中包含许多‘要害因素’,如案发地点、行政区划、相干金额、诉讼当事人等等,而与类案共性相干的高价值线索就散落其中。”嘉诚信息上海翻新研究院副院长崔放介绍道,“以往检察官只能一个一个地去看案件材料、辨认要害信息,发现类案监督线索的难度较大。随着数字检察策略的提出,咱们紧跟检察机关工作需要,用大数据、人工智能技术把‘非结构化数据’进行要害因素提取后成为 ‘结构化数据’,从而极大地升高检察官的线索发现难度,晋升类案线索剖析和发现的效率。” 案件线索纷繁复杂,如何疾速找到要害因素? 例如,嘉诚信息曾胜利帮助某地检察机关办理套路贷虚伪诉讼案件。此类案件次要内容为同一当事人起诉不同原告,在法院的民事裁判文书中蕴含借款详情信息,未经提取前便是“非结构化数据”。检察官独自去看一份一份的民事裁判文书,很难发现各个案件之间暗藏的关联性,监督难度大。但当从百万级的裁判文书中提取出一些“结构化数据”,如单方当事人身份信息、原被告出庭状况、借款详情后,当地检察院发现有很多雷同身份信息的人或公司在继续起诉不同的原告,原告大多不出庭,并且通过剖析比照,发现大多数为重复使用借条或额定收取费用,从而进步原告还款额度。因而,这些结构化数据形成了很显著的监督线索,检察院判断相干案件波及虚伪诉讼, 提出抗诉和再审检察倡议,并向法院制发类案监督检察倡议,向市场监督管理局制发社会治理检察倡议,倡议其增强公司企业监管,摸排涉嫌“套路贷”违法犯罪公司,查处守法违规公司企业,保障了法律的偏心公正。 基于飞桨和文心大模型造“永动机”! 全国1亿案件1个月跑完,用200+法律监督模型助力数字检察嘉诚信息的团队中有很多业余法学背景的成员,并继续投入大量精力进行案件钻研,使团队和检察机关工作人员沟通更高效,能更好地把行业需要转化为模型开发逻辑;另一方面,公司从2017年就开始数据积攒,通过对公开数据中波及各种监督模型的要害因素继续开掘,打下了良好的法律监督大数据根底。然而在非结构化数据提取技术上,因为进入行业较早,市场中可外采的解决方案较少,团队决定采纳自研的形式来训练法律监督模型。最后嘉诚信息采纳传统的信息抽取技术,因过程中须要大量的文本标注工作,还专门组建了十几个人的数据标注团队,但模型准确度始终不够现实。尤其是2021年随着公司业务拓展至全国范畴后,业务量和数据量大幅减少,客户对产品的要求也越来越高,传统的信息抽取技术再难以满足业务需要。“起初咱们进行了整体的调研比照,最终抉择了百度飞桨。首先它是开源的,协定对商业化也很敌对。技术上,飞桨和基于文心大模型的通用信息抽取模型ERNIE-UIE给了咱们很大的惊喜,想不到竟然会有这么好的成果。”崔放介绍道,“以前不了解大模型,晓得ERNIE-UIE当前甚至感觉有些不堪设想。它对标注数据量要求非常少,以前咱们须要标注几千上万个数据,当初只需标注30-50个就曾经很好地实现了法律文书数据提取,且模型精度由原先的70%晋升至91%。 咱们之前的十几个数据标注人员,当初曾经全都转型为法研和项目管理人员,为公司施展了更大价值,也播种了集体职业成长。”嘉诚信息的大数据法律监督解决方案当中,有一款专门针对民事的法律监督产品,开发过程中应用ERNIE-UIE体现极为优良。很多民事虚伪诉讼波及全国跨区域作案,因而构建一个全国范畴的案件库十分必要,而将所有相干案件会集后,总数量超过1亿。崔放介绍:“以前咱们是不敢去跑全国的案件线索的,都是一个市一个市地去跑,因为数据挖掘是有工夫需要的,如果要跑全国,可能2、3年都不肯定能跑完。当初借助飞桨和ERNIE-UIE,咱们构建了一个24小时的‘永动机’机制,继续去跑全国线索。最终应用ERINIE-UIE的nano模型,一个月左右就能够跑完全国1亿案件的数据循环, 这才得以开发出极高效能的民事法律监督产品,晋升检察机关监督效率。比方咱们和某区基层人民检察院单干,为其提供了民事检察监督助手零碎,检察官在应用当前,3个月办理民事监督案件72件,数量是过来3年的总和。” 飞桨自然语言解决模型库PaddleNLP的通用信息抽取模型ERNIE-UIE,以文心大模型为根底,在没有业余团队的状况下,应用小样本训练,进行定制化开发,能够大量节俭标注老本。ERNIE-UIE提供了base、medium、mini、micro、nano等多模型尺寸抉择,可满足精度和速度的不同要求。具体来说,嘉诚信息技术计划演绎为如下步骤: 数据筹备阶段 数据采集、标注和加强。从公开的合规网络路径获取数据用于钻研,利用Python、Flink程序等脚本,对标准数据的格局进行解决。再结合实际抽取需要对畛域数据进行标注,通过PaddleNLP提供的数据协定将标注数据转为ERNIE-UIE模型训练的数据格式; 训练阶段 基于ERNIE-UIE nano在畛域标注数据上对模型进行微调; 模型部署阶段 训练实现后,将模型部署到飞桨预测的服务器上。通过调用ERNIE-UIE进行信息提取,再将抽取到的实体、关系等结构化数据作为根底标签供业务模型应用,实现NLP性能的部署。 技术计划流程图 目前,嘉诚信息通过和全国多家检察机关的密切配合,大数据法律监督解决方案在刑事检察、民事检察、行政检察、公益诉讼检察、未成年人检察等畛域积攒了200余个成熟的法律监督模型,反对与其余大数据监督模型零碎对接,提供模型上传、共享、整合、本地化利用能力。服务覆盖全国25个省市县区的近800家检察院,把检察官从绝对简略、繁冗、反复的劳动中解脱进去,让检察官有更富余的工夫和精力把检察智慧用在法律监督的提质增效上。 嘉诚信息数字检察业务全景 继续翻新,让技术更易用。 赋能党政机关、企事业单位数智转型 发明社会价值让技术更便捷易用,从而更好地服务检察机关工作人员,发明真正的利用价值,是嘉诚信息长久以来继续翻新的方向。 在底层技术方面,嘉诚信息自主研发“慧眼预警指数”、“时空数据分析”两大技术,与“非结构化数据转结构化数据”一起,形成了助力检察机关实现监督线索发现的外围技术壁垒。在数据转为结构化数据后,通过“慧眼预警指数”, 联合不同案件类型须要的统计数据维度,造成新的因素规定,从而实现不同类型案件的数据关联机制,达到预警成果。同时,通过“时空数据分析”技术,将大量相干数据进行统计,如大量个案的案发地点辨认后,转变为经纬度投放到地图上,清晰显示案件的地理位置汇集状况,从而帮忙检察机关从时空角度发现案件关联的同一时间段类似特色线索的关联性和真实性。在利用侧,嘉诚信息继续优化应用体验,翻新开发了“因素检索模式”和“可视化常识图谱”工具。“因素检索模式”即为将提取进去的外围因素以标签模式可视化地出现在检察官眼前,检察官能够联合不同类型案件需要,通过鼠标点击的形式来组合相干标签,比方套路贷案件,检察官能够抉择“当事人未出庭”、“民间借贷”、“某贷款公司”等标签,实现对此类案件的疾速检索。“可视化常识图谱”则是在ERNIE-UIE信息抽取的根底上,进一步做了线索的可视化解决。最常见的利用场景就是将被告、原告、律师、法官信息等人和案信息提取进去,造成参与方关系网,帮忙检察官发现简单关系网背地的潜在线索。 一案多连可视化常识图谱:体现法官、律师、第三人关联,诉讼人关联在此基础上,嘉诚信息助力各地检察机关办理了多起极具社会意义的类案。如在外卖平台横蛮成长期间,通过大数据平台模型,与某市人民检察院单干,基于外卖商家公示的数据分析,为检察院提供了一系列不合规商家清单,从而促成了当地的食药监部门对于网络外卖餐饮监管的增强。又如与某市人民检察院单干,开发校园周边违规经营监督模型,帮忙检察机关及时发现监督校园周边守法设置的娱乐场所、酒吧、烟酒及彩票销售点等不合适未成年人流动场,该案例被最高检评为大数据赋能未成年人监督的全国典型案例之一。除了继续赋能检察机关,嘉诚信息也将产品、服务及解决方案拓展至更多党政机关、企事业单位,截至目前,嘉诚信息产品、服务及解决方案已利用于全国30个省份、自治区及直辖市,以智慧政务、网络安全为两大外围业务版块,服务客户涵盖党委、政府、检察院、法院、司法监狱、生态环境、自然资源、卫生医疗、金融、教育等多个畛域,携手实现更宽泛的社会价值。“我本人是做技术出身,最开始就是心愿通过技术的力量去解决一些问题,让社会变得更好。”崔放介绍到,“而随着教训的增长,我意识到仅仅凭技术是无奈促成社会公共利益和国家利益爱护的,但如果咱们能将技术赋能到行业,把检察院、法院等政法机关客户服务好的话,就能够一起为这个社会、为国家、为咱们的公众利益作出贡献。这也是嘉诚信息翻新倒退的源能源。”将来,嘉诚信息还将继续在技术创新上发力,除文本信息提取,还将拓展到图片、视频等要害信息的提取。而飞桨与文心大模型也将继续携手更多行业搭档,独特助力政法行业应用人工智能技术实现质效晋升。正如崔放所说,“把法律人工智能倒退得越来越好,让法律制度的感性之光和科学技术的智慧之光交相响应,大放异彩。”

June 30, 2023 · 1 min · jiezi

关于paddle:零样本视频生成无压力基于飞桨框架实现Text2VideoZero核心代码及依赖库

我的项目背景继 AI 绘画之后,短视频行业正迎来 AI 智能创作的新浪潮。AI 智能创作正在各个方面为创作者和用户带来新的体验和价值。AI 动漫视频、AI 瞬息宇宙、AI 视频风格化等诸多创作性能不仅为视频内容创作提供了全新灵感,而且大大降低了用户创作的门槛,进步了视频生产效率。 然而,现有的文本-视频生成办法须要极其昂扬的计算资源和超大规模的文本-视频数据集(如:CogVideo、Gen-1),对大多数用户来说,老本较高。此外,很多时候单纯应用文本提醒生成视频,生成的内容较为形象,不肯定合乎用户的需要。因而,在某些状况下,用户须要提供参考视频,并通过文本提醒来疏导模型进行文本视频生成。与之对应,Text2Video-Zero 能够通过静止动力学(motion dynamics)、帧间注意力机制(frame-level self-attention)等技术手段对原始的文本-图像模型进行批改,使其能够实现文本-视频工作,且不需任何训练,是一种非常现实的文本-视频生成办法。本我的项目基于飞桨框架实现了 Text2Video-Zero 的外围代码及依赖库,并通过 PPDiffusers 的文本-图像生成模型实现了文本-视频生成、文本-视频编辑、姿势疏导的文本-视频生成、边缘疏导的文本-视频生成、深度图疏导的文本-视频生成、边缘疏导和 Dreambooth 定制的文本-视频生成在内的全副视频生成模块,并将该成绩开源在 AI Studio 上。该实现对丰盛飞桨 AIGC 生态具备极大的意义。 大模型专区 Text2Video-Zero-零样本文本到视频生成(上) https://aistudio.baidu.com/aistudio/projectdetail/6212799 大模型专区 Text2Video-Zero-零样本文本到视频生成(下) https://aistudio.baidu.com/aistudio/projectdetail/6389526 模型原理Text2Video-Zero 以随机采样潜在编码  为终点,应用预训练的 Stable Diffusion 模型(SD),通过 DDIM 反向流传  步来取得 。对于每一帧 k,作者应用变形函数将变换为,从而取得特定的运动场后果。通过应用静止动力学对潜在编码进行加强,模型能够确定全局场景和相机静止,从而实现背景和全局场景的工夫一致性。之后,作者应用 DDPM 前向流传对潜在编码  , k=1,…,m 进行传递。这里,概率 DDPM 办法能够实现更大自由度的物体静止。而后将潜在编码传递到应用帧间注意力机制批改后的 SD 模型中,帧间注意力机制应用第一帧的 key 和 value 来生成整个视频序列的图像。通过帧间注意力机制,前景物体的身份和外观能够在视频序列中保留。不仅如此,作者还对生成的视频序列应用了背景平滑技术。具体来说,作者应用显著指标检测来取得每一帧 k 中暗示了前景像素的掩码  ,并应用第一帧变换到第 k 帧的潜在编码  和潜在编码  来进一步提高掩码  中背景局部的工夫一致性。该办法的整体架构图如下: 图1 Text2Video-Zero 模型的整体架构图 因为 Text2Video-Zero 是一种通过对文本-图像模型进行零样本微调来生成视频的 AIGC 模型。因而,本我的项目会波及到很多预训练的文本-图像生成模型,包含 Stable Diffusion V1.5、Instruct-Pix2Pix 、ControlNet 和张一乔老师(AI Studio昵称为笠雨聆月)的诺艾尔 Dreambooth 模型。其中,Stable Diffusion V1.5 模型用于文本-视频生成,Instruct-Pix2Pix 模型用于文本-视频编辑,ControlNet 模型用于姿势疏导的文本-视频生成,边缘疏导的文本-视频生成和深度图疏导的文本-视频生成,诺艾尔 Dreambooth 模型用于边缘疏导和 Dreambooth 定制的文本视频生成。所有开源模型附在文章最初,在此也对所有开源贡献者示意衷心感谢。 ...

June 29, 2023 · 2 min · jiezi

关于paddle:AI克隆歌手AI配音AI届老牌顶流语音合成玩出新高度

热度与争议并存!AI孙燕姿成新晋顶流? 随着AI孙燕姿的爆火,AI老牌顶流「语音合成」再度被炒热 飞桨AI Studio也汇聚着泛滥“语音合成”深度玩家 本期就来带大家疾速上手 AI克隆歌手该利用我的项目应用AI孙燕姿同源模型So-VITS-SVC 4.0,其原理为音色转换,将一首歌的音色替换为另一个人的音色。利用作者制作出AI克隆歌手作为演示demo,可进入我的项目链接查看具体教程,克隆任意音色发明你的AI歌手。 开发者:梅花三弄再聚首 我的项目链接 https://aistudio.baidu.com/aistudio/projectdetail/6393188 视频MV成果 https://www.acfun.cn/v/ac41696803 听书朗诵大会该利用我的项目应用PaddleSpeech制作而成,为在线体验版本,反对体验多种声学模型与声码器,同时能够fork我的项目将其微调训练为AI配音员。朗诵听书再也不须要下载一堆软件了,连忙收费用起来! 开发者:ASman 我的项目链接 https://aistudio.baidu.com/aistudio/projectdetail/6441519 克隆音色训练模型想要更灵便、更自在、更定制化的玩语音合成?那还是连忙看看baseline!间接网页端就可进行训练微调,反对小样本训练! 创始作者:飞桨PaddlePaddle 我的项目链接 https://aistudio.baidu.com/aistudio/projectdetail/5003396 语音合成特典如上,更多语音合成优质我的项目欢送大家摸索飞桨AIStudio,更欢送语音合成的玩家们退出飞桨AI Studio!大家在玩语音合成时肯定要留神版权与隐衷问题哦。 现也向各位AI利用玩家发动征集令,邀请大家玩起来!创作可间接体验的利用! 文生文、文生图、创意、工具等多个创作专区等你退出!更有丰富处分! 点击下方链接退出创作激励 https://aistudio.baidu.com/aistudio/cooperate/appcreation

June 29, 2023 · 1 min · jiezi

关于paddle:AI药物研发大赛培训来啦清华博导讲解高分基线等你来Fork

首届寰球AI药物研发算法大赛,是由清华大学药学院、百度飞桨、百度智能云和临港实验室独特主办,并失去中国药学会等单位大力支持的一项全球性技术创新大赛。旨在借助百度飞桨在生物计算方向上的算法劣势,通过AI Studio平台,摸索AI+药学畛域前沿技术,开掘和培养优秀人才。上线一个月以来,吸引了来自全国200余所高校、100余企业的500余支队伍、600余名选手加入。 赛题背景 新冠病毒(SARS-CoV-2)自从其首次暴发以来,迅速成为寰球关注的焦点。为了抵挡新冠病毒的攻打,理解病毒的复制和感化机制至关重要。主蛋白酶(main protease, 简称M pro)是新冠病毒的要害酶,负责在感化过程中剪切病毒产生的蛋白质前体,促成病毒的复制。  主蛋白酶因其在病毒生命周期中的关键作用,成为潜在的医治靶点。克制该酶的活性能够无效烦扰病毒的复制过程,从而提供一种潜在的医治办法。 其中,人工智能的筛选办法,利用机器学习和深度学习技术,剖析大量构造和活性数据,从而实现对小分子与主蛋白酶之间相互作用的预测。 本次较量旨在激励参赛者利用人工智能办法,挖掘医治新冠病毒的潜在药物。 赛题链接 https://aistudio.baidu.com/aistudio/competition/detail/1012/0... 赛段设置 赛题工作解析初赛阶段大赛提供小分子对新冠病毒主蛋白酶的克制活性数据,参赛选手能够应用深度学习、分子对接等办法进行建模,预测小分子克制主蛋白酶活性的概率。 即给定分子(SMILES),预测克制主蛋白酶活性的概率。 复赛阶段大赛提供小分子在Caco细胞上克制新冠病毒复制的活性数据,参赛选手须要基于PaddlePaddle进行模型的设计和训练,预测小分子在Caco细胞上克制新冠病毒复制的概率。 即给定分子(SMILES),预测Caco细胞上克制新冠病毒复制的概率。 评估指标本次较量选用AUC(ROC曲线下面积)和AP(PR曲线下面积)的平均值作为评估指标。 $$\text { score }=\frac{1}{2}(A U C+A P)$$ Baseline链接 https://aistudio.baidu.com/aistudio/projectdetail/6251614?sUi... 赛题培训7月1日(本周六)晚七点,入门培训来了!为了帮忙更多新同学理解和入门较量,本次培训特邀清华大学药学院研究员、博士生导师田博学、清华大学药学院博士生陈靖轲、百度飞桨Jungle老师负责讲师!率领同学们深刻理解本次赛题工作的产业背景、赛题工作和破题技巧,逐行了解baseline的全流程代码! 田博学清华大学药学院研究员,博士生导师,次要从事计算化学和计算生物学相干钻研。 陈靖轲,清华大学药学院博士生 零根底入门,一举通关较量工作! 点击下方链接,立刻报名较量!https://aistudio.baidu.com/aistudio/competition/detail/1012/0...

June 29, 2023 · 1 min · jiezi

关于paddle:清微智能TX5368A与飞桨完成Ⅱ级兼容性测试助力全行业智能化升级

近日,清微智能的高性能视觉芯片TX5368A与飞桨实现Ⅱ级兼容性测试(基于Paddle2ONNX工具)。测试结果显示,单方兼容性体现良好,整体运行稳固。这是清微智能退出“硬件生态共创打算”后获得的又一阶段性成绩。 产品兼容性证实 本次Ⅱ级兼容性测试实现了对计算机视觉技术畛域总计10个模型的验证。通过单方联结严格测试表明,清微智能TX5368A在GhostNet、PP-OCRv3、MobileNetV2等模型上的精度、速度等各方面性能体现满足要求,与飞桨的兼容性良好,整体运行稳固,达到了Ⅱ级适配互认要求,推理性能能够满足用户的利用需要。 对于清微智能清微智能是可重构计算(CGRA)企业,致力于以可重构计算打造灵便、高性能的芯片产品,以“芯片+”驱动万物智能。外围团队来自于清华大学以及海思、英伟达、苹果、AMD等知名企业,专一于可重构计算芯片的翻新研发和产业利用。面向云端训推一体,边端机器视觉等智能计算场景,提供高性能算力反对,致力于打造自主可控的可重构通用计算生态。 TX5368A是清微智能旗下面向AIoT端的挪动AI芯片TX5系中的一款高性能的视觉解决芯片。产品集成了功能强大的可重构计算(CGRA)架构ISP,AI计算无效能效比最高可达10TOPS/W,典型功耗仅1W。基于高性能人工智能减速引擎RNE以及通用计算减速引擎RCE,TX5368A在计算机视觉解决、低码率、高画质、智能解决和剖析等方面具备高性能的体现。 清微智能TX536智能芯片 清微智能 & 飞桨“可重构计算架构灵便通用,被行业内称为第四代通用处理器架构。基于可重构计算的芯片产品疾速与百度飞桨实现适配兼容,是单方在推动AI软硬件生态协同倒退愿景下共同努力的后果。”清微智能相干负责人示意:“基于已有工具链技术积攒和生态根底,从边缘端向云端扩大,清微智能将与百度飞桨团队开展更加深刻的单干。清微智能面向云端的训推一体芯片TX8系列采纳数据驱动、动静重构的空域计算模式,面向大模型的训练和推理,以高度拓展的软硬件能力,实现跨服务器、跨机架间接连贯,达到近似算力线性扩大的成果。基于此,将来单方将面向各行业畛域打造更宽泛的通用计算能力,为AI利用提供助力,推动全行业的智能化降级。” 飞桨(PaddlePaddle)以百度多年的深度学习技术钻研和业务利用为根底,集深度学习外围训练和推理框架、根底模型库、端到端开发套件、丰盛的工具组件于一体,是中国首个自主研发、功能丰富、开源凋谢的产业级深度学习平台。目前,飞桨已凝聚535万开发者,基于飞桨创立67万个模型,服务20万家企事业单位。与飞桨适配的国内外芯片/IP厂商曾经超过40家,飞桨与硬件厂商的单干也进入了新阶段。2022年,飞桨携手国内外近30家硬件厂商联结公布硬件生态共创打算,联合搭档自有软硬件根底开发栈特色,针对不同利用场景和产品,独特推出厂商定制版飞桨框架,建设开源凋谢模型库,开发课程与培训内容等,以更好地服务开发者。\将来飞桨将联结更多硬件搭档通过技术的联结研发和生态共建,一起开辟更多软硬件协同的产品和性能,共创单干共赢生态模式。在此,飞桨诚邀更多企业退出硬件生态共创打算,聚生态之力,独特打造软硬一体的全栈式人工智能平台,促成人工智能产业链高质量倒退。 点击下方链接申请加入“硬件生态共创打算” https://www.paddlepaddle.org.cn/hardware_co_creation

June 29, 2023 · 1 min · jiezi

关于paddle:天数智芯通用GPU产品天垓100与飞桨完成III级兼容性测试加速人工智能产业生态建设

近日,上海天数智芯半导体有限公司(以下简称“天数智芯”)通用 GPU 产品天垓 100 与飞桨已实现 III 级兼容性测试。测试结果显示,单方兼容性体现良好,整体运行稳固。这是天数智芯退出“飞桨硬件生态共创打算 ”后的阶段性成绩。 产品兼容性证实本次 III 级兼容性测试蕴含自然语言解决、计算机视觉、智能举荐、智能语音及强化学习五大技术畛域的模型验证。通过单方联结严格测试表明,天数智芯的天垓 100 产品在 Transformer、BERT、ResNet50、PP-YOLOE、ERNIE 3.0、GPT-2、FFM 等模型上的精度、速度等各方面性能体现满足要求,与飞桨的兼容性良好,整体运行稳固,达到了 III 级适配互认要求,性能能够满足用户的利用需要。 对于天数天数智芯的天垓 100 是量产的通用 GPU 产品,采纳 7 纳米制程工艺和 2.5D CoWoS 晶圆封装技术,集成 240 亿晶体管,反对多精度数据类型规范/混合训练,提供片间互联扩大。以后,天垓 100 已撑持近百个客户在人工智能畛域进行超过两百个不同品种模型训练,ResNet50、SSD、BERT 等骨干网络模型的性能比肩国内市场主流产品。此外,天垓 100 还广泛支持传统机器学习、数学运算、加解密及数字信号处理等畛域,率先适配 X86、ARM、MIPS 等各种类型 CPU 架构的国产通用 GPU 产品。自量产以来,天垓 100 深受各畛域客户宽泛好评,触达客户超 400 家。 天数&飞桨天数智芯产品线总裁邹翾示意,天垓 100 与百度飞桨在短短 3 个月之内实现 III 级适配,得益于天数智芯 GPU 架构的通用、易用性,更离不开百度飞桨团队的大力支持。天数智芯器重和各生态合作伙伴的携手共进,而百度飞桨是天数智芯的长期合作伙伴,彼此对将来有着独特的愿景。国内 AI 行业的向前是软硬件协同倒退的后果,后续天数智芯将与百度飞桨团队持续放弃深度单干,致力于搭建和欠缺国内的 AI 软硬件生态。基于此次兼容性测试,单方将继续施展各自软硬件产品劣势,实现强强联合,独特打造合乎市场需求的利用解决方案。此外,也将进一步推动产品多场景、规模化利用,减速推动人工智能产业生态建设。将来,单方将进一步增强联动,用更可信、更高效、更绿色的算力与算法赋能各行各业智能化转型。 飞桨(PaddlePaddle)以百度多年的深度学习技术钻研和业务利用为根底,集深度学习外围训练和推理框架、根底模型库、端到端开发套件、丰盛的工具组件于一体,是中国首个自主研发、功能丰富、开源凋谢的产业级深度学习平台。目前,飞桨已凝聚535万开发者,基于飞桨创立67万个模型,服务20万家企事业单位。与飞桨适配的国内外芯片/IP厂商曾经超过40家,飞桨与硬件厂商的单干也进入了新阶段。2022年,飞桨携手国内外近30家硬件厂商联结公布硬件生态共创打算,联合搭档自有软硬件根底开发栈特色,针对不同利用场景和产品,独特推出厂商定制版飞桨框架,建设开源凋谢模型库,开发课程与培训内容等,以更好地服务开发者。\将来飞桨将联结更多硬件搭档通过技术的联结研发和生态共建,一起开辟更多软硬件协同的产品和性能,共创单干共赢生态模式。在此,飞桨诚邀更多企业退出硬件生态共创打算,聚生态之力,独特打造软硬一体的全栈式人工智能平台,促成人工智能产业链高质量倒退。 点击下方链接申请加入 “硬件生态共创打算” https://www.paddlepaddle.org.cn/hardware_co_creation

June 28, 2023 · 1 min · jiezi

关于paddle:沐曦与百度飞桨完成兼容性测试助力计算机视觉应用发展

近日,沐曦集成电路(上海)有限公司(以下简称“沐曦”)的曦思®N100人工智能推理GPU与百度飞桨实现 I 级兼容性测试。测试结果显示,单方兼容性体现良好,整体运行稳固。这是沐曦自2022年9月退出“硬件生态共创打算”后的阶段性成绩。 本次 I 级兼容性测试基于Paddle2ONNX工具,实现了计算机视觉技术畛域包含图像分类、指标检测和OCR等畛域共计10个模型的验证。经单方联结严格测试表明,曦思®N100在ResNet50、YOLOv3、det_mv3_db等模型上的精度和性能的体现满足要求,与飞桨的兼容性良好,整体运行稳固,达到了I级适配互认要求,推理性能能够满足用户的利用需要。 曦思®N100是一款面向云端数据中心利用的人工智能推理GPU,内置MXN100异构GPGPU处理器以及HBM2E高带宽显存,单卡算力达160TOPS(INT8)和80TFLOPS(FP16),兼备高带宽和低延时的个性,可能提供高达128路编码和96路解码的高清视频解决能力, 兼容HEVC、H.264、AV1、AVS2等多种视频格式, 最高反对8K分辨率。同时装备自主研发的MXMACA®软件栈,与硬件架构严密耦合,反对多种支流框架的网络模型,以及支流计算机视觉解决和多媒体解决框架。通过继续欠缺的ModelZoo,客户能够开箱即用,实现了各类利用场景和业务模型的疾速迁徙。曦思®N100可广泛应用于智慧城市、智慧交通、云计算、智能视频解决等行业多场景。目前,该产品已实现规模量产,并与多家重点行业客户及服务器厂商联结打造利用落地解决方案,发展深度的生态单干。 “此次与飞桨实现兼容性测试,证实曦思®N100在计算机视觉畛域与飞桨模型高度适配,这是单方共创打算单干的重要成绩,体现了沐曦产品的高度成熟度和宽泛适用性。” 沐曦联结创始人、CTO兼首席软件架构师杨建示意:“将来,沐曦将与飞桨进一步深入单干,面向更多智能应用领域,独特打造更宽泛的软硬件一体解决方案,减速AI产业利用落地,促成人工智能产业链和数字经济的高质量倒退。” 飞桨(PaddlePaddle)以百度多年的深度学习技术钻研和业务利用为根底,集深度学习外围训练和推理框架、根底模型库、端到端开发套件、丰盛的工具组件于一体,是中国首个自主研发、功能丰富、开源凋谢的产业级深度学习平台。目前,飞桨已凝聚535万开发者,基于飞桨创立67万个模型,服务20万家企事业单位。与飞桨适配的国内外芯片/IP厂商已超过40家,飞桨与硬件厂商的单干也进入了新阶段。2022年,飞桨携手国内外近30家硬件厂商联结公布硬件生态共创打算,联合搭档自有软硬件根底开发栈特色,针对不同利用场景和产品,独特推出厂商定制版飞桨框架,建设开源凋谢模型库,开发课程与培训内容等,以更好地服务开发者。 将来飞桨将联结更多硬件搭档通过技术的联结研发和生态共建,一起开辟更多软硬件协同的产品和性能,共创单干共赢生态模式。在此,飞桨诚邀更多企业退出硬件生态共创打算,聚生态之力,独特打造软硬一体的全栈式人工智能平台,促成人工智能产业链高质量倒退。 点击下方链接申请加入“硬件生态共创打算”https://www.paddlepaddle.org.cn/hardware_co_creation

June 27, 2023 · 1 min · jiezi

关于paddle:李彦宏AI原生应用比大模型数量更重要

6月26日,百度创始人、董事长兼首席执行官李彦宏缺席“世界互联网大会数字文化尼山对话”,发表了题为 《大模型重塑数字世界》 的演讲。 大模型是当下寰球科技翻新的焦点,也是寰球人工智能比赛的主战场。李彦宏认为,“新的国际竞争策略关键点,不是一个国家有多少个大模型,而是你的大模型上有多少原生的AI利用,这些利用在多大程度上晋升了生产效率。如果咱们能挤上牌桌,取得比赛入场券,中国将领有更壮大的数字化产业,数字经济规模将取得微小增长。” 李彦宏在演讲中还走漏,百度文心大模型曾经迭代到3.5版本。与3.0版本相比,训练速度晋升了2倍,推理速度晋升了17倍,模型成果累计晋升超过50%。 “文心大模型3.5版本,不仅是技术上的降级,更是平安上的降级。”李彦宏强调,“在数据品质、生成成果和内容安全性上,都失去了显著晋升。” 李彦宏认为,以大模型为要害驱动的数字经济,与实体经济深度交融,将做强做优做大实体经济。汽车制作、能源、交通等行业,大模型能够深刻外围业务场景,在智能客服、供应链、系统调度等版块翻新,促成行业的数字化转型和智能化晋升。 人工智能大模型带来的治理挑战也不容忽视。李彦宏对此示意,“保持技术倒退和平安可控的双轮驱动,能力行稳致远。 如果咱们平安、负责任地驾驭AI倒退之路,大模型就会重塑数字世界,人工智能就能够为中国经济、乃至寰球经济发明无可比拟的凋敝,进步全人类福祉。” 以下是演讲实录 尊敬的各位领导,各位嘉宾,大家上午好! 很快乐加入世界互联网大会数字文化尼山对话,我演讲的主题是《大模型重塑数字世界》。 过来一年,人工智能在技术、产品、利用等各个层面,都以“周”为迭代速度向前突进。大模型胜利压缩了人类对于世界的认知,让咱们看到了实现通用人工智能的门路。大模型倒退的下一个前沿,不仅是模拟人类,实现人类的“规定动作”,更是帮忙人类去钻研和发现未知领域,冲破人类过来没有冲破过的极限。如果可能迈出去这一步,将更加意义不凡。 大模型如何重塑数字世界?我想从技术和利用两个层面来谈谈: 技术层面,人工智能时代,IT技术栈产生了根本性扭转,从原来的芯片、操作系统和利用三层架构,变成了芯片、框架、模型、利用四层架构: 底层是芯片层,支流芯片从CPU变成了GPU。芯片之上是框架层,支流框架包含百度飞桨,Meta的PyTorch,谷歌的TensorFlow。框架下面是模型层,ChatGPT和文心大模型就在模型层。大模型成为了人工智能时代的操作系统,所有利用都将基于大模型开发。模型之上是应用层,包含各种各样的AI原生利用。 IT技术栈的结构性变动,意味着人工智能尤其是大模型技术,将重构寰球数字化产业。新的国际竞争策略关键点不是一个国家有多少个大模型,而是你的大模型上有多少原生的AI利用,这些个利用在多大程度上晋升了生产效率。如果咱们能挤上牌桌,取得比赛入场券,中国将领有更壮大的数字化产业,数字经济规模将取得微小增长。 百度投入人工智能曾经超过10年了,在芯片、框架、模型、利用四层有全栈布局,在要害核心技术攻坚上,百度在四层架构都有自主研发的当先产品和技术,因而能够进行端到端的优化,迅速晋升大模型训练和推理的效率。文心大模型是齐全自主可控的,咱们做到了数据可控、框架可控、模型可控。 当然,人工智能大模型带来的治理挑战也不容忽视。新技术利用往往先于标准,而建立健全保障人工智能衰弱倒退的法律法规、制度体系、伦理道德,能力营造良好的翻新生态。着眼将来,在器重防备危险的同时,也应同步建设容错、纠错机制,努力实现标准与倒退的动态平衡。 当下,大模型变得煊赫一时。但在4年前,大模型还没被宽泛关注的时候,百度就推出了文心大模型1.0。而后继续演进到2.0、3.0版本。 明天,文心大模型曾经迭代到3.5版本,与3月份的3.0版本相比,训练速度晋升了2倍,推理速度晋升了17倍,模型成果累计晋升超过50%。 文心大模型3.5版本,不仅是技术上的降级,更是平安上的降级。咱们采纳业界支流的大模型根底能力评估办法发展评估,结果显示,文心大模型3.5版本,在数据品质、生成成果和内容安全性上,都失去了显著晋升。 我国人工智能大模型已具备肯定根底,咱们须要奋起直追。同时,应施展利用场景劣势,进一步深耕垂直畛域,打造金融、医疗、电力等畛域的业余大模型,以高质量利用和数据反馈实现技术优化,帮忙大模型迭代降级,并建好AI生态。 能够预感,大模型将渗透到越来越多的畛域,以大模型为要害驱动的数字经济,与实体经济深度交融,将做强做优做大实体经济,发明可观的增量价值,带来经济社会倒退和产业的粗浅改革。 比方在汽车制作行业,最简单的设计环节,须要有经验丰富的工程师在2万多个零部件、几十万个参数里,找到满足需要的各种组合,再写文档、画图纸。在长安汽车,大模型能够高效地找到组合信息,主动生成设计文档,大幅缩减研发周期和老本。在中石化、南方电网,大模型能够深刻外围业务场景,在智能客服、供应链、系统调度等版块翻新,促成行业的数字化转型和智能化晋升。 在交通畛域,通过大模型技术支持的智能交通计划,能够晋升交通运行效率。 比方,往年五一长假之前最初一个工作日,北京城市拥挤指数暴增2.5倍。从二环堵到六环,一片红,惟一绿的是亦庄。亦庄车流量同样明显增加,但因为部署了AI全域信控计划,300多个智能路口,都能够依据车流量主动调节红绿灯,亦庄成为不堵车的一片“绿洲”。在端午前一天,北京城区和亦庄的交通比照来看,惊人的类似:城区很堵,但亦庄畅通。 在山东泰安泰山景区,为了服务游览经济倒退,推动城区疏堵保畅,解决当地游客“停车难”的痛点,百度利用交通诱导屏、绿波带等智能管控形式,无效保障了市民和游客的平安出行。 百度智能交通解决方案曾经被69个城市采纳。通过智能调整红绿灯的工夫,能够让通行效率晋升15%-30%,这将拉动GDP2.4%-4.8%的增长。 在山东济南,咱们还落地了百度智能云(山东)人工智能根底数据产业基地,既培养了AI训练师这样的新职业,又孵化了22家数据标注科技企业,带动区域待业的同时,拉动了经济增长。 无论从技术趋势,还是产业利用来看,大模型都绝不是过眼云烟的风口,而是影响人类倒退的重大技术改革,是拉动寰球经济增长的引擎,是相对不能错过的重大策略时机。 保持技术倒退和平安可控的双轮驱动,能力行稳致远。如果咱们平安、负责任地驾驭AI倒退之路,大模型就会重塑数字世界,人工智能就能够为中国经济、乃至寰球经济发明无可比拟的凋敝,进步全人类福祉。 我的发言就到这里,谢谢!

June 27, 2023 · 1 min · jiezi

关于paddle:如何驯化机器狗读懂人类手势手把手教你

作为全国普通高校大学生比赛榜单内比赛,“中国软件杯”大学生软件设计大赛-智能四足机器狗电力巡检零碎开发赛项,目前已吸引了全国2041支队伍加入。通过强烈的指标检测与宰割算法打榜赛,最终,有153支团队胜利升级区域赛。在行将于7月中旬发展的区域赛中,升级选手须基于搭载飞桨框架的国产四足机器狗宇树 Go1 机器狗,在规定的地图上进行主动巡检、避障越障和实现指定工作,依据各工作的实现品质和实现速度取得分数。 较量模仿地图 开发者介绍安泓郡 大连海事大学智能科学与技术业余大三在读,钻研方向为机器视觉、智能自主机器人。RoboCup 机器人世界杯中国赛水下作业组全国总冠军;全国大学生 RoboCom 机器人开发者大赛物资运送赛道全国总冠军;中国大学生计算机设计大赛飞桨赛道全国总冠军;全国大学生嵌入式芯片与零碎设计比赛海思赛道全国总冠军。输送至西北工业大学光电与智能研究院攻读博士研究生。 莫善彬 大连海事大学电子信息迷信与技术业余,主攻机器视觉以及硬件机器管制方向。宽泛涉猎各类大赛,2022届 ROBCOM 物资运送冠军队伍选手,相熟四足机器狗的管制逻辑及其底层静止管制,有肯定的开发教训;在全国大学生电子设计大赛,蓝桥杯等嵌入式硬件开发大赛中屡获佳绩。 预期指标:先看成果监测到点赞手势时,进行静止追随 监测到666手势时,小狗跳舞 检测到 STOP 手势时,原地静止追随 驯化之路一:感知局部实现感知局部工作指标:应用 mini-HaGRID 数据集,借助 PaddleDetection 工具训练一个能够辨认 like、call、stop 三种手势的指标检测模型。 服务器端模型训练本次应用 HaGRID 手势检测数据集的精简版:mini-HaGRID 作为训练数据。当然也能够应用 Labelme 标注工具自行制作数据集,或寻找网络公开数据集。应用 Labelme 标注数据集能够参考教程:https://gitee.com/paddlepaddle/PaddleDetection/blob/release/2... 在 AI Studio上,基于数据训练深度学习视觉模型。 1.1 数据筹备 # 解压数据集!unzip data/data215595/mini-HaGRID.zip -d data/mini-HaGRID1.2 下载并装置 PaddleDetection v2.4 # 下载PaddleDetection仓库!git clone https://gitee.com/paddlepaddle/PaddleDetection.git# 更新pip版本!pip install --upgrade pip# 装置其余依赖%cd PaddleDetection!pip install -r requirements.txt --user# 编译装置paddledet!python setup.py install%cd ~1.3 新建数据集配置文件 进入 PaddleDetection/configs/datasets 目录,新建文件 voc_hand.yml以同目录下 voc.yml 为模板,批改数据集根目录,数据集类别数及数据列表文件。可间接复制如下内容: metric: VOCmap_type: 11pointnum_classes: 4TrainDataset:  !VOCDataSet    dataset_dir: /home/aistudio/data/mini-HaGRID    anno_path: train.txt    label_list: label_list.txt    data_fields: ['image', 'gt_bbox', 'gt_class', 'difficult']EvalDataset:  !VOCDataSet    dataset_dir: /home/aistudio/data/mini-HaGRID    anno_path: val.txt    label_list: label_list.txt    data_fields: ['image', 'gt_bbox', 'gt_class', 'difficult']TestDataset:  !ImageFolder    anno_path: /home/aistudio/data/mini-HaGRID/label_list.txt1.4 新建训练配置文件 进入PaddleDetection/configs/picodet目录,新建配置文件picodet_xs_320_voc_hand.yml以同目录下 picodet_xs_320_coco_lcnet.yml 为模板,批改数据集配置。可间接复制如下内容: _BASE_: [  '../datasets/voc_hand.yml',  '../runtime.yml',  '_base_/picodet_v2.yml',  '_base_/optimizer_300e.yml',  '_base_/picodet_320_reader.yml',]pretrain_weights: https://paddledet.bj.bcebos.com/models/pretrained/LCNet_x0_35_pretrained.pdparamsweights: output/picodet_xs_320_voc_hand/best_modelfind_unused_parameters: Trueuse_ema: trueepoch: 300snapshot_epoch: 10LCNet:  scale: 0.35  feature_maps: [3, 4, 5]LCPAN:  out_channels: 96PicoHeadV2:  conv_feat:    name: PicoFeat    feat_in: 96    feat_out: 96    num_convs: 2    num_fpn_stride: 4    norm_type: bn    share_cls_reg: True    use_se: True  feat_in_chan: 96TrainReader:  batch_size: 64LearningRate:  base_lr: 0.32  schedulers:  - !CosineDecay    max_epochs: 300  - !LinearWarmup    start_factor: 0.1    steps: 3001.5 训练模型 # 装置VisualDL可视化工具!python -m pip install visualdl -i https://mirror.baidu.com/pypi/simple# 训练模型%cd ~/PaddleDetection!python -u tools/train.py -c configs/picodet/picodet_xs_320_voc_hand.yml --use_vdl=true --vdl_log_dir=vdl_dir/scalar --eval训练时,能够用VisualDL工具可视化训练参数。visualdl --logdir vdl_dir/scalar/ --host <host_IP> --port <port_num>模型导出应用 PaddleDetection 训练完模型后,须要将模型导出。 2.1 导出为 PaddleInference 格局 # 导出模型%cd ~/PaddleDetection!python tools/export_model.py \    -c configs/picodet/picodet_xs_320_voc_hand.yml \    --output_dir=./inference_model -o weights=output/picodet_xs_320_voc_hand/best_model.pdparams2.2 服务器端装置 PaddleLite 关上 PaddleLite 官网 github 仓库:https://github.com/PaddlePaddle/Paddle-Lite关上 Release 页面,下载v2.12版本的 opt_linux 至 PaddleDetection 根目录。能够间接执行如下命令: ...

June 26, 2023 · 1 min · jiezi

关于paddle:燧原科技与飞桨完成-I-级兼容性测试可用于文字识别等多个场景

近日,燧原科技第二代训练产品云燧T20与飞桨已实现 I 级兼容性测试。测试结果显示,单方兼容性体现良好,整体运行稳固。这是燧原科技退出飞桨“硬件生态共创打算”后的阶段性成绩。 本次 I 级兼容性测试实现了对计算机视觉与自然语言解决2大技术畛域5个模型的验证,同时也反对了多卡分布式训练。通过单方联结严格测试表明,燧原科技云燧T20在ResNet50、DBNET、BERT等 5个模型上的精度、性能等各方面体现优良,与飞桨的兼容性良好,整体运行稳固,达到了 I 级适配互认要求,能够满足用户的理论利用场景需要。燧原科技与飞桨将在6月从软硬技术适配及落地利用的角度为大家带来一场线上直播课,敬请期待。 云燧T20是面向数据中心的第二代人工智能训练加速卡,具备模型笼罩广、性能强、软件生态凋谢等特点,可反对多种人工智能训练场景,同时具备灵便的可扩展性,提供业界当先的大规模智算集群计划。 云燧T20燧原科技专一人工智能畛域云端算力产品,致力为人工智能产业倒退交付普惠的基础设施解决方案,提供原始翻新、全栈自研、具备齐全自主知识产权的通用人工智能训练和推理产品。凭借其第二代具备高能效比的训练和推理产品组合,已广泛应用于智算核心、互联网、金融、智慧城市等多个行业和场景。“此次燧原科技与飞桨实现了兼容性测试,飞桨多年积淀的深度学习技术、领有产业级开源模型库的开发平台以及寰球前三的AI开发者生态,能够帮忙咱们减速与客户AI利用场景的适配工作,为业界提供软硬一体、更加优化的计算解决方案,为单方的客户及合作伙伴带来更多价值。”燧原科技李彬示意:“飞桨作为国内当先、技术成熟度高的深度学习平台,曾经成为燧原科技重点反对的框架。咱们打算在往年反对数十个飞桨模型,并联结实现性能优化,以满足客户的各种理论人工智能业务场景需要。将来单方将充分发挥各自在算力和算法方面的劣势,独特建设模型库与场景范例,为人工智能产业赋能,推动中国数字化产业转型和降级。” 飞桨(PaddlePaddle)以百度多年的深度学习技术钻研和业务利用为根底,集深度学习外围训练和推理框架、根底模型库、端到端开发套件、丰盛的工具组件于一体,是中国首个自主研发、功能丰富、开源凋谢的产业级深度学习平台。目前,飞桨已凝聚535万开发者,基于飞桨创立67万个模型,服务20万家企事业单位。与飞桨适配的国内外芯片/IP厂商已超过40家,飞桨与硬件厂商的单干也进入了新阶段。2022年,飞桨携手国内外近30家硬件厂商联结公布硬件生态共创打算,联合搭档自有软硬件根底开发栈特色,针对不同利用场景和产品,独特推出厂商定制版飞桨框架,建设开源凋谢模型库,开发课程与培训内容等,以更好地服务开发者。 将来飞桨将联结更多硬件搭档通过技术的联结研发和生态共建,一起开辟更多软硬件协同的产品和性能,共创单干共赢生态模式。在此,飞桨诚邀更多企业退出硬件生态共创打算,聚生态之力,独特打造软硬一体的全栈式人工智能平台,促成人工智能产业链高质量倒退。 点击下方链接,申请加入“硬件生态共创打算”https://www.paddlepaddle.org.cn/hardware_co_creation

June 26, 2023 · 1 min · jiezi

关于paddle:2023科创中国大湾区青年百人会论坛即将召开

2023“科创中国”大湾区青年百人会论坛将于6月28日在香港科技大学(广州)召开。 本次论坛以“ ‘湾’通世界、青年领航 ”为主题,由“科创中国”青年百人会、广东省科协、广州市委人才办领导,广州市科学技术协会、“科创中国”大湾区青年百人会主办,深圳市科协、珠海市科协、京港学术交流核心、澳门科学技术协进会、中山市科协、东莞市科协、佛山市科协、肇庆市科协、江门市科协协办,香港科技大学(广州)、粤港澳大湾区科技协同翻新联盟等作为反对单位,广州科奥信息技术有限公司、北京百度网讯科技有限公司、广州趣丸网络科技有限公司等作为技术支持单位。 据悉,在论坛开幕式上,“科创中国”大湾区青年百人会成立典礼将重磅举办。“科创中国”大湾区青年百人会旨在施展粤港澳大湾区青年人才会聚的劣势,建设有利于青年人才成长的培养机制,搭建大湾区各畛域青年首领的沟通交流平台,以建立青年楷模、引领青年翻新、汇聚青年智慧为主旨,不断完善青年人才的造就机制、应用机制、激励机制,切实推动粤港澳大湾区高水平人才洼地和国内科技翻新枢纽的建设过程。 在论坛宗旨报告环节,全国人大代表、广州迈普再生医学科技股份有限公司创始人、董事长,粤港澳大湾区高性能医疗器械翻新核心主任袁玉宇、香港特别行政区立法会议员、香港人工智能州)实验室董事局成员执行董事尚海龙、香港科技大学(广州)协理副校长伍楷舜将缺席并别离作宗旨报告。 圆桌对话环节设置“翻新攻关”,“湾区协同”,“智能涌现”等三个主题研究方向,与会专家学者代表将从各自业余畛域的角度,为推动守正翻新、建设科技强国建言献策。 据理解,“科创中国” 青年百人会秉承 “科技扭转世界、青年引领将来” 的核心理念,始终致力于构建更加平面、凋谢、鲜活的青年价值共同体,为各地科技经济交融倒退提供青年组织人才撑持。粤港澳大湾区区位劣势显著、产业倒退迅速、青年人才会聚,“科创中国” 大湾区青年百人会的成立,将无效助力推动大湾区高质量协同倒退。

June 25, 2023 · 1 min · jiezi

关于paddle:CVPR首个大模型研讨会顺利召开吸引超1000支队伍参与文心大模型国际比赛

CVPR 作为计算机视觉和模式识别畛域的世界级学术顶会,不仅是学者们展现前沿科技成果的学术会议,也是企业界摸索前沿利用的一大平台。近年来,随着大模型技术的爆发式倒退,基于大模型技术的翻新利用正逐渐在产业界开释出微小价值空间。作为人工智能技术畛域的领军者与深耕者,百度在大模型技术畛域领有弱小的技术劣势和深厚技术积攒,百度自主研发的产业级常识加强大模型体系文心大模型曾经建设了残缺的大模型体系 , 涵盖根底大模型、工作大模型、行业大模型等,全面满足产业利用需要。作为文心大模型的外围之一,文心 · CV 大模型 VIMER 已广泛应用在主动驾驶、云智一体、挪动生态等外围业务。 百度召开CVPR首届大模型研讨会共探大模型技术现状和将来 为了进一步推动视觉大模型技术的倒退,百度联结浙江大学、香港大学、中科院空天院在 CVPR 2023 上独特举办了首届大模型 Workshop,大模型畛域内的顶级学者和精英们独特探讨了大模型技术的最新进展和将来动向,并收录了来自百度、剑桥大学等企业/高校的论文。 在6月19日举办的 CVPR 2023 Foundation Model Workshop 上,来自百度的资深工程师、中科院空天院客座研究员希滕传授和百度主任架构师张刚别离进行了开幕式和闭幕式致辞。希滕传授还重点介绍了百度文心 CV 大模型及文心交通大模型。 来自华为的资深研究员谢凌曦介绍了 NLP 大模型与 CV 大模型的区别并提出了 CV 大模型将来的时机与挑战。 千支队伍逐鹿产业级大模型盛赛产学共探技术革新之道 智能交通畛域首个多任务大模型国内较量的举办是往年CVPR 2023大模型研讨会的一大亮点,比赛从Foundation Model畛域的关键问题登程,设置了多任务大模型赛道及跨模态大模型赛道,吸引了寰球35个国家和地区、超过1500人参赛,征集到来自美团、网易、大华等公司以及清华大学、香港科技大学、华中科技大学、中科院等高校的泛滥解决方案。 近年来,智慧汽车、人工智能等产业倒退,为智能交通倒退发明了良好的倒退时机。智能交通相干技术曾经渗透到咱们的日常生活中,然而现有大模型的多任务处理模式以及传统的感知办法(如分类、检测、宰割等)无奈满足咱们对更广交通场景以及更高主动驾驶程度的追赶。百度从以后理论技术钻研中的关键问题登程, 设置了两大赛道: 赛道一:对立多任务大模型赛道本赛道旨在解决多任务、多数据的合并抵触问题。对于设计精良的网络结构和损失函数,多个工作独特训练能大幅晋升模型的泛化性。因为特定工作的数据存在noise,仅应用繁多工作的数据进行训练,存在过拟合的危险。对立多任务大模型通过将多个工作的数据整合进行对立训练,可能对不同工作的noise做一个均匀,进而使模型学到更好的特色。为了进一步摸索对立多任务大模型的能力下限,本赛道以交通场景典型工作为题,笼罩了分类、检测、宰割三大类CV工作至繁多大模型中,使得繁多大模型具备能力的同时取得当先于特定单任务模型的性能。最终Allin one大模型在分类、检测、宰割工作上的加权指标会作为获奖规范。 赛道二:跨模态图像检索赛道本赛道旨在晋升文本图像检索的精度。在交通场景中高性能的图像检索能力对于交通执法、治安治理具备非常重要的作用,传统的图像检索形式通常应用先对图像进行属性辨认再通过与冀望属性的比照实现检索能力。随着多模态大模型技术的倒退,文本与图像的表征对立和模态转换已有广泛应用,应用该能力能够进一步晋升图像检索的准确性和灵活性。 研讨会上,希滕传授发表了往年Foundation Model国内较量的胜出队伍,最终CTRL队、njust队别离取得了多任务大模型赛道及跨模态大模型赛道的冠军,并现场进行了技术计划的分享。 随着CVPR 2023 大模型研讨会的正式闭幕,会议中探讨的利用场景正在陆续走向行业落地。百度作为人工智能技术畛域的领军者与深耕者,在修炼好AI技术“内功”的同时,也将一直向各行业场景输入技术能力与解决方案,进一步推动产业智能化降级倒退。 文心·CV大模型地址 https://github.com/PaddlePaddle/VIMER

June 25, 2023 · 1 min · jiezi

关于paddle:飞桨携手登临解读软硬一体技术优势共推AI产业应用落地

家喻户晓,AI利用落地面临着场景碎片化、开发成本高、算力老本低等诸多难题,这对AI框架与AI芯片都提出了十分高的要求,即既要满足端、边、云多场景的部署需要,还须要反对自动化压缩与高性能推理引擎深度联动。因而充分发挥软硬一体交融劣势,能力为AI产业利用落地提供最优解。 作为目前国内市场利用规模第一的深度学习平台,飞桨凝聚了丰盛的产业AI模型,可为泛滥产业用户提供成熟、标准化的AI解决方案, 也能够基于个性化需要做二次开发,是泛滥企业及开发者的不二之选。 作为国内通用GPU畛域的当先企业,登临科技十分重视本身软硬件生态建设。 与飞桨的单干也是登临科技生态建设的重要一环。目前登临科技已退出由飞桨发动的硬件生态共创打算,并与飞桨实现II级适配,笼罩视觉、自然语言解决、智能举荐技术畛域,实现了VGG19、Bert-Base、DSSM等15个模型的验证。目前,单方正在积极开展III级适配工作。 对于登临作为国内通用GPU当先企业,登临科技保持核心技术齐全自主研发。其自主翻新的GPU+(基于GPGPU的软件定义的片内异构计算架构)硬件兼容CUDA生态,并通过架构翻新使其兼具通用性和高效率。目前,登临首款基于GPU+的系列产品Goldwasser™(高凛™)已在智慧城市、交通、金融、能源、电力、教育、无人驾驶、互联网等泛滥行业实现商业化落地,客户订单达数万片,并已实现批量量产交付。

June 25, 2023 · 1 min · jiezi

关于paddle:Run-in-PaddleX-20一站式搞定飞桨精选模型开发全流程

2020年4月,飞桨推出了 PaddleX 全流程开发工具(以下简称 PaddleX 1.0 系列),其在社区播种了宽泛的影响力。PaddleX 1.0 系列采纳本地单机版的形式,将深度学习开发全流程从数据筹备、模型训练与优化到多端部署端到端买通,并提供对立工作API接口及图形化开发界面Demo,开发者无需别离装置不同套件,以低代码的模式即可疾速实现飞桨全流程开发。 在一直与开发者深刻交换的过程中,咱们也发现,PaddleX 1.0 系列不能齐全满足开发者需要。因而,飞桨进一步研发了 PaddleX 2.0 系列。如下表所示,相比 PaddleX 1.0,PaddleX 2.0 次要有以下劣势: PaddleX 2.0 云端疾速开始为了不便开发者更便捷地体验 PaddleX 2.0,疾速跑通从数据校验、模型训练开发到部署的全流程,飞桨在人工智能学习与实训社区 AI Studio 上全新上线了 PaddleX 2.0 的云端版本,只须要在模型库中抉择反对 PaddleX 2.0 的模型,创立模型产线,即可通过工具箱模式/开发者模式疾速体验模型产线全流程,十分不便易用,欢送开发者在线体验。 相比于在 AI Studio 创立一个空白我的项目,Run in Jupyter NoteBook,咱们更举荐开发者应用这种全新的开发模式,即Run in PaddleX 2.0。 疾速体验地址 https://aistudio.baidu.com/aistudio/modelsoverview 举荐利用场景相比 PaddleX 1.0,PaddleX 2.0 版本在二次开发方面更具备灵活性,同时比开发套件更易用,咱们举荐以下场景能够优先应用 PaddleX 2.0,包含: 刚刚接触AI的学生和高级开发者 PaddleX2.0 的工具箱模式能够疾速上手,学习应用; 传统行业转型AI开发的企业中级开发者 PaddleX 2.0 精选优质模型,搭配易用性是 POC 的最优抉择; 曾经纯熟应用飞桨某个方向开发套件的资深开发者 心愿扩大更多方向,PaddleX 统一性非常适合晋升我的项目交付效率。 集体学习效率进步、疾速我的项目 POC 问题、高效实现我的项目交付,Run in PaddleX 2.0,尽可能满足您的场景需要。 ...

June 21, 2023 · 1 min · jiezi

关于paddle:嘉楠科技加入硬件生态共创计划共同打造一站式AI解决方案

近日,嘉楠科技与百度飞桨签订硬件生态共创打算单干协定,正式退出由飞桨发动的硬件生态共创打算。以后单方的单干次要基于嘉楠科技勘智系列AI芯片产品。 对于嘉楠科技嘉楠科技(NASDAQ:CAN)成立于2013年,是一家以ASIC高性能计算芯片设计为外围,集芯片研发、计算设施生产和软件服务的科技公司。作为国内较早采纳开源指令集架构研发芯片的企业,嘉楠科技自2018年公布寰球首款RISC-V架构商用边缘AI芯片以来,一直摸索AISC技术在高性能计算和人工智能畛域的最大潜能。目前,嘉楠科技已自主研发三代视觉神经网络加速器IP核,领有多项核心技术和自主知识产权,其勘智系列AI芯片聚焦于边缘计算畛域,在智能家居、智能门禁、STEAM教育和机器人等利用场景具备低功耗和高精度计算劣势。 继2018年公布了寰球首款基于RISC-V架构的自主知识产权商用边缘AI芯片勘智K210,2021年公布第二代勘智系列AI芯片K510之后,嘉楠科技于2023年正式公布勘智系列最新一代AI芯片K230 嘉楠科技&飞桨嘉楠退出硬件生态共创打算后,将与百度飞桨在算法和软硬件畛域,实现嘉楠勘智AI芯片与飞桨深度学习平台的深度适配,提供一站式的AI解决方案。嘉楠科技副总裁汤炜伟示意:“作为一家致力于自主RISC-V AI芯片研发的当先企业,嘉楠在AI行业深耕超过七年工夫,累计出货数百万颗勘智AI系列芯片,并实现多个行业的落地利用。咱们深知AI的倒退须要建设凋谢、丰盛的产业和生态,咱们非常重视与生态搭档的单干。百度飞桨是中国首个自主研发、功能丰富、开源凋谢的产业级深度学习平台,领有弱小的生态合作伙伴和宽泛的利用场景。本次单干将基于单方在AI畛域的独特愿景和互补劣势,为客户提供更加优质易用的AI解决方案,推动AI技术在各个行业畛域的落地利用和翻新倒退。” 飞桨(PaddlePaddle)以百度多年的深度学习技术钻研和业务利用为根底,集深度学习外围训练和推理框架、根底模型库、端到端开发套件、丰盛的工具组件于一体,是中国首个自主研发、功能丰富、开源凋谢的产业级深度学习平台。目前,飞桨已凝聚535万开发者,基于飞桨创立67万个模型,服务20万家企事业单位。与飞桨适配的国内外芯片/IP厂商已超过40家,飞桨与硬件厂商的单干也进入了新阶段。2022年,飞桨携手国内外近30家硬件厂商联结公布硬件生态共创打算,联合搭档自有软硬件根底开发栈特色,针对不同利用场景和产品,独特推出厂商定制版飞桨框架,建设开源凋谢模型库,开发课程与培训内容等,以更好地服务开发者。 将来飞桨将联结更多硬件搭档通过技术的联结研发和生态共建,一起开辟更多软硬件协同的产品和性能,共创单干共赢生态模式。在此,飞桨诚邀更多企业退出硬件生态共创打算,聚生态之力,独特打造软硬一体的全栈式人工智能平台,促成人工智能产业链高质量倒退。 点击下方链接,申请加入“硬件生态共创打算” www.paddlepaddle.org.cn/hardware_co…

June 21, 2023 · 1 min · jiezi

关于paddle:海飞科加入硬件生态共创计划共建通用计算人工智能生态

近日,海飞科(北京)科技有限公司与百度飞桨签订硬件生态共创打算单干协定,正式退出由飞桨发动的硬件生态共创打算。以后单方的单干次要基于海飞科Compass C10通用GPU芯片系列产品。 对于海飞科海飞科(Hexaflake)致力于GPU(通用并行处理器)芯片研发。基于自主翻新的并行计算架构,可提供GPU芯片、板卡和全栈软件平台等产品,产品在算力通用可编程性、无效利用率、密度和规模等次要指标上具备外围竞争力。 海飞科GPU产品可广泛应用于人工智能计算机视觉、语音、自然语言解决、数据分析等畛域,亦可用于大数据处理、科学计算等场景。可为各类数据中心、计算中心、云服务、垂直行业等提供高性价比、低能耗的算力解决方案。   Compass C10芯片与Compass C10-0X计算加速卡 海飞科&飞桨“海飞科退出硬件生态共创打算后,将与飞桨携手在算力和算法上深度交融,联结打造基于飞桨框架的高性能人工智能行业解决方案。”海飞科相干负责人示意:“飞桨是业界当先的产业级深度学习开源开放平台,在国内市场利用规模第一,在产业实际落地方面经验丰富。海飞科GPU在架构通用性、生态兼容性、算力利用率上具备显著劣势,同时具备128GB大容量显存等性能特点。退出硬件生态共创打算后,单方将致力于施展软硬一体外围劣势,打造有竞争力的行业解决方案,共建人工智能软硬一体生态。” 飞桨(PaddlePaddle)以百度多年的深度学习技术钻研和业务利用为根底,集深度学习外围训练和推理框架、根底模型库、端到端开发套件、丰盛的工具组件于一体,是中国首个自主研发、功能丰富、开源凋谢的产业级深度学习平台。目前,飞桨已凝聚535万开发者,基于飞桨创立67万个模型,服务20万家企事业单位。与飞桨适配的国内外芯片/IP厂商已超过40家,飞桨与硬件厂商的单干也进入了新阶段。2022年,飞桨携手国内外近30家硬件厂商联结公布硬件生态共创打算,联合搭档自有软硬件根底开发栈特色,针对不同利用场景和产品,独特推出厂商定制版飞桨框架,建设开源凋谢模型库,开发课程与培训内容等,以更好地服务开发者。 将来飞桨将联结更多硬件搭档通过技术的联结研发和生态共建,一起开辟更多软硬件协同的产品和性能,共创单干共赢生态模式。在此,飞桨诚邀更多企业退出硬件生态共创打算,聚生态之力,独特打造软硬一体的全栈式人工智能平台,促成人工智能产业链高质量倒退。 点击下方链接,申请加入“硬件生态共创打算” https://www.paddlepaddle.org.cn/hardware_co_creation

June 20, 2023 · 1 min · jiezi

关于paddle:基于多尺度图神经网络的流场预测实现精度与速度的平衡

1. 我的项目简介本我的项目来源于飞桨AI for Science共创打算的论文复现赛题,复现论文为《AMGNET: multi-scale graph neural networks for flow field prediction》。该论文次要采纳图神经网络,因为在计算流体力学中计算域被网格离散化,这与图构造人造符合。论文中通过训练 CFD 仿真数据,构建一种数据驱动模型进行流场预测。本文将与大家分享基于飞桨实现该论文的复现过程,欢送大家一起沟通学习。 论文链接https://doi.org/10.1080/09540091.2022.2131737 原文代码https://github.com/baoshiaijhin/amgnet AI for Science 共创打算 AMGNET 论文复现 2. 环境依赖硬件与框架本我的项目须要的硬件环境与框架要求如下所示: GPU Memory >= 8GB飞桨== 2.4.0Python ==3.7.4PGL == 2.2.4Matplotlib == 3.5.3pyamg == 4.2.3scipy本地装置通过以下指令实现飞桨以及各个库的装置。 1.conda create -n paddle_env python=3.7  2.conda install paddlepaddle-gpu==2.4.0 cudatoolkit=11.6 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/Paddle/ -c conda-forge   3.pip install pgl==2.2.4  4.pip install matplotlib==3.5.3  5.pip install pyamg==4.2.3  6.pip install scipy3. 模型介绍模型框架AMGNET 是一种基于图神经网络的 CFD 计算模型,该模型能够预测在不同物理参数下的流场。图3.1为模型的网络结构图,该模型的基本原理就是将网格构造转化为图构造,而后通过网格中节点的物理信息、地位信息以及节点类型对图中的节点和边进行编码。接着对失去的图神经网络应用基于代数多重网格算法( Olson and Schroder, 2018 )的粗化层进行粗化,将所有节点分类为粗节点集和细节点集,其中粗节点集是细节点集的子集。粗图的节点汇合就是粗节点集,于是实现了图的粗化,放大了图的规模。粗化实现后通过设计的图神经网络信息传递块( GN )来总结和提取图的特色。之后图复原层采纳反向操作,应用空间插值法( Qi et al.,2017 )对图进行上采样。例如要对节点i插值,则在粗图中找到间隔节点i最近的k个节点,而后通过公式计算失去节点i的特色。最初,通过解码器失去每个节点的速度与压力信息。 图3.1 网络结构图 论文源码原文的代码总体上能够分为4个局部,别离是数据预处理、图粗化层、图卷积块和图复原层。如图3.2所示。 图3.2 原文代码构造原文代码的关键技术要点如下: 编码节点的特色和边的特色:进而将原始网格数据变换为图构造的数据。 应用代数多重网格算法进行图粗化,这个过程中存在大量的稠密矩阵乘法,例如:其中,A示意图的邻接矩阵。 在图复原层中,源代码采纳空间插值法进行上采样:其中,ri示意要复原的节点i的特色,wij示意节点i和节点j之间间隔的倒数。 飞桨复现的技术要点在模型中咱们须要应用图神经网络模仿网格,基于图这种数据结构模仿物理场的状态,于是咱们调用了飞桨的 PGL 库。因为模型进行图数据的粗化时进行了大量的稠密矩阵运算,为了进步运算效率,缩小运算工夫,咱们须要对图进行合并。然而 PGL 是以列表的模式存储图,所以在图数据进入模型之前须要预处理,如下: 1.def forward(self, graphs):  2.    batch = MyCopy(graphs[0])  3.    for index, graph in enumerate(graphs):  4.        if index > 0:  5.            batch = Myadd(batch, graph)  6.  7.    latent_graph = self.encoder(batch)  8.    x,p= self.processor(latent_graph)  9.    node_features=self.spa_compute(x,p)  10.    pred_field = self.decoder(node_features)  11.  12.    return pred_field 在基于代数多重网格的图粗化层中,咱们将图粗化到不同的尺度,而后应用 GN 块通过消息传递来总结和提取图的特色。与基于代数多重网格的图粗化层相比,图复原层采纳反向操作。在图复原层中,咱们应用空间插值办法对图进行上采样,空间插值法的实现如下: 1.def knn_interpolate(features, coarse_nodes, fine_nodes):  2.    coarse_nodes_input = paddle.repeat_interleave(coarse_nodes.unsqueeze(0), fine_nodes.shape[0], 0)   3.    fine_nodes_input = paddle.repeat_interleave(fine_nodes.unsqueeze(1), coarse_nodes.shape[0], 1)   4.    dist_w = 1.0 / (paddle.norm(x=coarse_nodes_input - fine_nodes_input, p=2, axis=-1) + 1e-9)    5.    knn_value, knn_index = paddle.topk(dist_w, k=3, largest=True)   6.    weight = knn_value.unsqueeze(-2)  7.    features_input = features[knn_index]  8.    output = paddle.bmm(weight, features_input).squeeze(-2) / paddle.sum(knn_value, axis=-1, keepdim=True)  9.    return output   应用代数多重网格算法对图进行粗化时,波及大量的稠密矩阵乘法,于是咱们调用了 scipy.sparse 库。然而 scipy.sparse 库中的.dot 办法和现在大部分深度学习框架中的稠密矩阵乘法不同,后者会保留一些0,而前者只存非零值。这种差别会导致数据维度不统一,进而影响之后的操作。针对这个问题,咱们提出了两种解决方案,第一种是采纳填充的办法保持数据维度,第二种是采纳编码器与解码器将特色维度进行压缩。其中第一种办法与代数多重网格算法保持一致,精度较高。第二种办法进步了约20倍的训练速度,然而均方根误差会略高。两种计划的代码如下: 计划1:1.if (index_E.shape[1] != standard_index.shape[1]):  2.    index_E, value_E = FillZeros(index_E, value_E, standard_index, kN)  3.  4.def FillZeros(index_E, value_E, standard_index, kN):  5.    shape = [kN, kN]  6.    row_E = index_E[0]  7.    col_E = index_E[1]  8.    # coo_E = paddle.sparse.sparse_coo_tensor(index_E, value_E, shape)  9.    DenseMatrix_E = sp.coo_matrix((paddle.ones_like(value_E), (row_E, col_E)), shape).toarray()  10.  11.    row_S = standard_index[0]  12.    col_S = standard_index[1]  13.    DenseMatrix_S = sp.coo_matrix((paddle.ones([row_S.shape[0]]), (row_S, col_S)), shape).toarray()  14.  15.    diff = DenseMatrix_S - DenseMatrix_E  16.    rows, cols = np.nonzero(diff)  17.    rows = paddle.to_tensor(rows, dtype = 'int32')  18.    cols = paddle.to_tensor(cols, dtype = 'int32')   19.    index = paddle.stack([rows, cols], axis=0)  20.    value = paddle.zeros([index.shape[1]])  21.    index_E = paddle.concat([index_E, index], axis=1)  22.    value_E = paddle.concat([value_E, value], axis=-1)  23.  24.    sp_x = paddle.sparse.sparse_coo_tensor(index_E, value_E)  25.    sp_x = paddle.sparse.coalesce(sp_x)  26.    index_E = sp_x.indices()  27.    value_E = sp_x.values()  28.  29.    return index_E, value_E   计划2:1.model_1 = paddle.nn.Sequential(  2.('l1', paddle.nn.Linear(128, 256)), ('act1', paddle.nn.ReLU()),  3.('l2', paddle.nn.Linear(256, 256)), ('act2', paddle.nn.ReLU()),  4.# ('l3', paddle.nn.Linear(256, 256)), ('act3', paddle.nn.ReLU()),  5.('l4', paddle.nn.Linear(256, 128)), ('act4', paddle.nn.ReLU()),  6.('l5', paddle.nn.Linear(128, 1))  7.)  8.model_2 = paddle.nn.Sequential(  9.('l1', paddle.nn.Linear(1, 64)), ('act1', paddle.nn.ReLU()),  10.('l2', paddle.nn.Linear(64, 128)),('act2', paddle.nn.ReLU()),  11.# ('l3', paddle.nn.Linear(128, 128)),('act3', paddle.nn.ReLU()),  12.('l4', paddle.nn.Linear(128, 128))  13.)  14.  15.val_A = model_1(value_A)  16.val_A = paddle.squeeze(val_A)  17.index_E, value_E = StAS(index_A, val_A, index_S, value_S, N, kN, nor)  18.value_E = paddle.reshape(value_E, shape=[-1, 1])  19.edge_weight = model_2(value_E)4. 预测后果咱们的模型依照论文给的案例,别离在机翼和圆柱这两种不同的物理场景中进行预测,其中机翼采纳 NACA0012 翼型,示意翼型的网格蕴含6648个节点。圆柱体网格蕴含3887个节点。所有网格均由三角形和四边形网格组成。翼型在稳态、可压缩和无粘性条件下由 Navier-Stokes 方程管制。圆柱在稳态、不可压缩和无粘性条件下由 Navier-Stokes 方程管制。预测结果表明,咱们的模型预测的流场与实在流场基本相同,可能达到原文的精度,证实复现胜利。咱们模型对圆柱和机翼的预测后果如图4.1和图4.2所示。原文的预测后果如图4.3所示,其中原文的预测后果图采纳了业余的流体力学软件绘制。 图4.1 雷诺数=78的圆柱速度场的预测值与实在值比照图 图4.2 攻角=8.0,马赫数=0.65下的机翼压力场的预测值与实在值比照图 图4.3 原文中雷诺数=78的圆柱速度场的预测(左图);攻角=8.0,马赫数=0.65的机翼压力场的预测(右图) 5. 结语这是咱们团队第一次加入百度飞桨的论文复现赛,这次较量的经验让咱们受害良多。首先,飞桨的复现赛赛事流程安顿十分正当,咱们被要求浏览论文,而后跑通论文的原始参考代码,这使得咱们对论文的整体思路和原始代码有了清晰的理解。在复现的过程中,咱们疾速理解两种框架之间的差别,应用API映射表顺利切换和应用不同的框架。只管有一些 API 无奈齐全对应,但咱们能够进行适当地改变或重写来解决这个问题。第二,飞桨团队为这个较量提供了优良的平台、短缺的资源以及充沛的领导,这使咱们可能更好地了解论文和实现代码。他们的反馈对咱们复现的后果和进一步改良十分有帮忙。最初,特别感谢论文作者杨志双学长以及实验室的李天宇师兄对本次复现工作提供的技术领导和专业知识解说。参加飞桨的论文复现赛是一次贵重的学习和成长机会。我学到了很多对于论文复现和深度学习框架转换的常识,也结识了许多气味相投的同学和专业人士。将来,咱们期待看到更多来自企业、高校、科研院所以及超算的小伙伴,退出飞桨 AI for Science 共创打算,参加建设基于飞桨的 AI for Science 畛域顶尖开源我的项目和开源社区。 论文复现我的项目的代码链接为: https://aistudio.baidu.com/aistudio/projectdetail/5592458 往期举荐 随机2D形态四周层流预测!基于飞桨实现图形神经网络基于数据驱动 U-Net 模型的大气污染物扩散疾速预测,晋升计算速度近6000倍

June 20, 2023 · 1 min · jiezi

关于paddle:随机2D形状周围层流预测基于飞桨实现图形神经网络

我的项目背景近年来,疾速流场预测畛域始终由基于像素的卷积神经网络(Convolution Neural Network,CNN)主导。当 CFD 与基于 CNN 的神经网络模型耦合时,来自网格的数据必须在笛卡尔网格上进行插值,而后再投影回网格。然而平均笛卡尔网格的外在几何示意较差,相干的计算成本很大,并不适宜疾速流场预测。与 CNN 不同,图卷积神经网络(Graph Convolution Neural Network,GCNN)能够间接利用于实体拟合的三角网格,从而与 CFD 求解器轻松耦合,解决上述问题。本项目选择复现基于 GCNN 构造的论文《Graph neural networks for laminar flow prediction around random two-dimensional shapes》,验证飞桨框架可能基于 GCNN 模型实现 2D 障碍物四周层流预测的能力。 论文原文 https://hal.archives-ouvertes.fr/hal-03432662/document 原文代码 https://github.com/cfl-minds/gnn_laminar_flow 开发环境与实现过程开发环境本文依靠于飞桨框架2.4版本实现 2D 障碍物四周层流预测的图卷积神经网络。能够通过拜访飞桨官网的装置文档实现装置。详情见链接:https://www.paddlepaddle.org.cn/install/quick?docurl=/documen... 实现过程图卷积神经网络的根本组成部分是卷积块。卷积块由一个两步图卷积层和一个两步平滑层组成。在论文中,节点和边上的特色矩阵别离用示意,其中,Nv 和 NE 是节点和边的数量,dV 和 dE 是节点和边上特征向量的维度。卷积层将节点级音讯流传到边缘,而后聚合新的边缘特色并依据以下规定更新节点特色。  其中,v1 和 v2 是由边 e 连贯的两个节点,N(v)是围绕节点 v 的相邻边的汇合。卷积核 fe 和 fv 为单暗藏层的全连贯神经网络,暗藏层中的神经元数量设置为128。 节点特色更新代码如下: def update_node_features(node_features, grad_P1, num_filters, initializer, message_fn):    message_input = paddle.concat([node_features, grad_P1], axis=1)    updated = message_fn(message_input)    return updated边特色更新代码如下: def update_symmetry_edge_features(node_features, edges, edge_features, edge_feat_dim, initializer, message_fn):    n_nodes = paddle.to_tensor(node_features.shape[0])    n_features = paddle.to_tensor(node_features.shape[1])    reshaped = paddle.reshape(node_features[edges], shape=[-1, 2 * n_features])    symmetric = 0.5 * paddle.add(reshaped[:, 0:n_features], reshaped[:, n_features:2 * n_features])    asymmetric = 0.5 * paddle.abs(paddle.subtract(reshaped[:, 0:n_features],    reshaped[:, n_features:2 * n_features]))    inputs = paddle.concat([symmetric, asymmetric, edge_features], axis=1)    messages = message_fn(inputs)  # n_edges, n_output    n_edges = edges.shape[0]    updates = paddle.slice(        paddle.add(paddle.index_add_(paddle.zeros([n_edges, messages.shape[1]]), edges[:, 0], 0, messages),        paddle.index_add_(paddle.zeros([n_edges, messages.shape[1]]), edges[:, 1], 0, messages)),        axes=[0, 1], starts=[0, 0], ends=[n_nodes, messages.shape[1]])    return messages, updates在边缘卷积步骤中,对称节点特色 优先于 x1 和 x2,以放弃排列不变性。节点卷积步骤中的求和对于相邻边的排列也是不变的。平滑图层对输入图形执行均匀操作。在三角网格上实现的均匀内核分为两个步骤: 增加此层的动机不是为了音讯流传,而是为了缩小节点因素的空间变异性。它通过相邻节点因素的弥补来压低卷积层的特色图。平滑层代码如下: class EdgeSmoothing(nn.Layer):    def __init__(self):        super(EdgeSmoothing, self).__init__()    def forward(self, to_concat, node_features, edges, count):        n_nodes = paddle.to_tensor(node_features.shape[0])        flow_on_edge = paddle.mean(node_features[edges], axis=1)        aggre_flow = paddle.add(paddle.index_add_(paddle.zeros([edges.shape[0], flow_on_edge.shape[1]]), edges[:, 0], 0,flow_on_edge[:, :]),        paddle.index_add_(paddle.zeros([edges.shape[0], flow_on_edge.shape[1]]), edges[:, 1], 0,flow_on_edge[:, :]))        return paddle.concat([to_concat, paddle.divide(aggre_flow[:n_nodes, :], count)], axis=1)下图为论文中采纳的网络架构图,该架构图由图卷积层和平滑层组成。输出由三个图像组成,8个卷积块/平滑层重叠造成图卷积神经网络,而后以1×1卷积作为输入层。架构中一个重要组成部分是从输出图到卷积块的跳过连贯。在每个平滑图层之后,结点的坐标将连贯到结点因素。这些跳跃连贯为公式中的边缘卷积步骤提供空间信息。 图1 网络架构图 网络架构代码如下: class InvariantEdgeModel(nn.Layer):    def __init__(self, edge_feature_dims, num_filters, initializer):        super(InvariantEdgeModel, self).__init__()        self.edge_feat_dims = edge_feature_dims        self.num_filters = num_filters        self.initializer = initializer        self.layer0 = InvariantEdgeConv(self.edge_feat_dims[0], self.num_filters[0], self.initializer)        self.layer1 = InvariantEdgeConv(self.edge_feat_dims[1], self.num_filters[1], self.initializer)        self.layer2 = InvariantEdgeConv(self.edge_feat_dims[2], self.num_filters[2], self.initializer)        self.layer3 = InvariantEdgeConv(self.edge_feat_dims[3], self.num_filters[3], self.initializer)        self.layer4 = InvariantEdgeConv(self.edge_feat_dims[4], self.num_filters[4], self.initializer)        self.layer5 = InvariantEdgeConv(self.edge_feat_dims[5], self.num_filters[5], self.initializer)        self.layer6 = InvariantEdgeConv(self.edge_feat_dims[6], self.num_filters[6], self.initializer)        self.layer7 = InvariantEdgeConv(self.edge_feat_dims[7], self.num_filters[7], self.initializer)        self.layer8 = nn.Linear(10, 3)        self.smoothLayer = EdgeSmoothing()    def forward(self, node_input, edges, edge_input, smoothing_weights):        new_node_features_0, new_edge_features_0 = self.layer0(node_input, edge_input, edges)        smoothed_0 = self.smoothLayer(node_input[:, 0:2], new_node_features_0, edges, smoothing_weights)        new_node_features_1, new_edge_features_1 = self.layer1(smoothed_0, new_edge_features_0, edges)        smoothed_1 = self.smoothLayer(node_input[:, 0:2], new_node_features_1, edges, smoothing_weights)        new_node_features_2, new_edge_features_2 = self.layer2(smoothed_1, new_edge_features_1, edges)        smoothed_2 = self.smoothLayer(node_input[:, 0:2], new_node_features_2, edges, smoothing_weights)        new_node_features_3, new_edge_features_3 = self.layer3(smoothed_2, new_edge_features_2, edges)        smoothed_3 = self.smoothLayer(node_input[:, 0:2], new_node_features_3, edges, smoothing_weights)        new_node_features_4, new_edge_features_4 = self.layer4(smoothed_3, new_edge_features_3, edges)        smoothed_4 = self.smoothLayer(node_input[:, 0:2], new_node_features_4, edges, smoothing_weights)        new_node_features_5, new_edge_features_5 = self.layer5(smoothed_4, new_edge_features_4, edges)        smoothed_5 = self.smoothLayer(node_input[:, 0:2], new_node_features_5, edges, smoothing_weights)        new_node_features_6, new_edge_features_6 = self.layer6(smoothed_5, new_edge_features_5, edges)        smoothed_6 = self.smoothLayer(node_input[:, 0:2], new_node_features_6, edges, smoothing_weights)        new_node_features_7, new_edge_features_7 = self.layer7(smoothed_6, new_edge_features_6, edges)        smoothed_7 = self.smoothLayer(node_input[:, 0:2], new_node_features_7, edges, smoothing_weights)        node_outputs = self.layer8(smoothed_7[:, 0:])        return node_outputs我的项目后果为了展现复现的成果,咱们应用复现模型对圆柱流场进行预测,后果如下: 图2 预测成果比照图 其中左侧为论文原文中采纳的实在流场,右侧为咱们复现的模型所预测的流场。可见咱们失去的预测值(左边)与实在值(右边)基本一致,模型精度很好。咱们复现的模型在试验后果中的 MAE 为0.0046,与原论文的后果0.0043也十分靠近,验证了飞桨框架可能基于该模型实现 2D 障碍物四周层流预测的能力。 心得体会百度飞桨的论文复现较量为咱们团队提供了贵重的学习和成长机会。这个较量不仅让咱们深刻理解流场预测这个细分畛域,还锤炼了咱们团队单干和解决问题的能力。当初回顾这次较量,值得称赞的中央有很多。第一,飞桨官网弱小的赛事组织能力,将较量组织的标准和有序。从项目前期宣传、队伍报名、赛前解说、赛中答疑以及后果提交一环扣一环,我的项目安顿有序,每支队伍都分明每个阶段该干什么。第二,较量中,飞桨科学计算团队的技术人员提供粗疏答疑。较量要求咱们仔细阅读论文,并依据论文提供的参考代码应用飞桨进行复现。这个过程不仅须要咱们对深度学习模型有深刻的了解,也须要咱们相熟飞桨框架。作为一个老手,不免遇到各种各样的技术问题,每次找飞桨技术人员,总能失去急躁粗疏的解答。除此之外,官网还会定期跟踪复现的停顿状况,有问题立刻为选手解决问题。第三,加入飞桨的论文复现较量也为咱们关上了更广大的视线。通过此次较量,咱们有机会接触到 AI for Science 这个畛域很多优秀论文。在复现实际的过程中,咱们深入研究了这些论文的办法和技术,加深了咱们对这个畛域的了解,理解到了学术界的最新进展和利用。最初,我要衷心感谢百度飞桨团队所有组织者和工作人员。他们的辛勤付出和业余反对使得这次较量得以顺利进行。也要特别感谢陆林、汪璐、孔德天这些一起加入较量的师兄弟,感激咱们团队中每一位成员的致力和贡献。将来,咱们将持续放弃学习的态度,一直摸索和翻新,争取为推动该畛域的倒退做出奉献。 往期举荐 基于数据驱动 U-Net 模型的大气污染物扩散疾速预测,晋升计算速度近6000倍

June 19, 2023 · 1 min · jiezi

关于paddle:2023年全国高校公益人工智能师资培训营报名正式开启

为满足社会对人工智能人才的需要,晋升高校教师的人工智能教学能力和推动高校的人工智能教学工作,山东大学国家大学科技园、百度飞桨、济南市市中区科技协会将独特主办的《2023年全国高校公益人工智能老师暑期师资培训营》。流动正在报名中! 培训内容本次培训营将分两个方向进行,别离是智能驾驶方向和人工智能大模型方向: 智能驾驶方向 咱们将联合百度飞桨和人工智能学习与实训社区 AI Studio,深刻解说交通标记识别、路线宰割等相干利用场景的模型算法原理及训练,并通过一辆智能小车展现预训练模型如何离线部署并通过单片机对车辆实现管制等内容。课程内容对标各类人工智能和智能车大赛的知识点,赋能高校教师领导学科比赛和发展学生科研项目。 人工智能大模型方向 咱们将联合百度文心相干产品及国内外开源“文生图”、“文生文”和“文生代码”大模型,深入探讨大模型的基础知识以及提醒工程实际办法。咱们重点介绍百度文心系列各类大模型,联合百度智能云的弱小算力,让高校教师在最短时间内迅速利用大模型减速科研过程。此外,为了不便高校教师深刻摸索大模型技术,咱们还将讲授如何部署国内外支流大模型,并针对科研要求进行微调,训练出面对特定需要的大模型。 课程安顿 注:授课内容以实际上课安顿为准 培训证书山东大学-百度飞桨全国高校人工智能师资培训结业证书 报名信息培训对象 高校 IT 相干业余、或对人工智能方向感兴趣的退职老师 培训工夫 第一期报到工夫:7月17日 / 离会工夫:7月22日中午 第二期报到工夫:7月24日 / 离会工夫:7月29日中午 第三期报到工夫:7月31日 / 离会工夫:8月5日中午 第四期报到工夫:8月7日 / 离会工夫:8月12日中午留神:本次师资培训的授课费,由山东大学引航打算基金补贴;网络流量和云计算费自理(约150元),流动内容最终解释权归协办单位所有。 其余事项举荐住宿 山东大学国家大学科技园公寓酒店单人间1500/人,双人间900/人(五个早晨) 培训周期 6天/5晚 培训地址 山东省济南市市中区兴仲路山东大学国家大学科技园 报名截至工夫 2023/7/18 联系方式 手机号码:18866838353 曹鑫鑫老师 (微信同号) 电子邮箱:yhjh@sdu.edu.cn 报名链接 https://aistudio.baidu.com/aistudio/activitydetail/1502010221...

June 16, 2023 · 1 min · jiezi

关于paddle:广东省高校人工智能产教融合院长研讨会召开校企协同探索AI教育新范式

为深入产教交融、促成校企单干,着力推动人工智能产业和高校人才培养体系相交融,深入探讨校企单干、产教交融与课程建设布局等事宜,2023年6月9日下午,百度飞桨联结广东省计算机学会、华南理工大学计算机科学与工程学院、荔峰科技(广州)有限公司独特举办广东省高校人工智能产教交融院长研讨会。广东省高校计算机学院、软件学院及人工智能学院相干院领导,琶洲管委会等单位和企业领导近30人加入会议。 产教融通校企协同摸索 AI 教育新范式 研讨会上,广东省计算机学会秘书长黄轩、华南理工大学计算机科学与工程学院院长陈俊龙、百度 AI 技术生态副总经理周奇、荔峰科技总经理肖茂财顺次致辞,独特对人工智能与科研、产教交融所带来的时机和挑战发表了认识。 黄轩秘书长示意,人工智能作为引领将来的战略性技术和推动产业改革的外围驱动力,已成为经济倒退的新引擎、社会提高的加速器,成为全球战略的科技制高点。从需要来看,放慢人工智能在教育领域的翻新利用,利用 AI 大模型技术更新人才培养模式、改革教学方法、晋升教育治理能力,构建智能化的终身教育体系,是构建教育现代化的强劲能源;从供应侧来看,高校仍是第一生产力、人才第一资源、翻新第一能源的集合点,倒退一流的人工智能、培养高端的人工智能人才、造成优质的人工智能成绩,从而服务人工智能技术与实体经济深度交融的须要,为科技强国提供翻新撑持。 广东省计算机学会秘书长黄轩致辞 华南理工大学计算机科学与工程学院陈俊龙院长首先代表华南理工大学欢送各位兄弟院校和企业的领导光临参加本次研讨会,也衷心感谢百度公司的组织协调和鼎力支持。陈俊龙示意,可能与各位院长、领导一起深入探讨人工智能教学与产业相交融的倒退时机与挑战,就如何将大模型人工智能技术融入高校教育改良以及新一代人工智能人才的造就当中做深入探讨,是一件十分有意义的工作。在以后蓬勃发展的人工智能畛域,高校教育须要从多方面与企业进行深刻的交换,将最新的人工智能技术融入到高校教育中,以更好地满足社会的需要。此次围绕 AI 大模型,高校既扮演着新一代AI技术的用户,又承当为该畛域造就相干人才的责任。围绕大模型 AI 深入产教交融,既是高校教育模式改良降级的契机,也是我国人工智能产业得以进一步推动的必要动作。 华南理工大学计算机科学与工程学院院长、欧洲科学院院士陈俊龙致辞 百度 AI 技术生态副总经理周奇示意,在过来的一段时间里,咱们见证了大模型技术的飞速发展。在教育领域,大模型人工智能新技术也正逐步成为推动教育改革与翻新的重要力量。往年4月飞桨(广东)人工智能教育翻新核心启动典礼是个开始,这次研讨会是飞桨(广东)教育翻新核心落地的第一步,咱们期待可能为人工智能产教交融搭建交换与单干的平台,独特探讨如何让教育与科技更好地联合,将产业与教学紧密结合,以造就出更多适应将来社会需要的优秀人才。 飞桨在广州市琶洲算谷已落地百度飞桨(广州)人工智能产业赋能核心,致力于打造粤港澳大湾区最具实力代表的数字经济产业化的技术平台、生态平台、赋能平台。飞桨将基于产业赋能核心+教育翻新核心,发展与政府、院校、生态企业的单干,将百度人工智能技术赋能本地企业、高校,让产业转型与倒退所需的技术真正进入产业、行业,造成需要、基础设施和人才的有机整合和全面晋升。飞桨有信念也有实力服务好广东省的人工智能产教交融,为科技翻新、人才培养和社会提高注入弱小的能源。 百度 AI 技术生态副总经理周奇致辞 荔峰科技总经理肖茂财示意,荔峰科技作为广东省首批建设培养产教交融型企业,同时做为百度飞桨在广东地区的生态合作伙伴,围绕人工智能产业岗位、人才培养、产学研我的项目、技能大赛、翻新守业等内容,为高校提供人工智能“岗课赛证训创”人才培养解决方案。 荔峰科技总经理肖茂财致辞 交融共谋生态助力创始 AI 教育新篇章 深度学习和大模型作为 AI 前沿技术和基础设施,迎来倒退黄金期,百度将自主研发的产业级深度学习平台飞桨开源凋谢,为高校学习前沿技术、产业实现智能化降级提供了根底技术撑持。百度 AI 技术生态华南区负责人曾旭东以《百度飞桨和文心大模型的技术生态与产业化利用》为题作报告,百度 AI 技术生态教育经营负责人钱芳以《百度飞桨产教交融共育 AI 人才》为题,进行相干分享。高校分享环节中,华南理工大学计算机科学与工程学院副院长高英介绍了华南理工大学计算机科学与工程学院的教学实际体系建设,华南师范大学人工智能学院计算机学院院长蒋运承介绍了华南师范大学人工智能产教交融人才培养形式,分享在 AI 畛域所做钻研或教学工作中的教训、遇到的难点和面临的痛点。 百度公司与高校代表分享环节 交换研究阶段,与会嘉宾开展了企业和高校之间的对话,为人工智能产教交融提供了宝贵意见,热切探讨了从晚期的校企单干到现在的产教交融理念和外延递进,对高校人才培养和企业用人需要之间的贯通要求。人工智能产业技术人才的造就关系国家经济和科技的倒退,在人才培养的过程中,要重视根底教学与实际培训相结合,加强学生的实际创新能力,增强产教交融,促成校企多方单干,为社会、企业倒退提供优秀人才。 交换研究环节 与会嘉宾合影 飞桨(广东)人工智能教育翻新核心启动典礼 作为我国首个自主研发、功能丰富、开源凋谢的产业级深度学习平台,百度飞桨长期以来与高校深入开展产教交融,赋能高校 AI 人才培养,从教学资源、工具与平台、反对与服务三个层面,围绕学习、实际、待业等环节,为高校师生提供丰盛多样的资源反对。针对时下热门的大模型畛域,百度飞桨也在继续打造相干课程及内容建设。 将来,百度飞桨将持续保持对 AI 人才教育的投入,推动产教深度交融翻新,赋能区域产业倒退,面向华南增强产教交融示范基地、人工智能社会化人才培养基地建设,为国内人工智能畛域的倒退注入新生机、新动力。

June 16, 2023 · 1 min · jiezi

关于paddle:飞桨携手第二届GitLink开源夏令营邀你参与顶尖开源项目

想参加顶尖开源我的项目开发? 想相熟开源社区参加流程? 想取得资深导师领导和丰富现金处分? 机会来啦! 2016年9月,飞桨框架正式开源,其兼备易用性、高效性、灵活性和可扩展性等特点。现在,百度飞桨在中国深度学习平台市场中的综合份额跃居第一,已凝聚535万开发者,基于飞桨创立67万个模型,服务了20万家企事业单位。作为国内当先的开源深度学习平台,飞桨致力于让深度学习技术的翻新与利用更简略。在飞桨框架建设中,除了来自百度的工程师外,还汇聚了一批酷爱飞桨、酷爱开源的开发者,他们正在用本人的形式参加飞桨框架建设,与飞桨独特成长。 在飞桨开源社区,有90余个开源代码仓库,16700+贡献者,有急躁、技能精湛、专职开源的社区导师,有乏味、乐于分享、酷爱开源的社区开发者,开源社区的沉闷离不开每一个人的参加。本着凋谢、共享、协同的开源精力,在飞桨开源社区独特发展了许多乏味硬核的开源流动,包含飞桨黑客松、高兴开源流动、PFCC meetup 等,与此同时,飞桨开源社区也积极探索对外开源单干。 这个夏天,飞桨开源社区携手第二届 GitLink 的确开源编程夏令营(GLCC2023),多畛域开源工作等你认领,大牛导师一对一领导,更有现金处分和绿色通道等你来拿。如果感兴趣的话,快来参加 GLCC✖️飞桨,开启你的开源之旅吧! 对于 GitLink 的确开源编程夏令营GitLink 的确开源编程夏令营(GLCC)是由 CCF 中国计算机学会主办,之江实验室与 CCF 开源倒退委员会独特组织的面向全国高校学生的暑期编程流动。流动笼罩近千所高校,并联结各大开源基金会、开源企业、开源社区、开源专家,旨在激励青年学生通过加入实在的开源软件开发,晋升本身技术能力,为开源社区输送优秀人才,以期进一步推动国内开源社区的凋敝倒退。 流动工夫布局 在 GitLink 的确开源编程夏令营(GLCC)里,你能够参加行业顶尖开源我的项目、结识开源搭档和技术大咖、取得丰富处分! 对于流动工作在本次 GitLink 的确开源编程夏令营(GLCC)中,飞桨社区共带来了五个课题供选择,课题示例如下: 全副课题预览: 参加夏令营你能失去什么?开发经验参加开源我的项目,成为大型开源我的项目的 Contributor,多畛域多难度梯度工作,给你丰盛的我的项目开发体验,是丰盛简历、锤炼开发能力的好机会! 资深研发导师1V1领导百度资深研发工程师一对一领导,答疑解惑,助力成长,是晋升技术能力的好机会! 奖金本次较量共设有两个难度等级,不同等级对应不同奖金: 高阶难度:学生结项奖金税前人民币 10,000 元中等难度:学生结项奖金税前人民币 8,000 元报名形式第一步:点击 “报名链接” 进入GitLink编程夏令营 第二步:点击 “我的项目列表” 并搜寻 “飞桨”找到飞桨我的项目 第三步:点击飞桨我的项目查看赛题 第四步:点击申请课题,并填写申请表格上传所需资料 留神:请务必在零碎实现申请课题并上传相干资料,仅与导师沟通报名将【无奈取得奖金】!! 心动不如口头快和飞桨、GitLink的确开源编程夏令营(GLCC)一起走进这场开源盛会吧! 报名链接 https://www.gitlink.org.cn/glcc/2023/projects

June 15, 2023 · 1 min · jiezi

关于paddle:加速44RTDETR量化无损压缩优秀实战

RT-DETR 模型是飞桨指标检测套件 PaddleDetection 最新公布的 SOTA 指标检测模型。其是一种基于 DETR 架构的端到端指标检测器,在速度和精度上均获得了 SOTA 性能。在理论部署中,为了谋求“更准、更小、更快”的效率能力,本文应用飞桨模型压缩工具 PaddleSlim 中的主动压缩工具(ACT, Auto Compression Toolkit)将针对 RT-DETR 进行量化压缩及部署实战。应用 ACT 工具只须要几十分钟,即可实现量化压缩全流程。在模型精度持平的状况下,RT-DETR 模型体积压缩为原来的四分之一,GPU 推理减速44% 。 注:上述表格测试应用 Paddle Inference 开启 TensorRT,因为蕴含 D2H 拷贝时延,和论文 FP16 FPS 相比略慢。 传送门 https://github.com/PaddlePaddle/PaddleSlim/tree/develop/example/auto_compression/detection 1. RT-DETR 模型疾速开始RT-DETR 在一众 YOLO 模型中怀才不遇,成为新 SOTA,它的成果如下图所示。 点击下方文章,获取更多RT-DETR信息: 超过YOLOv8,飞桨推出精度最高的实时检测器RT-DETR!为了更不便开发者体验 RT-DETR 的成果,疾速跑通从数据校验,模型训练开发到部署的全流程,飞桨在 AI Studio 全新上线了 PaddleX 模型产线。开发者只须要在模型库中抉择创立模型产线,即可通过工具箱或者开发者模式疾速体验 RT-DETR 模型产线全流程,十分不便易用,欢送开发者在线体验。 疾速体验地址:https://aistudio.baidu.com/aistudio/modelsoverview![] 2. RT-DETR 模型剖析在对 RT-DETR 量化压缩前,咱们对它进行了剖析。RT-DETR 网络模型次要由两个局部组成,别离是 ResNet 或者 HGNetv2 形成的 backbone 和 RT-DETR 形成的检测头。在模型的 backbone 中有大量的卷积层,此外在检测头中也有大量的矩阵乘计算,这些操作均可进行量化,从模型构造上剖析来看,RT-DETR 模型领有足够的量化减速后劲。咱们应用了量化剖析工具剖析了各层的激活值散布:大部分激活值散布都比拟集中,离群点很少,这对量化很敌对。同时咱们剖析了各层的权重数值散布:能够看到权重的数据分布基本上合乎正态分布,且数值较小,这样的权重散布比拟适宜量化。剖析发现 RT-DETR 有较好的量化压缩后劲,并且为了进一步晋升模型部署的性能,咱们就开始量化压缩实战吧。 3. RT-DETR 模型压缩实战RT-DETR 模型筹备PaddleDetection 中提供了官网训练好的应用了不同 backbone 的模型,咱们间接应用这些模型作为原始的模型即可。在 PaddleDetection 的环境下依照其流程将模型导出成为动态图模型,这些动态图用于量化压缩和部署测试。 python tools/export_model.py -c configs/rtdetr/rtdetr_r50vd_6x_coco.yml \              -o weights=https://bj.bcebos.com/v1/paddledet/models/rtdetr_r50vd_6x_coco.pdparams trt=True \              --output_dir=output_inference数据集筹备应用 PaddleSlim 主动压缩工具量化模型须要大量的校准数据,这里咱们应用规范的 COCO 数据集进行测试,能够依照 PaddleDetection 中数据筹备教程进行筹备,数据格式如下所示: ...

June 14, 2023 · 1 min · jiezi

关于paddle:Prompt范式产业实践分享基于飞桨UIEX和Intel-OpenVINO实现跨模态文档信息抽取

近期 Prompt 范式备受关注,实际上,其思维在产业界曾经有了一些胜利的利用案例。中科院软件所和百度独特提出了大一统诸多工作的通用信息抽取技术 UIE(Universal Information Extraction)。截至目前,UIE 系列模型已公布 UIE、UIE-X、UIE-senta 三大模型。基于 Prompt 思维,UIE 系列模型凭借其弱小的零样本与小样本能力、多任务对立建模能力,成为业界在信息抽取、情感剖析等工作上的首选计划。   UIE系列模型(UIE、UIE-X、UIE-senta)根本信息表 本次产业实际范例基于 UIE-X 和 OpenVINO 实现医疗文档信息抽取,提供了 UIE-X 模型在 Intel x86 平台上优化部署的残缺计划,升高了产业落地门槛,可迁徙至金融等行业的信息抽取利用场景。 我的项目链接 https://aistudio.baidu.com/aistudio/projectdetail/6335929?con... 场景难点文档品种繁多、版式多样,如何无效联合文本、图片、布局信息进行建模是一大难题;传统基于序列标注的抽取计划依赖大量畛域标注数据,老本极高;同一个业务中往往存在实体、关系等多种信息抽取需要,独自建模训练老本高。模型选型除了纯文本内容外,企业中还存在大量须要从跨模态文档中抽取信息并进行解决的业务场景,例如目前医疗畛域有大量的医学查看报告单、病历、发票以及 CT 影像等医疗图片数据。为了满足跨模态文档信息抽取需要, PaddleNLP 基于文心 ERNIE-Layout 跨模态布局加强预训练模型,集成 PaddleOCR的PP-OCR、PP-Structure 版面剖析等当先能力,基于大量信息抽取标注集,训练并开源了 UIE-X——首个兼具文本及文档抽取能力、多语言、凋谢域的信息抽取模型。 本案例为 UIE-X 在医疗畛域的实战,通过大量标注+模型微调即可具备定制场景的端到端文档信息提取能力。为实现智能文档信息抽取,咱们采取“定义 schema”、“Taskflow 定义”、“指定进行信息抽取的文档”的计划: 第一步,基于 Prompt 范式,定义信息抽取的工作及所需抽取的信息;第二步,定义 Taskflow,包含装载定制模型。通过 task_path 指定模型权重文件的门路,门路下须要蕴含训练好的模型权重文件 model_state.pdparams;第三步,指定进行信息抽取的文档所在门路 doc_path,进行信息抽取。飞桨通过宏大、精选的模型库,可能显著升高用户在模型抉择方面的难度,升高工夫老本,实现疾速迭代。在落地阶段应用 Intel OpenVINO™ 工具套件进行模型部署,充分发挥通用x86平台上的网络执行效力,优化计划整体老本,晋升计划推理性能。 调优策略基于 OpenVINO 的 auto-device 中提供的多种 performance hint 策略,依据应用场景需要的不同,进行多线程配置,晋升推理吞吐量或升高提早。反对 Intel CPU 以及 GPU 上的 Dynamic Input Shape 以晋升计划在进行信息抽取时的推理性能,在保障推理时延的同时,优化计划整体老本。模型部署本我的项目的最终部署环境为 Intel x86 硬件平台设施。思考开发便捷性,本次示例应用 Python 部署开发环境。通过输出医疗文档图片以及定义抽取信息的 schema,利用 Taskflow 框架实现基于 UIE-X 的智能信息抽取。 该计划能够反对中文及英文的 Prompt/schema 以及跨语言抽取,同时也反对定制 OCR 后果。通过配置 layout 参数传入 OCR Bounding Box 信息,优化抽取成果。飞桨 AI Studio 也提供了残缺的应用示例与开发阐明,可参考该教程疾速学习,并针对实际我的项目进行开发和集成。 医疗文档信息抽取部署demo计划 为了让小伙伴们更便捷地利用范例教程,OpenVINO 布道师武卓博士将于6月14日(周三)19:00为大家深度解析从数据筹备、方案设计到模型优化部署的开发全流程,手把手教大家进行代码实际。 飞桨PaddlePaddle

June 14, 2023 · 1 min · jiezi

关于paddle:最强AIGC实战应用速成指南来了14天掌握核心技术

OpenAI 创始人 Sam Altman 在近期采访中说到:" AI 是少有的被重大炒作之后,还被重大低估的货色。" 当初的 AI 简直把互联网上所有的数据都学习了一遍,相当于一个世界常识的对立建模。在如此规模的参数量下,更好的关联推理就可能实现了,也可能通过算法更好地模仿人的用意。不可否认,AI 大模型在当下的每一秒都在发明着让人们惊艳的作品,让人为之赞叹! AI歌手AI 孙燕姿成为顶流,完满复刻的嗓音在不同曲风的经典作品中毫无违和感,大模型让 AI 音乐创作的门槛再次被拉低,人们直呼将来的听歌的流程是否是“关上软件->歌曲->抉择歌手”。 AI 孙燕姿创作出的歌曲在网络上爆火 AI 绘画由百度文心一格续画的"民国才女陆小曼未尽稿"联同驰名海派画家乐震文补全的同名画作《未完·待续》,以110万元落槌成交,是寰球首次胜利拍卖的AI山水画作。 左:乐震文实现稿  中:陆小曼未尽稿  右:百度文心一格实现稿 AIGC 内容创作用 AI 大模型生成营销文案、视频;依据用户的喜爱和需要,生成个性化的广告和营销内容,内容创作的门槛和老本一直升高。 创作者利用文心一言一键生成小红书笔记文案此外 AI 虚拟人、AI 编程、AI 办公软件助手等更多利用正在产生.......在这个充斥时机、前所未有的全民 AI 时代,你还在屏幕前观望吗?预测将来的最好形式就是去亲手发明将来! 国内外大模型产品格局,AI产品正在疾速融入咱们的工作和生存—图源自InfoQ钻研核心明天,百度飞桨 AI Studio 为处于时代漩涡的你,提供了一次收费的绝佳学习机会——14天 AIGC 实战营!带你躬身入局,抓准 AIGC 红利!文心大模型联结飞桨官网出品课程  14天带你吃透AIGC! 《基于大模型的优质 Prompt 开发课》 0根底 AI 小白、能联网会打字就能学! 如果你还在因为那些哭笑不得的网络梗而质疑大模型的能力,那么你应该思考本人是否具备了写出优质的提醒词( Prompt ,即用于触发或疏导大模型生成内容的输出文本)的技能;如何向大模型发问,有何高效学习技巧,怎么让大模型为咱们所用,进步生成效率?毫无疑问这是大模型时代必备技能,也是成为“调教 AI 高手”的捷径。本课程将从理论利用登程,依靠大量中文实例逐渐带你学习优质 Prompt 根底构建形式、丰盛的优化技巧、针对具体场景利用做优化等实用常识。 开始构建你的优质Prompt生产更好的提醒词-Prompt优化技巧针对利用场景定向开发优质Prompt优质Prompt分享与结业颁奖《大模型利用开发技巧与实战》 顶流大模型利用,由你来发明!想打造你的专属聊天机器人、智能文档查问助手?这里有开箱即用的大模型利用实战代码!业内专家学者和一线工程师将带你从0到1理解⼤模型技术原理、上手大模型微调和应⽤开发实战,疾速学会应用大模型技术构建翻新应⽤,造就 AI 原生利用思维。 如果说 Prompt 是想象力的种子,那么这节课就是将你的种子埋入土壤,将创意转化为理论的 AI 利用解决方案。 ...

June 8, 2023 · 1 min · jiezi

关于paddle:以AI为灯照亮医疗放射防护监管盲区

置信绝大部分人都有在医院拍X光片的经验,它可能让医生更不便疾速地找出潜在问题,判断病人健康状况,是医疗诊断过程中的常见查看形式。但同时X射线也是一把双刃剑,它的照耀量可在体内累积,对人体血液白细胞有杀伤力,对甲状腺、肾腺、性腺等内分泌腺体影响尤大。孕妇、儿童及恶性肿瘤患者更是X射线的“高危人群”。 思考到 X 射线的潜在危害,监管部门对此畛域也非常重视。医疗喷射卫生监管次要偏重三个方向:一是资质,二是设施,三是从业人员。然而设施监测等形式往往是预先发现问题,一旦呈现辐射泄露,就曾经造成了医疗事故。因而,监管机构越来越将眼光放到从业人员监督上,心愿通过对人员操作标准的监督,更好地保障患者医疗喷射查看平安。 我国早在2002年卫生部颁发的《喷射工作卫生防护治理方法》以及2006年国家卫健委颁发的《喷射诊疗治理规定》中也明确了相干防护要求:喷射诊疗工作人员对患者和受检者进行医疗照耀时,对邻近照耀野的敏感器官和组织进行屏蔽防护,并当时告知患者和受检者辐射对衰弱的影响。据理解,病人穿上防护服查看时,99%以上的散射光都能够防护掉,可能极大升高这一医疗查看形式带来的潜在危险。 河南中盟新云,一家为卫生部门提供信息化建设与软件解决方案的公司,基于飞桨企业版 EasyDL 零门槛 AI 开发平台,训练出喷射器具穿戴辨认模型,并在此基础上研发医疗喷射防护 AI 智能在线监管零碎。该零碎可自动识别在喷射查看过程中患者是否应用防护用品,为医院喷射诊疗工作人员减少一道“双保险”。还可将监测数据上传至医院及中央卫健委监督监测中心,为医疗喷射卫生监督执法提供根据,无效标准医疗机构行为,使受诊者防止因为医护人员操作疏漏而蒙受到射线危险。 以“从业人员监管”为切入点,用 AI 为老百姓做实事为什么会存在不穿戴喷射防护配备的状况?这和防护配备个性非亲非故。个别的喷射防护用品如防护围裙、防护帽、防护围脖等均含铅,绝对较重,穿戴不便,很多时候还需喷射诊疗工作人员来帮忙受检者穿戴。这就导致受检者穿防护服所破费工夫,甚至会长于拍一般 X 光片的工夫。在医院放射科绝对忙碌的时间段,尤其是赶上患者较多的时候,一些工作人员往往顾不上检查和揭示任务,导致患者们在不知情的状况下接受危险。“ 监管部门在监督过程中,对从业人员的监管往往是感到力不从心的,”中盟新云技术负责人崔涛介绍到,“受制于人力与工夫老本等因素,目前监管部门以巡检或突击检查形式为主,这就很难笼罩到每一次的喷射诊疗。因而,咱们就设计研发了这个零碎,来帮忙医疗卫生监督机构更好地进行从业人员监管,为老百姓实实在在做一些坏事。目前这在河南省范畴来说,是第一次。” 立足于河南省“智慧卫监”的摸索方向,中盟新云创新性地将 AI 图像识别技术使用到喷射防护监管畛域中。据调查,过后市面上风行的通用图像识别模型不足针对性训练,仅能辨认是否有人,无奈精准的辨认出是否穿戴防护器具,更无奈辨认数十种之多的防护器具品类、不同医院应用的不同制式。而业内做得比拟好的大公司对此类我的项目不足器重,虽有尝试,但业余研发人员投入有余,最终成果也不现实。中盟新云心愿可能联合本身对于行业的粗浅洞察,让业余的行业常识疾速与 AI 能力联合,从而更好地解决这一问题。 飞桨Easy DL助力无算法工程师团队,自研高精度模型中盟新云针对医疗喷射防护人员监督的整体解决方案设计如下: 定制化训练高精度AI模型,可能辨认防护用品应用状况;在医疗机构放射科室部署抓拍摄像头,通过对喷射查看过程的视频剖析进行精准的受检场景抓怕;通过模型剖析该场景中受检者是否正确穿戴防护设施,主动对辨认后果进行危险等级分类并被动与预警;监督核心监管大屏实时显示预警信息,同时该预警信息主动下发至被抓拍的放射科室操作员手机端,操作人员能够对高风险预警信息进行申述。 技术计划流程图 然而在第一阶段的模型开发训练上,团队犯了难。因为没有算法工程师,之前如果遇到 AI 类需要,只能与高校进行单干,但高校单干的开发进度往往无奈满足客户的需要。从头招聘资深的算法工程师并不事实,不仅短时间内人才难寻,相匹配的费用开销也不低。起初团队又分割到一家公司打算定制开发一套模型,而对方却报价几十万,最终也只得无奈放弃。就在束手无策的时候,中盟新云寻找到了飞桨 EasyDL 零门槛 AI 开发平台。“ 真的是非常简单易用,满足了咱们‘定制’和‘零门槛’的需要。”崔涛介绍到,“咱们用本人的数据在飞桨 EasyDL 上训练模型,全程只需抉择和配置,操作非常简单。训练好的模型还提供丰盛的部署形式,间接调用接口或者线下部署就能够调用模型能力,满足咱们的需要。齐全是一个开箱即用的体验。这对咱们而言就曾经没有任何难度了。” 飞桨 EasyDL 零门槛 AI 开发平台预制了高精度的预训练大模型 VIMER-CAE ,它是百度文心大模型 VIMER 系列的 CV 自监督预训练大模型,训练数据过亿,笼罩宽泛行业场景。自监督视觉表征学习 VIMER-CAE 大模型创新性地提出“在隐含的编码表征空间实现掩码预测工作”的预训练框架,在图像分类、指标检测、语义宰割等经典上游工作上达到 SOTA 后果。用户只须要应用绝对大量的本身场景数据,在 EasyDL 平台依靠其底层预训练通用大模型,疾速训练高可用小模型,再通过私有云接口或者私有化部署调用模型能力。中盟新云整体计划采纳“预训练+微调”的新范式,基于互联网海量的无标签数据对 VIMER-CAE 模型进行自监督学习形式训练,通过大量数据进行上游工作的模型训练。 最终,中盟新云团队每个标签仅应用100+张训练数据,共1000张左右图片,便训练出照片抓拍精准状况下辨认精度达95%的模型,并基于模型开发出医疗喷射防护AI智能在线监管零碎。该零碎在多种X射线检测场景中(如 CT 设施、DR 设施、CR 设施、X 射线胃肠机等),可辨认出铅帽、铅裙、铅方巾、铅围脖、铅屏风等多种防护器具是否被应用,实现了对医疗喷射防护行为的自动识别与监测,为后续的进一步监管提供了根底。 利用示例 继续赋能医疗卫生畛域 为病患带来衰弱与平安目前,中盟新云研发的医疗喷射防护AI智能在线监管零碎已深刻服务于河南省内各县区的卫健委、监督局,在河南省内笼罩了郑州市和各县区宽泛的一二三级医院,并在河南滑县、兰考县两个县区全副140余家医疗机构利用。在河南全省属独一份。 该智能监控零碎的应用解决了卫生监督单位无奈继续监管医疗机构喷射防护状况的难点。不仅实现对医疗喷射防护行为的自动识别,同时能够对辨认后果进行初步的评估和判断,辨认到危险行为后能够在监督指挥核心进行实时预警揭示。对实在产生的医疗违规行为也能够进行相应的录像取证作为执法根据,后续剖析后果可用于领导喷射卫生工作的不断改进,帮忙政府机构高效执法,无效标准医疗机构行为,同时更是爱护了受诊者的身体健康。 ...

June 6, 2023 · 1 min · jiezi

关于paddle:听说最近AI应用爆了来AI-Studio玩转大模型应用

飞桨 AI Studio 是基于百度深度学习平台飞桨(PaddlePaddle)的人工智能学习与实训社区,反对一站式模型在线开发与利用。提供优质开源模型、丰盛的开源内容、功能强大的在线编程环境、云端超强 GPU 算力及存储资源,帮忙开发者们疾速创立和部署模型,实现一键运行即开即用。目前 AI Studio 已汇集 400+ 万开发者、创作 550+ 万实训我的项目、凋谢 20+ 万数据集,打造 180+ 个 AI 课程、开办/承办 400+ 场较量,笼罩开发者不同阶段、不同场景、不同行业、不同档次的开发与利用需要。 飞桨 AI Studio 精选速递将定期为大家介绍最新的开源内容、最热的利用方向等。本期飞桨 AI Studio 精选速递为利用专区,为大家带来这些可间接体验的 AI 利用。 语言模型利用基于本地知识库的主动问答大模型时代,让咱们物尽其用! 该利用基于 LangChain 和大语言模型 ChatGLM-6B 构建本地常识问答库, 反对间接上传文档,无需更多整顿,间接以 QA 的模式获取答案。 开发者:Thomas-yanxin 利用链接https://aistudio.baidu.com/aistudio/projectdetail/6195067 多 LLM 的生成成果评测开源模型哪家好?来这里一站式比照! 该利用提供一键式的基于多个 LLM 的生成成果评测,不便开发者自我评估模型成果,也不便高阶开发者更为直观且精确地分析模型在场景、参数等之间的差别。 开发者:Thomas-yanxin 利用链接https://aistudio.baidu.com/aistudio/projectdetail/6145966 RWKV-Novel 中文小说续写一键成为小说作家?续写拓展你的灵感乍现! 该利用了 ChatRWKV 上比拟热门的两类模型:用于间断对话的 Raven 聊天机器人、用于小说续写的 Novel 模型,输出小说前文,即可主动续写小说后续。 开发者:艾梦 利用链接https://aistudio.baidu.com/aistudio/projectdetail/5947826 ChatGLM-6B 本地化对话无需魔法!开启体验式对话! 该利用是基于开源模型 ChatGLM-6B 搭建的对话机器人,已根本能生成合乎人类偏好的答复。 ...

June 5, 2023 · 1 min · jiezi

关于paddle:百度倾力出品|神经网络机器翻译技术及产业应用正式上线

随着经济社会的国际交流单干日益亲密,人们迫切需要高质量、高效率的跨语言信息获取和流传工具。 《神经网络机器翻译技术及产业利用》以产业需要为牵引,剖析了新期间机器翻译的产业需要特点和挑战,介绍了神经网络翻译的根本实践、前沿技术以及面向产业利用的实用零碎开发方法。 《神经网络机器翻译技术及产业利用》次要面向相干畛域的学生、科研人员、技术开发人员以及语言服务行业的从业人员。 读者能够通过本书厘清机器翻译技术的倒退脉络,疾速理解和把握最新办法,还能够依据书中的解说,在开源平台上疾速搭建实用的机器翻译零碎。 《神经网络机器翻译技术及产业利用》共九章,由浅入深地为读者解说神经网络机器翻译的前世今生。 本书特色 权威性:顶级专家独特执笔专业性:介绍机器翻译畛域的多种技术,面向产业利用和畛域支流技术实践性:联合国内外知名企业的产业实际,提供多种机器翻译零碎的搭建指南可读性:内含大量插图、示例、伪代码,便于浏览了解作者简介 王海峰,百度首席技术官,深度学习技术及利用国家工程钻研核心主任。国内计算语言学学会(ACL)首位华人主席、ACL亚太分会开创主席、ACL Fellow、IEEE Fellow、CAAI Fellow。长期从事机器翻译、自然语言解决、深度学习等人工智能技术的钻研及产业化工作。以第一实现人身份获国家技术创造二等奖、国家科技进步二等奖、中国专利金奖、北京市科技进步一等奖、中国电子学会科技进步一等奖,获光华工程科技奖、全国翻新争先奖、吴文俊人工智能卓越贡献奖等。 何中军,百度人工智能技术委员会主席。长期从事机器翻译钻研与开发,并致力于推动机器翻译大规模产业化利用。曾获国家科技进步二等奖、北京市科技进步一等奖、中国电子学会科技进步一等奖、中国专利银奖等多项处分。被评为“中国电子学会优良科技工作者”“北京青年楷模”等。 吴华,百度技术委员会主席。长期从事机器翻译、自然语言解决、机器学习等技术的钻研及产业化工作。曾获国家技术创造二等奖、国家科技进步二等奖、中国专利金奖、北京市科技进步一等奖、中国电子学会科技进步一等奖。被评为“卓越工程师”“青年北京学者”等。 点击下方链接即可购书。https://item.jd.com/10076043497736.html

June 2, 2023 · 1 min · jiezi

关于paddle:2023-CCF百度松果基金正式启动申报大语言模型AIGC等热点课题首次公布

5 月 31 日,2023 年 CCF-百度松果基金(简称“松果基金”)正式启动申报,面向寰球高校及科研院所青年学者凋谢,入选我的项目将取得松果基金百万课题基金及千万级反对与服务。申报截至 2023 年 7 月 10 日。 本届松果基金共设置七大课题方向,不仅判若两人器重 AI 根底科研,同时聚焦行业技术前沿,新增大语言模型、跨模态大模型技术及 AIGC 利用等热门课题,深入 AI 科学计算课题,激励 AI 翻新人才申报,扩容降级人工智能技术生态圈。 搭台:依靠自研平台,促成寰球 AI 人才产学研单干松果基金于 2020 年由百度与中国计算机学会(CCF)独特发动,是目前国内惟一基于中国首个自主研发、开源凋谢、功能丰富的产业级深度学习平台飞桨设立的科研基金。松果基金通过为期一年的课题我的项目,提供数百万课题基金,以及价值千万的平台、数据、技术等多维度反对,为寰球 AI 翻新人才搭建产教交融及学术交流的平台。 作为百度“500 万 AI 人才培养”打算的重要组成部分,松果基金自成立以来备受学界关注。三年内,松果基金已收到来自北京大学、清华大学、中国科学院、香港理工大学、苏黎世联邦理工学院等海内外顶级高校和科研院所超过 800 份我的项目申请。 争先:颁布七大课题,摸索AI前沿技术热点2023 年度松果基金七大课题方向为:深度学习基础理论和技术、深度学习框架技术、大语言模型、计算机视觉、AI+科学计算、推理部署关键技术钻研与开源实现、跨模态大模型技术及 AIGC 利用。不难看出,松果基金在命题方向的一大特点——将根底技术实践与前沿科研方向紧密结合。在今年根底上,往年更深刻细化了钻研办法举荐和规范。 随着 ChatGPT、百度文心一言点燃 AI 产业倒退新高潮,课题新增了大语言模型、跨模态大模型技术及 AIGC 利用两大方向。飞桨深度学习平台和文心大模型联结优化,文心一言在一个多月工夫推理性能晋升了近 10 倍,效率更高,成果更好。大语言模型的钻研与利用对学术研究既是挑战也是不可多得的机会。松果基金期待接管到更多能为行业提供实践和办法领导的课题我的项目,推动国产大模型弯道超车。 另一课题 AI 科学计算,则被业内视为继大模型后另一 AI 的重点倒退方向,该课题波及计算流体力学、分子动力学、地球科学、工程计算畛域。近期,百度生物计算团队提出的 mRNA 序列优化算法 LinearDesign 登载在国内顶级学术期刊《Nature》正刊,百度也成为首个以第一单位在该刊发表论文的中国科技互联网企业。该团队提出用 AI 优化设计更无效、更稳固的 mRNA 疫苗,这正是 AI 科学计算畛域的重要冲破。当下,科学计算正进入迷信智能的新阶段。 赋能:搀扶青年学者,降级AI技术生态圈2023 松果基金从 5 月 31 日起承受申报,7 月 10 日截止。取得松果基金反对的青年学者,将取得基金赞助,围绕相干课题发展钻研,产出顶级期刊论文、专利、开源我的项目等引领学术翻新的科研成果。往届松果学者研究课题,复旦大学陈智能的“基于 PaddleOCR 的商品图像文本检测与辨认”,东南大学张竞慧的“异构 GPU 集群下基于流水线的分布式深度学习训练优化技术钻研”,大连理工大学刘胜蓝的“基于百度飞桨平台的时空细粒度人体动作剖析钻研”,均聚焦在前沿畛域,具备广大的行业利用空间。 ...

June 1, 2023 · 1 min · jiezi

关于paddle:基于数据驱动-UNet-模型的大气污染物扩散快速预测提升计算速度近6000倍

我的项目背景以后,常见的大气污染预测模型大多是基于物理机理构建的,比方空气质量预测模型 Calpuff、AERMOD、CMAQ 等。然而,这些模型运算较为简单,对于输出数据的要求十分高,运算耗时也比拟长,适宜用于惯例固定区域的预报。当遇到突发净化事件时,就无奈无效发挥作用。 针对以上问题,本我的项目以某城区 3km*3km 范畴的固定模仿区域,依据污染物扩散模型,疾速计算任意开释点源和任意风向的污染物扩散动图,并进行精度评估。仅利用城市部分污染物扩散云图作为输出,应用深度学习模型提取图像中污染物扩散的特色,纯数据驱动,无需建设物理模型,预测耗时短,适宜作为突发净化扩散事件时的应急处理决策辅助。 我的项目需要课题名称基于数据驱动的污染物扩散深度学习模型案例 课题需要内部单位提供数据集,总数据集详细描述:120 个动图数据(3 个风速5 个开释源点位 8 个风向)。选取其中任意 1 个动图的数据,基于数据驱动类模型(模型不限度)提取数据特色,失去污染物扩散模型,可对污染物扩散进行预测。 我的项目地址https://aistudio.baidu.com/aistudio/projectdetail/5663515 实现过程数据集咱们抉择了风速 15m/s,风向正北,Pos_0 作为污染源开释点的动图数据,数据来源于某城区 3km*3km 范畴的固定区域内污染物扩散 CFD 模仿后果(南京欧帕提亚公司提供),共 745 秒 148 张污染物浓度云图,两张图片工夫距离 5 秒。 基于飞桨 2.4.0 的开发环境,在对动图解压之后,咱们发现动图解压失去的 181 张动态图片中第 148 张之后的图片存在显著的图像抖动。咱们采纳了基于 Harris 角点检测的图像对齐算法进行解决,然而图像抖动没有失去齐全打消。为了保障模型输出数据的品质,咱们抛弃了第 148 张之后的动态图片。 图1  原始数据 U-Net 网络模型网络模型如图 2 所示,其由 3 个 Encoder/Decoder、9 个卷积 Conv、9 个反卷积 Conv-T 组成,约 30 万个训练参数。之所以抉择 U-Net,是因为该网络在图像宰割和指标辨认中利用宽泛,污染物扩散模式学习能够看作是一种动静的指标辨认工作,只不过指标的状态比拟形象;另一个起因是 U-Net 的代码实现较简略,短时间内能够实现网络的搭建。 图2 U-Net网络图 外围代码import paddleimport paddle.nn as nnimport paddle.nn.functional as Ffrom paddle.nn.utils import weight_norm# 创立根底卷积层def create_layer(in_channels, out_channels, kernel_size, wn=True, bn=True,                 activation=nn.ReLU, convolution=nn.Conv2D):    assert kernel_size % 2 == 1    layer = [ ]    conv = convolution(in_channels, out_channels, kernel_size, padding=kernel_size // 2)    if wn:        conv = weight_norm(conv)    layer.append(conv)    if activation is not None:        layer.append(activation())    if bn:        layer.append(nn.BatchNorm2D(out_channels))    return nn.Sequential(*layer)# 创立Encoder中的单个块def create_encoder_block(in_channels, out_channels, kernel_size, wn=True, bn=True,                         activation=nn.ReLU, layers=2):    encoder = [ ]    for i in range(layers):        _in = out_channels        _out = out_channels        if i == 0:            _in = in_channels        encoder.append(create_layer(_in, _out, kernel_size, wn, bn, activation, nn.Conv2D))    return nn.Sequential(*encoder)# 创立Decoder中的单个块def create_decoder_block(in_channels, out_channels, kernel_size, wn=True, bn=True,                         activation=nn.ReLU, layers=2, final_layer=False):    decoder = [ ]    for i in range(layers):        _in = in_channels        _out = in_channels        _bn = bn        _activation = activation        if i == 0:            _in = in_channels * 2        if i == layers - 1:            _out = out_channels            if final_layer:                _bn = False                _activation = None        decoder.append(create_layer(_in, _out, kernel_size, wn, _bn, _activation, nn.Conv2DTranspose))    return nn.Sequential(*decoder)# 创立Encoderdef create_encoder(in_channels, filters, kernel_size, wn=True, bn=True, activation=nn.ReLU, layers=2):    encoder = [ ]    for i in range(len(filters)):        if i == 0:            encoder_layer = create_encoder_block(in_channels, filters[i], kernel_size, wn, bn, activation, layers)        else:            encoder_layer = create_encoder_block(filters[i - 1], filters[i], kernel_size, wn, bn, activation, layers)        encoder = encoder + [encoder_layer]    return nn.Sequential(*encoder)# 创立Decoderdef create_decoder(out_channels, filters, kernel_size, wn=True, bn=True, activation=nn.ReLU, layers=2):    decoder = []    for i in range(len(filters)):        if i == 0:            decoder_layer = create_decoder_block(filters[i], out_channels, kernel_size, wn, bn, activation, layers,                                                 final_layer=True)        else:            decoder_layer = create_decoder_block(filters[i], filters[i - 1], kernel_size, wn, bn, activation, layers,                                                 final_layer=False)        decoder = [decoder_layer] + decoder    return nn.Sequential(*decoder)# 创立网络class UNetEx(nn.Layer):    def __init__(self, in_channels, out_channels, kernel_size=3, filters=[16, 32, 64], layers=3,                 weight_norm=True, batch_norm=True, activation=nn.ReLU, final_activation=None):        super().__init__()        assert len(filters) > 0        self.final_activation = final_activation        self.encoder = create_encoder(in_channels, filters, kernel_size, weight_norm, batch_norm, activation, layers)        decoders = [ ]        # for i in range(out_channels):        decoders.append(create_decoder(out_channels, filters, kernel_size, weight_norm, batch_norm, activation, layers))        self.decoders = nn.Sequential(*decoders)    def encode(self, x):        tensors = [ ]        indices = [ ]        sizes = [ ]        for encoder in self.encoder:            x = encoder(x)            sizes.append(x.shape)            tensors.append(x)            x, ind = F.max_pool2d(x, 2, 2, return_mask=True)            indices.append(ind)        return x, tensors, indices, sizes    def decode(self, _x, _tensors, _indices, _sizes):        y = [ ]        for _decoder in self.decoders:            x = _x            tensors = _tensors[:]            indices = _indices[:]            sizes = _sizes[:]            for decoder in _decoder:                tensor = tensors.pop()                size = sizes.pop()                ind = indices.pop()                # 反池化操作,为上采样                x = F.max_unpool2d(x, ind, 2, 2, output_size=size)                x = paddle.concat([tensor, x], axis=1)                x = decoder(x)            y.append(x)        return paddle.concat(y, axis=1)    def forward(self, x):        x, tensors, indices, sizes = self.encode(x)        x = self.decode(x, tensors, indices, sizes)        if self.final_activation is not None:            x = self.final_activation(x)        return x训练训练时输出数据为上一时刻的污染物云图,输入为预测的下一时刻的污染物云图。以后的训练 batch-size 为 1,即只预测下一时刻的污染物扩散状况。训练时,每 10 个 epoch 保留一次模型,避免训练意外中断时模型参数失落。 ...

May 31, 2023 · 1 min · jiezi

关于paddle:全国流体力学盛会召开飞桨AI4S携最新科研进展亮相西湖大学

5月20-21日,第四届全国智能流体力学研讨会暨第二届智能流体力学产业联合体大会在西湖大学召开。此次会议由中国力学学会、中国空气动力学会、《水动力学钻研与停顿》编委会、西湖大学、浙江大学、上海交通大学、中国船舶团体第七〇八研究所主办;上海中船编印社有限公司、中国力学学会流体力学专委会、中国空气动力学会智能空气动力学专业组、喷水推动重点实验室、智能流体力学产业联合体、西湖大学工学院、西湖大学将来产业钻研核心承办。会议共吸引了200多位来自全国各地高校与企业的老师与学生参会,大家独特探讨流体力学前沿钻研及其在各学科与工程畛域的利用。 百度飞桨作为本次大会协办方,为流体力学及相干畛域工作的科学家和工程师提供交换和沟通的平台,增进相干方面的单干,并与主办方一起推动 AI for Science 的倒退。 会议邀请到中国空气能源钻研与倒退核心、中国空气动力学会理事长、中国科学院院士唐志共、西湖大学讲席传授崔维成、浙江大学航空航天学院副院长王顶峰、西北工业大学长江学者特聘传授、智能空气动力学专业组主任张伟伟进行致辞。 在会议主会场上,上海交通大学刘应征传授、中国空气能源钻研与倒退核心钱炜祺研究员、浙江大学高琪传授、上海交通大学徐辉传授、中国科学院力学研究所杨晓雷研究员、北京航空航天大学潘翀传授、哈尔滨工业大学 Bernd Noack 传授、浙江大学罗坤传授、西湖大学范迪夏传授,中国科学院计算技术研究所贾伟乐研究员、北京大学赵耀民传授、浙江大学谢芳芳传授和百度飞桨周旷野博士进行了主题演讲,论述了对智能流体力学倒退的观点和科研停顿。在会议分会场上,来自海内外高校科研院所的老师就“智能水动力学”“智能空气动力学”“智能流体试验与智能实践”三个方向进行了28场精彩纷呈的报告。 会议间歇期间西湖大学范迪夏传授举办了一场沙龙,大家对智能流体力学的将来倒退、学科建设、人才培养等议题进行了探讨。会后大家还参观了西湖大学校园和范迪夏传授的流体智能与信息化实验室,并进行了深刻的交换。 主题分享,赛桨 PaddleScience 最新科研停顿 作为百度飞桨 AI for Science 团队的代表,周旷野博士做了主题为“基于 PINN 的转子间隙定常 Taylor-Couette 涡模仿”的报告。PINN是一种基于神经元网络求解偏微分方程的一种办法。 本报告中,咱们介绍了基于飞桨自研套件赛桨 PaddleScience 搭建的多工况 Multi-Operation Condition PINN (mocPINN) 模型,实现不依赖任何先验数据(仿真和试验数据),仅依赖流体力学 Navier-Stokes 方程,求解低雷诺数下的一种 Taylor-Couette 涡模式——Couette 流。mocPINN 通过学习肯定雷诺数范畴内无限个工况的 Taylor-Couette 涡(训练过程),就能够预测这个雷诺数范畴内任意工况的流动(推理过程),证实该模型具备较好的泛化性,并且能够预计 mocPINN 在多工况计算耗时上会优于 CFD 求解,因为 CFD 多工况求解耗时是线性叠加的,而 mocPINN 是同步求解多工况问题,这与主会场上浙江大学罗坤传授的观点相互印证。 诚然,对于高雷诺数的 Taylor-Couette 涡模式,比方 Steady Taylor Vortex,mocPINN 办法还无奈学习到其中特地简单的二次流景象(二次流速度远远小与支流速度),阐明 PINN 办法自身在求解特地简单的流动景象上还存在一些挑战。将来咱们期待与企业、高校、科研院所以及超算等搭档,通过 AI for Science 共创打算,解决这类难题,携手独特建设基于飞桨的 AI for Science 畛域顶尖开源我的项目,打造沉闷的前瞻性的 AI for Science 开源社区,建设产学研闭环,推动科研翻新与产业赋能。 ...

May 30, 2023 · 1 min · jiezi

关于paddle:听听飞桨框架硬核贡献者如何玩转开源

当俯视星空时,你在想什么?我在设想,将来可能是什么样子。从利用宽泛的人工神经网络,到火遍全网的AIGC,发明新宇宙的人,置信永远看不到天花板。 在这些神奇的AI产品背地,有一个了不起的开源我的项目——飞桨PaddlePaddle。飞桨以百度多年的深度学习技术钻研和业务利用为根底,是中国首个自主研发、性能齐备、开源凋谢的产业级深度学习平台。目前,飞桨累计开发者535万,服务企业20万家,基于飞桨开源深度学习平台产生了67万个模型。《2022中国开源年度报告》数据显示,飞桨PaddlePaddle开源我的项目位列GitHub中国我的项目活跃度榜首;在Linux基金会颁布的寰球开源我的项目中,飞桨开源能源指数进入国内Top 30。 在飞桨开源社区,有90余个开源代码仓库,16700+贡献者,开源社区的沉闷离不开每一个人的参加。本着凋谢、共享、协同的开源精力,大家在飞桨开源社区独特发展了许多乏味硬核的开源流动。包含飞桨黑客松、高兴开源流动、PFCC meetup等。 这里有急躁、技能精湛、专职开源的社区导师;这里有乏味、乐于分享、酷爱开源的社区开发者;这里有类型多样、充斥挑战的社区开源我的项目;这里有乏味好玩、学常识、交朋友的社区活动。 参加飞桨开源社区,不仅丰盛本人的经验,也能取得来自社区的认可。 在这里,与你一起定义飞桨的将来。 飞桨自2016年开源至今,受到了许许多多开发者的认可与青睐,也汇聚了一大批酷爱开源的社区贡献者,飞桨框架贡献者数量一直增长,飞桨框架主仓库贡献者PR占比继续进步。社区开发者与飞桨研发工程师联合开发我的项目,在框架动态图算子主动生成、PHI算子库独立编译、丰盛飞桨API体系、飞桨文档体验优化、CINN算子开发、动转静性能优化等多个畛域奉献成绩显著。 某个月周期内飞桨主仓库PR状况-Top15贡献者外面9个内部开发者 「贡献者说」 一起来听一听他们和飞桨的故事吧。 社区committer 001 GitHub ID: SigureMo 作为一名开源开发者,逛GitHub刷issue和PR list是我每天必做的事件,一旦发现一些感兴趣的且力不从心的问题,我便会提一个PR去尝试解决。当然,我与飞桨也是如此结缘的,从修typo到参加Hackathon再到参加Call for Contributions,人不知;鬼不觉就奉献了上百个PR。在这个过程中,我也见证了飞桨开源社区的倒退,随着黑客松、Call for Contributions、高兴开源等流动的一直发展,飞桨曾经吸纳了大量的优良开发者,PFCC的建设也行之有效,曾经有越来越多的开发者参加到 飞桨的开源共建中来,为飞桨的开源建设提供了极大的助力。 社区committer 002 GitHub ID: Liyulingyue 作为一个非专业的开源开发者,我最开始接触飞桨PaddlePaddle是在AI Studio上学习深度学习的相干我的项目。机缘巧合之下,接触到了飞桨PaddlePaddle的文档评审工作,参加了飞桨API文档的评审工作,并对API文档进行修改。在这个过程中,我减少了对飞桨API的理解,也理解到框架开发工作。之后,通过高兴开源流动,着手于一些简略的开发工作,例如修复飞桨PaddlePaddle的零除问题、PHI算子库注册等,逐步减少对飞桨PaddlePaddle框架的意识。围绕着飞桨PaddlePaddle框架开发,我播种了SigureMo、gouzil、enkilee、sanbuphy等敌人的帮忙,结识了许多的小伙伴,也有机会和很多小伙伴们一起单干趣味的我的项目开发,独特成长。 社区committer 003 GitHub ID: enkilee 我最开始接触飞桨PaddlePaddle是在网上寻找收费的GPU算力进行机器学习,而后找到了国内最有诚意也最大气的AI Studio,同时发现下面很多根底课程,就开始学习相干我的项目。在查看API文档的时候,机缘巧合之下,进了飞桨PaddlePaddle的API文档批改组,结识了孙师傅和梦徒弟。在这个过程中,学会了提PR。并在后续的高兴开源流动中,通过飞桨研发提出的Issue清单,对飞桨PaddlePaddle有了更粗浅意识。前面为了晋升本人的能力加入了黑客松第四期,在开发算子题目中就发现高兴开源流动的各类题目对黑客松有着十分大的帮忙,同时也播种了很多敌人的帮忙,结识了许多的小伙伴。心愿在花花、孙师傅、梦徒弟、涛姐和各位飞桨大佬的帮忙下,PaddlePaddle社区吸引更多开源爱好者独特保护飞桨框架! 社区contributor GitHub ID: gouzil 我和开源我的项目飞桨PaddlePaddle的故事是我从2021年的实习开始的,那个时候我从公司的我的项目中接触到了飞桨PaddlePaddle,我开始不满足于公司的应用层业务,开始将趣味的一部分转向了开源我的项目,心愿开源软件的学习可能更好的将工作须要工具化的局部承载起来,一次偶尔的机会遇到孙师傅的API文档评测,缓缓的我开始在飞桨PaddlePaddle的主仓库修复文档了,前面我开始不满足于只停留在文档,退出了飞桨高兴开源流动,也是往年开始着手飞桨PaddlePaddle的一些开发流动,以及提一些 RFC,提倡议,编译优化,线下WAVE SUMMIT等流动外面去,随着社区的倒退,PFCC的成员从30多人到2023年到了90多人,这得益于花花、孙师傅、梦徒弟、以及涛姐和各个部门研发人员的继续耕耘,也同样是飞桨PaddlePaddle社区凋谢交换的文化,吸引着咱们这群深度学习框架爱好者们走在一起。 社区contributor GitHub ID: zrr1999 我最后是在师兄的举荐下加入了飞桨黑客松的第三期,也开始接触到飞桨PaddlePaddle这个开源社区。那时我接触到了深度学习编译器CINN的赛题,我开始学习和摸索CINN的代码和架构。在这个过程中,我提交了我的第一个正式的PR,这也是我在开源社区的第一个正式提交。在接下来的几个月里,我逐步深刻理解飞桨PaddlePaddle的代码和架构,我开始参加到飞桨PaddlePaddle的开发中。我提交了一些PR,其中最有挑战性的一个是对于稠密矩阵sum算子的优化。在这个过程中,我学到了很多对于深度学习框架的常识,也意识到了很多气味相投的开发者。除了黑客松第三期,我还加入了高兴开源流动和黑客松的第四期。在这些流动中,我意识了更多的社区大佬和飞桨的社区维护者。我和他们交流经验和技巧,也学习到了很多新的常识和技能。总之,我非常感谢飞桨PaddlePaddle社区给我提供了一个学习和成长的平台。我会持续致力,为这个社区做出更多奉献。 社区contributor GitHub ID:RedContritio 作为一名飞桨PaddlePaddle框架开发者,我与飞桨PaddlePaddle开源社区未然同行近一年。正如first PR通常是fix typo,我最后退出开源社区,也从为文档仓库奉献开始。随着对飞桨PaddlePaddle理解的逐步深刻,我参加的工作范畴,也逐步深刻到python api、cpp代码中,在更底层的角度了解飞桨PaddlePaddle框架。开发中,不免和reviewer意见抵触,只管偶然能据理力争,更多时候则是被大佬们的透彻了解和周密思路所折服,在集体为框架奉献的同时,也反哺集体能力与思维的晋升。\与飞桨PaddlePaddle同行的路上,我不仅学到了很多深度学习方面的常识与技能,也结识了许多气味相投的敌人。将来,我也将持续与PFCC的同好和潜在的集体贡献者们携手前进,持续为飞桨PaddlePaddle框架的倒退与推广奉献出本人的力量。 社区contributor GitHub ID:huangjiyi 我和飞桨PaddlePaddle的故事开始于去年11月我偶尔看到的一篇黑客松收官推文,那时我还只是PyTorch的用户,没用过飞桨PaddlePaddle,对于推文里介绍的那些框架建设工作也不理解,但出于对深度学习框架的底层实现的趣味,我增加了推文下方企业花花的微信,退出了高兴开源群。起初一次机会在群里看到了PHI算子库独立编译工作的公布,开源小白的我实现了GitHub上的第一个PR,刚开始的我改一两行代码就畏手畏脚,但随着陆续实现了更多任务,我对飞桨PaddlePaddle框架有了肯定的理解,提起PR来也得心应手了。再起初通过花花和涛姐的帮忙,我很幸运地获取了去百度实习的机会,我也把握住了这个机会,通过实习我对飞桨的一些实现机制有了更深的理解,同时也积攒了一些开发教训,目前我也持续在飞桨开源流动中实现一些工作,心愿可能学到更多的同时也能为飞桨的建设做出小小的奉献。 ...

May 29, 2023 · 1 min · jiezi

关于paddle:设计师解放双手之作3秒生成风景园林效果图AIGC赋能景观设计

我的项目简介在过来几十年,风景园林经验了从“刀耕火种”的齐全手绘设计时代到当下比拟风行的参数化设计时代,过来的每一轮技术革新都让风景园林作品的表现形式产生了微小的扭转。随着计算机图像技术的倒退,咱们有更多的建模和渲染软件辅助晋升图纸体现成果,但体现成果晋升的背地随同的是越来越微小的人力资源投入,一张好看的效果图须要通过建模、渲染、图像编辑等多个软件繁冗重复操作能力生产进去,加班熬夜重复性地绘图已成为行业常态。简而言之,过来计算机图像技术的倒退并没有让设计师的工作更加轻松,反而成为了一把惨重的“桎梏”。 在人工智能生成内容技术(Artificial Intelligence Generated Content,AIGC)井喷式倒退的背景下,风景园林行业正经验着智能化改革。如何借助人工智能技术进一步提高设计效率、实现疾速多样化设计,对满足用户多样和变动的需要、扭转行业投入高和人效低现状有重要意义。在飞桨 AI Studio 和 PPDiffusers 的反对下,华南农业大学 SCUrban Lab 团队尝试在风景园林的场景下对 Stable Diffusion 模型进行调教优化。本文将分享以后摸索成绩,除此之外,咱们也公开了一个“城市公园”场景下的 LoRA 模型权重,欢送大家测试反馈。 环境装置PPDiffusers 介绍PPDiffusers 是一款反对多种模态(如文本图像跨模态、图像、语音)扩散模型(Diffusion Model)训练和推理的国产化工具箱。依靠于飞桨框架和 PaddleNLP 自然语言解决开发库,PPDiffusers 提供了超过50种 SOTA 扩散模型 Pipelines 汇合,反对文图生成(Text-to-Image Generation)、文本疏导的图像编辑(Text-Guided Image Inpainting)、文本疏导的图像变换(Image-to-Image Text-Guided Generation)、超分(Super Resolution)在内的10+工作,笼罩文本图像跨模态、图像、音频等多种模态。 PPDiffusers 装置如果您是刚接触 Python 编程的新用户,咱们举荐应用以下便捷的 pip 的装置形式: pip install --upgrade ppdiffusers -f https://www.paddlepaddle.org.cn/whl/paddlenlp.html --user因为最近 AIGC 倒退速度比拟快,PPDiffusers 代码仓库更新也比拟频繁,如果您有肯定的 Python 根底,咱们举荐克隆 PaddleNLP 仓库源代码进行手动装置。 git clone https://github.com/PaddlePaddle/PaddleNLPcd PaddleNLP/ppdiffuserspython setup.py install模型介绍本我的项目次要用到的是模型是 Stable Diffusion V1.5 版本和 ControlNet。为了使生成图像的体现成果更加靠近事实场景,咱们也应用了基于 Stable Diffusion 的 Realistic Vision V2.0 模型。针对风景园林公共景观设计畛域,咱们实验室利用自有的城市公园图像数据库训练了 CityParkLoraV1 权重模型并开源,同时咱们还应用了针对地产景观的 Fair-faced-concrete-V1 微调权重,所有开源地址的模型附在文章最初,在此也对所有开源贡献者示意衷心感谢。 效果图生成利用基于文字生成与设计大类业余相似,在景观设计院的工作过程中,咱们也简直每天都会收到来自甲方各式各样的文字需要,比方咱们常常调侃的“五彩斑斓的黑”“尊贵大气而低调的格调”等等。对于老成持重的设计师,外表上笑脸嘻嘻投合甲方,但心田早已万马奔腾。所以咱们第一个场景试验就是基于文字的景观成果图像生成,上面咱们就演示一个湿地公园景观生成场景。 推理代码: ...

May 26, 2023 · 1 min · jiezi

关于paddle:又一开发者公布高分方案源代码助力软件杯选手高效解题

本文作者:艾宏峰 算法工程师M6 Global赛道总排名4thKDD Cup 2022风电功率预测飞桨赛道5th“中国软件杯”大学生软件设计大赛——龙源风电赛道,5月31日预选赛截止,80%选手将升级区域赛,欢送大家放松报名! 赛题背景随着清洁能源的疾速倒退,风力发电曾经成为可再生能源的重要组成部分,然而风具备随机性特点,惯例天气预报无奈精确反映出风电场所在区域的实在风速,从而造成发电功率预测准确率低下,影响电力供需平衡。因而,进步风电功率预测的准确性,为电网调度提供迷信撑持,对我国能源产业有非常重要的价值。 此次赛题由百度飞桨和龙源电力设置,数据集由寰球最大风电经营企业龙源电力提供,采集自实在风力发电数据,要求选手基于百度飞桨 PaddlePaddle 设计一个能够通过深度学习技术实现对风力发电进行功率预测及治理的软件系统。 时序预测技术介绍工夫序列预测技术是指基于历史数据和工夫变化规律,通过数学模型和算法对将来发展趋势进行预测的一种技术。工夫序列预测技术广泛应用于经济、金融、交通、气象等畛域,以帮忙人们做出更加精确的决策。 时序预测从不同角度看有不同分类: 从实现原理的角度,能够分为:传统统计学,机器学习(又分非深度学习和深度学习);按预测步长辨别,能够分为单步预测和多步预测;按输出变量辨别,能够分为自回归预测和应用协变量进行预测;按输入后果辨别,能够分为点预测和概率预测;按指标个数辨别,能够分为一元、多元、多重工夫序列预测 这些分类是不同角度下的分类,同一种算法往往只能是分类中的一种,例如传统的统计学算法只适宜做自回归预测而不适宜协变量预测。 工夫序列预测技术的钻研历史能够追溯到20世纪初期。最早的工夫序列预测办法是基于工夫平均法和线性趋势法,起初倒退出了指数平滑法、ARIMA 模型、神经网络模型等预测办法。随着机器学习和深度学习的倒退,工夫序列预测技术也失去了一直的拓展和翻新,比方 Transformer 与时序的联合。 风电功率预测钻研意义与价值工夫序列预测技术有着宽泛的利用场景。例如, 在经济畛域,工夫序列预测技术能够用于股票市场预测、经济增长预测、通货膨胀预测等。在交通畛域,工夫序列预测技术能够用于公交车到站工夫预测、交通拥堵预测等。在气象畛域,工夫序列预测技术能够用于气象灾祸预警、天气变动预测等。而在风电功率预测上,其钻研意义和价值更不容忽视,它们包含: 进步风电发电效率:通过精准预测风电功率,能够合理安排风电机组的运行,进步风电发电效率,缩小能源节约。保障电网稳固运行:风电功率预测能够帮忙电网运营商及时调整电网负荷,防止电网过载或供电有余等问题,保障电网稳固运行。促成可再生能源倒退:风电功率预测能够进步风电发电的可靠性和经济性,促成可再生能源倒退,升高对传统能源的依赖。升高能源老本:通过精准预测风电功率,能够无效防止风电机组的过剩和有余,升高能源老本,进步能源利用率。推动智能电网建设:风电功率预测是智能电网建设的重要组成部分,能够实现对风电发电的精准监控和治理,推动智能电网建设。赛制赛段预选赛5月31日截止,算法赛,80%选手升级区域赛; 区域赛6-7月,算法赛60%+软件赛40%,颁发省级奖项; 总决赛8月,软件赛,颁发国赛奖项。 赛题数据本赛题数据集由寰球最大风电经营企业龙源电力提供,采集自实在风力发电数据。预选赛训练数据和区域赛训练数据别离为不同10个风电场近一年的运行数据共30万余条,每15分钟采集一次,包含风速、风向、温度、湿度、气压和实在功率等,具体的数据字段中英文对应如下: WINDSPEED 预测风速WINDDIRECTION 风向TEMPERATURE 温度HUMIDITY 湿度PRESSURE 气压PREPOWER 预测功率(系统生成)ROUND(A.WS,1)理论风速ROUND(A.POWER,0) 理论功率(计量口径一)YD15 理论功率(预测指标,计量口径二) 注:“预测风速”字段,指的是由权威的气象机构,像是中央气象台、欧洲国家气象中心等公布的商业气象数据源。从工夫线来说,理论功率预测须要提前 36 个小时、72 个小时、240 的小时等取得数值天气预报,从而进行功率的预测。 数据注意事项 原始数据集存在不同格局的风机数据,须要额定的数据拼接解决工作;每个风机的最初一天的 ROUND(A.POWER,0)和 YD15 两个字段数据根本为空,这是出题方心愿咱们预测填空的数据;csv 内的工夫戳未必有序,须要自行排序;数据存在缺失和离群值;数据存在反复样本(即同一时间戳有多条样本)。以风机04为例,反复样本数量: 34764, 占比: 38.68340232340766%。以风机4为例的EDA后果展现 官网对数据的一些回复 因为测量设施和网络传输问题,YD15 可能呈现数据异样(包含用于评测的输出数据)。实际上因为一些脏数据的存在,YD15 有时候会缺失或异样,这个时候 ROUND(A.POWER,0)如果有正常值的话,能够被视为YD15的代替。YD15 的异样值解决规定是,当 YD15 为空时,依照逻辑顺次用 ROUND(A.POWER,0)、PREPOWER 进行替换。如何定义 YD15 存在异样?在本赛题中,YD15 异样包含两种状况:(1) 空值,(2) 在一段时间内、其它字段失常变动时,YD15 继续齐全不变。除以上两种状况之外,YD15 的数值变动都可认为是失常景象,如为 0 或负值。集体补充 ...

May 25, 2023 · 1 min · jiezi

关于paddle:顺丰科技携手飞桨自研智能外呼机器人为客户打造优质服务体验

“您好,请问是李立学生吗”,或者不少人在拨通客服电话后发现是机器人客服,都心愿能快点转人工。但顺丰的“客服机器人”却是“不同凡响”的存在。 顺丰已成为国内当先的快递物流综合服务商、寰球第四大快递公司,依靠当先的科技研发能力,为用户提供便捷、业余、有温度寄递服务。作为顺丰的智慧大脑,顺丰科技聚焦实现物流大网和供应链底盘的数智化转型与降级,通过买通营运、销售、体验等环节与板块的数字闭环,助力客户体验晋升。 顺丰科技的自然语言解决(NLP)团队基于飞桨语音模型库 PaddleSpeech 自研了“智能外呼机器人”的语音合成零碎,于2022年双十一前夕正式上线并继续稳固运行,助力业务提质增效。 据悉,顺丰科技 NLP 总工李理率领团队借助飞桨深度学习平台提供的开源语音模型库,用时不到半年就实现了语音合成自研性能开发、测试和上线利用。顺丰速运全国客服热线“95338”每月的热线外呼告诉、回访、调研等,其中有百万话务量都是通过“智能外呼机器人”实现。 为了长线倒退,自研是为了更好的服务顺丰的快递小哥在上门派送前,通常会通过“95338”与客户进行电话沟通,询问客户是否在家、可不可以当初派送,或者什么时候派送等内容。“智能外呼机器人”解决方案,便是用外呼机器人代替快递小哥本人打电话的形式与客户提前沟通,该计划早已有较为宽泛的利用,帮忙快递员大幅晋升了工作效率,也为用户带去更优质的服务。 此前,顺丰通过外采语音合成技术和产品,发展“智能外呼机器人”服务。然而,随着近年来顺丰团体业务量的快速增长,每月的话务量达到百万级时,内部洽购的产品就无奈满足当初的业务需要了。 一方面,内部供应商只能提供局部基础性服务,针对顺丰的差异化定制较难实现,且业务翻新和改良周期长,无奈满足继续晋升客户服务体验的需要;另一方面,公司冀望在该畛域构建全链条自研技术闭环,以更加灵便地满足客户的针对性需要,适应人工智能倒退的浪潮。在此背景下,顺丰科技决定打造自研的“智能外呼机器人”。 提质增效成绩显著,员工违心用、客户更称心作为顺丰科技自研 “智能外呼机器人”项目组的技术负责人,李理介绍道,自研整体智能外呼零碎,其中很重要的两局部就是 ASR (Automatic Speech Recognition)主动语音辨认技术和 TTS (Text-To-Speech)语音合成技术。 “当初不是从零开始造轮子的年代,自研也不可能从零开始。国外的语音合成零碎也有开源,但很多是英文,而飞桨语音模型库 PaddleSpeech 对中文反对得更好,而且咱们也理解到 PaddleSpeech 有十分成熟的解决方案。”2022年4月底,在对业内深度学习平台和模型库开展比照调研后,李理开始率领团队进行尝试。 飞桨语音模型库 PaddleSpeech 提供了端到端开发套件和丰盛的工具组件,让顺丰科技能够像搭积木一样更快更好地开发和落地利用。“我的项目执行过程中团队屡次在飞桨社区寻求帮忙,均失去了飞桨业余的研发团队、经营团队的积极响应,为我的项目推动及时扫清了阻碍,这让咱们团队高效实现了语音合成零碎的开发及各项测试工作。”李理总结到。 语音合成零碎,采纳前端、声学模型、声码器对输出文本进行解决,再输入合成语音数据,而后用于顺丰智能外呼机器人中,与被叫进行语音交互,每路通话进行实时屡次 TTS 转换。 语音生成零碎示意图 具体而言,基于飞桨语音模型库 PaddleSpeech ,李理率领团队进一步训练了 FastSpeech 2 和 HifiGAN 两个算法模型,实现语音合成工作。前端解决模块将输出文本处理为音素 ids ,声学模型选取非自回归算法模型 FastSpeech 2 ,显著晋升了合成语音的表现力 ,且非自回归模型,速度也比拟快;声码器选用了基于 GAN 框架的 HifiGAN 算法模型,不仅速度快,合成的音质成果比拟好,理论应用中满足机器人智能交互对实时率的要求。飞桨语音模型库 PaddleSpeech 使得文本到语音合成的成果更加优良。 顺丰自研的“智能外呼机器人”已实现每月百万话务量的规模利用,理论利用的成果也能够从多个方面失去映射。对员工应用而言,越来越多的快递小哥违心应用一键外呼,让机器人帮本人干活。顺丰外部评测自研零碎的客户满意度也在继续晋升,零碎提质增效成绩显著。 打造极致客户体验,期待将来更多施展空间李理坦言,“‘服务体验’是顺丰的外围竞争力之一,长久以来备受器重,咱们甚至称之为快递物流行业的‘生命’。继续晋升数字化科技能力赋能外部经营,能够帮忙顺丰为客户提供更多个性化、有温度的服务。” 比方咱们要做大量的多音字纠正、提供千人千面的音色、反对客户自己声音生成的祝福语或留言。“满足更多个性化的需要、做到极致的客户体验,这对于提供规范服务的供应商很难,或者是供应商不违心做的业务。从策略层面思考,有了这种自研的语音合成技术之后,咱们将来更有机会做出个性化和有温度的产品。物流行业场景联合更多的 AI 技术利用,将有更多可能性和更大的设想空间”。 同时,顺丰科技依靠积淀多年的科技产品及数据资产,联合各行业特色场景,疾速赋能内部客户:通过数智伎俩,嵌入业务价值链条,助力客户供应链转型降级。顺丰科技致力于构建数字时代的智慧供应链生态,成为智慧供应链的领导者。 百度飞桨致力于让开发者和企业更疾速、更便捷地开发 AI 利用,作为根底平台撑持各行各业实现产业智能化降级。李理也期待借助飞桨深度学习平台,将来可拓展更广大的利用场景。 机器人客服(百度文心一格 AI 作画生成,作者eagle_kang) 参考 PaddleSpeech 我的项目地址https://github.com/PaddlePaddle/PaddleSpeech ...

May 25, 2023 · 1 min · jiezi

关于paddle:最高奖金100万第二届广州琶洲算法大赛火热报名中

第二届广州·琶洲算法大赛以“优选AI算法 让世界更智能”为主题,聚焦前沿 AI 技术,推动算法畛域的学术交流、人才培养、技术倒退及利用,面向算法畛域的开发者、守业机构、企事业单位,招募具备原创性、独创性、引领性的算法模型和利用计划。自4月25日启动以来,即受到社会各界的宽泛关注和踊跃参加。在近期举办的 CCIG 中国图象图形大会、商务部对外支援培训我的项目交换座谈等流动中,均对大赛进行宣讲推广,失去企业代表、高校师生,以及来自多国外宾的热烈反应。截至目前,预报名参赛队伍数量已逾1000支。 *左:CCIG 中国图象图形大会\右:商务部对外支援培训我的项目交换座谈本届大赛将在处分、赛制、资源等维度全面降级,进一步推动打造行业顶级赛事。* 处分降级,赋能翻新研发生态本届大赛按赛制组别,设置冠军、亚军、季军、擂主、优胜奖等奖项,并首次增设奖金100万元的全场特地大奖。除现金处分以外,参赛企业还可获取多重处分,包含公布赛事榜单、政策搀扶、投融资反对、产品展现等。\ 赛制降级,催生AI翻新利用本届大赛设置计划翻新赛、算法优选赛、揭榜打擂赛三大组别,宽泛邀请来自寰球的企业、科研机构、高校及集体开发者参赛。参赛者可依据要求自行抉择报名并提交参赛作品。计划翻新赛设置绿色能源、智慧交通、智能制作、电子商务、前沿科技五大行业赛道,不设固定命题,参赛者围绕五大行业自行开掘翻新利用场景,关注技术创新、利用翻新、场景翻新,提交基于人工智能技术赋能产业的解决方案或商业计划书。 算法优选赛由广汽团体、南方电网、工信部电子五所、广州地铁、唯品会、琶洲实验室、百度等龙头企业和科研平台别离公布赛题,透过行业一线理论需要,开掘更具挑战性的赛题,催生更有利用价值的算法模型和解决方案。 揭榜打擂赛瞄准社会民生与前沿科技课题,由广州市科学技术局、广州市工业和信息化局、广州市政务服务数据管理局、广州市海珠区政务服务数据管理局别离公布赛题,涵盖人机交互、网络安全、数字民生与智慧交通等畛域,力求促成相干畛域的翻新企业、科研机构解决技术创新难题,减速科技成果转化。 大赛将采取线上线下相结合的形式,分为报名、初赛、复赛、总决赛、颁奖典礼等赛程,预计将于8月在琶洲举办总决赛。 大咖聚智,打造业界权威赛事本届大赛设立评委会,评委会主任由欧洲科学院外籍院士陈俊龙、国内欧亚科学院院士魏少军、俄罗斯工程院外籍院士谢胜利等3位专家负责,国家超级计算广州核心副主任肖侬负责赛题特地参谋。大赛评委成员由来自高校、科研机构、企业、行业协会、投资机构等各领域专家组成,为大赛全程提供业余领导与评审,通过向参赛者提供更具针对性、建设性的领导倡议,驱动迭代出更卓越的算法作品。 平台护航,助力选手无忧参赛大赛将以百度飞桨产业级深度学习开源开放平台为技术基座,为参赛者提供丰盛的产业级模型库与工具组件,进一步升高 AI 技术利用门槛,并提供收费算力反对。 摸索算法畛域,推动算法技术和利用翻新,百万大赛奖金等你来拿! 立刻报名 官网地址: https://ai.baidu.com/tech/competition/pazhou 报名截止工夫:2023年6月30日24时 主办单位 广州市人民政府 承办单位 海珠区人民政府、广州市科学技术局、广州市工业和信息化局、广州市政务服务数据管理局、人工智能与数字经济广东省实验室(广州)、北京百度网讯科技有限公司

May 24, 2023 · 1 min · jiezi

关于paddle:数链科技用飞桨和文心大模型打造大宗商品数字供应链系统提升行业透明度及标准化

大宗商品行业市场规模微小、关系国计民生,它的三个外围类别——能源商品、根底原材料、农副产品均在我国经济倒退过程中起着无足轻重的作用。这其中,大宗商品供应链的顺畅运行和稳固倒退对整个产业链的运作至关重要。 然而传统大宗商品供应链普遍存在交易环节不通明、业务流程不规范两大问题:贸易链条中各个节点的信息互不相通,各自造成了信息孤岛;贸易流程中的合同、发票、货物品质、资金流转、税务等环节往往难以严格依照相干规范和规定执行,且广泛依赖人工解决交易信息。这两大问题导致了各环节信息无奈穿插验证、信息流通效率低下,不仅制约了大宗商品供应链降级提效,而且行业造假、欺诈事件频频产生,重大影响行业倒退。 数链科技,一家致力于用人工智能等先进科技伎俩实现大宗商品实时交易数字化的公司,基于飞桨文字辨认开发套件 PaddleOCR、自然语言解决模型库 PaddleNLP,开发了大宗商品数字供应链智能辨认与管理系统。聚焦线下单据辨认场景难题,基于 PaddleNLP 的通用信息抽取模型 UIE-X (以文档智能大模型文心 ERNIE-Layout 为模型底座, ERNIE-Layout 创新性引入布局常识加强,在多个文档问答榜单登顶,为各类下层利用提供了 SOTA 模型底座),通过实现非标单据的辨认及关键字段提取,破除大宗商品供应链环节信息壁垒,欠缺零碎数据品质的同时显著进步了交易效率。 以非标单据数字化为切入点,破除“不通明、不规范”信息壁垒基于对大宗商品行业的粗浅认知及对行业供应链的痛点洞察,数链科技团队敏锐地意识到,要让大宗商品交易实现降级提效,首先要让所有交易信息实现高效精准的数字化。 “传统的大宗商品供应链中,比方物流票据、合同之类的交易信息,都以实物模式存在,须要人工拍照、存档,而后人工进行信息录入。一旦呈现问题,也须要人工审查、回溯图片信息。”数链科技总裁助理张越介绍,“而各个企业的单据规范经常不一样,也就是存在大量线下非标单据,这就导致人工录入单据和追溯复查的难度极大。于是咱们心愿可能找到一种形式,先晋升非标单据数字化的效率,而后以此为切入点,推动行业的整体数字化降级。人工智能技术,就是咱们的最优选。” 联合业务流程,数链科技技术团队将实现非标单据数字化的眼光锁定在文字辨认与信息抽取畛域。然而团队调研后发现,尽管市场上曾经存在文字辨认技术供应商,但鲜少有针对于大宗商品供应链开发的解决方案。大宗供应链各环节都须要大量的线下表单来记录商品及其运输、交易信息。然而,企业与企业之间的单据款式存在较大差别,没有行业统一标准,而且往往机打单据与手写单据并存。不仅如此,大宗商品与其余普通商品不同,商品记录中存在大量日常生产生存中不罕用的特殊字符。市场上的计划模型广泛不足针对特殊字符等行业数据的训练,且难以反对多种非标表单的精确辨认和信息抽取归类,导致信息辨认效率低,无奈满足以后业务的需要。 传统非标单据示例:不同企业的汽运磅单另一方面,洽购内部供应商的产品也不足灵活性,系统升级革新须要破费大量工夫与供应商对接调校,遇到供应商人力无奈反对时,更会重大影响投入使用的进度。因而,自研一种高效灵便的产品,成为团队事不宜迟。 飞桨技术+生态,助力非标单据辨认效率晋升20倍最终,团队抉择基于飞桨文字辨认开发套件 PaddleOCR 和自然语言解决模型库 PaddleNLP 和通用信息抽取模型 UIE-X 发展自研我的项目。通过 PaddleOCR 提供的丰盛实用的工具库,训练针对大宗供应链非标单据辨认模型,并通过 PaddleNLP 调用 UIE-X 的根底上,应用本人的数据集进行微调,极大升高训练开发成本。整体技术计划能够演绎为如下步骤: 充沛调研业务单据的类型,依据已有的海量的样本,明确须要提取的要害信息,设定提取的关键字规定;基于 PaddleOCR、PaddleNLP、UIE-X 进行模型剖析,开发相应的关键字抽取规定;通过数据标注、模型评估进行模型训练,通过业务反馈进行规定优化。 研发流程示意图 在文字辨认过程中,传统的光学字符识别过程为:图像预处理(彩色图像灰度化、二值化解决、图像变动角度检测、改正解决等)、版面划分(直线检测、歪斜检测)、字符定位切分、字符识别、版面复原、后处理、校对等。应用飞桨文字辨认开发套件 PaddleOCR ,首先升高了入门门槛,不须要最根底的光学字符识别实践,其次 PaddleOCR 领有丰盛的组件和公开的文字检测、文字辨认等一系列根底预训练模型,大大降低了 AI 入门难度。对于开发者来说,只需具备肯定的 Python 开发能力即可在开源模型根底上进行测试、调优,最终短时间内实现部署上线。 自然语言解决模型库 PaddleNLP 内的跨模态文档通用信息抽取模型 UIE-X ,以文心大模型为根底,在没有业余标注团队的状况下,应用小样本训练,进行定制化开发,大量节俭了标注老本。在此基础上,数链只需筹备几十份合同样本,应用飞桨智能标注 PaddleLabel 进行标注、训练,最终要害信息抽取精度达到87.5%。 在部署过程中,PaddleOCR 反对 HubServing 服务,PaddleNLP 反对 SimpleServing 服务,并且反对半精度推理形式,放慢推理速度,可进行一键部署。还反对 CPU、GPU 多种服务器部署,在测试过程中升高了调试难度。部署过程应用 Docker 一键装置形式,升高了运维部署累赘。 最终,我的项目团队胜利自研出大宗商品数字供应链智能辨认与管理系统,在大宗商品供应链线下单据的辨认场景下,实现了线下非标单据的辨认及关键字段提取,极大进步了人工补录相干单据的效率。本来人工补录线下合同须要5分钟,当初只需人工确认后果及局部纠正即可,工夫晋升至15秒以内,辨认效率达到原先的20倍。 据数链科技介绍,应用该零碎的某企业信息录入人员反馈,每月业务最密集的时候,往往会有集中性的大量非标单据须要录入,通常部门中3位共事须要每天全员加班4个小时以上。当初通过应用大宗商品数字供应链智能辨认与管理系统,即便是在业务最忙碌的时候,也能够辞别加班,开释出了更多的人力实现更具专业性的经营工作。同时,由原先的人工录入改为机器辨认,也极大减少了数据准确度。原先每季度均匀会遇到10-15次信息录入谬误,重大的甚至会造成付款金额谬误,当初则再也没有呈现过。整体晋升了业务水平,让公司倒退更衰弱。 我的项目在大宗供应链典型的表格辨认场景下体现优良。团队从新训练标注表格辨认模型,将单行数据提取以单元格为维度进行改正输入,最终使表格辨认精度从87%回升到98%,大大晋升合同中表格辨认的准确率,对大宗商品业务场景中大量的表格局单据(如财报、铁路大票、发票、磅单、化验凭证等)的信息提取有重大意义。 张越示意,飞桨生态社区的存在也是团队当初抉择飞桨进行开发的一个重要起因:“飞桨社区提供了比拟多的产业范例,例如在图片反欺诈、签名比对等场景带给咱们很多灵感和技术领导,同时还能帮忙咱们及时获取技术在产业利用的最新动静。不仅如此,咱们在研发过程中遇到技术上的问题,也总能及时失去飞桨业余的研发团队和经营团队的相应反对。” 目前,数链科技大宗商品数字供应链智能辨认与管理系统,曾经实现线下合同、铁路大票、汽运磅单等非标单据的自动识别与信息提取,为1000余家煤炭、食粮等大宗商品畛域不同规模的供应链企业提供商业化服务。 ...

May 23, 2023 · 1 min · jiezi

关于paddle:2023语言与智能技术竞赛开辟双赛道寻找全民测评官探索AI多模态能力

开年以来,人工智能大语言模型(LLM)掀起新一轮寰球科技比赛,寰球科技巨头打响“百模大战”。当大语言模型正粗浅扭转人类生产生存形式时,该如何进一步开释其潜能,成为业界关注的问题,也成为了2023语言与智能技术比赛命题的终点。 5月17日,2023语言与智能技术比赛正式启动,该大赛由中国计算机学会(CCF)和中国中文信息学会(CIPS)联结主办,百度公司、中国计算机学会自然语言解决专委会和中国中文信息学会评测工作委员会承办。本届大赛设置“大语言模型能力评估”和“视频语义了解”两大赛道,立足事实难题,挖掘翻新人才,助推技术倒退。 紧跟技术趋势命题,寰球人才集结“揭榜”语言与智能技术比赛自2018年开始,已间断举办5届,凭借面向实在利用场景的工作设计和源自实在场景的数据集,取得产学研各界关注,成为寰球最权威、最热门的中文自然语言解决赛事之一。 历届比赛先后组织了浏览了解、人机对话、语义解析、信息抽取等评测工作,笼罩自然语言解决和人工智能畛域的重要前沿课题,对于推动相干技术钻研及智能搜寻、智能举荐、智能交互等人工智能利用倒退具备重要意义。每届赛题如同英雄帖,吸引超过2000支队伍前来“揭榜”,其中80%选手来自寰球多所顶尖高校和科技企业,笼罩金融、互联网、传媒、通信、工程机械、能源、生物等多个行业。 以后,大语言模型作为“大数据+大算力+强算法”的产物,基于万亿级数据集预训练后能应答多样化需要,被视为 AI 迈向 AGI (通用人工智能)的里程碑技术。本届比赛紧跟技术趋势,设置“大语言模型能力评估”和“视频语义了解”两大赛道,旨在携手寰球翻新人才,为推动语言与智能畛域技术倒退和利用贡献力量。 寻找“全民测评官”,构建大模型能力评估体系不同于往届比赛次要面向业余 AI 开发者,本届大赛第一条赛道“大语言模型能力评估”向所有用户收回邀请。该赛道心愿选手从底层能力(生成、逻辑等)、专项能力(创作、问答等)以及在实在场景的利用能力等维度登程,制订评估计划和数据示例,为大语言模型构建能力评估体系(请参考下方示例)。   评估体系示例 这一赛题的设置让个人用户和中小规模开发团队尤为振奋。一方面,大语言模型扎推问世,呈现同质化等问题,亟待提出全面、无效的评估办法;另一方面,模型参数量已激增至万亿级,单次训练老本昂扬,仅多数头部企业有能力承当。而通过加入语言与智能技术比赛,选手只需从本身对大模型的了解登程,建设逻辑顺畅的评估维度和评估规范,就能低成本地参加技术改革。作为承办方,百度将为所有选手提供全新一代常识加强大语言模型文心一言的邀请码,帮忙选手更好地建设大模型评估体系。 这也意味着,第一条赛道简直“零门槛”。不限年龄、不限业余,无需代码根底,只有有理有据就能负责“全民测评官”,帮忙人们理解大语言模型在不同场景的适应性和局限性,从而打造得更加平安、可控。 摸索多模态能力“天花板”,强化视频语义了解第二条赛道“视频语义了解”则重点面向业余 AI 开发者,评测工作以互联网视频为输出,需在感知内容分析(如人脸识别、OCR 辨认、语音辨认等)的根底上,通过交融常识、NLP、语音等多模信息,联合常识图谱计算与推理,为视频生成多常识维度的语义标签。 这一工作,是大赛对 AI 多模态能力及 AGI 的一步初探。多模态被业界认为是大语言模型下一步的倒退方向,和人类基于视觉零碎进行大部分信息获取相似,AI 也正从文本、语音、视觉等单模态智能向多种模态交融的 AGI 方向倒退,GPT-4 的识图能力和文心一言的文生图能力均是多模态能力的体现。 参加第二条赛道的选手,将取得由百度提供的基于飞桨平台的基线零碎,以便疾速上手,达成最佳比赛条件。同时,选手还能够基于百度飞桨的人工智能学习与实训社区 AI Studio,应用在线编程环境,获取收费 GPU 算力反对,突破算力枷锁,一直深入对 AI 多模态能力的认知。 “百模大战”现下正酣,AGI 不再边远。正如百度 CTO 王海峰所说,“大模型的通用性越来越强,AGI 在肯定水平上曾经实现,但 AI 为人类带来价值才是咱们致力的方向”。本届比赛两大赛道,既联结 AI 时代最宽泛的参与者,构建全面、迷信的评估体系,也激励业余 AI 开发者动摇地朝着下一个技术高点前行,让 AI 服务于人类更美妙的生存和社会的倒退。同时,百度也通过比赛、校企单干等形式,继续推动“5年500万 AI 人才”打算,为国家策略科技力量建设继续奉献。 即日起,2023语言与智能技术比赛报名通道已凋谢,详情返回大赛官网查看。大赛还筹备了丰富的赛事奖池,获奖团队将有机会在2023语言与智能高峰论坛与泛滥领域专家介绍作品。 官网链接http://lic2023.ccf.org.cn/

May 22, 2023 · 1 min · jiezi

关于paddle:为世界第一大癌症高效研发首创新药AI大模型助力药物研发叩开未来之门

近日,三位高中生引爆了医药圈,他们应用人工智能(AI)引擎进行靶点发现,确定了多形性胶质母细胞瘤(GBM)的新医治靶点,多形性胶质母细胞瘤(GBM)是最具侵袭性和最常见的恶性脑肿瘤类型,占所有原发性脑肿瘤的16%。他们单干撰写的论文于4月26日发表在国内迷信期刊《苍老》(aging)上,显示了人工智能零碎辅助新药研发的广大前景。 人工智能(AI)技术正在从老本、效率等方面重塑制药行业。近年来,相干专家认为,AI制药将成国内医药产业弯道超车时机,应以AI制药为切入点,对这一新兴畛域增强前瞻性政策搀扶,推动整个中国翻新药行业的原始、自主翻新,或者在制药畛域,真正走向中国“智”造就在于人工智能技术的成熟利用。 目前在制药畛域,AI制药次要由三大类公司进行相互协作独特推动药品研发过程,IT技术公司、药物研发CRO公司以及大型药企。IT公司利用自身的互联网根底与平台劣势赋能行业利用,大型药企则领有药物研发的相干数据、成熟的研发管线以及资深的药物专家,在优势互补的状况下,目前曾经能够看到AI制药的很多成熟案例。 (局部外资制药企业公开的AI制药单干汇总) 我国AI制药起步较欧美起步稍晚,但倒退迅速,更具数据、算法等劣势,在刚刚完结的百度飞桨中国行(上海站)流动中,杭州立德百克生物医药总经理王紫壹博士讲述了他如何针对乳腺癌发展CDK4/6抑制剂的AI制药之路。 依据世卫组织公布的数据,早在2020年,乳腺癌就在寰球新发病例上超过肺癌,成为世界第一大癌症。我国则是寰球乳腺癌发病人数最多的国家,每年新发病例数靠近42万。 而CDK4/6抑制剂是目前寰球范畴内医治乳腺癌最为滞销的药物,用于医治HR阳性/HER2阴性的乳腺癌患者。比方,恒瑞医药的达尔西利、美国辉瑞的哌柏西利和美国礼来的阿贝西利等三款药已在中国获批上市,其中阿贝西利还进入了国家医保目录。 但CDK4/6抑制剂在给宽广患者带来福音的同时,也存在着“瑕疵”,比方难以避免的产生了不同水平的耐药性以及临床副作用,而且同质化竞争异样强烈。这就要求独辟蹊径,开发全新机制的CDK4/6抑制剂乳腺癌药物。 对此,王紫壹团队提出利用CDK4/6的激酶活性必须依赖于本身同CCND(细胞周期素D)造成复合物这一要害个性,开发出能阻断CDK4/6-CCND蛋白-蛋白相互作用的小分子化合物,同样可能使CDK4/6激酶失去活性,进而达到抑制乳腺癌细胞成长的目标。 新药研发思路确定后,一个老大难问题再次浮现,即须要找到对应的指标分子。这一过程的快慢,在过来只能取决于运气。而王紫壹团队回绝按部就班,抉择了一条新门路,采纳百度飞桨螺旋桨生物计算平台提供的文心生物计算大模型能力来进行药物发现的工作,功效令他颇为惊艳,仅仅几个小时内,就在780万个化合物的虚构筛选库中筛选出了110个打分较高的潜在候选分子。 立德百克构建了特异性的检测办法对筛选出的化合物进行活性检测,从110个分子中洽购了40个进行湿试验检测,最初发现有6个高后劲分子,其中3个化合物能同时打断CDK4/6-CCND蛋白-蛋白相互作用,还有3个化合物能打断CDK4-CCND蛋白-蛋白相互作用。目前,单方团队正对这些化合物做更进一步的钻研,无望在不久的未来将这种新型抑制剂推向临床。 据介绍,相比于现有CDK4/6抑制剂,新型药物属于机制翻新的独创新药,具备更优的特异性,并在耐药性与潜在副作用上更有劣势,这将为宽广乳腺癌患者带来福音。得益于这些劣势,新型药物无望关上可观的市场空间。  王紫壹博士介绍道,“百度领有国内当先的AI+药物研发的技术能力,特地是文心生物计算大模型在国内是十分当先的,使用这些技术能力,飞桨螺旋桨帮忙咱们更高效的找到苗头化合物分子,这大大晋升了咱们药物发现的效率。” 百度飞桨螺旋桨(PaddleHelix)是基于飞桨深度学习框架打造的“AI+生物”计算平台,提供文心大模型-生物计算大模型能力,已凋谢多个算法模型,笼罩小分子药物筛选、多肽/蛋白药物设计、mRNA疫苗/药物设计等技术,面向新药研发、疫苗设计、精准医疗等场景,为生物医药畛域的翻新药企、医药技术提供商、科研机构、生物科技公司等提供全面的算法工具和技术计划。 目前在华东区域,已有不少企业采纳飞桨螺旋桨平台发展了相干药品研发。除杭州立德百克联结百度飞桨螺旋桨开发乳腺癌翻新药之外,索智生物也在多个畛域与飞桨螺旋桨单干,其中ADMET性质预测大模型HelixADMET,曾经整合到索智本身的AI药物发现平台(AIxMol®),并胜利利用于其在研管线我的项目,无效地帮忙索智晋升合成测试湿试验成功率,进而进步整体研发效率,在短短的18个月中胜利确定了3个PCC分子。 数据显示,40-45%临床试验的失败归纳于药物的高毒性和低类药性。如果可能在药物研发的晚期就排除性质不佳的分子,就能够省下大量的工夫和资金投入。因而,化合物的成药性预测(简称ADMET)对新药研发的胜利至关重要。ADMET是药物代谢动力学所关注的化合物在体内的排汇、散布、代谢和排泄行为 (简称ADME) 与毒性 (Toxicity) 的合称,是掂量化合物成药性最重要的参考指标。 针对该问题,业界曾经提出了很多解决方案,比方admetSAR、ADMETlab、swissADME等,但这些办法训练所应用的数据集量级广泛较小,故在对未知骨架构造的化合物进行性质预测时成果较差,同时无奈基于用户需要做指标拓展。未知骨架构造的化合物进行性质预测泛化能力较差,药物设计老本较高,可拓展性存在肯定阻力。 而飞桨螺旋桨的HelixADMET大模型可在60秒内计算1000个分子的ADMET相干指标。比照国内外多个出名的ADMET预测软件,在性能的残缺度(预测52项指标)和指标上的精度上(超过其余比照平台4个百分点以上),都大大超过竞品。相应的钻研已被收录在生物信息学畛域的顶级期刊Bioinformatics上。 能够预感,在生物制药畛域,HelixADMET大模型能够利用于化合物优化/筛选阶段,辅助决策优先进入临床的化合物,躲避前期的可能危险;还能领导学术/我的项目的钻研打算制订,缩小自觉试验的概率;同时模型能够用于验证新药/仿造药的成药性,评估新药/仿造药的危险,大大提高药效钻研的效率,更快地评估和验证新药/仿造药的成果。 此外,在5月2日,国内顶级学术期刊《Nature》正刊发表了百度与单干单位在生物计算畛域的突破性成绩 ——《Algorithm for Optimized mRNA Design Improves Stability and Immunogenicity》,提出 mRNA 序列优化算法 LinearDesign,百度赫然以第一实现单位署名该钻研。以新冠病毒Spike蛋白为例,该算法能在短短11分钟之内找到最稳固的mRNA候选序列。 试验数据证实,LinearDesign算法设计序列将有助于生物医药公司疾速研发更无效的 mRNA 疫苗,缩短研发周期,升高研发老本。这一算法的有效性曾经在新冠 mRNA 疫苗和带状疱疹 mRNA 疫苗两种疫苗中失去验证。与传统基准相比,百度的设计显著改善了体外 mRNA 半衰期和蛋白质表白,使体内抗体反馈加强了高达128倍。 结语人工智能最广泛应用畛域或在药物钻研,一项新药物的研发,钻研人员常须要通过设计、合成和评估多种化合物来发明潜在新型药物,将具备发展前景的化合物精制为候选药物的过程经常既低廉又耗时。如果将人工智能与药物钻研相结合,不仅投入资本将大大减少,效率也会大幅度提高。 然而,就目前而言,咱们依然面临倒退中的瓶颈,AI制药将来是否可能疾速倒退应从体制上全面激发我国AI制药产业生机,在人才培养、监管审批、园区建设、数据管理多角度予以搀扶,推动AI制药实现我国的翻新药研发“反动”,最初让咱们期待人工智能技术的“第四次科技反动”。

May 19, 2023 · 1 min · jiezi

关于paddle:人工智能与大模型主题师资培训落地飞桨持续赋能AI人才培养

5月12日-5月14日,由百度飞桨联结中国自动化学会、复旦大学独特举办的“人工智能与大模型”主题师资培训班在百度飞桨(张江)人工智能产业赋能核心圆满举办。来自全国各地17所高校、26个人工智能及相干业余的50名老师线下加入此次培训。复旦大学教务处副处长孙兴文缺席并致辞,复旦大学传授邱锡鹏、复旦大学传授张军平、复旦大学青年研究员陈智能、同济大学特聘研究员王昊奋、百度飞桨华东区域经营负责人魏宗凯等专家学者汇聚一堂,研究分享了大模型技术、科教交融、校企单干的研究成果和实践经验。 整体学员合影 流动期间专家们分享了在机器学习和大模型畛域所做钻研以及教学工作中的教训、遇到的难点和面临的痛点,热切探讨了人工智能相干业余教学中的测评伎俩、教学成绩测验形式,以及对大语言模型Prompt工程等相干优化门路。本次师资培训全副回放视频将收录至人工智能学习与实训社区 AI Studio 的课程栏目中,邀请宽广老师、学生、开发者群体一起学习观看。 点击下方地址或者小程序页面,退出后观看课程内容。 视频地址https://aistudio.baidu.com/aistudio/course/introduce/28644 复旦大学教务处副处长孙兴文 复旦大学教务处副处长孙兴文老师在致辞中示意:百度飞桨与中国自动化学会、复旦大学联结举办本次人工智能技术与大模型主题师资培训,是飞桨继续致力于服务全国高校、服务产业与经济倒退的重要动作,是对校企单干的深入,是人工智能翻新人才培养、科技翻新产教交融新范式构建的助推剂。 复旦大学计算机科学技术学院传授邱锡鹏 复旦大学计算机科学技术学院传授邱锡鹏老师以《大型语言模型介绍》为题作报告,以简化繁、抽丝剥茧地分享了大型语言模型对人工智能技术的颠覆性影响。 同济大学特聘研究员王昊奋 同济大学特聘研究员王昊奋老师以《加强大语言模型关键技术与利用范式》为题,对加强语言大模型的可能方向和关键技术进行了深入分析,就大语言模型产业落地和利用开发新范式进行了分享。 复旦大学计算机科学技术学院传授张军平 复旦大学计算机科学技术学院传授张军平老师以《人工智能的两种文化:统计学习和深度学习》为题,深刻比拟了统计学习和深度学习两种思路,就泛化、翻新的重要性及AI偏见的不确定性进行了分享。 百度飞桨华东区域经营负责人魏宗凯 百度飞桨华东区域经营负责人魏宗凯老师以《百度大模型与AI人才培养》为题,对人工智能与产业联合为数字经济提供新动能、百度飞桨助推产业倒退和全方位高校教学服务体系构建进行了分享。 复旦大学青年研究员陈智能 复旦大学青年研究员陈智能老师以《场景文本辨认:从视觉辨认到视觉-语言交互》为题,针对文本辨认的传统办法、基于宰割和注意力解码的办法进行了深入分析。 百度高级研发工程师聂风 百度高级研发工程师聂风以《循环神经网络》为题,对前馈神经网络、循环神经网络等根底模型进行了深刻解读,并率领现场老师基于LSTM进行了文本分类工作的实际。 复旦大学计算机科学技术学院助教李鹏 复旦大学计算机科学技术学院助教李鹏以《基于CNN的图像分类实际》《基于Transformer实现文本生成实际》等为题,率领现场老师进行了卷积神经网络和Transformer网络的实际,并组织老师进行自然语言解决相干实际较量。 学员参观百度飞桨上海展厅 参训老师与讲师交换本次培训 局部内容围绕书籍《神经网络与深度学习:案例与实际》开展,该书由邱锡鹏老师和飞桨教材编写组独特撰写。培训期间,参训老师和讲师针对书中课题开展了深刻的交换和探讨。 结营典礼 本次师资培训是百度飞桨联结中国自动化学会、复旦大学在增强校企深度单干、产教全面贯通,面向社会发展人工智能畛域技术人才培训与服务区域的一次重要尝试,是推动高校教学翻新、教学教训的一次重要成绩。百度飞桨长期以来从教学资源、工具与平台、反对与服务三个层面,围绕学习、实际、待业等环节,为高校师生提供丰盛多样的资源反对。针对时下热门的大模型畛域,也在继续打造相干课程及内容建设。 将来,百度飞桨将持续保持对AI人才教育的投入,推动产教深度交融翻新,期待为国内人工智能畛域的倒退注入新生机、新动力。

May 18, 2023 · 1 min · jiezi

关于paddle:宝武中南钢铁借助飞桨让钢筋超限监控有了火眼金睛

古代钢铁工业生产过程是一个简单而宏大的生产体系,涵盖数百道工序。 在70多年的倒退历程中,炼钢、轧钢、连铸以及节能减排等各项技术一直进化,无一不印证了中国钢铁在技术创新之路上取得的持续性冲破。现在,宝武中南钢铁(宝武团体中南钢铁有限公司)通过对一处细节的深刻洞察,实现了又一个翻新冲破。 钢铁厂生产钢筋过程中会采纳计算机控制技术实现钢筋主动定尺并对钢筋进行切断,这道工序看似简略却极具杀伤力——一旦局部钢筋长度超限,且没有及时处理,就会给后续工序的机械臂造成重大伤害。 针对这一问题,宝武中南钢铁在该智能化我的项目的负责人引入AI技术手段,打造了基于飞桨图像宰割开发套件PaddleSeg的“钢筋长度超限监控计划”,于2023年2月上线使用在多条产线并继续稳固运行至今。该计划替换了传统的工人徒弟人工核查的形式,显著进步了生产安全性和生产效率,单条产线老本节俭超过50万。 该智能化我的项目的负责人示意,“我的项目上线后,各项指标成果优异,语义宰割评估指标(mIoU)> 99%,异样/失常二分类准确率(Accuracy)大于99.5%。后续咱们将思考采纳飞桨相干技术,在平安生产和智能辨认质检等方向持续摸索更多智能化的场景解决方案。” 图:全自动钢筋超限监控产线现场 “火眼金睛” ,宝武中南钢铁洞察技术创新利用突破口在钢筋生产的过程中,因为工业环境具备肯定随机性,无奈保障生产流水线上每一捆每一根钢筋都在标准长度内。长度超限的钢筋会给生产线上的机械臂带来伤害,间接的设施损耗、间接的误工老本都可能造成微小的经济损失。 传统的形式都是钢铁厂安顿工人徒弟在生产线上通过目视加以判断,一旦发现钢筋长度超限,就及时干涉。该办法纯正依赖人力,对业务熟练度要求较高,而且存在误判景象,不能从根本上解决问题,同时工人徒弟也无奈追随生产线24小时不间断工作,这在肯定水平上制约了生产效率。 据悉,单条产线,配一个工人,配一个机械臂,每年的人力老本加机械臂运维老本超过50万元。 该智能化我的项目的负责人示意,“或者从钢铁工业全流程来看,该类问题紧急重要水平不是那么高。利用视觉传感设施实时监控钢筋长度是否超限这个工作看似也比较简单,但传统的图像处理办法其实无奈达到足够的精度和泛化性。而当初新的AI技术曾经能够很好的解决这类问题,哪怕只是这一个场景下的利用,就能够为产线节俭很可观的老本,并极大晋升生产效率,发明经济价值。” 图:全自动钢筋超限监控计划视觉图像 基于飞桨图像宰割开发套件PaddleSeg,“搞定”工业视觉智能化传统的图像处理计划精度和泛化性无奈满足需要。精度决定了计划的理论利用价值,泛化性决定了计划是否向其余场景复制。该智能化我的项目的负责人抉择引入深度学习等AI技术来解决这一难题。在考查比对国内外相干技术后,我的项目负责人认为百度飞桨产业级深度学习平台具备独有劣势。 整体技术计划能够演绎为如下步骤: 在钢筋一侧装置摄像头,拍摄图像;利用图像宰割技术提取钢筋掩膜;依据摄像头地位和角度确定长度界线;最初依据该长度界线和钢筋宰割范畴的几何关系判断本批次钢筋是否超限;钢筋超限监控问题能够转换为图像宰割后的几何判断问题。飞桨提供了全流程宰割计划——图像宰割开发套件PaddleSeg,只需简略地批改配置文件,就能够进行模型训练,取得高精度的宰割成果。“数据标注只标了大略四五百张,而后进行模型的开发,成果是相当不错的,能够满足产线需要”。进一步地,筛选应用精度和速度均衡的PP-LiteSeg模型,保障在实现高精度的同时,满足工业部署的要求。 重要的是,从行业特色来看,简单工业环境导致图形采像以及对应数据很难保障对立的规范与品质,PaddleSeg内置的数据加强算法可实现对数据的裁减,克服采像样本不平衡、图片含糊、背景变换差别大、钢筋方向不统一、数据量较少等问题,疾速迭代解决方案,缩短模型研发周期。 目前,宝武中南钢铁已将基于飞桨开发的“全自动钢筋长度超限监控计划”利用在两条生产线上,解决钢筋长度超限的主动监控问题,实现端到端全自动的钢筋长度超限监控,语义宰割mIoU > 99%,异样/失常二分类准确率(Accuracy)大于99.5%,高精度高与高准确率,在理论工业场景下助力企业生产降本增效。 图:飞桨PaddleSeg图像宰割开发流程 AI在工业场景的大规模利用可期宝武中南钢铁立足钢铁业,工、科、贸并举,多元化经营,是广东省重要的钢铁生产基地,也是钢铁行业中智慧制作和5G工厂的推动者。产品次要包含特棒、工业线材、修建材(普材)、板材,广泛应用于汽车、机械制造、能源交通、航天航空、核电等行业。 此次宝武中南钢铁率先引进AI新技术,将飞桨使用在钢铁工业的自动化、智能化降级流程中,优化成果失去实际测验,“后续咱们思考在平安生产和智能辨认质检等方向利用飞桨持续摸索更多智能化场景和解决方案”。 “工业场景的容错率非常低,咱们只有在确保AI平台技术利用的各方面性能都达到咱们理论生产的规范时,能力将其上线。飞桨齐全满足了咱们的要求,让咱们可能释怀将更多任务交给机器来实现,也让咱们对人工智能在工业畛域的大规模利用更加充满信心。”该智能化我的项目的负责人示意。 传统工业向高端化、智能化演进,是必然趋势。对企业开发者而言,趁手的“工具”能帮忙他们疾速且高效地克服工业环境的复杂性,催生更多“AI+工业”的利用。飞桨将持续为钢铁工业的智能化降级提供无效助力,携手拓展技术创新之路。 相干浏览 长三角生物医药产业减速跑,飞桨螺旋桨为翻新药企、医药技术搭档装上AI大模型引擎利用飞桨技术引领废钢判级行业新格局银行智能案防:以“AI技防”堵住违规破绽实时性升至秒级!飞桨PaddleSpeech赋能金融双录业务走向智能化飞桨赋能润建股份打造智能化路网零碎,实现精度速度全面晋升

May 18, 2023 · 1 min · jiezi

关于paddle:百度Q1财报发布文心一言性能提升10倍大语言模型带来革命性潜力

北京工夫5月16日,百度(NASDAQ:BIDU,HKEX:9888)公布了截至2023年3月31日的第一季度未经审计的财务报告。第一季度,百度实现营收311亿元,同比增长10%;归属百度的净利润(non-GAAP)达到57亿元,同比大幅增长48%,营收和利润双双超市场预期。 百度创始人、董事长兼首席执行官李彦宏示意:“咱们置信生成式人工智能和大语言模型为各行各业带来了革命性的后劲,帮忙用户与客户实现目标并对社会产生侧面影响。基于这个趋势,文心一言开启内测。咱们打算逐渐将文心一言融入咱们的所有业务,为咱们的产品及服务赋能,吸引更宽泛的用户及客户。围绕文心一言在新的时代中建设新生态。这也将助力咱们实现长期、可继续的增长。” 3月16日,百度在寰球大厂中首先公布对标ChatGPT的大模型产品文心一言。文心一言启动内测后一个多月工夫,要害技术指标实现了新冲破:实现了4次大的技术升级,单机QPS累计晋升近10倍。 这意味着大模型推理老本曾经降到了原来的十分之一,换句话说,同样计算资源可为原来10倍数量的用户提供服务。推理作为大模型利用的要害,其性能的晋升间接影响到产品侧的成果。 百度之所以可能在Google、Meta、Amazon等大厂之前率先公布生成式人工智能产品,并疾速迭代提高,得益于百度人工智能四层架构的全栈布局,从芯片、深度学习框架,到大模型,再到利用,实现了层与层反馈,端到端优化。 尤其是飞桨和文心一言的联结优化,大幅晋升模型训练和推理速度。同时文心一言也建设起人类反馈、处分模型和策略优化之间的飞轮机制。随着实在用户的反馈越来越多,模型成果越来越好,能力越来越强。 同时,基座模型训练性能一直优化,基于飞桨分布式并行策略优化和训练精度调整,基座模型训练峰值FLOPS利用率可进一步大幅晋升。 目前,百度正迅速将文心一言整合到所有业务中进行测试,利用其能力来重塑公司面向企业和消费者的产品和服务。百度文库已内测接入文心一言,推出“百度文库文档助手”,15秒就能够为用户生成一篇业余文档;文心一言也已全面利用在智能工作平台“如流”中,均匀5秒就能够解答一个难题,大幅晋升工作效率。 财报中还开释了其余业绩亮点:百度智能云实现盈利,内测企业级大模型生产平台。挪动生态强劲增长,萝卜快跑稳居寰球最大无人驾驶运营商。 举荐浏览 百度公布2023年Q1财报:营收311亿元,净利润大幅增长48%

May 17, 2023 · 1 min · jiezi

关于paddle:开箱即用AI模型库全新发布一站式在线开发部署

人工智能学习与实训社区飞桨AI Studio模型库全新降级! 反对模型创立、上传、托管 并一键调用模型线上开发部署! 飞桨AI Studio已接入飞桨生态特色模型库,全面笼罩模型畛域,蕴含文心系列大模型、CV、NLP、语音、科学计算、量子计算等,更有收录开发者所奉献的各畛域开源模型、自研模型、微调模型等。模型库全新性能反对开发者共享深度学习模型与demo演示,开发者能够轻松地创立和治理本人的模型,同时可利用界面或开发环境来便捷地上传、体验相干模型文件,并进行二次开发。 理解模型库全新性能集体模型空间开发者可创立集体模型空间,可于空间内进行模型的存储、版本治理,还将反对设置空间公开范畴、分享等。 模型公布开发者可公布自研模型或微调模型于模型空间中,反对关联对应的我的项目、利用等。同时,反对间接调用模型进入线上环境,在线进行模型的训练、调优、利用部署,实现一站式深度学习。 开发者奉献模型展现奉献模型:Vicuna-7B,由 UC 伯克利、CMU、斯坦福等机构的学者联手公布的最新开源大模型,基于 Meta 开源的 LLaMA 大模型微调而来。模型贡献者:@寂寞你快进去模型链接:https://aistudio.baidu.com/aistudio/modelsdetail?modelId=239 反对git拉取运行或下载至本地、或一键线上开发模型库 全新性能已凋谢排队预约,将逐批凋谢,进入“AI Studio-流动-AI模型库全新公布”进行报名!

May 16, 2023 · 1 min · jiezi

关于paddle:飞桨EasyDL月刊4月功能全新升级模型训练步骤缩短63

敬爱的开发者: 近来以生成式 AI、多模态预训练大模型为代表的技术改革正席卷寰球,与此相关的智能化工具和平台陆续公布。飞桨 EasyDL 和 BML 位于文心全景图的工具与平台层,提供大模型开发套件及多种建模形式,全面反对基于大模型能力的开发、训练和利用。 5月12日晚,飞桨 EasyDL 首期月刊正式公布。立足产业实际的 AI 开发平台,本专栏将以月度为单位,面向企业级开发者提供行业趋势洞察、平台性能降级、落地利用案例和重大流动预报。期待通过这四局部内容的出现,晋升对大模型时代AI开发平台的认知了解,减速企业数智化转型降级。 行业趋势洞察热门行业工业制作、教育培训、文化娱乐、智慧城市和互联网,位列行业 top5 。本月互动营销小程序和 App 备受交付型 ISV 青眼,主因估算、我的项目周期整体可控。 头部场景零部件瑕疵质检、 视频抽帧辨认、图像标签分类、商品辨认打标,位列场景 top4 。 工作类型EasyDL 图像、EasyDL 文本占比超9成,结构化数据创立模型数占比晋升。 平台性能降级4月降级EasyDL 聚焦开发体验降级,简化用户训练模型步骤,以下为本次性能降级的次要内容,返回 EasyDL 官网即刻体验。 整合流程:「数据处理」、「模型创立」、「训练配置」,三大流程交融于一个链路,给每位开发者提供步骤疏导。 老手指南步骤拆分:每位开发者可随时切换流程查看教程,模型开发更简略。 标准降级:EasyDL 各页面降级最新标准,推动产品一致性体验。 5月预报EasyDL 文本创作工作,将联合市场同类型产品的调用价格和资源投入优化产品定价,给您带来性价比更高的文本创作能力。EasyDL 文本工作,行将反对 P4 训练算力的资源包购买,您在训练模型时将有更多样化的抉择。EasyDL 官网新增「重大公布时间轴」,便于您更及时地把握平台最新动静。模型训练专项优化,咱们将通过功能完善、信息披露、工单答疑等模式,缩小训练失败和耗时过长 case ,为您提供高效的售后服务。落地利用案例企业服务利用场景应用 EasyDL 图像分类训练照片翻拍模型,审核业务员外出作业时上传的图片是否实在,实现考勤监控,扭转原有人工定期批量审核形式,晋升审核效率80% ,同时保障了审核后果的实在有效性,避免漏辨认及舞弊状况的产生。应用 EasyDL 物体检测审核用户上传的文件是否合乎平台标准,审核包装类图片是否合乎商标标准,如不符合规范,弹窗提醒用户批改后从新上传,模型准确率靠近100%。应用 EasyDL 文本分类-多标签工作,主动分类回收用户反馈并打标,能疾速对收集到的海量反馈信息进行分类,进步剖析效率,扭转原有人工一一查看打标形式,减速理解客户心声,助力体验晋升。智慧城市利用场景应用 EasyDL 图像检测智慧垃圾箱的回收筒是否为空桶、垃圾是否易侵蚀,模型准确度达到95%,物联通的利用实现垃圾分类投放、分类收集,不便后续分类运输、分类解决,帮忙全过程监控,辅助溯源机制的实现,以推动数字化治理。应用 EasyDL 桌面版在本地服务器环境,辨认特定的家养动植物,助力警方破获非法交易案件。应用 EasyDL 物体检测训练渔船辨认模型,在长江干流监管沿岸架设摄像头,将辨认后果告诉执法人员,实时监控海面渔船航行,扭转了原有渔政执法人员巡逻监管模式,实现局部区域无人监守,同时进步了执法效率。互联网利用场景应用 EasyDL 图像分类,对用户上传与家装设计相干的案例和图库(UGC 内容)打标分类,模型准确度达到97%,模型的应用补充产品后盾数据处理能力,扭转原有人工打标办法,进步了用户上传图像审核效率。应用 EasyDL 物体检测在小程序、App实现钢筋、钢管、方木计数,模型准确度达到95%,拍照后3秒内即可返回数量,扭转原有人工盘点形式,节俭反复盘点工夫,进步了盘点效率与准确度。应用 EasyDL 文本分类用户的注册信息,零碎打标填写者之间的关系、性别、填写形容是否合乎平台标准,升高人工审核老本。重大流动预报5月中旬,百度智能云官网举办618大促,EasyDL 实名用户可加入离线 SDK、私有化部署包的价格直降流动。往年 EasyDL 首次纳入百度智能云优惠券的笼罩产品,面向企业老客、平台新客以及流动期内实现实名认证的企业客户,提供不同额度的满减优惠券,优惠券同价格直降二选一。更多流动详情,请返回百度智能云官网查看。以上是飞桨 EasyDL 4月平台月刊的全部内容。

May 15, 2023 · 1 min · jiezi

关于paddle:大模型时代入场级技能提示词工程百度文心中文教程来啦

写出优质的提醒词,让 AI 生成惊艳的图文作品。——这就是现在年薪百万仍一人难求的提醒词工程师们在解决的问题。大语言模型时代下,不断涌现出泛滥让人瞳孔地震的绘画、赞不绝口的文案,它们的创作者并非传统定义的画家、作家,而是这群懂得利用 AI 生成能力的提醒词工程师。他们彷佛把握了与大语言模型沟通的魔法,让其可能高效、稳固、疾速的生成一个又一个优良的图文,而不太会写的提醒词的"麻瓜"们仿佛只能干看着为其鼓掌。 AI 生成风靡寰球 大模型时代已来 近年来,深度学习模型愈发弱小的生成能力一次次引爆学术圈产业界,乃至普罗公众的关注。当年成果惊艳到一度"挤爆服务器”的反抗生成网络 GAN 仿佛已成历史,图像生成已成 Stable Diffusion 等跨模态文生图模型的天下。文本生成的变革更是一浪更比一浪高,从 GPT3 论文公布引起学术狂欢到一经问世间接让寰球轰动的 ChatGPT ,连国内出租车的电台里都在探讨这技术会带来哪些时代时机,这能放开给国内用吗? 确实,激情磅礴之后越来越多人开始困扰于国内无服务导致的调用门槛高、生成速度慢等问题,即便勇闯难关用上了也逃不过语言环境:应用页面、官网教程、优质 Prompt 实例、 Prompt 技巧鲜有中文,很多中文工作也难以被了解……对国内自研的呼声也因而越来越高。2023年3月,集文本创作、常识问答、 AI 绘画等十八般武艺于一身的百度新一代常识加强大语言模型文心一言横空出世、热度空前,尔后国内大规模预训练语言模型如雨后春笋般相继公布,各显神通。 激活大模型能力的钥匙:优质 Prompt 模型有了,但用户们生成的后果却是形形色色甚至天壤之别,导致呈现一些“大模型只能当做玩具”“网上的 case 都是假的”等声音。背地起因其实是提醒词工程(Prompt Engineering) 能力的差别。 对于同一个大模型,给予不同的提醒词(Prompt,即用于触发或疏导大模型生成内容的输出文本) 会生成不同的后果,艰深说就是用户输出给大模型的问题。而提醒词工程实质上是一种通过优化提醒词来改良模型生成后果品质的办法。能够说谁把握了提醒词工程(Prompt Engineering)能力,谁就拿到了开释大模型弱小生成能力的钥匙。 百度文心官网开课 手把手教你写出优质 Prompt 百度文心官网团队打造,应用页面、教学案例、在线课程、答疑服务全中文环境,帮忙大家把握以文心一言为代表的大语言模型对话技巧与高级用法,与大模型高效交换从而开释大模型弱小的生成能力。 同时,大模型的生成能力利用宽泛波及千行百业,许多没有计算机学习背景的同学也心愿可能写出优质的提醒词,从而利用大模型帮忙本人进步生产效率。因而本次课程抉择从理论利用登程,依靠大量中文实例逐渐带你学习优质 Prompt 根底构建形式、丰盛的优化技巧、针对具体场景利用做优化等实用常识。无需技术根底、能联网会打字就能学的大模型时代必备技能。 课程详情提醒词工程师直播教学、多位大模型资深玩家在线答疑、真人班主任全程助攻、装备 Prompt 积分赛等实际、大疆无人机/iPad/现金奖学金等万元奖池等你挑战、5月16日(周二)正式开课! .png") 本次《基于大模型的优质 Prompt 开发课》为百度文心大模型AIGC主题月中的 Prompt 课程,也欢送开发者们持续关注后续的《大模型利用开发技巧与实战》课程,疾速学习大模型技术原理、上手模型微调和利用开发实战。另外《开发者说 AIGC 系列直播》也曾经上线啦,欢送理解文生图、文生声、文生文、文生视频4个热门方向内容~! 奖品体系大模型利用时代,实际出真知:学习课程、入手写优质 Prompt ,参加积分赛!能力和大奖双赢! Prompt积分赛 提交原创优质 Prompt 获取积分,总积分 Top9 的学员将取得最强 Prompt 生产者大奖! 一等奖/Top1:大疆无人机 或 iPad第十代二等奖/Top2-4:AirPodsPro三等奖/Top5-9:富士拍立得优良作业奖 顺利结业且提交的原创优质 Prompt 在 【商业后劲】【人气】【创意价值】 任一赛道获得 Top9 (共计27个),即可取得: ...

May 12, 2023 · 1 min · jiezi

关于paddle:政务智能办体验升级乳腺癌创新药加速研发飞桨和文心大模型驱动应用智能涌现

4月27日,百度“飞桨中国行”落地上海,围绕“如何使用深度学习平台+大模型技术打造壁垒疾速破局”主题,飞桨携手区域企业、高校院所、硬件厂商、开发者等生态搭档共话 AI 技术新动向和产业降级新趋势,助力上海夯实具备国内影响力的人工智能“新高地”,引领上海集成电路、生物制药、人工智能三大产业翻新倒退。 主会场设于张江迷信会堂,汇聚了来自政产学研各界嘉宾。浦东新区行政服务中心主任蒋红军、上海张江(团体)有限公司副总经理陈衡、浙江大学上海低等研究院常务副院长吴飞、百度 AI 技术生态总经理马艳军,NVIDIA 、昆仑芯、沐曦等硬件企业代表,智慧政务、生物医药、绿色制作、智慧金融等畛域的搭档企业深度分享交换。 现场还进行了一系列公布和典礼流动,包含人工智能赋能产业联盟成立典礼、飞桨 AI Studio 硬件生态专区联结公布以及百度 AI 技术生态搭档体系降级公布及搭档授牌等。 技术引领,生态降级,为产业打造 AI 新引擎由 AI 大模型引领的翻新浪潮席卷寰球,掀起产业降级的蝶变,上海正全力打造世界级人工智能产业集群。作为国内人工智能技术的引领者,百度积极参与建设更具影响力的人工智能“上海洼地”。目前,飞桨在张江落地人工智能产业赋能核心,服务上海企业智能化利用;与上海市 7 所高校达成“松果基地”校企单干,上海市高校本科 AI 业余 70% 应用飞桨教学,近三年来,上海市 29 所高校的 81 支队伍应用飞桨参加国赛并获奖。 随着“数实交融”减速步入深水区,区域企业与产业集群在推动数字化过程中遭逢新问题,亟待科技企业降级赋能。百度 AI 技术生态总经理马艳军示意,深度学习和大模型作为 AI 新型基础设施,两者联结优化,相互促进,迎来倒退黄金期。飞桨深度学习平台和文心大模型,构筑产业智能化基座,赋能千行百业。针对区域企业新痛点,飞桨通过人工智能产业赋能核心,整合百度 AI 技术服务、解决方案及生态资源,全面反对区域产学研用低门槛、高效率利用 AI 技术和资源,携手推动复合型 AI 人才培养及重点产业智能化降级,曾经成为区域数字经济高质量倒退的催化剂。 百度 AI 技术生态总经理马艳军飞桨携手浙江大学上海低等研究院推动产教交融实际,成为长三角区域校企单干的榜样。浙江大学上海低等研究院常务副院长吴飞传授示意,人工智能正施展基座能力,AI 已成为一种通用策略使能技术,具备加强诸多畛域技术的后劲。在产教交融畛域,浙江大学上海低等研究院联结百度飞桨推动了一系列行之有效的实际,包含共建飞桨联结翻新实验室,联结实现国家重大课题;共建人工智能微业余和人工智能科教平台,联结出版教材和课程体系等,助力人工智能人才培养。同时,单方深入 AI+ 科学计算畛域研发单干,在生物计算、钢铁煤炭产业,利用百度 AI 技术,播种行之有效的成绩。 浙江大学上海低等研究院常务副院长吴飞生态建设是推动 AI 技术落地利用的关键步骤。流动现场,百度 AI 技术生态搭档体系全新降级。百度为技术合作伙伴、服务增值搭档、硬件共创搭档三大类生态搭档,设定了不同维度的单干模式和级别,并匹配相应的生态权利计划及搀扶政策。生态搭档还将取得来自飞桨人工智能产业赋能核心的业务领导,以及高校教育体系、开发者社区提供的人才反对。百度 AI 技术生态总监周奇为哲元科技、美华零碎、复亚智能、金古代、南洋万邦、致宇信息、金仕达、慧安股份、云钠科技、仪酷智能,10 家企业代表进行了授牌。飞桨生态朋友圈的一直扩容,有助于进一步激活生态创新力,实现更高水平的产学研协同。 硬件生态是生态建设的重要一环。目前,已有 33 家硬件搭档退出飞桨 “硬件生态共创打算”,其中有 15 家企业位于上海。此次飞桨中国行,百度与NVIDIA 、Intel 、Arm 、昆仑芯、天数智芯、燧原、芯原等 25 家硬件企业联结公布飞桨 AI Studio 硬件生态专区。AI Studio 人工智能学习与实训社区为超 369 万 AI 学习者提供在线课程与一站式开发实训平台。硬件生态专区的建设,将有助于晋升硬件底层开发体验感,帮忙更多开发者低门槛、低成本实现 AI 利用翻新。 ...

April 28, 2023 · 1 min · jiezi

关于paddle:第二届广州琶洲算法大赛启动百度飞桨助力广州打造中国算法新高地

生成式人工智能热潮席卷寰球,算法翻新成为 AI 冲破倒退的要害,推动实体经济高质量增长。4月25日,第二届广州·琶洲算法大赛正式启动,广州市政府主办、百度飞桨等联结承办,广召天下算法英雄,放慢“琶洲算谷”建设。百度飞桨与文心大模型构筑产业智能化基座,为此次大赛提供技术撑持,联结各方生态力量,推动 AI 大规模利用。 启动典礼汇聚了来自政产学研各界嘉宾和算法专家。中国科学院院士、计算机科学家、数学家张景中,中国工程院院士倪光南,中国科学院院士钱德沛,百度首席技术官、深度学习技术及利用国家工程钻研核心主任王海峰等进行致辞,均表白了对人工智能倒退根底软件、算法翻新的高度重视。百度副总裁杨兆明现场参加了大赛启动典礼。 现场还公布一系列人工智能新品,包含琶洲实验室公布“ AI 宽度学习大模型”、“百度·数字经济时代多算力协同解决方案”;百度飞桨(广州)人工智能产业赋能核心正式落成,飞桨 100 个产业算法模型一并入驻琶洲算法库。 超有料赛题列阵,亟待算法高手用 AI 破题“优选 AI 算法,让世界更智能”,随着大赛启动,赛制和赛题也第一工夫颁布,颇具亮点。大赛分为算法优选赛、揭榜打擂赛、计划翻新赛三个组别,围绕绿色能源、智慧交通、智能制作、电子商务、前沿科技等热门畛域设置赛题,邀请寰球 AI 开发者和企事业单位报名参赛。 作为算法赛出题方,广汽团体、南方电网、工信部电子五所、广州地铁、唯品会、琶洲实验室、百度等龙头企业和科研平台巧设赛题,包含“基于多指标、多源数据扰动预测的智能排产算法”、“基于简单场景的输电通道隐患指标检测算法”、“新能源汽车动力电池衰弱度预测与预计”、 “基于客流数据的城际铁路网络列车运行计划编制模型”、 “基于文心交通大模型的多任务联结训练”……更贴近产业一线理论需要、更具挑战性的赛题,将催生更有利用价值的算法和解决方案。 大赛启动后将采取线上线下相结合的形式,经验报名、初赛、复赛等几大赛程,8月决赛决出算法高手,总奖金池不低于 300 万元。 本届大赛亮点之一,评委会主任由欧洲科学院外籍院士、欧洲迷信与艺术学院院士、中国自动化学会副理事长、华南理工大学计算机科学与工程学院院长、琶洲实验室副主任陈俊龙,清华大学传授、国内欧亚科学院院士、IEEE Fellow、AAIA Fellow 魏少军,俄罗斯工程院外籍院士、物联网通信、管制与信号处理专家谢胜利负责。现场还为评委会主任和评委代表颁发聘书。 高质量赛题考验着参赛者们的才华,更考验背地弱小的技术平台撑持,飞桨和文心大模型将成为选手参赛的“趁手利器”。深度学习平台飞桨,具备丰盛的产业级模型库、端到端开发套件、工具组件,可高效反对深度学习模型开发、训练、部署等全流程,升高 AI 技术利用门槛,帮忙选手便捷参加较量、实现算法。 百度设置的算法赛题,基于文心交通大模型打造。产业级常识加强大模型文心,既蕴含根底通用的大模型,也蕴含面向重点工作畛域和行业的大模型,以及丰盛的工具与平台。新一代常识加强大语言模型“文心一言”是文心大模型家族的新成员,具备对话交互、内容创作、常识推理、多模态生成等突出能力。大会收场前,广东省、广州市、海珠区等政府领导和张景中院士等算法专家亲自体验文心一言,并提出“如果屈原当初来广州,会给广州什么评估”、“如何解决广交会期间交通拥堵问题”等问题。 飞桨深耕区域赋能,降级琶洲“算法”新名片飞桨深耕区域生态,与广东、乃至粤港澳大湾区产业链,从来单干严密。典礼上,百度飞桨(广州)人工智能产业赋能核心正式落成,同时飞桨产业算法模型正式入驻琶洲算法库。后续,飞桨将基于广州产业赋能核心,联结上下游合作伙伴,持续壮大、凋敝生态,摸索更多区域特色,反对广州当地企业、科研团队和开发者更便捷经济地实现人工智能相干技术利用开发。 百度飞桨人工智能产业赋能核心此前已在上海、宁波、南昌等区域落地,深度赋能当地产业,减速实现智能化跃迁,实现高质量倒退。 目前,飞桨已累计服务笼罩广州企业三千余家,蕴含南方电网、北方航空、广汽等头部企业;与 4 所广州高校达成人才培养实际基地校企单干,8 所本地高校已应用飞桨教学并开设学分课;组建 10 个飞桨领航团,助力开发者升高 AI 利用门槛。 基于本次算法大赛,百度飞桨一直加大技术支持,为粤港澳大湾区的人工智能与数字经济相干产业倒退注入全方位的赋能,汇聚产业、翻新、人才资源,交融翻新成绩,为产业经济转型降级提供要害撑持。 点击文末下方链接可间接进入官网报名。 https://ai.baidu.com/tech/competition/pazhou 

April 26, 2023 · 1 min · jiezi

关于paddle:今天飞桨公众号六岁啦

时光荏苒,岁月不居。不经意间,飞桨PaddlePaddle公众号已成立六周年了。 2190个日夜、52560个小时, 感恩大家的一路相伴! 周年之际,让咱们一起回首走过的六年! 回首过来过来六年, 咱们共公布了1595篇文章 其中原创259篇 总浏览量500万+ 总分享量24万+ 咱们相聚于此,是因为这些话题将咱们分割在一起。 公众号文章题目中呈现最多的词组 这些话题,兴许就是咱们建立联系的契机呢? 寒来暑往,六年相伴,咱们一路同行2020年7月25日,咱们迎来了五万粉丝。 这意味着五万名气味相投的敌人与咱们在飞桨公众号相聚; 2022年1月24日是一个难以忘怀的日子。 在这一天,十万粉丝关注飞桨公众号,咱们承载了大家沉甸甸的期待。 你们的每一次关注、分享、留言, 都是对咱们的反对和激励。 咱们找出了最近关注咱们的1024位敌人,快来看看有没有你本人吧~ 感激大家始终以来的陪伴! 在将来,咱们心愿可能遇到更多的敌人,分享更多的高兴。 工夫走过六年,仍旧记得登程时的幻想,让弱小的 AI 人人可用2017年4月23日,飞桨公众号公布了第一篇文章,笔触青涩但真挚。 深度学习平台放出了一只“大熊猫”,叫PaddlePaddle? 2019年4月1日,飞桨公众号开启了专栏之旅。第一次摸索,只为更好地将优质内容出现给大家。 2021年11月25日,飞桨视频号正式启动。第一次直播,你是否守在屏幕前一起观看? 步履不停,飞桨公众号将继续推出优质内容无论是原创文章,还是技术专栏 这些干货的输入源泉,都来自原创作者们的奉献! 感激大家判若两人对飞桨的反对与相伴!你们沉甸甸的祝愿,飞桨公众号都收下了~ 点击上方视频,查看生日祝愿 优质专栏、博采众长,飞桨将在将来继续提高! 将来,咱们将继续推动创作者激励打算,联动更多的资源,提供欠缺的激励机制,心愿与你共建开源凋谢的技术内容社区! 礼品放送最初,4.23是飞桨公众号6周年纪念日,同时也是世界读书日,咱们在这里筹备了诸多好礼,为你续航充电~ 【常识礼品免费送】流动一:AI Studio官网领算力112 小时 GPU 算力收费获取 登录 AI Studio 官网即可体验支付, 运行我的项目每周可取得 112小时 16GB V100 算力, 还可通过多种流动模式获取更多的应用时长! 流动二:最新版学习地图收费得关注飞桨PaddlePaddle公众号,回复关键词 “最新版学习地图” ,即可获取! 机器学习常识地图示例 6份不同的学习地图等你支付~ 【粉丝互动赢好礼】互动一:走心留言,点赞多多领专属礼品!进入飞桨PaddlePaddle公众号,转发此条推送到朋友圈, 并在本文评论区带上标签 #我和飞桨的回顾# , 写下你与飞桨之间的点滴故事, 一起回顾走过的六周年时光~ 咱们将会为评论区留言点赞数量前30的敌人, 送上飞桨定制礼品! 点赞第1名将取得飞桨定制机械键盘一个 点赞第2-第6名将取得飞桨二十四节气冰箱贴一套 ...

April 24, 2023 · 1 min · jiezi

关于paddle:百度CTO王海峰做客中国经济大讲堂文心一言读书破万亿

当下,大语言模型热度空前,诸如文心一言、ChatGPT 等曾经可能与人对话互动、答复问题、帮助创作,逐步利用于人们的工作和生存,也引发了社会热议。近日,百度首席技术官、深度学习技术及利用国家工程钻研核心主任王海峰再次做客 CCTV-2 《中国经济大讲堂》,阐释文心一言这类大语言模型的产品能力、技术原理和产业价值。 文心一言读书破万亿五大能力业内当先 人工智能时代,IT 技术栈可分为“芯片层、框架层、模型层和应用层”,百度是寰球为数不多、进行全栈布局的人工智能公司。从昆仑芯片、飞桨深度学习平台、文心大模型到利用,在技术栈的每一层,都有当先的要害自研技术,实现了层与层反馈,端到端优化,大幅晋升效率。文心一言是百度人工智能多年技术积攒和产业实际的瓜熟蒂落,尤其是飞桨深度学习平台和文心大模型的联结优化,为文心一言提供了松软的技术撑持。 王海峰强调,文心一言齐全是百度自主研发的大语言模型。百度早在 2019 年就公布文心大模型 ERNIE 1.0,通过近 4 年研发和迭代,文心大模型曾经造成了产业级常识加强大模型技术体系,包含自然语言解决、视觉、跨模态、生物计算、行业大模型,以及撑持大模型利用的工具平台,蕴含了大量百度自主翻新、并且在大规模产业利用中失去验证的技术。其中有些关键技术已申请专利或者发表论文,还有一些相干技术也已开源凋谢。 文心一言是大语言模型的典型代表。王海峰以“读书破万卷,下笔如有神”为例,解读了大语言模型从海量数据中学习,就相当于读了万亿卷书籍,排汇了万亿常识,做到了了解,在此基础上,就能够依照用户的需要去生成文案、答复问题、实现总结剖析了。 对于 “文心一言”名字由来,王海峰做了具体阐释:“文”是语言文字,“心”是用心了解,“文心”指致力于了解和使用语言文字的自然语言了解模型,同时也响应了《文心雕龙》,寓意用雕缕龙纹一样精密的功夫去钻研语言文字的外延和魅力;“一言”既有“一言为定、一言九鼎”的寓意,也有对人机之间“你一言我一语”晦涩沟通的殷切期盼。文心“一言”既出,即可“毕生二、二生三、三生万言”。 现场还展现了文心一言的文学创作、商业文案创作、推理计算、中文了解和多模态生成等能力。在文学创作方面,文心一言不仅能够撰写《漂泊地球2》的影评文案,还能够创作朋友圈配图,并续写《漂泊地球3》的后续剧情;在商业文案创作方面,文心一言帮忙想开店的创业者做好筹备工作,比方调研北京中关村3公里范畴内办公人群口味偏好、设计店名、创作宣传语和藏头诗,以及收集汇总创建餐饮店波及的政府部门与相干流程手续;在推理计算方面,文心一言能够精确计算简单的数学问题,先了解问题,再通过思维链推理,最初生成答案;在中文了解方面,文心一言能够精确解答“日照香炉生紫烟,遥看瀑布挂前川”诗句是哪里的天然现象及其背地的物理现象;在多模态生成方面,文心一言能够精确答复中国新诗的相干问题,并制表、作画,用方言朗诵。 六大核心技术加持文心一言落地瓜熟蒂落 文心一言是文心大模型家族的新成员,在文心常识加强大模型 ERNIE 及对话大模型 PLATO 的根底上研发,基于飞桨深度学习平台训练和部署,其关键技术包含,有监督精调、人类反馈的强化学习、提醒、常识加强、检索加强和对话加强。前三项是这类大语言模型都会采纳的技术,在 ERNIE 和 PLATO 模型中曾经有利用和积攒,文心一言中又进行了进一步强化和打磨,做到了更懂中文、更懂中国文化、更懂中国的应用场景;后三项则是百度已有技术劣势的再翻新,也是文心一言越来越弱小的技术底气。 王海峰以老师教学生为例,深入浅出地解读了大语言模型背地的技术原理。预训练大模型像博览群书的学生,记住了很多常识,但须要老师来领导如何使用,而有监督精调就是老师在教学生,将提炼进去的常识要点、典型范例等教给模型,让它晓得该如何合乎人类标准、习惯和价值观,去执行相应动作,生成相应内容。文心一言训练了处分模型,为每次输入的后果打分并给到反馈,进行强化学习,随着实在用户的反馈越来越多,文心一言的成果会越来越好,能力越来越强,提高“日新月异”。此外,文心一言还交融了不同类型数据和常识,主动结构提醒,包含实例、提纲、标准、知识点和思维链等,提供了丰盛的参考信息,激发模型相干常识,生成高质量后果。 对于百度已有技术劣势的再翻新,王海峰也做了进一步解读。 在常识加强方面,常识是人类意识和革新世界的智慧结晶。百度构建了 5500 亿事实的常识图谱。文心一言基于宏大的常识图谱来做常识加强,从海量数据和大规模常识中交融学习,还能够间接调用常识图谱做常识推理,主动构建提醒,高效满足用户需要。在常识的领导下,文心一言如同站在伟人的肩膀上,学得又好又快,模型效率和成果均大幅晋升。 在检索加强方面,百度领有世界上最大的中文搜索引擎,百度搜寻曾经倒退到基于语义了解和匹配的新一代搜寻架构,深刻了解用户需要和网页内容,进行语义匹配,失去更精准的搜寻后果,进而为大模型提供准确率高、时效性强的参考信息,更好地满足用户需要。 在对话加强方面,基于对话技术和利用积攒,文心一言具备记忆机制、上下文了解和对话布局能力,实现更好的对话连贯性、合理性和逻辑性。百度深耕对话技术多年,获得了国内当先的技术成绩,荣获中国专利金奖、吴文俊人工智能科技进步特等奖等,为文心一言的胜利研发奠定了根底。 文心一言普惠千行百业减速产业智能化改革 大语言模型的飞速发展曾经引起社会热议,对于工作岗位代替、教育模式改革、人工智能平安等问题,王海峰也给出了解答。 他示意,文心一言这样的人工智能技术,实质上是晋升生产力的工具,能够代替人类实现一些工作,但同时也会发明更多工作机会,使人类能够去做更具创造力的工作。正如人类历史上任何一次科技反动和产业改革都会带来一些工作被代替,同时发明了更多新的工作机会。在教育模式的转变上,“死记硬背”曾经掉队,教育将与时俱进,向激发灵感、造就创造力的方向转变。 在人工智能安全性方面,百度动摇恪守相干法律法规和伦理标准,专门装备了相应监督机制和管理机制,从各个环节做好平安防备。在文心一言的开发过程中,从最后的数据的采集、解决,模型的训练,到最初的应用过程,构筑了五道平安防线。百度也成立了数据管理委员会,还与社会各界独特单干,不断完善相干政策、规定,强化人工智能平安。对于人工智能是否会管制人类,王海峰强调,就像人造地球卫星永远也不会和月球这样的天然卫星画等号一样,人工智能永远也不会间接跟人类的智能齐全画等号,钻研人工智能是在钻研用技术手段来模仿、延长和拓展人的智能,最终目标是为人类带来更先进的科技,服务于人类更美妙的生存和社会的倒退。 当下,人工智能曾经成为新一轮科技反动和产业改革的重要驱动力量,而深度学习作为人工智能的核心技术,具备很强的通用性,呈现出标准化、自动化、模块化的工业大生产特色,推动人工智能进入工业大生产阶段。大模型具备成果好、泛化性强、研发流程标准化的特点,正在成为人工智能技术及利用的新基座。但与此同时,大模型研发门槛高、难度大,依赖算法、算力和数据综合撑持,产业化面临挑战:模型体积大,训练难度高;算力规模大,性能要求高;数据规模大,数据品质参差不齐。 如何实现大模型产业化?王海峰示意,相似芯片代工厂的模式,具备算法、算力和数据综合劣势的企业,能够将模型生产的简单过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务。将来,文心一言这类大语言模型会成为一个通用的赋能平台,金融、能源、媒体、政务等各行各业,都能够基于文心一言实现智能化改革,提高效率,发明微小的商业价值。期待社会各界踊跃拥抱新技术,共同努力,实现高水平科技自立自强,为经济高质量增长带来更多动能。 欢送大家关注飞桨视频号,获取更多对于中国经济大讲堂的短视频~

April 18, 2023 · 1 min · jiezi

关于paddle:报名啦来飞桨中国行听深度学习平台大模型如何破局产业智能化

4月27日“飞桨中国行”流动将落地上海,来自政府、企业、高校的10+位专家学者将齐聚张江迷信会堂,聚焦区域企业与产业集群倒退过程中的理论状况与要害痛点,围绕“如何使用深度学习平台+大模型技术打造壁垒疾速破局”主题,分享最新AI技术与行业利用案例,助力当地产业智能化转型降级。 放慢实现高水平科技自立自强,是推动高质量倒退的必由之路。在世界新一轮科技反动和产业革命中,人工智能引领潮流并彰显着“头雁效应”,正在对世界经济、社会提高和人类生存产生极其粗浅的影响。寰球人工智能技术正在减速演进,出现从感知走向认知、从辨认走向生成、从专用走向通用的趋势。 过来十年是深度学习的黄金十年,百度自研的产业级深度学习平台飞桨,作为框架层连接着底层人工智能芯片和下层模型,独特撑持应用层开发。截止2022年底,飞桨已凝聚535万开发者,服务20万家企事业单位,创立67万个模型。大模型的衰亡,带来了AI开发范式变动与产业降级,百度研制了产业级常识加强文心大模型,飞桨撑持大模型的开发训练和推理部署,使其成果更好、效率更高、性能更强。深度学习平台和大模型构筑的产业智能化基座,正在赋能千行百业。 上海在核心技术、场景使用、生态建设、人力资源等方面继续发力,全力打造世界级人工智能产业集群。作为国内人工智能技术的引领者,百度特设百度飞桨(张江)人工智能产业赋能核心,积极参与建设更具影响力的人工智能“上海洼地”。 4月27日,飞桨中国行·上海站将在张江迷信会堂举办。直面企业智能化降级需要,聚焦工业、金融、生物医药、集成电路等重点产业AI利用,由政府专家、行业大咖、出名高校学者等分享最新技术成绩与行业利用案例,共话产业利用、人才培养! 本流动既有行业干货分享,又有圆桌探讨,诚挚邀请您的光临!

April 17, 2023 · 1 min · jiezi

关于paddle:低成本全流程基于PaddleDepth和Paddle3D的三维视觉技术应用方案

现实生活中的很多利用场景都须要波及到三维信息。针对三维视觉技术利用场景简单多样、三维感知工作泛滥、流程简单等问题,飞桨为开发者提供了低成本的深度信息收集计划 PaddleDepth 以及面向主动驾驶三维感知的全流程开发套件 Paddle3D 。 三维视觉技术利用场景3D 视觉是近年来非常风行的概念。它着力于让计算机模拟人类大脑,对传感器采集到的数据进行了解和剖析。以往咱们做的二维视觉工作更多是对摄像头采集的彩色图像信息进行了解和剖析,但现实生活中,很多场景须要三维信息,因而三维视觉工作应运而生。 如下图所示,从展现的三维视觉技术利用场景能够看到,三维视觉技术在智能制作、智能无人零碎、智能医疗等畛域有极大的利用价值。 依据三维视觉技术利用场景,咱们须要对问题进行针对性建模。例如,对于智能体育场景,须要通过 3D 姿势预计技术对运动员姿势量化剖析。在主动驾驶场景下,须要通过 3D 指标检测和跟踪技术实时检测无人车旁边的车辆。 综上所述,三维视觉工作所要面对的次要场景复杂多变,咱们须要针对具体业务场景选取适合的传感器,并依据采集的数据确定工作的具体建模形式。由此,咱们发现了目前三维视觉技术落地须要解决的两大外围问题。 三维视觉利用难点及计划在数据采集上,现有三维数据采集设施存在价格昂贵、采集到的数据存在稠密或者分辨率低等问题。针对这些问题,咱们提出了飞桨深度加强开发套件 PaddleDepth 。目前,罕用的深度信息采集设施分为激光雷达和 ToF (Time of Flight)设施。其中,激光雷达常利用于室外场景,它采集的深度信息较为稠密,无奈进行浓密三维重建,因而须要对深度信息进行补全。而ToF设施常利用于室内场景,它采集的深度信息个别以图像模式贮存,分辨率较低,因而须要对深度信息进行超分操作。此外,现有的深度设施价格较高,极大限度了其在实在场景中的利用范畴。因而咱们思考从彩色图像间接预计场景的深度信息,从而大幅度降低获取深度信息的老本,即深度信息估计。咱们在飞桨深度加强开发套件 PaddleDepth 开源了深度信息加强技术,其能够提供一个低成本的深度信息收集计划。 在 3D 感知畛域,训练、评估到部署的端到端流程非常复杂,基于此,飞桨提出了 Paddle3D ,其聚焦于 3D 感知畛域,涵盖了大量的 3D 感知模型,并提供了从训练、评估到部署的全流程教程,以升高用户开发成本。 飞桨深度加强开发套件——PaddleDepth如下图所示, PaddleDepth 旨在打造一个低成本的深度信息收集计划,实现深度信息补全、深度信息超分辨和深度信息估计这三类深度信息加强技术的全笼罩。目前 PaddleDepth 共蕴含 10+ 前沿模型以及 4+ 首次开源的自研算法。 在技术影响力方面, PaddleDepth 所提出的深度信息补全、超分辨率、单/双目深度预计自研算法在各公开数据集中均达到 SOTA 的性能。 在开源数据集 KITTI 上, PaddleDepth 在自监督单目深度信息估计、有监督双目深度信息估计工作以及深度信息补全工作上均排名第一。在 Middlebury 数据集上, PaddleDepth 在深度超分辨率工作上排名第一,并在 ECCV2020 Robust Vision Challenge Stereo Matching task 上取得冠军,其深度信息加强技术业界当先。 以下是成果展现: ...

April 14, 2023 · 1 min · jiezi

关于paddle:PaddleSeg-28版本正式发布啦

PaddleSeg 2.8版本正式公布啦!这次公布的内容相当丰盛给力,快来看看有没有你期盼已久的feature~ 最近Segment Anything Model大模型甚是炽热,飞桨版本的SAM这就来啦!咱们提供了WebUI演示demo和多种prompt形式下的推理脚本,欢送大家尝鲜! 公布超轻量级语义宰割模型PP-MobileSeg:在ADE20K数据集上比照此前模型,精度晋升1.5%、速度晋升42.3%、参数量减少34.9% 公布工业质检全流程解决方案QualityInspector v0.5:提供对立可配置的算法Pipeline,集成检测和宰割模型库,反对3种无监督异样检测算法,反对工业级指标评测、剖析、调优等性能。 公布通用的全景宰割解决方案PanopticSeg v0.5:提供全景宰割的全流程开发性能,集成2个前沿高精模型,具备灵便的二次开发能力。 新增了七个前沿语义宰割模型:MaskFormer、HRFormer、ViT-Adapter、CAE、SegNeXt、K-Net和LPSNet。 ⭐️此外还有很多新性能和个性,比方FastDeploy全场景部署能力的集成、EISeg V1.1版本、视频抠图模型RVM、人像抠图.NET部署教程等,详情请关注Release Note:https://github.com/PaddlePaddle/PaddleSeg/releases

April 13, 2023 · 1 min · jiezi

关于paddle:一文解读基于PaddleSeg的钢筋长度超限监控方案

我的项目背景钢铁厂生产钢筋的过程中会存在局部钢筋长度超限的问题,如果不进行解决,容易造成机械臂伤害。因而,须要通过质检流程,筛选出存在长度超限问题的钢筋批次,并进行预警。传统的解决形式是人工核查,该形式一方面减少了人工成本,升高了生产效率;另一方面也要求工人徒弟对业务比拟纯熟,可能精确地判断钢筋长度是否超限,且该办法可能存在肯定的误判率。在AI时代,利用深度学习技术,能够实现端到端全自动的钢筋长度超限监控,从而升高人工成本,进步生产效率。整体技术计划能够演绎为如下步骤: 在钢筋一侧装置摄像头,拍摄图像;利用图像宰割技术提取钢筋掩膜;依据摄像头地位和角度确定长度界线;最初依据该长度界线和钢筋宰割范畴的几何关系判断本批次钢筋是否超限。 钢筋长度超限监控整体流程 钢筋超限监控问题能够转换为图像宰割后的几何判断问题。为了实现图像宰割,咱们应用提供了全流程宰割计划的飞桨图像宰割套件 PaddleSeg,只需简略地批改配置文件,就能够进行模型训练,取得高精度的宰割成果。进一步地,咱们筛选应用精度和速度均衡的 PP-LiteSeg 模型,保障在实现高精度的同时,满足工业部署的要求。 装置环境应用 PaddleSeg 套件,咱们须要筹备如下环境: Python >= 3.6飞桨框架>= 2.1PaddleSeg接下来,应用如下命令装置 PaddleSeg 以及相应的依赖: git clone --branch release/2.6 --depth 1 https://gitee.com/PaddlePaddle/PaddleSeg.gitcd PaddleSegpip install -r requirements.txt数据处理因为钢筋长度超限检测数据集是应用图像标注工具 LabelMe 标注的,其数据格式与 PaddleSeg 反对的格局不同,因而可借助 PaddleSeg 中 tools 目录下的脚本 labelme2seg.py,将 LabelMe 格局标注转换成 PaddleSeg 反对的格局。 python tools/labelme2seg.py ~/data/dataset接下来,应用 PaddleSeg 提供的脚本(split_dataset_list.py)将数据集划分为训练集、验证集和测试集。 python tools/split_dataset_list.py ~/data/dataset . annotations --split 0.7 0.15 0.15模型训练此处咱们抉择轻量级语义宰割模型 PP-LiteSeg 模型,对钢筋进行宰割。具体介绍可参考 PP-LiteSeg 的 README 阐明文件。 阐明文件链接https://github.com/PaddlePaddle/PaddleSeg/tree/release/2.7/configs/pp_liteseg 为了在自定义数据集上应用 PP-LiteSeg 模型,须要对 PaddleSeg 提供的默认配置文件(PaddleSeg/configs/pp_liteseg/pp_liteseg_stdc1_cityscapes_1024x512_scale0.5_160k.yml)进行轻微批改。 如下所示,增加自定义数据集门路、类别数等信息: batch_size: 4  # total: 4*4iters: 2000optimizer:  type: sgd  momentum: 0.9  weight_decay: 5.0e-4lr_scheduler:  type: PolynomialDecay  end_lr: 0  power: 0.9  warmup_iters: 100  warmup_start_lr: 1.0e-5  learning_rate: 0.005loss:  types:    - type: OhemCrossEntropyLoss      min_kept: 130000   # batch_size * 1024 * 512 // 16    - type: OhemCrossEntropyLoss      min_kept: 130000    - type: OhemCrossEntropyLoss      min_kept: 130000  coef: [1, 1, 1]train_dataset:  type: Dataset  dataset_root: /home/aistudio/data/dataset  train_path: /home/aistudio/data/dataset/train.txt  num_classes: 2  transforms:    - type: ResizeStepScaling      min_scale_factor: 0.125      max_scale_factor: 1.5      scale_step_size: 0.125    - type: RandomPaddingCrop      crop_size: [1024, 512]    - type: RandomHorizontalFlip    - type: RandomDistort      brightness_range: 0.5      contrast_range: 0.5      saturation_range: 0.5    - type: Normalize  mode: trainval_dataset:  type: Dataset  dataset_root: /home/aistudio/data/dataset  val_path: /home/aistudio/data/dataset/val.txt  num_classes: 2  transforms:    - type: Normalize  mode: valtest_config:  aug_eval: True  scales: 0.5model:  type: PPLiteSeg  backbone:    type: STDC1    pretrained: https://bj.bcebos.com/paddleseg/dygraph/PP_STDCNet1.tar.gz  arm_out_chs: [32, 64, 128]  seg_head_inter_chs: [32, 64, 64]接下来,开始执行训练: python3 train.py --config /home/aistudio/work/pp_liteseg_stdc1.yml \    --use_vdl \    --save_dir output/mask_iron \    --save_interval 500 \    --log_iters 100 \    --num_workers 8 \    --do_eval \    --keep_checkpoint_max 10应用 PaddleSeg 训练过程中可能会呈现报错,例如,one_hot_kernel 相干的报错: Error: /paddle/paddle/phi/kernels/gpu/one_hot_kernel.cu:38 Assertion `p_in_data[idx] >= 0 && p_in_data[idx] < depth` failed. Illegal index value, Input(input) value should be greater than or equal to 0, and less than depth [1], but received [1].这里须要留神类别是否正确设置,思考背景类是否增加。one_hot_kernel 另一种报错: Error: /paddle/paddle/phi/kernels/gpu/one_hot_kernel.cu:38 Assertion `p_in_data[idx] >= 0 && p_in_data[idx] < depth` failed. Illegal index value, Input(input) value should be greater than or equal to 0, and less than depth [5], but received [-1].此时须要留神 mask 中标签是否超过 [0, num_classes + 1] 的范畴。训练实现后,可应用模型评估脚本对训练好的模型进行评估: python val.py \       --config /home/aistudio/work/pp_liteseg_stdc1.yml \       --model_path output/mask_iron/best_model/model.pdparams输入后果为: 2023-03-06 11:22:09 [INFO]    [EVAL] #Images: 32 mIoU: 0.9858 Acc: 0.9947 Kappa: 0.9857 Dice: 0.99282023-03-06 11:22:09 [INFO]    [EVAL] Class IoU: [0.993  0.9787]2023-03-06 11:22:09 [INFO]    [EVAL] Class Precision: [0.9969 0.9878]2023-03-06 11:22:09 [INFO]    [EVAL] Class Recall: [0.996  0.9906]由评估输入可见,模型性能为 mIoU:0.9858,Acc:0.9947,可能满足理论工业场景需要。 模型预测应用 predict.py 可用来查看具体样本的切割样本成果。 python predict.py \       --config /home/aistudio/work/pp_liteseg_stdc1.yml \       --model_path output/mask_iron/best_model/model.pdparams \       --image_path /home/aistudio/data/dataset/ec539f77-7061-4106-9914-8d66f450234d.jpg \       --save_dir output/result预测的后果如下所示。 ...

April 13, 2023 · 1 min · jiezi

关于paddle:基于PINN的极少监督数据二维非定常圆柱绕流模拟

2022年10月16日-19日,亚洲计算流体力学会议在韩国九州举办。会议涌现了不少联合人工智能技术进行流体力学模仿的论文成绩,这阐明人工智能技术逐步浸透流体力学模仿畛域。百度与西安交通大学的钻研人员一起,利用飞桨框架和科学计算工具组件PaddleScience,首次实现了基于物理信息束缚神经元网络(PINN)办法,利用极少量监督点模仿二维非定常不可压缩圆柱绕流,将同等条件的CFD流场求解耗时升高了3个数量级。因为会议论文在网上无奈下载,因而附上该论文的具体介绍(图1为论文封面),不便感兴趣的钻研人员理解论文状况以及飞桨和PaddleScience的能力。 会议论文代码下载地址https://github.com/tianshao1992/PINNs_Cylinder 图1  ACFD2022会议收录摘要 钻研背景计算流体力学(Computational Fluid Dynamics, CFD)是钻研流体力学问题的一种无效办法。CFD模仿通过在示意流体区域的网格上求解流体力学纳维-斯托克斯方程组(一种偏微分方程)来实现。在过来的几十年中,CFD模仿在模仿不同工程畛域的流体问题方面获得了微小停顿,并已成为流体力学中的重要工具。 然而,CFD模仿存在肯定的限度。当流体域和流场简单时,网格生成可能是一项艰难的工作。更细的网格能够给出更精确的后果,但它在工夫和资源上的计算成本很高。通常,学者们会通过部分网格加密在精度和计算成本之间进行权\(横^1\),。然而,这会导致另一个问题,即如果在相邻的部分网格块的交界处,网格尺寸变动太快,则交界处网格的品质可能会变差,因而即便进行了部分网格加密,也须要兼顾不同网格块之间的网格尺寸过渡。此外,不同物理现象须要不同的网格尺寸。例如,在CFD-DEM模仿中,须要对网格进行非凡的解决来适宜细小颗粒的模\(拟^2\)。因而,如果CFD模仿不须要网格,则能从实质上克服上述挑战。物理信息束缚的神经元网络(PINN\()^3\)的呈现,给无网格CFD模仿提供了一种可行计划。 本论文利用飞桨框架和科学计算工具组件PaddleScience,首次实现了基于物理信息束缚神经元网络(PINN)办法,利用极少量监督点模仿二维非定常不可压缩圆柱绕流。通过与基于无限体积法(FVM)的CFD求解办法比照,证实PINN办法在求解精度上可能达到FVM办法等同的精度。同时利用事后训练好的网络模型,每个工夫步的后果预测只需8ms,远远快于FVM办法计算速度,这是因为PINN办法能够在GPU上实现不同工夫步的并行计算。然而PINN模型的训练较为耗时,将来须要开发更高效的算法来解决训练耗时长的问题。 钻研办法二维非定常不可压圆柱绕流问题形容二维非定常不可压缩圆柱绕流是一种典型的非定常不可压缩流体景象,蕴含了流动边界层、流动拆散、逆压梯度、粘性耗散等典型的流动景象,经常被用来验证数值求解算法。在本论文中,咱们也选用圆柱绕流作为验证案例,选取的圆柱绕流几何和边界设置如图2所示。 整体流动为长方形区域,左侧为速度入口,右侧为压力进口,高低界面为有限远界面(即不设置边界条件),两头搁置了一个直径为D=1cm的圆柱。圆柱外表满足无滑移条件,速度为0m/s。左侧入口的速度为1m/s,右侧的压力为0Pa。流体的静止粘性系数为0.4c\(m^2\)/s,密度为1kg/\(m^3\)。根据上述参数,能够确定流动的雷诺数Re=250。流动的初始时刻状态由CFD软件OpenFOAM进行非定常模仿后果失去,其中OpenFOAM的工夫步长设置为0.5ms。这里阐明下,OpenFOAM采纳的是无限体积办法(FVM)去求解下列纳维-斯托克斯方程组: $$\mathrm{\nabla}·u=0$$ (1) $$\frac{\partial\mathrm{u}}{\partial t}+\mathrm{u}∙∇\bullet+\frac{1}{\rho}\mathrm{\nabla}\mathrm{p}-\mathrm{\nabla}2u-f = 0$$ (2) 其中方程(1)为连续性方程, \( \mathrm{u}\)代表速度矢量,\(\mathrm{\nabla}·u \)示意进出管制体的品质差,因为本案例采纳不可压缩流动,因而进出管制体的品质差为0;方程(2)为动量方程,\( \nu\)示意流体静止粘性系数,\(\rho\)示意流体密度,\(p\)示意管制体上的静压,\(\mathrm{f}\)示意作用在管制体上的体积力(本案例里为0)。 图2  二维圆柱绕流示意图及初始和边界条件 物理信息束缚神经元网络(PINN)区别于OpenFOAM的无限体积法(FVM),物理信息束缚神经元网络(PINN)利用神经元网络能迫近任意润滑函数的能力,来进行无网格求解纳维-斯托克斯方程组。本文构建的PINN网络结构示意图如图3所示。 神经元网络为一个全连贯层网络,输出为3个神经元节点,别离对应流动的工夫(t)和坐标(x,y),输入为3个神经元节点,别离对应流动的横向速度(u)、纵向速度(v)和静压(p)。在图3中,为了简便表白,采纳速度矢量模式(u)来展现。 为了求解纳维-斯托克斯方程组,在神经元网络的损失函数项引入了物理信息束缚,使得神经元网络既能够在数据层面失去训练,也能够在物理法则层面失去训练。具体损失函数的定义形式见下一节。 本文采纳的神经元网络参数见表1。除了输出和输入的神经元节点,一共有6层暗藏层,每层蕴含64个神经元节点,激活函数为tanh,优化器为Adam,初始学习率为0.001,训练迭代步数为40万。 表1 神经元网络参数设置 图3 物理信息束缚神经元网络构造示意 PINN的损失函数神经元网络的训练过程,是通过损失函数的反向传递来实现网络参数的更新。本文中,损失函数蕴含数据项和物理法则项: $$J=J_d+\omega J_p$$(3) 其中, \(J\)是神经元网络的总损失函数,\(J_d\)是数据项损失函数,\(J_p\)是物理法则项损失函数,\(\omega\)是物理法则项的权重。 当\(\omega=0\)时,该神经元网络就是一般的神经元网络。通过设置\(\omega\neq0\),在损失函数中引入物理法则的影响,加强神经元网络对物理法则的拟合能力。物理法则损失函数项通过神经元网络本身的微分传递链计算失去。 数据项损失函数(\(J_d\))定义为预测数值与实在数值之间的均方差(MSE): $$J_d=\frac{1}{N_d}\sum_{i=1}^{N_d}\left|Y_{pred}^i-Y_{true}^i\right|^2$$(4) 其中,\(N_d\)代表用来结构数据项损失的监督点数目,Y示意用来比拟的物理量,实在数值为OpenFOAM计算结果;监督点指已知流场物理量数值的点,值得注意的是,监督点数目能够比OpenFOAM里的网格点数少。物理项损失函数(\(J_p\))定义为: $$J_p=J_{PDE}+J_{BC}+J_{IC}$$(5) 其中,\(J_{PDE}\)代表了流体偏微分方程的损失函数项,这也是PINN网络必不可少的一项;\(J_{BC}\)代表了流体零碎的边界条件损失函数项,代表了流体零碎的初始条件损失函数项。 \(J_{PDE}\),\(J_{BC}\)和\(J_{IC}\)的定义如下: $$J_{PDE}=\frac{1}{N_f}\sum_{i=1}^{N_f}\left|G\left({u}^i,p^i\right)\right|^2$$ (6) $$J_{BC}=\frac{1}{N_{BC}}\sum_{i=1}^{N_{BC}}\left|Y_{pred}^i-Y_{true}^i\right|^2$$ (7) $$J_{IC}=\frac{1}{N_{IC}}\sum_{i=1}^{N_{IC}}\left|Y_{pred}^i-Y_{true}^i\right|^2$$ (8) 其中,\(N_f\)是用于计算流体偏微分方程损失函数的数据点数量,\(N_{BC}\)是用于计算流体零碎边界条件损失函数的数据点数量,\(N_{IC}\)是用于计算流体零碎初始条件损失函数的数据点数量,\(G\)代表了流体零碎的即纳维-斯托克斯方程组的隐式格局,现实的状况下\(G=0\)。 流体零碎的总损失函数定义为: $$J=\omega_1J_d+\omega_2J_{PDE}+\omega_3J_{BC}+\omega_4J_{IC}$$ (9) 其中\(\omega_1,\ \omega_2,\ \omega_3,\ \omega_4\)是各损失函数项的权重。区别于方程(3),方程(9)提供了一个更不便调节各损失函数项权重的定义。本文中\(\omega_1=\omega_3=\omega_4=10,\ {\ \omega}_2=1\)。 PINN的监督点散布联合之前咱们曾经实现的基于大量监督点的PINN办法精确求解二维度非定常圆柱绕\(流^4\),本文咱们进一步摸索了监督点数量对PINN求解的影响,因为监督点的数目既影响模型的计算速度,也影响模型对数据的依赖性。缩小监督点数量,既能够进步模型计算速度,也能够升高模型对数据的依赖性。为此,咱们设计了6种不同的监督点散布,监督点数量从4到68,如图4所示。 \(N_d=68\)的监督点散布存在两种形式,a计划在圆柱前缘也安排一些点,b计划则所有点均在圆柱前方。 \(N_d=34\)的监督点散布存在两种形式,a计划集中在圆柱近前方,b计划则扩散在圆柱近和远前方。\(N_d=16\)和\(N_d=4\)的监督点散布的区别在于\(N_d=4\)仅在圆柱外表均分散布4个监督点。 ...

April 12, 2023 · 1 min · jiezi

关于paddle:AIGC爆火的背后需要掌握的基础原理

最近AIGC和大模型的大火让视频行业的老板们异样兴奋,以前制作一个视频须要经验文案、配音、画面、出镜等简单流程,当初利用生成式AI产品主动生成文案脚本,再应用一键生成视频(TTV技术)性能,一天能够实现50条视频产出。人工智能如此降本提效,局部行业的从业者面临职业挑战。 某内容创作者应用百家号“文字生成视频”性能,5分钟即产出一条视频 AI绘画,AI写作,AI对话……大家是否感觉AI正在减速浸透着咱们的生存?AI赛道正在热火朝天的倒退,业内外称“咱们曾经迈入AIGC元年”。AIGC(AI Generated Content)即通过人工智能办法生成内容,是以后深度学习最热门的方向之一。它曾经在新闻报道、广告营销、电子商务、虚拟现实等各个领域失去了宽泛的利用,深刻咱们生存的方方面面,逐步颠覆现有内容生产模式。 相比于传统的内容生成往往须要消耗大量的工夫和人力,AIGC能够高效主动生成,满足大量需要,大大降低人工成本,使得内容从业者更专一于精细化的内容打磨,对企业来说是更高效的资源分配,对于整个产业来说使得生产方式优化。 在这种背景下,AIGC人才急缺,无论是大模型技术还是利用,领有相干能力的开发者曾经成为猎头们的重点跟踪对象。 图来自脉脉《AIGC人才趋势报告》 为了让大家更好了解大模型,理解AIGC畛域利用与技术要点,晋升AIGC技术能力,百度飞桨AI Studio重磅推出3大AIGC入门必修课,带你摸索AI生成内容的原理、技术和利用,心愿能帮忙开发者理解和把握AI生成内容的基本知识和技能。本次课程完全免费! 3大精品课 任你挑战根底入门——《Python从小白到精通》如果您毫无编程根底,渴望关上AI世界的大门,那么Python是最好入门的编程语言。Python语言简洁、功能强大、丰盛的库、简略易学、可移植、可扩大、对于0根底小白难度低,上手快。 实战利用——《零门槛搞懂基于大模型的AIGC利用及技术要点》从大模型的AIGC利用与趋势讲开,带你疾速把握用AI生成文本/画作/视频、智能对话生成、创意玩法等AIGC畛域利用与技术要点。 拓展进步——《两小时玩转大模型创意利用》以百度文心大模型为引,解析大模型的价值,基础知识、技术原理,联合该技术在产业中的利用场景演示大模型利用案例,为大家拓展技术视线,提供创意灵感。 学习形式本次课程将配合飞桨AI Studio社群组队学习办法,采取社群组队学习/单人学习两种模式,报名后退出课程学习社群,能够与小伙伴们一起探讨分享,更有助教全程伴学,在线答疑解惑,与大佬们零距离对话,抱团学习进步你的学习效率! 课程福利 课程全副收费学习配套代码运行平台和收费GPU算力卡百度飞桨AI Studio结课证书及丰富礼品报名形式 进入AI Studio查看相干我的项目获取信息即可~

April 11, 2023 · 1 min · jiezi

关于paddle:4月飞桨国赛火热报名中产业级赛题和免费硬件等你来拿

自3月以来,飞桨在“中国软件杯”大学生软件设计大赛和全国大学生智能汽车比赛两大赛事中,陆续公布了五项赛题。面向4月,咱们将会举办一系列更大规模、更为全面和深刻的线上/线下培训,为同学们的学习和备赛一路保驾护航!登程的号角未然吹响,欢送高校师生们报名加入!上面是以后正在报名中的飞桨国赛清单及资料链接。 “中国软件杯”大学生软件设计大赛基于百度飞桨与龙源电力风电数据的功率预测算法零碎开发 赛题背景清洁能源的疾速倒退,风力发电曾经成为可再生能源的重要组成部分。然而,风具备随机性特点,惯例天气预报无奈精确反映出风电场所在区域的实在风速,从而造成发电功率预测准确率低下,影响电力供需平衡。因而,进步风电功率预测的准确性,为电网调度提供迷信撑持,对我国能源产业有非常重要的价值。 工作要求算法局部 要求选手基于飞桨PaddlePaddle依据官网提供的数据集,设计一种利用当日05:00之前的数据,预测次日00:00至23:45理论功率的办法。准确率按日统计,依据10个风电场均匀准确率进行排名;准确率雷同的情景下,依据每日单点的均匀最大偏差绝对值排名。 软件局部 本次较量要求选手基于Web技术实现: 数据可视化:将预测后果以图表等模式展现进去,便于用户进行察看和剖析;实时更新与滚动预测:可能基于提供的数据实时模仿实在功率、预测功率及其之间的差别,通过调节过来不同长度的时间段,以更新将来预测后果,且预测的时间段可调节;响应式设计:反对多种终端,包含PC端、挪动端等,以适应不同设施的屏幕尺寸和分辨率;其余翻新附加性能。赛段设置预选赛:5月31日截止,算法赛,80%团队升级区域赛;区域赛:6-7月,算法赛+软件赛,颁发省级奖项;总决赛:8月,软件赛,颁发国赛奖项。相干链接 赛题阐明页面https://aistudio.baidu.com/aistudio/competition/detail/887/0/... 预选赛数据集地址https://aistudio.baidu.com/aistudio/datasetdetail/205286 baseline地址https://aistudio.baidu.com/aistudio/projectdetail/5866171?con... “中国软件杯”大学生软件设计大赛智能四足机器狗电力巡检零碎开发 赛题背景传统变电站监控和巡视采取人工形式,通过人的感官对设施进行简略定性判断,会存在着很多有余。如劳动强度大、工作效率低、检测品质扩散、伎俩繁多等有余,人工检测的数据也无奈精确、及时地接入管理信息系统。并且,随着无人值守模式的推广,巡视工作量越来越大,巡检到位率、及时性无奈保障。 为了满足对供电品质日益进步的要求,更灵便实用的变电站四足机器人巡视零碎得以利用。相比于传统的轮式机器人,四足机器人面对简单地形更加有劣势,而利用深度学习技术来进行简单环境的感知,为电力系统巡视工作提供实时智能剖析与决策反对,也逐步成为了重要趋势。 工作要求在预选赛中,要求选手基于飞桨PaddlePaddle,利用企业提供的训练数据,实现一个可能对仪器仪表、火点、安全帽进行准确辨认的深度学习模型; 在区域赛和总决赛中,要求选手基于搭载飞桨PaddlePaddle的国产四足机器狗宇树Go1机器狗,在规定的地图上进行主动巡检、避障越障和指定工作的实现,依据各工作的实现品质和实现速度进行评分。 赛段设置预选赛:4月30日截止,算法赛,80%团队升级区域赛;区域赛:6-7月,算法赛+地图赛,颁发省级奖项;总决赛:8月,地图赛,颁发国赛奖项。相干链接 赛题阐明页面https://aistudio.baidu.com/aistudio/competition/detail/771/0/... 预选赛数据集地址https://aistudio.baidu.com/aistudio/datasetdetail/199384 Baselinehttps://aistudio.baidu.com/aistudio/projectdetail/5718676 硬件反对面向组织老师 :4月30日之前 组织超过200人报名参赛的指导老师,即可获赠一只价值4.9万的机器狗5个月的收费借用权! 数量无限先到先得! 面向升级选手: 4月30日之前 合乎预选赛升级比例的团队,每校可取得一只机器狗借用,用于区域赛和国赛。 “中国软件杯”大学生软件设计大赛基于百度飞桨的3D医疗数据解析平台 赛题背景医学影像是临床疾病诊断的重要形式,高效精准的从影像中辨认出器官构造或病变,是医学影像学中重要的课题。其中,3D影像可能更直观辅助医生晋升诊断效率。然而,医疗影像的读片工作对专业知识要求高,工作沉重且重复性较高,经常仅能由业余的影像科医生实现。随着深度学习技术的倒退,咱们看到了应用AI技术辅助医生疾速剖析阅片、加重阅片工作累赘的可能性。 工作要求算法局部 要求选手基于飞桨PaddlePaddle,在官网指定数据集(11种部位)上设计算法进行打榜,实现在验证集上,给定任一3D医疗数据,精确地实现医学数据的宰割工作,并且在新的、未进行过训练的数据集上可能取得较好的泛化性能。 软件局部 要求选手实现基于Web的3D医疗数据解析平台,其中蕴含医疗数据的导入、宰割、可视化和数据分析性能四大根底性能,且飞桨模型可在本地或云端部署进行推理。选手可设计更多相干场景的附加性能,通过稳固的软件性能和优良的人机交互,为非AI业余人员提供良好用户体验。(包含“图生文”性能,依据医疗影像,主动生成高质量病例报告。) 相干链接 赛题阐明页面https://aistudio.baidu.com/aistudio/competition/detail/889/0/... 预选赛数据集地址https://aistudio.baidu.com/aistudio/datasetdetail/204195 baselinehttps://aistudio.baidu.com/aistudio/projectdetail/5836342 第十八届全国大学生智能汽车比赛赛题背景全国大学生智能汽车比赛是以智能汽车为钻研对象的创意性科技比赛,是面向全国大学生的一种具备探索性工程的实际流动,是教育部提倡的大学生A类科技比赛之一。比赛以立足造就,重在参加,激励摸索,谋求卓越为指导思想,造就大学生的创意性科技比赛能力。 赛题工作线上较量 参赛学生必须在规定工夫内应用百度开源深度学习平台飞桨进行模型的设计、训练和预测,不得应用其余相干平台、框架及任何飞桨中未蕴含的学习办法参赛。AI Studio作为本次线上选拔赛的惟一指定训练平台,提供在线编程环境、收费GPU算力、海量开源算法和凋谢数据,帮忙开发者疾速创立和部署模型。 线下较量 参赛队伍须要在规定工夫实现基于车道定位及辨认、指标物检测与辨认等多种人工智能技术和自动化控制技术,符合人工智能时代倒退特点,充分调动学生的翻新、发明生机。参赛队伍必须应用组委会指定的百度EdgeBoard开发板(赛事专用卡)进行较量。 百度齐全模型组竞速赛 相干链接 线上资格赛链接https://aistudio.baidu.com/aistudio/competition/detail/760/0/... 线下赛任务说明https://zhuoqing.blog.csdn.net/article/details/128401912 baseline- **【PP-YOLO版】**https://aistudio.baidu.com/aistudio/projectdetail/5534961?channelType=0&channel=0- **【PP-YOLOE+版】**https://aistudio.baidu.com/aistudio/projectdetail/5513476?cha... 线上赛+线下赛培训课程合集https://aistudio.baidu.com/aistudio/education/group/info/28339 百度智慧交通组创意赛 线下赛主题:长江之歌线下赛规定:本周末详见社群告诉!相干链接 线上资格赛链接https://aistudio.baidu.com/aistudio/competition/detail/882/0/... baseline合集https://aistudio.baidu.com/aistudio/competition/detail/882/0/...

April 10, 2023 · 1 min · jiezi

关于paddle:CVPR-2023-单阶段半监督目标检测SOTAARSL

本文提出了针对单阶段半监督指标检测工作的Ambiguity-Resistant Semi-supervised Learning(ARSL)算法,翻新地提出了两个通用的单阶段半监督检测模块:Joint-Confidence Estimation(JCE)和Task-Separation Assignment(TSA)。JCE通过联结分类和定位工作的置信度评估伪标签品质。TSA基于老师模型预测的联结置信度将样本划分为正样本、负样本和不置可否的候选样本,并进一步在候选样本中别离为分类、定位工作筛选潜在正样本。 背景及动机基于深度学习的指标检测算法通常依赖大规模标注数据能力施展出最大的威力。为了节俭标注人力,升高数据标注老本,半监督指标检测(SSOD)应运而生。半监督指标检测旨在利用大量的标注数据和大量的无标注数据进行模型训练,在最新进展中,其次要依赖于Mean-Teacher框架以及Pseudo-labeling技术,即用老师模型在无标注数据上生成的伪标签(Pseudo labels)训练学生模型,再基于学生模型在时序上的权重均值来更新老师模型。 图1.在根底半监督框架下,单阶段检测器(FCOS)的晋升弱于两阶段办法(Faster RCNN)然而基于该流程,咱们发现相比于两阶段检测器(如Faster RCNN),单阶段检测算法(如 FCOS)仅能获得绝对无限的晋升。是什么限度了单阶段检测器的半监督训练? 通过定量分析,咱们发现单阶段检测器的伪标签中存在重大的筛选歧义性(Selection Ambiguity)及样本调配歧义性(Assignment Ambiguity)。 .png")表1. (筛选歧义性) 伪标签的品质剖析 .png")图2. (调配歧义性) 不同阈值下,样本调配的正确性 筛选歧义性是指,因为检测后果的分类置信度和定位品质并不匹配,使得基于分类得分筛选的伪标签不够精确。这一点在单阶段检测器中更加重大。表1中能够看到,相比于Faster RCNN,FCOS预测的检测后果中,分类得分和定位品质的相关性更低。换句话说,FCOS筛选高质量伪标签的能力更弱。 调配歧义性是指,基于伪标签的样本调配中,大量样本被调配了谬误的标签。问题的本源在于,FCOS的调配策略间接将边界框外部(或核心区域)的样本划分为正样本,而疏忽了伪标签的边界框并不精确。这使得大量的背景区域被当成了正样本(False Positive),同时被阈值过滤掉的物体也被划分为了负样本(False Negative)。如图2所示,不论伪标签的筛选阈值如何设置,调配后果中均存在大量的false positive和false negative。能够看出,基于边界框的样本调配策略(如 FCOS 的 center sampling)在伪标签调配上存在着人造的劣势。另外,相比于Faster RCNN,FCOS等单阶段检测器须要像素级的样本标签,因而对调配歧义性更加敏感。 算法简介为了解决上述问题,咱们提出了Ambiguity-Resistant Semi-supervised Learning(ARSL),包含Joint-Confidence Estimation(JCE)和Task-Separation Assignment(TSA),通用于单阶段半监督指标检测工作。 .png")图3. ARSL 框架图。对于无标签数据,老师模型首先通过JCE预测样本的联结置信度。而后,TSA基于置信度将样本划分为正样本、负样本和不置可否的候选样本,并进一步为分类、定位工作筛选潜在正样本。 针对伪标签的筛选歧义性,JCE基于分类工作和定位工作的联结置信度来评估伪标签的品质。更为具体地,JCE通过双分支构造,同时预测分类得分和定位品质,并将两者的乘积作为联结置信度。为了防止两个分支独自训练所导致的次优状态,对于标注数据,两者应用IoU-based soft label进行联结训练;对于无标注数据,间接应用老师模型联结置信度的最大响应值进行训练。 .png")图4. JCE 示意图 .png")图5. 正负样本在联结置信度区间中的散布 针对伪标签的调配歧义性,TSA摒弃了box-based assignment,基于老师模型在每个样本点上预测的联结置信度,间接对其进行正负样本划分。然而如上图5所示,处于置信度两头区域的样本仍然是难以抉择的。为此,TSA首先应用基于统计信息的双阈值将样本分为负样本、正样本和不置可否的候选样本,而后在候选样本中别离为分类工作和定位工作进一步筛选潜在正样本。候选样本次要由低置信度的正样本和艰难负样本组成,并不是单纯的背景区域(均匀IoU为0.369)。对于分类工作,这些样本都值得学习,因而所有候选样本都参加老师模型的一致性学习,间接模拟老师模型预测的概率分布。而定位工作对样本的抉择更加刻薄,差异性过大会导致定位工作不收敛。因而,TSA通过评估候选样本于正样本的相似性来筛选潜在正样本(类别相似性、定位相似性、几何地位相似性),并应用正样本边界框的加权值作为潜在正样本的学习指标。 试验成果与半监督检测SOTA 的比照.png") .png") 在COCO-Standard 1%,2%,5%,10% split中(应用1%,2%, 5%,10% 的COCO_train2017标注数据进行监督训练,残余作为无标注数据进行半监督训练,每个split均采样5组数据),ARSL均高于以后的SOTA算法,减少大尺度抖动(large-scale jittering)后进一步拉大了差距。 在COCO-Full中(应用全副的COCO_train2017标注数据进行监督训练,COCO_unlabel2017作为无标注数据),ARSL在较短的训练周期下获得了更加显著的晋升。 融化性剖析.png") .png") 表5.能够看到,FCOS在根底的半监督框架下仅获得了4.7%AP的晋升(26.0%->30.7%),而基于ARSL则进一步晋升了6.2%AP达到了36.9%AP。其中,JCE和TSA别离涨点4.0%AP,2.2%AP。表6为JCE中各个策略的晋升成果。 歧义性打消的验证剖析.png") 表8. 筛选歧义性 .png") 图6. 调配歧义性 ...

April 7, 2023 · 1 min · jiezi

关于paddle:首届兴智杯产业赛收官文心大模型助推产业创新

由工业和信息化部、科学技术部、深圳市人民政府独特主办,中国信通院等单位承办的首届“兴智杯”全国人工智能翻新利用大赛圆满收官。本次大赛受到国家部委、政府机构、科技企业、高校师生等社会各界亲密关注。为了进一步激发翻新生机,促成人工智能核心技术冲破和产业生态建设,推动人工智能与实体经济深交融,百度作为本次大赛反对单位之一,以源于产业实际的开源深度学习平台飞桨及产业级常识加强大模型文心大模型为根底,以高水平AI赛题为载体,为产业翻新提效注入了松软的技术及生态力量! .png") 四大AI赛题助力,激发产业翻新生机本次共有四道百度赛题入围“兴智杯”全国人工智能翻新利用大赛,涵盖技术创新与生态构建双赛道,其中生态构建赛道入围赛题“国产开发框架工程化利用赛”,技术创新赛道入围三道赛题“基于国产开发框架的前沿模型复现赛”“深度学习模型可解释性赛”“基于大规模预训练模型的利用翻新赛”,多角度赛题与平台生态资源的双倍反对为大赛注入了多样可能,产出多项优质论文及repo、高价值深度模型可解释计划、基于大模型的产业翻新解决方案等成绩,帮忙参赛队伍拓宽翻新视角的同时开释了更深层次的人工智能技术产业潜能。 顶尖大模型聚首 ,产业赛题场群雄逐鹿人工智能大规模预训练模型可类比于人工智能畛域的算法基础设施,本次“基于大规模预训练模型的利用翻新赛”吸引到百度文心大模型、中国科学院自动化研究所紫东太初多模态大模型、浙江大学滨江研究院OmModel多模态大模型等多家大模型聚首,其中文心大模型在本次产业大赛中博得泰康保险团体、安全团体等行业头部企业及中传、华师等跨畛域名校等二百多支参赛队伍的青眼。他们基于文心大模型独特的技术劣势与产业痛点联合,采纳根底模型+微调等形式,围绕金融保险、文化创意等重要行业的利用场景进行共创产出高价值翻新解决方案。入围决赛的20支队伍中有9支基于文心大模型参赛,先后斩获该赛道一等奖2枚、二三等奖7枚,以及兴智杯总决赛一等奖! 文心大模型队伍交卷,技术赋能产业提效与人文关心技术的倒退致力于为产业赋能提效,本次兴智杯赛事中,来自安全团体的“鲲之队”开发的“基于大规模预训练模型的坐席辅助我的项目”胜利斩获大模型赛道一等奖及大赛总决赛冠军。以保险行业最宽泛的电销场景为根底,从以后电销畛域所面临的产品更新快、零碎操作简单、客户群体差别大的痛点登程,以“沟通导航”和“辅助操作”两大方向进行模型坐席辅助,以晋升坐席在零碎中操作的便携性和产品销售的成功率。目前,该我的项目已在企业凋谢利用,高级坐席转化率均匀晋升2.43%, 获得了良好的利用成果。 泰康保险团体的泰康数智翻新团队以文心大模型为底座、基于业界当先的深度学习技术,首个提出了由影像质检、影像分类、影像结构化辨认以及衰弱危险预测四大模块形成的全流程、模块化的两核流程自动化技术解决方案。该计划教训证,领有业内最齐备的影像质检能力、最全的影像分类性能以及独创的基于图网络的端到端OCR结构化辨认技术,反对对1万种疾病、3万+种药品、500+种手术的精密结构化,为保险两大业务场景理赔和核保的互联网化、流程自动化提供了强力撑持。 另外,基于大模型的网络与信息安全计划也在本次较量中怀才不遇,来自北京的天际友盟团队,采纳文心大模型作为根底模型,在业界首次提出虚伪威逼情报辨认的解决方案,为开源情报分析、态势感知和基于AI的网络进攻零碎等威逼情报的利用提供原始数据的防火墙,拦挡数据投毒攻打,避免零碎外部虚伪情报数据导致的数据净化传递,为零碎的精准运行提供原始数据层面的防护。 科技倒退的最终目标是让技术帮忙人,而百度也始终保持做有温度的技术。本次较量中的北冥星眸团队,将AI与人文相融,基于文心大模型并联合AI在交换时可达到的认知、情绪、记忆、人格、动机、逻辑的一致性成果,打造出用户专属的AI衰弱治理师数字人。该数字人可通过自然语言与用户进行凋谢域自在聊天和互动,为用户提供健管计划评估、衰弱打算执行监督、情志陪伴、衰弱关心等多类衰弱相干性能,与本身衰弱类线下业务(医美、体检健管、痊愈医院等)相结合,打造了一站式、全生命周期的AI陪伴级衰弱治理和生存形式解决方案。 与此同时,来自新疆师范大学的新思平方团队则聚焦当下大学生精力心理疾病发病率一直攀升的现状,基于大规模预训练模型、联合常识图谱等人工智能相干技术,开发出了不便高效的心理健康辅助诊疗咨询服务零碎。该零碎基于面向语义了解、辅助医治、私人衰弱服务、人机对话、用户画像等人性化利用的设计与实现并且与企业微信联合便于训练后的模型部署。用户在零碎输出询问,就能够获取到与问题相干更为精确的心理健康倡议,很好地补救了现阶段获取信息简单,心理医生造就老本大、供不应求的毛病。现在,越来越多北冥和新思平方这样的队伍,用理论的技术创新证实着人工智能的温度,致力挖掘出技术向“善”的潜能。 以上这些优胜团队的案例只是百度文心大模型赋能千行百业的一个缩影,将来,百度文心大模型还将继续倒退技术生态建设,携手各界翻新力量为产业注入更多生机、进一步推动大规模预训练模型等前沿技术在产业界更深层次的落地利用、助力产业智能化过程。

April 6, 2023 · 1 min · jiezi

关于paddle:飞浆paddle实现机器学习

一:飞浆(paddle)介绍飞桨是国内惟一性能齐备的端到端开源深度学习平台,集深度学习训练和预测框架、模型库、工具组件和服务平台为一体,领有兼顾灵活性和高性能的开发机制、工业级利用成果的模型、超大规模并行深度学习能力、推理引擎一体化设计以及系统化服务反对的五大劣势,致力于让深度学习技术的翻新与利用更简略。 飞桨提供的70+ 官网模型,全副通过实在利用场景的无效验证。不仅蕴含 更懂中文 的NLP 模型,同时开源多个视觉畛域国内比赛冠军算法。 反对python、C ++ PaddleNLP是一款简略易用且功能强大的自然语言解决开发库。聚合业界优质预训练模型并提供开箱即用的开发体验,笼罩NLP多场景的模型库搭配产业实际范例可满足开发者灵便定制的需要。 GPU 测试工具 https://aistudio.baidu.com/ 支付收费算力 二:飞浆(paddle)相干地址官网:https://www.paddlepaddle.org.cn/paddle/paddlenlpgithub:https://github.com/PaddlePaddle/PaddleNLP文档:https://paddlenlp.readthedocs.io/zh/latest/ 三:PaddleNLP装置环境依赖python >= 3.7paddlepaddle >= 2.3 pip install --upgrade paddlenlp装置胜利后应用时提醒谬误 解决办法: pip install --upgrade paddlepaddle如果无奈装置能够通过更换国内源的办法来解决 pip install --upgrade paddlepaddle -i http://pypi.douban.com/simple --trusted-host pypi.douban.com罕用的国内镜像源地址: 中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/阿里云 http://mirrors.aliyun.com/pypi/simple/中国科学技术大学 http://pypi.mirrors.ustc.edu.cn/simple/豆瓣(douban) http://pypi.douban.com/simple/四:PaddleNLP个性开箱即用的NLP工具集丰盛齐备的中文模型库产业级端到端系统范例高性能分布式训练与推理五:PaddleNLP应用1:中文分词PaddleNLP提供了多种分词模式,满足疾速切分和实体粒度精准切分,训练数据起源 百度自建数据集,蕴含近2200万句子,笼罩多种场景>>> from paddlenlp import Taskflow# 默认模式————实体粒度分词,在精度和速度上的衡量,基于百度LAC>>> seg = Taskflow("word_segmentation")>>> seg("近日国家卫健委公布第九版新型冠状病毒肺炎诊疗计划")['近日', '国家卫健委', '公布', '第九版', '新型', '冠状病毒肺炎', '诊疗', '计划']# 疾速模式————最快:实现文本疾速切分,基于jieba中文分词工具>>> seg_fast = Taskflow("word_segmentation", mode="fast")>>> seg_fast("近日国家卫健委公布第九版新型冠状病毒肺炎诊疗计划")['近日', '国家', '卫健委', '公布', '第九版', '新型', '冠状病毒', '肺炎', '诊疗', '计划']# 准确模式————最准:实体粒度切分准确度最高,基于百度解语# 准确模式基于预训练模型,更适宜实体粒度分词需要,实用于常识图谱构建、企业搜寻Query剖析等场景中>>> seg_accurate = Taskflow("word_segmentation", mode="accurate")>>> seg_accurate("近日国家卫健委公布第九版新型冠状病毒肺炎诊疗计划")['近日', '国家卫健委', '公布', '第九版', '新型冠状病毒肺炎', '诊疗', '计划']批量样本输出,平均速度更快>>> from paddlenlp import Taskflow>>> seg = Taskflow("word_segmentation")>>> seg(["第十四届全运会在西安举办", "三亚是一个漂亮的城市"])[['第十四届', '全运会', '在', '西安', '举办'], ['三亚', '是', '一个', '漂亮', '的', '城市']]自定义分词创立一个user_dict.txt文件,内容如下 ...

March 13, 2023 · 2 min · jiezi

关于paddle:AI-脸部美容一键让你变瘦变美变老变年轻

我的项目成果随着 AI 技术的倒退,你不仅随时能够看到本人的老了之后的样子,还能看到本人童年的样子随着这部分技术的开源,会有越来越多的利用,当然我感觉前景更好的是用户能够先通过 AI 技术找到本人最美的样子,而后照着这个样子去扭转本人,减肥也好锤炼也好,衰弱餐也好,让本人更加的完满如何让技术更好的服务咱们,而不是取代咱们,才是咱们技术应该须要攻克的方向 我的项目装置该我的项目已开源,欢送watch、fork、star 反对一波,github地址:https://github.com/tinygeeker/edit-your-face该我的项目基于 Thinkphp6 和 PaddleGAN ,须要装置 PHP 和 PYTHON 环境能力运行# 下载我的项目git clone https://github.com/tinygeeker/edit-your-face.git 装置环境先装置 PHP 环境# 切换到我的项目目录cd edit-your-face# 先更新composercomposer self-update# 下载依赖composer install再装置PYTHON环境# 切换到我的项目目录cd edit-your-face/python/PaddleGAN# 装置环境依赖pip install cmake -i https://mirror.baidu.com/pypi/simplepip install boost -i https://mirror.baidu.com/pypi/simplepip install numpy -i https://mirror.baidu.com/pypi/simplepip install dlib==19.8.1 -i https://mirror.baidu.com/pypi/simple# 装置我的项目依赖,这里肯定要设置全局pip源pip install -r requirements.txt# 装置环境python setup.py develop# CPU版本pip install paddlepaddle启动环境而后咱们关上浏览器,拜访:http://127.0.0.1:8000/ 即可拜访我的项目cd edit-your-face# 启动网页think php run# 启动websocketthink php worker:server 我的项目应用须要上传一张自拍照,尽量五官清晰,纯色背景,辨认成功率更高须要抉择变换类型:包含年龄、笑容、睫毛、眼睛、嘴巴、眉毛等等变换水平,默认为0,不解决,数值越小,解决水平越轻,这个轻是只绝对水平,比方解决年龄,小于0就是比照片的年老,大于0就是比照片老态;因而,个别调到4左右,就能看到你老了之后的样子了点击生成按钮,即可期待图片的后果,大略出后果工夫须要一分钟内,成果还是不错的如下就是变换类型为笑容,解决水平为2,所得进去的图片后果

March 10, 2023 · 1 min · jiezi

关于paddle:通用信息抽取技术UIE产业案例解析Prompt范式落地经验分享

想理解用户的评估到底是“真心夸赞”还是“阴阳怪气”? 想疾速从多角色多事件的繁冗信息中剥茧抽丝提取核心内容? 想通过聚合类似事件精确地演绎出特色标签? …… 想理解UIE技术在产业中的实战落地教训?通用信息抽取技术UIE产业案例分享来了! 近期Prompt范式备受关注。实际上,Prompt思维在产业界曾经有了一些胜利的利用案例。由中科院软件所和百度独特提出了大一统诸多工作的通用信息抽取技术UIE(Universal Information Extraction)。基于Prompt思维,将心愿抽取的 Schema 信息转换成“线索词”(Schema-based Prompt)作为模型输出的前缀,使得模型实践上可能适应不同畛域和工作的Schema信息,并按需抽取出线索词指向的后果,从而实现凋谢域环境下的通用信息抽取。在实体、关系、事件和情感等4个信息抽取工作、13个数据集的全监督、低资源和少样本设置下,UIE均获得了SOTA性能。 截止目前,UIE系列模型已公布UIE、UIE-X、UIE-senta三大模型,凭借其弱小的零样本与小样本能力、多任务对立建模能力,成为业界在信息抽取、情感剖析等工作上的首选计划。 2022年5月,飞桨自然语言解决模型库PaddleNLP联合文心大模型中的常识加强NLP大模型ERNIE 3.0 ,施展UIE在中文工作上的弱小后劲,推出首个面向通用信息抽取的产业级技术计划。2022年11月,UIE新增文档信息抽取能力——UIE-X,OCR、版面剖析、跨模态文档信息抽取能力一应俱全。UIE-X基于文心ERNIE-Layout跨模态布局加强预训练模型,集成了PaddleOCR的PP-OCR、PP-Structure版面剖析等当先能力。2022年12月,PaddleNLP以UIE为训练底座,在大量情感剖析数据集上进一步训练,加强了模型对于情感常识的解决能力,推出基于UIE的情感剖析计划(下表简写UIE-senta)[6],笼罩句子级情感极性分类、属性抽取、观点抽取、属性级情感极性分类等多项情感工作,且解决了属性聚合和隐性观点抽取难题,并提供情感剖析后果可视化能力。 图:UIE 系列模型介绍 来自云南能投财务服务有限公司和黑蚁资本的两位讲师将带来精彩课程,解析UIE技术在多畛域的利用场景,分享落地实战经验。 2月28日、3月1日,飞桨直播间、B站直播间,两场连播,不见不散! 课程介绍2月28日 课程名称【金融】简单单据信息抽取——财务零碎智能化 主讲人钟榆星 | 云南能投财务服务有限公司 课程内容财务管理是企业治理的重要组成部分,财务人员经常须要将业务单据表格中的数据通过人工填制到财务零碎里,这往往费时费力,且容易产生谬误。云南能投财务服务有限公司(以下简称云南能投),成立于2020年4月,是云南省能源投资团体有限公司全资子公司。为无效撑持团体财务管控落地执行,起到反对团体国际化倒退、战略决策的作用,云南能投技术支持部利用PaddleNLP提供的文档信息抽取全流程解决方案,开发了基于UIE-X的表格信息抽取计划,实现简单构造表格的关系型抽取,帮忙业务、财务将罕用表格疾速导入业务零碎,取代人工手录,高效推动了财务共享智能提单业务的疾速落地。 图:云南能投基于UIE-X开发了表格信息抽取计划 3月1日 课程名称【批发】客户意见洞察促成生产品牌经营转型 主讲人Jeru | 黑蚁资本 课程内容黑蚁资本,是一家深耕生产畛域投资的企业,成立之初就信心让“投后服务”成为机构的外围能力之一,而“数字化”正是黑蚁服务被投企业的重要内容。随着餐饮行业进入线上线下、堂食外卖并重的“双主场”时代,面对铺天盖地的用户评论数据,如何用数字化伎俩优化经营成为餐饮企业降本增效的要害。为了帮忙被投企业晋升评估数据的解决效率,黑蚁投后数字化团队基于UIE开发了用户评论洞察零碎,帮忙品牌高效深刻理解用户反馈,主动抽取出高价值信息,实现量化统计分析,从而升高经营老本,优化产品和服务,晋升市场竞争力。 图:黑蚁资本基于UIE开发了用户评论洞察零碎 技术拓展——文心大模型随着数据井喷、算法提高和算力冲破,成果好、泛化能力强、通用性强的预训练大模型(以下简称“大模型”),成为人工智能倒退的要害方向与人工智能产业利用的根底底座。 文心大模型源于产业、服务于产业,是产业级常识加强大模型,涵盖根底大模型、工作大模型、行业大模型,大模型总量达36个,并构建了业界规模最大的产业大模型体系。文心大模型配套了丰盛的工具与平台层,包含大模型开发套件、API以及内置文心大模型能力的EasyDL和BML开发平台。 百度通过大模型与国产深度学习框架交融倒退,打造了自主翻新的AI底座,大幅升高了AI开发和利用的门槛,满足实在场景中的利用需要,真正施展大模型驱动AI规模化利用的产业价值。 从技术研发到落地利用,大模型的倒退曾经进入产业落地的关键期,欢送返回文心大模型官网理解详情。 文心大模型官网https://wenxin.baidu.com/ 相干我的项目 PaddleNLP GitHub地址https://github.com/PaddlePadd... PaddleNLP Gitee地址https://gitee.com/paddlepaddl... 参考 [1]Unified Structure Generation for Universal Information Extraction [2]https://github.com/PaddlePadd... [3]https://github.com/PaddlePadd... [4]https://github.com/PaddlePadd... [5]https://github.com/PaddlePadd... [6]https://github.com/PaddlePadd...

February 28, 2023 · 1 min · jiezi

关于paddle:百度CTO王海峰深度学习平台大模型夯实产业智能化基座

2月27日,中国人工智能学会首届智能交融产业论坛在成都顺利举办。本届论坛由中国人工智能学会(CAAI)主办,中国人工智能学会智能交融专委会、百度公司、深度学习技术及利用国家工程钻研核心和电子科技大学联结承办。中国工程院多名院士、出名专家、企业代表齐聚一堂,独特探讨人工智能技术倒退与翻新,促成智能交融畛域产学研交换,推动智能交融畛域的外围实践、关键技术和产业改革的蓬勃发展。百度首席技术官、深度学习技术及利用国家工程钻研核心主任王海峰以《“深度学习+”翻新倒退新引擎》为题,阐释了人工智能技术创新和产业倒退进入“深度学习+”阶段。 人工智能进入“深度学习+”阶段,驱动技术创新和产业倒退家喻户晓,第四次工业革命的外围驱动力是人工智能,而深度学习是其要害核心技术,具备很强的通用性,呈现出标准化、自动化、模块化的工业大生产特色,推动人工智能进入工业大生产阶段。 王海峰示意,深度学习在技术、生态、产业等多个维度已逐步成熟,人工智能的技术创新和产业倒退进入“深度学习+”阶段,正引领新一轮技术更迭。 在技术层面,“深度学习+常识”是人工智能技术进一步倒退的重要方向。常识加强的深度学习,让机器同时从海量数据和大规模常识中交融学习,成果更好,效率更高。百度文心产业级常识加强大模型,具备跨模态、跨语言的深度语义了解与生成能力,已利用于搜寻、信息流、智能音箱等互联网产品,并通过飞桨深度学习平台赋能制作、能源、金融、通信、媒体等各行各业。此外,在数字人、智能视频生成等方向,文心大模型的技术能力曾经体系化输入,并在冬奥等舞台亮相。 在生态层面,深度学习+上下游生态搭档。芯片、深度学习框架、模型及利用形成了深度学习良性生态,使得利用需要和反馈传递到深度学习技术及利用的每个环节,各环节继续迭代优化,减速AI技术创新和产业倒退。飞桨是我国首个自主研发的产业级深度学习开源开放平台,集外围框架、根底模型库、端到端开发套件、丰盛的工具组件于一体,极大升高利用门槛。飞桨把产学研用不同角色无效连接,携手开发者与合作伙伴,共建共创企业生态、教育生态、开源生态、硬件生态。在硬件生态上,飞桨深度学习框架与芯片联结优化,提供高性能弱小算力,已有超过40家硬件厂商与飞桨深度交融优化,国内外支流芯片根本都已适配飞桨。目前,飞桨平台曾经凝聚535万开发者,服务20万家企事业单位,创立67万个模型。 在产业层面,深度学习+千行百业。各行各业利用深度学习技术降本增效,翻新产品和业务,放慢产业智能化过程,努力实现高质量增长。我国的产业体系品类齐全、体量宏大,深度学习驱动的翻新有丰盛的利用场景,有助于造成良性循环,促成底层技术冲破,放慢降级现代化产业体系。 百度文心买通大模型产业落地门路,走进千行百业作为近几年人工智能倒退的重要方向,大模型具备成果好、泛化性强、研发流程标准化的特点。但与此同时,大模型研发门槛高、难度大,依赖算法、算力和数据综合撑持,产业化面临挑战:首先是模型体积大,训练难度高;其次是算力规模大,性能要求高;第三是数据规模大,数据品质参差不齐。 如何实现大模型产业化?王海峰示意,具备算法、算力和数据综合劣势的企业,能够将模型生产的简单过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务。 这一产业化门路曾经在文心大模型的产业实际中失去验证。百度与行业头部企业或机构共建的11个行业大模型,在能源、金融、航天、制作、传媒、城市、社科以及影视等畛域落地,减速推动行业的智能化转型降级。 王海峰强调,“深度学习+”驱动技术创新、产业倒退,离不开深度学习产业链的欠缺和壮大,而深度学习平台和大模型贯通了从硬件适配、模型训练、推理部署,到场景利用的全产业链,为人工智能技术创新和产业增长夯实了智能化基座。 面向未来,百度将保持技术创新,推动文心大模型与飞桨深度学习平台交融倒退、共享生态,推动AI技术创新进入新阶段,减速产业生态共荣,为实现高水平科技自立自强、经济社会高质量增长贡献力量。

February 28, 2023 · 1 min · jiezi

关于paddle:GAIDC-2023盛会迎来大模型论坛主场百度飞桨护航大模型产业发展

2月25日-26日,2023寰球人工智能开发者先锋大会(GAIDC)在上海临港举办,大会以“向光而行的AI开发者”为主题,汇聚了以后科技和产业革命中的开发者先锋力量。百度深度参加本次大会,飞桨联结上海市人工智能行业协会主办“智领将来:大模型技术与利用”论坛,百度AI技术生态总经理马艳军在“新程序员:人工智能新十年论坛”发表主题演讲,多位百度工程师在分论坛中演讲,大会还设置了文心一格展区和飞桨AI Studio集市,携手宽广开发者,共逐AI产业前沿。 大模型是近几年人工智能倒退的重要方向,具备成果好、泛化性强等特点,近期火爆的大语言模型为AI倒退带来新机遇。26日下午,“智领将来:大模型技术与利用”论坛座无虚席,开发者激情满满,多位大咖分享预训练大模型最新技术停顿。 论坛主席、百度飞桨总架构师于佃海发表致辞,“AI预训练大模型,是深度学习崛起以来最重要的一次技术改革,极大升高了AI开发和落地的门槛。叠加情景学习、指令微调等机制,使大模型实现超出设想的能力涌现以及价值观对齐,让咱们看到了通用人工智能实现的曙光。”他强调,大模型的技术倒退要抓住其通用性的特质,价值的体现须要通过产业利用落地来实现,同时,深度学习平台为大模型倒退保驾护航,将会施展更关键作用。 百度飞桨总架构师 于佃海 会上,复旦大学计算机学院传授邱锡鹏从学术角度动手,围绕时下大火的语言大模型为与会者进行深度拆解,认为百亿规模是小模型到大模型的分水岭,为开发者带来全新的AI开发模式,“要让大语言模型和事实世界买通、交互,能力学到更多文本无奈表白的常识。” 复旦大学计算机学院传授 邱锡鹏 大模型也在朝着多模态和跨模态演进,北京智源人工智能研究院研究员伍昱示意,语言、视觉模态的交融对齐,使得大模型出现多元倒退的态势,带来AIGC在钻研和利用层面的暴发,心愿通过开源共建的形式,以高质量数据推动多模态大模型倒退。 北京智源人工智能研究院研究员 伍昱 百度计算机视觉首席科学家王井东介绍了文心大模型家族中的视觉大模型。针对CV大模型,文心在表征预训练算法、自监督算法、图文模型疏导技术等畛域进行了行业摸索,基于当先的视觉技术,利用海量的图像、视频等数据,为企业和开发者提供弱小的视觉根底模型,以及一整套视觉工作定制与利用能力,已广泛应用于OCR、工业视觉、度目、主动驾驶数据挖掘等百度外部产品,为利用研发和体验优化带来深度价值。 百度计算机视觉首席科学家 王井东 现场,百度深圳自然语言解决部技术总监何径舟介绍了AIGC另一重要门路“跨模态文图生成”,论述其研发背景与倒退脉络,并带来文心大模型ERNIE-ViLG 2.0的技术解读。该模型是寰球首个常识加强的AI绘画大模型,也是目前寰球参数规模最大的AI绘画大模型,在语义可控性、图像清晰度、中国文化了解等方面体现突出,并打造了AI艺术与创意辅助平台“文心一格”,是以后最先进、最受欢迎的“AI作画”产品之一。 百度深圳自然语言解决部技术总监 何径舟 针对大模型产业面临的开发落地难、生态基础薄弱等问题,NVIDIA和昆仑芯则在现场分享了大模型实现软硬协同、减速优化的教训办法,推动构建底层硬件生态,减速大语言模型的钻研和利用落地。现场还演示了基于飞桨的大模型训练、压缩、推理全流程操作,飞桨分布式训练和压缩推理的劣势凸显。 百度产业级常识加强文心大模型,联合技术发展趋势与产业实际,目前已公布36个大模型,包含NLP(自然语言解决)、CV(计算机视觉)、跨模态等根底大模型,生物计算等畛域的工作大模型,以及11个行业大模型,已在能源、金融、航天、制作等畛域落地。同时打造大模型开发套件、面向大模型的AI开发平台、大模型API和场景化产品等。近日,IDC公布《2022中国大模型倒退白皮书》中,百度文心大模型在产品能力、利用能力、生态能力中全面当先。 实际上,深度学习平台和大模型,贯通了从硬件适配、模型训练、推理部署,到场景利用的全产业链,夯实产业智能化底座。 在26日上午举办“新程序员:人工智能新十年论坛”上,马艳军也强调这一点,随着人工智能产业倒退,深度学习平台与大模型联合越来越严密,飞桨深度学习平台从分布式训练、大模型推理、端到端开发等维度为大模型提供撑持,大模型也牵引着深度学习平台的倒退方向,两者联合无效升高人工智能开发与利用的门槛。马艳军还示意,飞桨深度学习平台长期从教学培训、生态培养、算力普惠等方向,携手开发者共建开源生态,飞桨也是目前中国最沉闷的开源我的项目。 百度AI技术生态总经理 马艳军 在展区,文心一格、飞桨AI Studio集市吸引了泛滥AI开发者驻足,体验当先的人工智能利用与开发、学习、实训套件。 文心一格展台、飞桨AI Studio集市 以“飞桨+文心大模型”筑基,百度致力技术创新,买通产业化门路,减速“数实交融”,百度将继续基于本身劣势,建设更凋敝的AI生态,推动产业智能化降级,为我国实现高水平科技自立自强、经济社会高质量增长贡献力量。

February 27, 2023 · 1 min · jiezi

关于paddle:飞桨鹏城云脑发行版亮相第四届启智开发者大会软硬一体化助力科研

2月24日,主题为“算网筑基、开源启智、AI赋能”的第四届OpenI/O启智开发者大会在深圳揭幕,大会由科技部领导、鹏城实验室与新⼀代人工智能产业技术创新策略联盟(AITISA)主办,科技部高新司副司长梅建平,中国工程院院士、鹏城实验室主任高文,北京智源人工智能研究院院长及AITISA秘书长黄铁军,百度技术委员会理事长陈尚义等在主论坛发言,分享开源摸索之路的远见卓识。 会上,百度联结鹏城实验室正式公布飞桨-鹏城云脑发行版,继续买通AI软硬件底座生态,为科研工作者和宽广开发者提供飞桨深度学习平台、文心大模型等一系列高效便当的研发工具和利用体验。 飞桨-鹏城云脑发行版正式公布 在去年11月30日由深度学习技术及利用国家工程钻研核心主办的“Wave Summit+ 2022深度学习开发者峰会”上,高文院士就走漏,鹏城实验室联结百度研发的飞桨-鹏城云脑发行版行将推出,发行版全面反对鹏城云脑异构算力,将助力AI开发者、宽广企业和科研院所基于鹏城云脑进行科研和利用开发。 两个多月后,飞桨-鹏城云脑发行版在OpenI/O启智开发者大会上正式亮相。百度技术委员会理事长陈尚义示意,这是飞桨与鹏城实验室长期深刻单干的又一项重大成果。 飞桨-鹏城云脑发行版具备软硬件联结优化的开发能力,能够提供定制化的Docker镜像和开发环境,具备了千亿大模型分布式训练能力,为开发者提供最优解。在工具套件层,飞桨-鹏城云脑发行版提供了深度适配的300+个产业级模型,以及端到端的开发套件,同时提供开箱即用的大模型利用计划,反对大模型的部署、推理以及精调训练计划,让开发者对ERNIE-ViLG、ERNIE-Tiny等大模型都能“得心应手”,进一步减速AI开发与落地。 截至目前,飞桨深度学习平台已宽泛适配英特尔、英伟达、昆仑芯等国内外硬件厂商,尤其对国产芯片适配量达到业界第一,笼罩CPU、深度学习训练芯片、深度学习推理芯片/IP厂商、FPGA等规格。2022年5月,飞桨联结硬件生态搭档公布“硬件生态共创打算”,在联结研发、资源共享、联结受权、培训赋能等多个维度全面单干。截至往年2月,飞桨已与英特尔、英伟达、Arm、寒武纪、天数智芯、Graphcore、燧原等13家厂商联结公布了飞桨生态发行版,在为开发者提供更好的软硬一体化体验的同时,携手共建凋敝硬件生态。 当天下午,百度飞桨还联结启智开发者大会举办深度学习与大模型产业利用论坛,邀请来自百度、AITISA联盟、昆仑芯等人工智能专家学者和资深工程师,围绕“引领前沿技术,推动产业降级”主题,从算法、硬件及大模型等不同视角进行深刻研究,介绍各畛域深度学习及大模型的最新进展与技术冲破。同时,邀请信润富联、中康科技、千巡科技和GAMECO等企业分享了飞桨及文心大模型在工业、医药、能源、制作等畛域的利用实际,迈过人工智能前沿技术从开发到落地的“临门一脚”。 构筑AI新型基础设施,买通AI软硬件生态,是产业实现大规模智能化的必然前提。目前,产业级深度学习平台飞桨和产业级常识加强大模型文心实现相互促进、独特倒退,成为产业智能化的基础性平台。将来百度将继续施展本身技术劣势与生态厚度,携手鹏城实验室等科研实体,OpenI启智等开源社区以及硬件搭档等一起,通过共建良好的可继续倒退生态,致力于技术创新,买通产业化门路,减速产业智能化,为促成社会经济高质量增长作出更大奉献。

February 27, 2023 · 1 min · jiezi

关于paddle:打造江西数智产业高地百度飞桨人工智能产业赋能中心落户南昌青山湖

2月23日,百度飞桨(江西)人工智能产业赋能核心在南昌市和青山湖区政府的反对下正式停业。核心由百度飞桨和生态合作伙伴独特建设,基于飞桨整合百度Al技术服务、解决方案及生态资源,全面反对江西产学研用各方低门槛、高效率地利用Al技术和资源,助力江西创始高质量跨越式倒退新场面。 南昌市委常委、副市长肖云及青山湖区委书记袁一旦、区长杨育星,百度技术委员会理事长陈尚义、百度AI技术生态总经理马艳军等领导,江西省局部企业、高校负责人缺席停业典礼。 图:百度飞桨(江西)人工智能产业赋能核心停业 陈尚义在致辞中示意,百度将依靠飞桨赋能核心在南昌青山湖搭建人工智能企业的汇集平台,造成立足南昌辐射江西及周边区域的人工智能产业生态,并与南昌及江西省内高校联结造就高水平的复合型AI人才,下好人工智能产业的“先手棋”。流动现场,赋能核心与上饶师院、南昌工程学院等高校就人工智能产学研共建,与合迅科技、众拓制衣等企业就AI赋能产业利用签订了单干协定。同时,还联结江西省内30余所高校举办了飞桨助力高校创培论坛。 图:飞桨赋能我的项目签约典礼百度飞桨(江西) 人工智能产业赋能核心的落成是南昌市、区两级贯彻全省数字经济做优做强“一号倒退工程”的示范实际,更为南昌以及江西全省放慢布局以人工智能为代表的将来产业点燃了新引擎。飞桨将聚焦江西省“2+6+N”产业体系,在重点产业集群推广AI利用示范,并与当地高校深入校企单干,共建AI翻新实训平台和人才培养基地,与生态搭档携手共享共创,放慢培养人工智能产业生态。 与会嘉宾在启动典礼完结后应邀参观了赋能核心,包含生态单干核心、算力核心、技术服务中心和产业赋能成绩展示中心。赋能核心本着“边建设、边经营”的思路,在筹建过程中围绕工业质检、智能巡检、智慧政务等畛域落地了诸多利用。其中,在布料瑕疵检测和幅宽(幅宽指面料的无效宽度)测量场景,原人工每分钟只能检测15-20米布匹,通过AI视觉算法能够达到每分钟60-70米,效率上进步了三至四倍,升高经营老本约80%,无效推动传统制造业的数字化转型降级,进步全因素生产效率;在城市治理场景中,通过车载视频采集器进行路线视频采集,针对病害路段进行高精度主动标注分拣解决,实现检测无人化。 图:百度飞桨(江西)人工智能产业赋能核心 坐落于赋能核心二层的算力核心,以人工智能芯片为外围,提供多核高密度高内存通量的高性能算力,目前算力已达11P,预计满载运行算力可达到300P,可能承载当地算力所需,为江西人工智能产业倒退提供松软底座。 倒退人工智能,是晋升国家竞争力、促成经济社会可继续倒退的重大策略。深度学习作为人工智能的底层外围关键技术,自立自强尤为重要。飞桨是中国首个自主研发、开源凋谢的产业级深度学习平台,在开发、训练、推理部署等外围能力上均有比肩甚至超过国外技术的体现。截至2022年11月,飞桨已凝聚535万开发者,创立了67万个模型,服务20万家企事业单位。在百度飞桨顶尖科创资源的根底上,赋能核心将提供技术、算力、生态资源等全方位一体化服务,“端到端”赋能宽广企业,推动产业智能化倒退。 现在,人工智能技术曾经浸透千行百业,尤其在传统产业的转型降级中施展着至关重要的作用。以江西及上海、宁波等区域的人工智能产业赋能核心为桥梁,百度飞桨将构建当先AI技术与实体产业需要的快车道,减速造成从算力、算法到解决方案的全套输入模式,买通赋能企业的“最初一公里”。

February 24, 2023 · 1 min · jiezi

关于paddle:从人工测量转向计算机视觉基于PaddleSeg实现自动测量心胸比

早上八点,在广州市第一人民医院南沙分院的放射科里,身穿白大褂的冯嘉骏开始了一天的繁忙工作。这位90后的年老小伙,从2012年在广州医科大学毕业后,就进入了这所医院工作,一干就是十年,目前曾经是医院放射科的主管技师。 据医学界统计,2023年,全国医院喷射从业人员大概158072人。放射科的医务人员大抵能够分为喷射技术和喷射诊断两类,医院的患者到放射科做查看,首先接触的就是喷射技师。近年来,随着医院面临查看量回升、医疗设施更新迟缓等挑战,利用AI技术晋升医疗诊断的准确性和效率性,从而解放医生劳动力,成为了医疗行业的迫切需要。事实医疗临床中须要写代码的状况并不多见,但有人曾经开始摸索将AI技术落地到医疗场景中,冯嘉骏便是这个群体里的代表之一。 冯嘉骏在放射科工作 与飞桨结缘纯属偶然提起与AI结缘,冯嘉骏显得有点腼腆,他用一口纯正的广东普通话,向咱们回顾了本人最后的“技术求医”经验。他说,本人高中就对医学产生了浓重的趣味,填报高考意愿时思考到本人性情更像一个“IT技术宅男”,因而最终在医学影像诊断和医学影像技术两个不同方向中抉择了医学影像技术业余。 2009年,冯嘉骏考入广州医科大学,自学了网页设计,起初又自学了C语言、Python等计算机编程语言。2019年正值AI比拟火爆,他无心中看到了飞桨举办的“深度学习7天打卡营”公开课,接触到AI技术,从此对AI的学习激情一发不可收拾。 2020 年初,冯嘉骏正式退出飞桨AI Studio-人工智能学习与实训社区的公开课进行学习,他诧异地发现原来国内居然还有这样的自主的、欠缺的深度学习框架! 之后一年,冯嘉骏跟着公开课学习,包含图像宰割、指标检测、医疗数据标注等常识,随着对深度学习的认知一直加深,他理解到飞桨能为开发者提供端到端套件,帮忙开发者0代码开发我的项目,他于是尝试将所学利用到医疗影像畛域中。2021年9月至2022年9月,冯嘉骏公布了13篇与医疗相干的精选我的项目。2022年,冯嘉骏退出PPDE打算,成为飞桨社区的指导老师。 PPDE(PaddlePaddle Developer Experts)全称飞桨开发者技术专家,是飞桨开发者的荣誉认证体系,由来自国内外顶尖高校和行业Top企业的技术骨干组成,他们为飞桨AI Studio人工智能学习与实训社区开发者提供业余领导,帮忙开发者摸索AI在各畛域的前沿利用,发明更多的开源我的项目成绩。自2020年5月20日公布打算以来,已有290多位开发者取得了飞桨开发者技术专家认证。 测心怀比从人工测量转向计算机视觉退出飞桨社区后,冯嘉骏联合医学专业相干常识,利用飞桨模型和开发套件,开发了腰椎辅助诊断系统、肺部疾病分类、椎间盘主动重建等多个我的项目,目前骨龄预测我的项目曾经利用到他所在的医院科室中,腰椎重建和疾速测心怀比我的项目也造成了重要的学术科研成果。 他重点介绍了“疾速测心怀比”我的项目。放射科医生在下诊断之前,会破费不少工夫看医学影像图像,测量各种数据指标,从而更好地判断患者的病情。测心怀比是影像诊断中判断心脏是否增大的罕用伎俩,心怀比是指在X线片上心脏横径与胸廓横径之比,个别成年人失常心怀比不大于0.5,如果心怀比大于0.5,阐明心脏有增大的偏向,患者须要去做进一步的CT查看,确定导致心脏增大的起因。 医师手动计算心怀比须要先测量心脏最大横径 与肺部最大横径,再计算两者比率通常,医院的喷射医师手动测心怀比,一天可能要测四五百张,十分消耗工夫。此外,因为人的肺部是一个不规则的生理构造,不是简略找到点到点的直径间隔就能测进去。因此,人工测心怀比主观性强,容易有误差,可能不同的医生检测进去的后果也并不一样。 冯嘉骏抉择应用PaddleSeg 2.0开发工具,实现主动精确测量心怀比,最终使得肺部和心脏的医疗图像宰割精度后果别离达到了0.978和0.955的准确率。 作为计算机视觉畛域重要的技术之一,图像宰割将图像分成若干具备类似性质的区域,是图像语义了解的关键环节。冯嘉骏采取区域分割办法,基于飞桨图像宰割套件PaddleSeg,借助其高精度和轻量级劣势,将心脏和肺部两个器官的横径精确测量进去,目前该技术曾经利用到农田宰割、工业机器指标检测、医疗影像宰割等畛域。 AI在医疗行业落地遇到难题冯嘉骏认为计算机视觉技术、PaddleSeg在医学场景中具备宽泛的利用场景。因为医学图像大多都与图像宰割分不开,除了测心怀比,其余像波及测量脑出血量、肺部结节、肿瘤等患病器官的体积和地位时,计算机视觉同样能施展它的独特作用。 例如,在诊断查看肿瘤的影像中,医生通常要手动把肿瘤的指标数据勾画进去,再进一步提取特色或者建模,事实中对肿瘤指标进行勾画很耗时。如果用一个新AI模型能够主动宰割肿瘤,那么,当有新的患者须要预测,就能间接输出患者数据,实现疾速宰割指标,进行主动勾画,这就大大节俭了医生的工夫。 要晓得事实工作中,医生的工夫是十分贵重的。比方,医疗有一种常见的检测我的项目是骨龄检测,是指各年龄时的骨成熟度,次要用于诊断儿童身高发育等方面疾病。在骨龄检测中,医生计算一个骨龄须要10多分钟,但这个工夫医生能够写好多份报告了,因此骨龄预测往往是让医生头疼的事件。 察觉到这一痛点后,冯嘉骏依据骨龄图谱做了一个主动预测的AI工具,借助飞桨指标检测套件PaddleDetection,将其装置到阅片器电脑上,医生能够从影像零碎里获取图像间接进行预测,这样医生只须要三四分钟就可实现一个结构化的骨龄报告。 尽管本人在医疗畛域进行了不少摸索,但放眼整个医疗行业,冯嘉骏坦言,AI在医疗行业中的落地仍面临不少难题。具体而言: 一方面是训练数据与事实数据差异很大。人的疾病多种多样,但训练数据大多来自于衰弱类或常见疾病的数据,理论落地后须要针对医院数据对模型进一步优化。如,一些专科肿瘤医院,肿瘤性患者比拟多,而一些大的三甲医院可能内伤类患者比拟多,当模型落地到具体医院时,首先须要针对不同医院数据从新对模型进行优化,能力让模型更加精确和贴合理论。另一方面,不同的医疗机构有着不同的影像零碎,各个系统之间非常关闭,存在较重大的“数据孤岛”和平安信息爱护问题,从而减少了AI医疗设施推广的难度。冯嘉骏在飞桨AI Studio人工智能学习与实训社区里写下的自我介绍是:想应用深度学习工具在业余上有点作为。置信随着AI技术的倒退,将来会有越来越多像冯嘉骏一样的技术专家、程序员、工程师,利用本人的业余技术和对行业的洞察,投身于AI的落地中,而飞桨也将继续陪伴开发者前行,为千行百业的智能化降级注入生生不息的能源。

February 23, 2023 · 1 min · jiezi

关于paddle:AI-for-Science系列一-飞桨加速CFD计算流体力学原理与实践

AI for Science专栏由百度飞桨科学计算团队出品,给大家带来在AI+科学计算畛域中的一系列技术分享,欢送大家关注和踊跃探讨,也心愿气味相投的小伙伴退出飞桨社区,互相学习,一起摸索前沿未知。 作为系列分享的第一篇,本文内容涵盖行业背景与痛点、AI+科学计算畛域的前沿算法、基于飞桨的AI+科学计算产品计划、波及的飞桨框架关键技术以及PINNs办法求解计算流体力学方腔流的案例等。 行业背景与痛点以后AI技术在CV、NLP等畛域已有了较为宽泛的利用,代替传统办法实现缺点检测、人脸检测、物体宰割、浏览了解、文本生成等工作,在产业界也造成了规模化的落地。然而放眼到更加广大的工业设计、制作等畛域,仍有诸多迷信和工程问题亟待解决。比方对于高层建筑构造、大跨桥梁、海上石油平台、航空飞机等,流体和构造的简单相互作用会引起能源荷载,进而导致抖振、涡振、驰振、颤振等流致振动,影响构造平安与退役年限。数值模仿是钻研工程构造流致振动的无效办法之一,然而传统数值办法须要大量的计算资源,在计算速度上有很大的局限性等等。 AI+科学计算畛域前沿算法与典型利用案例上述的问题指向了AI+科学计算的倒退: 利用深度学习技术冲破维数高、工夫长、跨尺度的挑战,扭转科学研究范式,帮忙传统行业转型。提到AI办法,大家直观的印象是大数据、神经网络模型搭建与训练。在CV,NLP等畛域中也的确如此,AI办法以数据驱动,训练出神经网络以模仿图像分类、语音辨认等理论问题中隐含的简单逻辑,整体是一个“黑盒”问题。但在解决科学计算相干问题上,应用的AI办法有所变动,除了应用纯数据驱动办法解决问题外,有时候还须要退出一些物理信息束缚,因而,须要更多的畛域相干常识。 具体来看,在科学计算畛域,往往须要针对陆地气象、能源资料、航空航天、生物制药等具体场景中的物理问题进行模仿。因为大多数物理法则能够表白为偏微分方程的模式,所以偏微分方程组的求解成为了解决科学计算畛域问题的要害。神经网络具备“万能迫近”的能力,即只有网络有足够多的神经元,就能够充沛地迫近任意一个连续函数。所以应用AI办法解决科学计算问题的一个思路是训练神经网络以模仿某个偏微分方程组的解函数。 应用AI 办法解决科学计算问题,绝对传统办法有一些潜在的劣势: (1)高维问题解决劣势 传统办法个别是基于无限差分、有限元、无限体积等办法,求得偏微分方程组的近似解。这些办法面临着“维度劫难”,即计算量随着维度减少快速增长。在AI办法的神经网络中,维度减少带来的计算量减少是线性的。 (2)硬件加速劣势 传统办法因为存在串行运算,往往难以使用GPU等硬件进行减速。AI办法中的训练和推理过程都比拟容易施展GPU等硬件劣势。 (3)泛化劣势 AI办法解决问题分为训练和推理两个过程,一次训练,屡次推理。借助神经网络的泛化能力,在某些物理参数条件下训练出的网络,在其余物理参数下也能够取得很好的模仿成果。 AI+科学计算畛域中最驰名的办法是PINNs(Physics-informed neural networks)办法,该办法提出一种新的复合型的损失函数,由偏微分方程组局部,边界条件局部,初始条件局部三局部组成。 Lu, L., Meng, X., Mao, Z., & Karniadakis, G. E.(2021). DeepXDE: A deep learning library for solving differential equations.SIAM Review, 63(1), 208–228. https://doi.org/10.1137/19m12... 因为退出了物理信息束缚,该办法在没有任何输出数据的状况下,只指定边界条件和初始条件,就能够训练出神经网络拟合指标PDE的解。也有一些学者在原始PINNs办法的根底上进行改良,退出一些数据,造成偏微分方程局部、边界条件局部、初始条件局部、数据局部4局部组成的损失函数,进一步提高神经网络的模仿精度,在3D不可压的流体问题上获得了不错的后果。如下图所示,别离对三种不同case应用PINNs算法基于二维二元察看速度进行了3D流场重建,并计算了三种case中不同方向速度及压力的L2范数相对误差。能够发现PINNs办法能够精准捕获漩涡脱落的不稳定性。 Cai, S., Mao, Z., Wang, Z., Yin, M., &Karniadakis, G. E. (2022). Physics-informed neural networks (PINNs) for fluidmechanics: a review. Acta Mechanica Sinica. https://doi.org/10.1007/s1040... ...

February 22, 2023 · 1 min · jiezi

关于paddle:AI-for-Science系列二基于AI框架的CFD工具组件赛桨v10-Beta-API介绍以及典型案例分享

AI for Science被宽泛认为是下一代科研范式,能够无效解决多维度、多模态、多场景下的模仿和实在数据,解决简单推演计算问题,减速新迷信问题发${现}^{[1]}$ 。百度飞桨科学计算工具组件赛桨PaddleScience是国内首个公开且可利用于CFD(Computational Fluid Dynamics,计算流体力学)畛域的工具,提供端到端利用API,致力于解决科学计算类工作。赛桨综合数学计算与物理数据相结合的解决办法,提供物理机理束缚的PINNs(Physics Informed Neural Networks 物理信息神经网络)减速求解偏微分方程,解决计算流体力学中的仿真剖析。本篇文章将重点介绍赛桨PaddleScience v1.0 Beta的典型案例及API应用示例。 赛桨提供的典型案例蕴含应用AI办法进行顶盖驱动方腔流(LDC)、达西流、2D&3D圆柱绕流的流场预测及涡激振动(VIV)。所有案例都基于泛化的微分方程、PINNs求解器、管制体、网络定义以及可视化等多种接口。上面咱们将具体解说赛桨PaddleScience v1.0 Beta中提供的计算流体力学案例及科学计算API的性能及应用。  图1 PaddleScience v1.0 Beta产品全景 场景案例详解前言在流体畛域,流体力学作为比拟传统的物理学科,广泛应用于航空航天、船舶工业以及修建、水利、能源等工程畛域。 在航空工程和造船工业中,如飞行器和船舶的形状设计、操控性、稳定性等问题成为流体力学中宽泛的研究课题,并促使流体力学失去了很大的倒退。在水利工程中,如大型水利枢纽和水力发电站的设计与建造、洪峰的预报工作、河流泥沙等问题都与流体力学严密关联。在动力机械制作工业中,如何进步水力及蒸汽涡轮、喷气发动机、压缩机和水泵等动力机械的性能,与叶片、导流片及其他整机设计形态的正确性无关。随着工程问题的深刻,流体力学曾经逐步与其余学科相互穿插浸透,造成新的交叉学科或边缘科学,如磁流体力学、物理-化学流体力学、生物流变学等等。 围绕不同的流体问题,以后流体力学剖析次要基于数值计算。典型的办法有间接数值模仿 (DNS) 、雷诺均匀办法 (RANS)、大涡模仿办法 (LES)、拆散涡模仿 (DES) 以及格子玻尔兹曼法(LBM)等求解流体本构N-S (Navier-Stokes) 方程。因为物理问题的复杂度,数值办法往往有很多局限性,如计算效率等。PaddleScience的PINNs科学计算求解器,将物理信息融入神经网络,针对流体力学问题提供新的解决思路。本章节中,咱们将介绍2D&3D圆柱绕流及涡激振动的案例,展现PaddleScience的根底科研能力。 图2 不可压缩N-S(Navier-Stokes)方程 2D非定常圆柱绕流圆柱绕流作为经典的CFD问题,在不同的雷诺数下,涡脱落产生的卡门涡街类型不同,是可能综合体现层流、湍流过渡的典型问题。针对该问题,采纳PINNs办法,并基于间断工夫的2D不可压、非定常NS方程作为束缚深度学习神经网络的物理规定,将传统的CFD求解转换为神经网络参数的优化问题。同时,为了减速训练的收敛工夫,进步预测精度,采纳半监督形式,从开源CFD工具OpenFOAM的后果中记录边界地位处约200个测点在不同时刻的流场信息,与N-S方程、初边值条件等独特造成了网络优化的损失函数。对雷诺数Re=100工况,定义约110W个时空训练点(t, x, y),并采纳NVIDIA V100-32G单卡训练约8小时,后果如下图所示。基于PINNs办法构建的网络可能残缺的模仿卡门涡的周期性脱落,且预测的流场后果与OpenFOAM相对误差小于5%(除边界层中个别点外),可满足工程需要。 图3 Re=100的2D圆柱绕流后果 (左:OpenFOAM后果,右:PINNs办法后果) 同时,基于训练实现的模型,利用推理性能,8ms内即可实现百万级空间地位在30个工夫步的后果预测,相比于同样网格数量且固定求解配置的OpenFOAM计算过程,速度晋升近12000倍,十分利于前期在线评估、优化等工程利用。 案例链接:https://github.com/PaddlePadd... 3D非定常圆柱绕流除2D圆柱绕流外,赛桨PaddleScience同时提供3D圆柱绕流案例,基于PINNs办法,求解3D非定常不可压缩Navier-Stokes方程,实现了无模化Re=100的圆柱绕流问题求解。在该问题中,采纳OpenFOAM的后果作为基准,抉择流场稳固的绝对0时刻,并记录无限工夫内特定测点的数据。采纳离散工夫的PINNs神经网络进行训练,其模型数量与所选取的工夫步长相干,在t_start至t_end内,定义离散工夫步长dt,采纳(t_end-t_start)/(T*dt)个模型进行训练,其中T为涡脱周期。比照OpenFOAM的理论值,相对误差在5%以内。x轴上的流场速度变动如下: 图4 3D圆柱绕流x轴流场速度 案例链接:https://github.com/PaddlePadd... 涡激振动涡激振动(VIV)是一种典型的流致振动,是流体通过构造后稳固涡脱频率与构造固有频率综合的流固耦合问题。是海洋工程中立管、输油管路等大跨度构造的次要伤害源,但因为结构复杂,无奈无效测量刚度、阻尼等本构特色,导致伤害探测及预防难度较大。相比基于PINNs办法实现2D圆柱绕流正问题剖析,解决“反问题”是PINNs办法的一个亮点,可通过局部试验数据“逆向”预测流场中构造的刚度、阻尼等本构特色,从而对理论工程中的简单构造的疲劳伤害及毁坏的预测及预防提出领导。 从工程落地的角度,赛桨 PaddleScience 从“半实物仿真”的技术路线登程,构建了涡激振动试验台架以及模型驱动试验配备的电控闭环,创新性地摸索并论证深度学习模型与物理配备的虚实联合的技术可行性。通过对涡激振动发展分阶段剖析,首先基于加速度计及激光设施等传感器采集构造振动振幅与构造升力,对系统进行弹簧-振子单自由度等效。基于实测的160组位移及受力数据,训练过程中最小化“振幅”、“升力”、“方程”等独特组成的损失函数。采纳V100-16G单卡训练约0.5h,预测后果如下图(右上)。基于PINNs预测的构造振动振幅、构造升力后果与试验数据的相对误差均在2%以内。同时基于“反问题”形式剖析失去的构造刚度、阻尼别离为1.092964与4.1e-6,相比实在值1.09与0,相对误差均小于2%。 涡激振动次要基于试验与深度学习模型联合的形式进行,通过构建风洞试验配备,在第一阶段实现构造刚度、阻尼的预测,在第二阶段则基于失去的构造刚度、阻尼等属性,进行流场重构以及升阻力的预测。过程中基于赛桨提供的泛化PDE接口,对涡激振动中流固耦合方程也从新进行了整合,定义新的网络与求解过程,具体流程如下图所示。 图5 VIV试验及深度学习模型联结验 案例链接:https://github.com/PaddlePadd... API性能及应用示例上述案例充分利用了赛桨PaddleScience v1.0 Beta提供的API。本局部将着重介绍波及的次要API接口及应用示例办法。 图6 PaddleScience科学计算工具组件设计架构 科学计算问题定义科学计算问题定义蕴含三局部:方程定义(PDE)、计算域定义(Geometry)、初边值条件定义(IC/BC)。下图展现了如何定义在一个方形区域内求解二维非定常Navier-Stokes方程问题。具体而言,该问题数学上由(图b) 定义,蕴含方程、初边值条件及计算域信息,代码上每一条信息由相应接口形容(图a及图c)。图中展现了一部分数学信息和接口的对应关系,该对应关系由同样的色彩方框示意。 图7 PaddleScience科学计算问题定义 本章节将介绍对于科学计算问题定义相干的API。 偏微分方程(PDE) ...

February 22, 2023 · 1 min · jiezi

关于paddle:AI-for-Science系列三赛桨PaddleScience底层核心框架技术创新详解

框架技术创新飞桨科学计算套件赛桨PaddleScience底层技术依赖飞桨外围框架。为了无力地撑持科学计算工作高效训练与推理,飞桨外围框架在主动微分、编译器、执行器和分布式等多方面别离进行了技术创新。值得一提的是,主动微分在机制上的变革带来了框架计算量方面的优化,联合自研编译器CINN的加持,在典型科学计算工作2D定常Laplace模型上达到业界性能最优。 主动微分 飞桨外围框架在2.3版本中针对主动微分机制和主动微分API提供多种技术创新。 主动微分机制主动微分在机制方面,通过设计主动微分根底算子体系,并在其上定义linearize和transpose程序变换规定。飞桨在动态图中新增对前向微分的反对,实现前反向不限阶的主动微分机制。翻新后的主动微分机制具备良好的算子反对扩展性,目前曾经反对全连贯网络,并在2D定常Laplace、3D定常圆柱绕流等典型科学计算工作上实现验证工作。 目前的主动微分机制设计流程为:用户实现前向组网后,会首先将前向过程对应的网络转化到主动微分根底算子体系上,而后屡次调用linearize和transpose两种程序变换实现高阶前向/反向微分,最初将网络整体转化到飞桨原生算子体系上实现组网或者对接编译器进行更多优化。该机制将计算拆分到更细的粒度,因为引入并正当应用切空间(前向微分空间)信息,绝对于原有的主动微分机制有计算量上的优化,在2D定常Laplace模型上实测有最大1.58倍性能晋升。 主动微分API在主动微分API方面,飞桨为内部用户新增2个主动微分API,别离是前向主动微分forward_grad与反向主动微分grad两种接口,均反对高阶微分。为了不便用户应用,同时提供Jacobian、Hessian的求解,反对按行提早计算,在简单偏微分方程组中显著晋升计算性能。另外,也公开了实现此次翻新后的主动微分外围机制API jvp与vjp,以后所有API均放在incubate空间下,处于试验个性,会依据用户需要及具体利用场景继续演进。上述API列表以及计算示例如下表所示。 分布式主动并行 为了反对用户应用大规模网格点数据进行高效训练,PaddleScience采纳高可扩大的飞桨主动并行技术,它能依据用户输出的串行网络模型和所提供集群资源信息主动进行分布式训练。基于对立分布式计算图和对立资源图设计,飞桨主动并行可反对任意并行策略和各类硬件集群资源上的分布式训练,能将原用户原计算图中每个串行tensor和串行operator主动切分成分布式tensor和分布式operator,并插入适合高效通信来保障与原串行计算统一,如下图所示。目前飞桨主动并行反对半自动与全自动两种模式: 模式一:半自动模式下用户能够依据本人须要指定某些要害tensor和operator的切分形式,而框架会通过数据流剖析形式进行主动推导残余的tensor和operator;模式二:全自动模式下不须要用户标记任何切分形式,所有tensor和operator都由框架基于Cost Model自适应抉择最优的切分策略。基于主动并行所提供的数据并行、梯度累积和数据集并行加载等分布式能力,在3D圆柱绕流工作上32卡扩大效率可达到93%。联合主动并行,PaddleScience将来将更容易取得简单并行策略反对。编译器主动微分机制将科学计算模型中的深度学习算子拆分成若干细粒度的根底算子,若间接计算,这些细粒度算子将使得模型的大部分工夫被节约在数据交换和执行调度而非理论计算上。这意味着咱们并未齐全利用到硬件的计算资源,因而模型的计算速度还仍有较大的晋升空间。神经网络编译器在此类问题上有着显著的劣势,包含针对计算图的通用Pass优化、算子交融以及主动代码生成等。飞桨神经网络编译器CINN即是解决此类问题的无力工具,它在打消大量无用数据交换和执行调度开销的同时,极大地升高算子开发所需的人力老本,相比于未开启编译减速的执行形式,开启CINN在2D定常Laplace模型上实测有最大3.72倍性能晋升。 CINN为科学计算模型提供了一套欠缺的优化机制,典型的常量折叠,冗余算子打消,特定硬件的gemm rewriter库算子替换等优化Pass在CINN中均已实现。主动算子交融能力也在日趋强化,为科学计算等畛域模型的训练性能提供更多的减速契机。以2D定常Laplace模型为例,最大的交融算子汇合可蕴含94个小算子。 图 左:CINN架构图 中:gemm rewriter示例 右:5个小算子交融示例 咱们以2D定常Laplace模型作为对立测试模型,设定采样点数100*100,选取多组网络层数和暗藏层节点数的全连贯网络训练2000 epoch,别离在JAX、飞桨动态图、飞桨动态图+新主动微分、飞桨动态图+新主动微分+CINN编译器几种模式下进行测试。以飞桨动态图模式作为baseline,计算其余模式绝对飞桨动态图的减速比。(性能测试硬件平台:V100 16GB单卡;Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz 40-core) 从试验后果能够看出,受害于新主动微分机制上的变革和自研编译器CINN的性能优化加持,在典型科学计算工作2D定常Laplace模型上达到业界性能最优。 执行器飞桨中有两种数据结构能够示意网络模型,一种是Program,将模型表示成OP序列,不便在单机单卡下程序执行OP;另一种是Graph,将模型表示成计算图构造,不便在多卡下并行调度OP,并默认开启许多图优化的IR pass以晋升训练性能。因为Program相比Graph批改简略,能够不便地插入分布式须要的数据通信等OP,因此飞桨中许多重要的分布式性能都是基于Program构造进行开发。在科学计算我的项目中,咱们对上述典型的科学计算模型实现Program和Graph两种示意构造的无损互转,使得计算图优化后的Graph能够转换成Program进行分布式训练,买通计算图优化和分布式训练联合的技术门路,充分利用两者的优化能力,大幅晋升模型训练性能。 此外,飞桨框架在2.3版本中公布了全新的动态图执行器,其中实现高效的多stream和多线程异步调度组件,使得模型训练更加性能优越和易扩大,并已在单机单卡场景下默认应用。针对PaddleScience,咱们通过对动态图新执行器在对接Graph IR体系和反对分布式训练等方面的性能适配和裁减,使图优化后的模型能够利用新执行器进行分布式训练。 拓展浏览 AI+Science系列(一) :飞桨减速CFD(计算流体力学)原理与实际 AI+Science系列(二):国内首个基于AI框架的CFD工具组件!赛桨v1.0 Beta API介绍以及典型案例分享! 赛桨PaddleScience v1.0 Beta:基于飞桨外围框架的科学计算通用求解器 相干地址 飞桨AI for Science共创打算https://www.paddlepaddle.org.... 飞桨PPSIG-Science小组https://www.paddlepaddle.org....**

February 22, 2023 · 1 min · jiezi

关于paddle:飞桨全量支持业内AI科学计算工具DeepXDE

AI技术在跨学科交融翻新方面扮演着日益重要的角色,特地是在Al for Science畛域,AI技术的倒退为跨学科、跨畛域的交融翻新带来了微小的机会。AI已成为一个要害的钻研工具,扭转了基础科学的钻研范式。依靠AI技术开发的科学计算工具,如DeepXDE、SciML等,正在解决传统科学计算过于简单且难以了解的问题。将来将会有更多功能弱小的科学计算工具呈现,从而推动AI技术成为重要的科研辅助工具,在数学、物理、化学、生物、天文等基础科学以及资料、电子、医疗、制药等应用领域施展独特价值[1]。 .png") 图1 AI for Science跨畛域利用 飞桨PaddlePaddle目前是国内市场综合份额第一的深度学习平台,且始终在为迷信研究者提供优良的AI技术支持。在AI for Science方面,飞桨曾经公布了针对流体、构造、电磁等学科的工具组件——赛桨PaddleScience V1.0 Beta。同时,为了更好地反对AI for Science在科研畛域的深刻摸索,飞桨也在同步拓展和反对一系列业内支流科学计算工具。本期咱们将重点介绍飞桨全量反对的深度学习科学计算工具DeepXDE,从全量算例及模型反对、高性能的训推环境以及典型工程实际等方面进行阐明。 科学计算工具-DeepXDEDeepXDE是一款开源且高度模块化的科学计算工具,以深度学习为外围,提供多种数据、物理机理及数理交融的模型,如PINN、DeepONet、MFNN等,同时反对多种类型微分方程,如常微分方程、偏微分方程的定义及求解,可无效解决简单科学计算问题。 基于所提供的深度学习求解模型,DeepXDE具备以下典型的性能特点: 高度模块化:DeepXDE提供多种反对调用、组合的模块,如计算域、边界条件、微分方程、神经网络、训练及预测等,不便用户组合构建物理零碎;多类微分方程:反对自定义常微分方程、偏微分方程、积分微分方程等来形容具体问题;可扩展性:反对用户联合本身需要增加自定义的数值算法、模型或其余性能;可视化:提供一系列丰盛的可视化工具,能够帮忙用户直观地了解计算结果。在科学计算畛域,DeepXDE的弱小性能与高精度求解能力,使其成为国内外出名的科学计算工具之一。截止目前,DeepXDE的下载量已超过40万次,并被寰球70多所出名大学、科研机构和企业采纳,比方MIT、Stanford、美国东南太平洋国家实验室、通用汽车等。在理论利用中,DeepXDE正在帮忙用户疾速解决简单的科学计算问题,为各畛域科学研究的停顿作出了重要奉献。 .png")图2 DeepXDE办法与Backends 飞桨全量反对DeepXDE全量反对DeepXDE办法与算例飞桨齐全反对DeepXDE工具中提供的PINN、DeepONet等办法,并对工具中提供的各类算例进行了全面的精度对齐。采纳PINN办法运行的42个算例涵盖多种方程和初值/边界条件,飞桨撑持状况如下表所示,相比PyTorch目前反对的算例(31个)多了11个。 表1 飞桨反对DeepXDE中全副微分方程算例 飞桨科学计算反对能力在反对科学计算方面,飞桨从神经网络、高阶微分、动转静技术等进行了全面改良,不仅可能全面反对DeepXDE提供的算例,也可能反对用户自定义的科学计算问题剖析。 齐备的训练网络 飞桨目前提供可笼罩PINN办法以及数据驱动办法的罕用网络,如全连贯网络、多尺度傅里叶特色网络及DeepONet、DeepONetCartesianProd等网络。 残缺的微分方程体系 飞桨目前可反对多种类型微分方程的定义,如常微分方程、偏微分方程、积分微分方程、分数阶偏微分方程等。 动态图模式及“一键动转静”计划 飞桨反对用户基于动态图编码,同时反对一键动转静,能够使用户应用简略的转换语句同时享有动态图和动态图劣势。 欠缺的科学计算罕用高阶算子 为了实现科学计算问题中管制方程的高阶表白,飞桨框架欠缺了如下算子及性能: 提供局部算子的三阶计算,如全连贯网络算子(matmul、add),激活函数(tanh, sin, cos等);提供标量与tensor的加减乘除幂运算;罕用算子如assign、concat、cumsum、expand_v2、reverse、squeeze、unsqueeze、scale、tile、transpose、sign、sum、mean、flip、cast、slice等有限阶计算。多优化器抉择 飞桨提供如ADAM、L-BFGS等优化器,可笼罩宽泛的科学计算利用,且针对DeepXDE中提供的科学计算算例,飞桨提供的L-BFGS 优化器能够达到更高精度的收敛成果。 此外,飞桨对DeepXDE局部算例曾经实现了分布式并行,扩大数据集大小后可取得更高的性能晋升。 飞桨性能劣势基于DeepXDE所提供算例的默认配置,在表2所示的测试环境中对其中20个算例进行了端到端的性能测试,后果如图3所示。左图示意飞桨(蓝色)与PyTorch(橙色)的算例对齐状况,其中横坐标为工具中的不同算例,纵坐标为算例达到收敛指标所需的训练工夫,右图则直观的示意飞桨相比于PyTorch在不同算例对齐过程中的减速状况。能够看出,在所测试的75%个算例中,飞桨的性能均当先PyTorch,最高提速达25%,这阐明飞桨能够作为DeepXDE全量算例的Backend,反对开发者进行科学计算剖析。 表2 默认测试环境 .png") .png") 图3 飞桨反对DeepXDE全量算例性能评估 飞桨DeepXDE开发验证学习文档针对DeepXDE中提供的算例及相干模型,飞桨实现了大量精度对齐、验证工作,积攒并造成了丰盛的开发和验证教训,能够为用户提供利用领导,帮忙用户正确应用DeepXDE工具进行新算例的开发和验证。 用户能够拜访DeepXDE官网代码仓库体验飞桨对DeepXDE中全量算例及模型的反对,在实现DeepXDE的装置后,用户仅需设置DDE_BACKEND环境变量,即可执行相应的算例代码($ DDE_BACKEND=paddle; python pde.py)。 DeepXDE官网代码仓库网址https://github.com/lululxvi/d... 另外,在飞桨AI Studio-人工智能学习与实训社区提供的NoteBook环境下,用户仅需定义环境变量DDE_BACKEND=paddle,即可实现代码块的独立测试、执行。 围绕飞桨+DeepXDE算例的开发验证过程,次要蕴含如下算例验证规范、算例验证流程、模型对齐问题排查流程等工作: 算例验证规范 联合科学计算的正问题与逆问题,能够从单框架测试、多框架测试等路径进行网络参数、指标解、Loss的计算比对,且验证的优先级为:网络参数>指标解>Loss。 算例验证流程 算例验证流程次要分为算例实现和验证两个阶段。下图给出了PINN办法的残缺训练过程,其中蓝色局部为每个阶段须要对齐的数据,黄色局部为算例实现的逻辑。对于算例的验证,次要从飞桨框架自测、多框架比照验证进行分阶段实现。 .png")图4 DeepXDE反对的PINN办法原理 模型对齐问题排查流程 围绕算例及模型对齐过程中呈现的问题,咱们也造成了一些可供用户参考的教训,如能够比照其余框架,进行前向和反向的逐渐对齐验证,并逐次打印对齐流程中的两头后果。此外,也须要进行如“随机种子”、“数据类型”、“初始化参数”、“管制正当误差”等设置,从而升高对齐难度。 此局部内容会在下一期的AI for Science专题“飞桨DeepXDE算例及模型精度对齐学习”中进行具体开展阐明,期待宽广用户浏览、斧正。 案例实际问题定义随着通过放大电路线宽进步集成度的“微细化”速度放缓,三维(3D)重叠技术将承当半导体继续进步性能的作用。在芯片国产自主的背景下,3D重叠技术也成为缓解国外技术制裁的重要形式。热挑战是3D重叠技术的次要阻碍之一,简单的架构和高度集成的器件减少了芯片功耗和热密度。基于AI的传热模型不仅能够评估3D重叠芯片的散热性能,而且为芯片散热结构设计的主动优化提供了宽泛的后劲。本节次要介绍采纳飞桨+DeepXDE进行芯片散热剖析的相干案例实际,如图5所示。 .png")*图5 3D重叠芯片 JL Ayala,A Sridhar, Through silicon via-based grid for thermal control in 3D chips * ...

February 22, 2023 · 1 min · jiezi

关于paddle:别错过4C首发直播上届全国总冠军带你入门赛题

中国大学生计算机设计大赛是我国高校面向本科生最早的赛事之一,自2008年开赛至今,始终由教育部高校与计算机相关教指委等或独立或联结主办。大赛的目标是以赛促学、以赛促教、以赛促创,为国家造就德智体美劳全面倒退的创新型、复合型、应用型人才。 2022年,飞桨队伍胜利摘取了4项国家级一等奖、15项国家级二等奖和20项国家级三等奖,预计24项省级一等奖、43项省级二等奖和66项省级三等奖。   2023年,精彩仍将持续! 直播预报赛题阐明https://mp.weixin.qq.com/s?__...报名地址https://aistudio.baidu.com/ai...本周三晚八点半,中国计算机设计大赛智慧救济组首发直播震撼来袭! 分享嘉宾 安泓郡《飞桨边缘计算入门秘籍》 大连海事大学信息科学技术学院本科三年级在读,智能科学与技术业余,工作于大连海事大学人工智能学院ACoTAI实验室。热衷于探讨深度学习模型在边缘计算设施的部署与工程利用,曾多次在全国科创类比赛中取得总冠军或一等奖。 局部奖项: [2022]中国大学生计算机设计大赛-百度飞桨智慧导盲挑战赛   全国总冠军[2022]RoboCom机器人开发者大赛物资运送比赛   全国总冠军[2022]中国大学生计算机设计大赛-物联网利用   国家一等奖[2022]全国大学生嵌入式芯片与零碎设计比赛-上海海思赛道   国家一等奖 莫善彬《机器狗管制入门秘籍》 大连海事大学信息科学技术学院本科三年级在读,电子信息迷信与技术业余。热衷于探讨嵌入式设计、机械管制、FPGA和计算机视觉相干实践及利用。曾加入过屡次科创比赛并取得佳绩。 局部奖项: [2022]中国大学生计算机设计大赛-百度飞桨智慧导盲挑战赛   全国总冠军[2022]RoboCom机器人开发者大赛物资运送比赛   全国总冠军[2022]美国大学生数学建模比赛   H奖

February 21, 2023 · 1 min · jiezi

关于paddle:即刻报名飞桨黑客马拉松第四期如约而至等你挑战

和气味相投的搭档并肩作战,用指尖敲出奇思妙想,飞桨黑客马拉松PaddlePadddle Hackathon第四期全新降级,凋谢报名啦! 玩技术,秀操作!这是一场高手星散的开发者盛会。四大赛道:外围框架开源奉献(PaddlePaddle)、模型套件开源奉献(Paddle Family)、生态搭档开源奉献(Paddle Friends)、产业单干开源奉献(Paddle Industry) ,200+开发工作,让你近距离感触开源、凋谢的魅力,更有收费机器资源、硬核导师助你成长,丰富处分等你来拿!Hacker集结,战火重燃!你筹备好承受挑战了吗? 再次相约黑客松,咱们期待更多有创造力、有想法的开发者可能退出本次流动,第四期黑客松流动又会碰撞出怎么的火花,咱们一起刮目相待! 流动介绍2023飞桨黑客马拉松PaddlePaddle Hackathon第四期由深度学习技术及利用国家工程钻研核心主办,飞桨承办,英特尔作为顶级资助方,OpenVINO、Arm、Hugging Face、Jina AI、TVM、瑞芯微、算能、地平线等独特出品,旨在激励开发者理解与参加深度学习开源我的项目的共建。 开发工作本次流动上线200+个开发工作,从框架开发、模型套件开发、模型复现、硬件我的项目开发到产业落地计划包罗万象,依据开发难度分为根底工作和进阶工作。你能够根据本人的趣味与能力抉择认领,在规定工夫内实现作品提交。 外围框架开源奉献:API开发、算子性能优化、TensorRT开发、CINN算子开发等多元的框架开发工作等你认领,还有开放性社区洞察工作等你发散思维。模型套件开源奉献:对模型库降级、模型复现、模型适配等工作感兴趣的小伙伴肯定不能错过,文字辨认、自然语言解决、指标检测、图像宰割、图像分类、全场景高性能AI部署、科学计算等10个子方向,任你抉择。生态搭档开源奉献:OpenVINO、Arm、Jina AI等合作伙伴我的项目等你摸索。产业单干开源奉献:蕴含工频场强计读数辨认、跨模态文档信息抽取等四个方向,对技术计划的可用性和可扩展性、产业落地价值感兴趣的你快来挑战吧!惊喜福利100W+现金奖池 周边礼品(往期参考) 飞桨黑客松结项证实 系列直播预报为了让大家全面理解飞桨开发,更快上手开发工作,黑客松组委会在配套启动了10+场硬核技术分享与开源经验交流。PaddlePaddle Hackathon第四期系列直播将在飞桨视频号和B站直播间播出,本系列直播特邀泛滥飞桨资深研发工程师、飞桨硬件合作伙伴、社区沉闷开发者等嘉宾,特地解说本次流动中的系列工作,带你一路过关斩将,实现本人的开源奉献。 近期预报 2月22日:《PHI算子库独立编译工作解说》2月27日:《飞桨黑客松启动典礼——参加开源流动给我带来的意义》 心动不如口头,筹备好了就快退出挑战吧!

February 21, 2023 · 1 min · jiezi

关于paddle:基于飞桨PaddleClas完成半导体晶圆图谱缺陷种类识别

wolfmax老狼,飞桨领航团无锡团团长,飞桨开发者技术专家(PPDE),AICA六期学员,某半导体CIM软件集成商图像算法工程师,次要钻研方向为图像检测、图像宰割等算法。 • 作者AI Studio主页 https://aistudio.baidu.com/ai... 我的项目背景半导体晶圆作为集成电路的载体,在制作过程中须要重复通过简单的薄膜、光刻、刻蚀等工序。而这些制作过程中工序的异样会导致晶圆缺点的产生。在晶圆质检中,利用电学测试设施对晶圆片上的每颗晶粒进行电性测试,可失去用于形容晶圆缺点状态的晶圆图谱,如下图所示。 在上图中,每个小方块即是晶圆上的一颗芯片,有色彩标识的即为测试异样的芯片。对晶圆上有缺点的芯片的空间散布图谱的模式进行辨认剖析,可无效辅助辨认制作过程中的缺点本源,并有针对性的进行改良和预防,从而晋升晶圆制作的产品良率。例如,上图中有局部长条状的生效可能是划伤等造成。 本我的项目基于开源的WM-811K晶圆缺点图谱数据集,应用飞桨图像分类套件PaddleClas进行晶圆缺点分类图谱剖析,演示如何应用PaddleClas疾速搭建一个残缺的图像分类计划,包含数据集筹备、模型训练、验证、测试以及相应的部署。 我的项目链接https://aistudio.baidu.com/ai... 数据集介绍本我的项目采纳开源的WM-811K数据集。原始数据能够从以下网站下载。 下载网址http://mirlab.org/dataSet/pub... 须要留神的是从该网站下载下的数据分为MATLAB格局的.mat文件和python序列化后的.pkl文件。该数据集共收集了811457张晶圆测试后的图片。然而要留神,其中只有172950做了标签,将生效依照芯片的空间散布分类成9个类别(0,1,2...8)。 对每种缺点的图谱进行可视化预览能够对数据有根本的意识。在数据集中有个label_list.txt文件,该文件中蕴含了每种缺点的标签(0-8)及其对应的缺点名称。上面应用该文件创建缺点名称,并抉择相应的图片进行可视化。 在train.txt文件中,每种缺点随机抉择5个样本进行可视化。 依据图片和缺点的名称,能够大略理解每种缺点的分类办法,例如: Center:大部分缺点的芯粒位于晶圆圆心左近;Donut:缺点的芯粒空间散布相似于一个甜甜圈;Loc:部分呈现缺点芯粒汇集等。开发环境筹备本我的项目应用PaddleClas进行图谱分类算法模型的训练和验证,须要装置PaddleClas以及相应的工具,配置PaddleClas的运行环境。 下载PaddleClas 执行git clone命令下载,GitHub比较慢,能够从Gitee上下载。另外,在本我的项目环境中打包了一份PaddleClas,应用时间接解压即可。 git clonehttps://gitee.com/paddlepaddl... 装置相应的依赖 应用pip install命令装置PaddleClas根目录下的requirements.txt即可,同时能够设置镜像,减速装置。 pip install --upgrade -r requirements.txt -ihttps://mirror.baidu.com/pypi... 抉择模型训练配置好PaddleClas的运行环境后,能够应用PaddleClas内的模型间接进行训练,这也是应用套件的益处。模型组网曾经实现,间接批改config配置文件即可实现模型的训练,十分高效!在本我的项目中,咱们应用用于服务器端部署的ResNet模型和挪动端部署的MobileNet模型来进行演示。 应用ResNet50模型进行训练 有了PaddleClas开发套件,只须要将对应模型的yaml文件依照本人的我的项目配置进行更改即可。次要是指定数据集的地位以及相应的优化器配置。对于ResNet50,相应的config文件地位为: PaddleClas/ppcls/configs/ImageNet/ResNet/ResNet50.yaml对于该模型,咱们作如下配置进行训练: epochs:200learning rate: 0.01learning rate scheduler: PiecewiseDecay应用toos/train.py脚本开启一键训练: python tools/train.py -c /home/aistudio/PaddleClas/ppcls/configs/ImageNet/ResNet/ResNet50.yaml训练后果可视化: 将训练过程可视化能够不便地察看训练过程的变动。差不多150个epoch之后,模型的精度稳固到0.85以上;另外,能够直观地看到学习率采纳PiecewiseDecay形式衰减的变化趋势。模型评估在训练过程中,咱们能够在训练的脚本中退出--eval,能够实现一边训练一边评估。另外,在训练完结之后,咱们也能够独自对模型进行评估,运行tools/eval.py脚本,同时指定模型的地位即可。执行以下命令评估ResNet50模型的成果: python tools/eval.py -c /home/aistudio/PaddleClas/ppcls/configs/ImageNet/ResNet/ResNet50.yaml -o Global.pretrained_model=/home/aistudio/PaddleClas/output/ResNet50/best_model模型预测实现评估后,能够应用tools/infer.py脚本进行单张图片或者多张图片批量预测。在预测脚本中传入应用的模型和测试的图片门路即可。 python tools/infer.py -c /home/aistudio/PaddleClas/ppcls/configs/ImageNet/ResNet/ResNet50.yaml -o Global.pretrained_model=/home/aistudio/PaddleClas/output/ResNet50/best_model -o Infer.infer_imgs=/home/aistudio/work/test/Center_85238.jpg 模型导出部署飞桨反对导出推理模型用于部署推理场景,相比于训练调优场景,推理模型会将网络权重与网络结构进行长久化存储。并且飞桨反对应用预测引擎加载推理模型进行预测推理。在PaddleClas套件中通过tools/export_model.py导出模型。导出后,将生成以下三个文件: inference.pdmodel:用于存储网络结构信息;inference.pdiparams:用于存储网络权重信息;inference.pdiparams.info:用于存储模型的参数信息,在分类模型和辨认模型中可疏忽。通过运行如下命令导出模型: python tools/export_model.py -c /home/aistudio/PaddleClas/ppcls/configs/ImageNet/ResNet/ResNet50.yaml -o Global.pretrained_model=/home/aistudio/PaddleClas/output/ResNet50/best_model -o Global.save_inference_dir=deploy/models/ResNet50推理应用ResNet50模型推理及可视化 应用以下指令实现ResNet50模型的推理: %cd /home/aistudio/PaddleClas/deploy !python python/predict_cls.py \    -c configs/inference_cls.yaml应用ResNet50模型进行推理,能够对照文件名和推理的后果来判断预测是否正确。对于ResNet模型,能够统计出75张图片,有5张预测谬误。咱们将分类谬误的图片独自拿进去剖析,直观地剖析谬误的起因,便于改良。 import osimport pandas as pdimport cv2import matplotlib.pyplot as plt%matplotlib inlineimg_root = "/home/aistudio/work/test"wrong_list = ['Edge-Loc_48272.jpg', 'Edge-Loc_58508.jpg', 'Edge-Loc_7413.jpg', 'Loc_87266.jpg', 'Scratch_355662.jpg']wrong_label = ['Loc','Edge-Ring','Loc','Donut','Loc']plt.figure(figsize = (15,6))for i in range(len(wrong_list)):img_path = os.path.join(img_root, wrong_list[i])img = cv2.imread(img_path)plt.subplot(1,len(wrong_list), i+1)plt.imshow(img[:,:, ::-1])plt.xlabel(wrong_list[i])# plt.axis('off')plt.title("Predict Result: " + wrong_label[i], fontsize = 12) 应用MobileNet推理及可视化 将inference_cls.yaml复制一份并更改为inference_cls_mobilenetv3.yaml,同时将该文件内的模型的地位更改成MobileNet的地位,即: inference_model_dir:"/home/aistudio/PaddleClas/deploy/models/MobileNetV3_large_x0_75"执行以下命令实现MobileNet模型的推理: %cd /home/aistudio/PaddleClas/deploy !python python/predict_cls.py \    -c configs/inference_cls_mobilenetv3.yaml最终,仅有3张图片分错,Test_Acc达到 96%,进一步改良即可上demo! wrong_list = ['Donut_7334.jpg', 'Edge-Loc_48272.jpg', 'Loc_94941.jpg']wrong_label = ['Random','Loc','Donut']plt.figure(figsize = (15,6))for i in range(3):img_path = os.path.join(img_root, wrong_list[i])img = cv2.imread(img_path)plt.subplot(1,3, i+1)plt.imshow(img[:,:, ::-1])plt.xlabel(wrong_list[i])# plt.axis('off')plt.title("Predict Result: " + wrong_label[i], fontsize = 12)根据上述两节的可视化后果来看,能够发现分类谬误的图谱大部分是Loc、Edge-Loc等图片,这种景象与晶圆图谱分类的特殊性无关,与一般的图片分类不同,晶圆图谱的生效模式类别和区域地位强相干,例如同样是loc生效,在两头为center类别,在边缘为Edge-Loc类别,在其余地位为Loc,这个和图片分类中的地位不变性相矛盾。对此,前期能够通过减少相应类别的样本数量来改善成果。 总结本我的项目次要介绍如何在半导体制作中引入深度学习技术解决问题。半导体制作作为高端制造业,其整个产业链的平安十分重要。本我的项目展现应用飞桨图像分类套件PaddleClas来疾速解决问题,心愿能在此畛域抛砖引玉,心愿更多的小伙伴能开掘更多的利用,一起助力半导体智能制作产业的倒退!大国崛起,吾辈自强!

February 20, 2023 · 1 min · jiezi

关于paddle:IDC发布2022中国大模型发展白皮书文心大模型能力全面领先

火爆寰球的ChatGPT让背地的大模型技术进入了更多人的视线。日前,国内权威咨询机构IDC公布《2022中国大模型倒退白皮书》(以下简称《白皮书》),认为大模型是AI倒退的必然趋势,并提出业内首个大模型评估框架。经评估,百度文心大模型处于行业第一梯队,产品能力、利用能力、生态能力全面当先。 IDC中国副总裁兼首席分析师武连峰示意,“大模型的背地蕴藏着一场人工智能落地模式的改革。现在火爆寰球的ChatGPT背地的技术撑持正是大模型。没有对大模型的长期投入,就不会诞生ChatGPT这样的利用。在IDC提出的大模型评估框架下,百度文心大模型在本次评估中体现十分突出,是其打造生成式对话产品文心一言的坚实基础。 ” 大模型开启 AI 开发新范式, 行业标准牵引标准倒退《白皮书》认为,人工智能已进入大规模落地利用的关键时期,而大模型的通用性、泛化性以及基于“预训练+精调”等新开发范式,可能解决落地门槛过高、数据资源无限、利用开发“反复造轮子” 等问题。因而,攻关大模型成为产业智能化倒退的必然选择,为政策制定者和企业管理者所重点关注。 https://www.bilibili.com/vide... IDC提出了行业首个大模型评估框架,进一步明确大模型开发标准和实用意义,为将来倒退提供量化规范。据理解,该评估框架包含模型能力、工具平台能力、开放性、利用广度、利用深度、利用生态共6大维度11项指标,通过定性和定量进行打分评估。评估结果显示,百度文心大模型在市场格局中处于第一梯队,产品能力、生态能力、利用能力全面当先。 IDC认为,百度文心大模型在产品能力呈现出较强技术实力和平台积攒,尤其 “文心大模型+飞桨深度学习平台”翻新了人工智能研发利用范式,可满足市场大规模落地需要,达到行业前端程度;同时,文心大模型已在多个行业领有理论落地标杆案例,与客户业务流程关键环节相交融,切实解决产业倒退的痛点,在利用深度与广度方面位列厂商前沿;文心大模型还实现了与开发者、行业用户、上下游产业的正向互动,生态能力处于行业当先地位。 三层体系加持, 百度文心买通大模型产业落地门路《白皮书》显示,背靠海量常识积淀和丰盛利用场景,百度文心大模型具备常识加强和产业级两大特色,构建了文心 “大模型层、工具平台层、产品与社区” 三层体系,买通撑持大模型产业落地的要害门路。 目前,文心大模型联合技术发展趋势、产业实际,公布36个大模型,包含 NLP(自然语言解决)、CV(计算机视觉)、跨模态等根底大模型,生物计算等畛域的工作大模型,以及与行业头部企业或机构共建的11个行业大模型,在能源、金融、航天、制作、传媒、城市、社科以及影视等畛域落地。 文心大模型还打造了大模型开发套件、面向大模型的AI开发平台、大模型API和场景化产品等,为企业和开发者进一步升高大模型的利用难度。同时,深度学习平台也在为大模型倒退与利用“保驾护航”,独特形成产业智能化基座:文心大模型与飞桨深度学习平台交融倒退、共享生态,带来更低门槛、更优成果、更标准化流程,推动AI技术创新和利用进入新阶段。 针对大模型的将来发展趋势,IDC认为大模型将会助推数字经济,为智能化降级带来新范式。对行业用户而言,大模型已体现出微小的后劲,企业应该尽早关注,在业务中布局。对大模型厂商来说,须要进一步明确大模型的商业化门路。 百度日前正式发表将基于文心大模型技术推出生成式对话产品文心一言(英文名:ERNIE Bot) ,在搜寻问答、云计算、内容创作生成、智能办公等泛滥畛域都有更广大的设想空间。百度是领有全栈布局的人工智能公司。从高端芯片昆仑,到飞桨深度学习框架,再到文心预训练大模型,以及下面的利用,各个层面都有要害自研技术。 截至目前,已有爱奇艺、集度汽车(通过Apollo)、小度、宇信科技、汉得信息、金蝶软件、宝宝巴士、智联招聘、太平洋汽车网等知名企业退出百度文心一言生态圈,取得这一当先AI技术的“加持”。 大模型曾经成为重要的AI新型基础设施之一,面向未来,百度等厂商将围绕整体平台建设、行业赋能、生态构建等关键点继续攻坚冲破,以解决大模型开发落地难、生态基础薄弱等问题,充分发挥大模型驱动人工智能产业高速倒退的元能力引擎作用,夯实中国的产业智能化底座。

February 17, 2023 · 1 min · jiezi

关于paddle:飞桨框架v24-API新升级全面支持稀疏计算图学习语音处理等任务

作者 | 飞桨 导读 飞桨框架2.4版本迎来正式公布啦!相比飞桨框架2.3版本,飞桨框架v2.4减少了167个功能性API,新增稠密计算(paddle.sparse)、图学习(paddle.geometric)和语音解决(paddle.audio)等更多畛域API,同时也进一步欠缺了loss计算、张量计算、分布式和视觉变换等类别的API,在提供了更加丰盛的API体系的同时更好地反对深度学习稠密计算、图学习、语音畛域的疾速迭代和翻新、一直扩大对3D点云、Sparse Transformer等场景利用的反对,减速翻新,让基于深度学习的利用开发更简略! 全文9947字,预计浏览工夫25分钟. 一、全面反对支流模型稠密化训练及推理以后越来越多的场景有稠密计算的需要,例如3D点云图像处理和NLP中的稠密Attention等。神经网络的稠密化能够进步网络的性能,缩小计算量及内存/显存的占用,已成为深度学习的钻研热门之一。飞桨v2.4新增了如下稠密类API,反对支流稠密模型的训练和推理,并反对多种稠密Tensor格局及稠密Tensor与浓密Tensor的混合计算,同时其名称和应用形式与惯例浓密Tensor的API保持一致,不便记忆且容易上手。 稠密根底计算API: 一元计算: paddle.sparse.sin/sinh/tan/tanh/expm1/log1p/pow/square/sqrt/abs/cast/neg... 二元计算: paddle.sparse.add/substract/multiply/divide... 矩阵和向量计算: paddle.sparse.matmul/masked\_matmul/addmm/mv... 数据变形: paddle.sparse.transpose/reshape... 稠密组网API: 网络层: paddle.sparse.nn.Conv3D/SubmConv3D/MaxPool3D/BatchNorm... 激活层: paddle.sparse.nn.ReLU/ReLU6/LeakyReLU/Softmax... Part1 笼罩稠密计算支流利用场景3D点云指标检测CenterPoint是一种物体检测器,以点云作为输出,将三维物体在Bird-View下的中心点作为关键点,基于关键点检测的形式回归物体的尺寸、方向和速度。 飞桨框架v2.4残缺提供了这类模型须要的稠密SubmanifoldConv3D/Conv3D、稠密BatchNorm和稠密ReLU等API。模型的训练评估、动转静及推理的各项性能均已齐全实现,欢送试用。实测比业界同类竞品提速4%,训练精度晋升0.2%。 CenterPoint模型介绍https://github.com/PaddlePadd... Sparse Transformer 稠密Transformer与经典的浓密Transformer相比,能反对更长的输出序列,失去更好的网络性能。 稠密Attention的外围计算逻辑为: 飞桨框架v2.4提供稠密矩阵乘、稠密softmax等运算,可残缺反对SparseTransformer的运算。在高稠密度场景下,相比应用DenseTensor提速105.75%,相比同类产品稠密计算提速4.01%~58.55%,极致节俭显存并晋升性能。 Part2 反对多种稠密Tensor格局及稠密Tensor与浓密Tensor的混合计算**飞桨API反对最常应用的稠密数据COO和CSR格局。COO为稠密数据坐标格局,CSR为压缩行信息格式。不同格局的稠密数据应用场景不同,其中SparseConv3D更适宜解决COO格局的数据,SparseTransformer中有较多取整行的操作,更适宜解决CSR格局的数据,能更好升高计算复杂度。尽管这些API有不同的格局偏向,然而飞桨稠密API在设计时,每个都尽可能反对多种稠密格局,这样在不同模型场景下解决不同的数据格式时都能够应用雷同的API,不必批改代码,更灵便且更能极致晋升性能。 以ReLU激活函数为例,其反对解决不同的稠密Tensor: # 稠密COO Tensorcoo = paddle.sparse.sparse_coo_tensor( indices = [[0, 1, 2], [1, 2, 0]], values = [1., 2., 3.], shape = [3, 3])out = paddle.sparse.nn.functional.relu(coo)# 稠密CSR Tensorcsr = paddle.sparse.sparse_csr_tensor( crows = [0, 1, 2, 3], cols = [1, 2, 0], values = [1., 2., 3.], shape = [3, 3])out = paddle.sparse.nn.functional.relu(csr)除了反对不同的稠密格局外,对于二元计算及矩阵向量计算等API,还反对多种稠密格局和惯例的浓密格局(Dense Tessor)的混合计算,网络能够局部应用传统组网,局部应用稠密,更不便已有模型的优化: ...

February 16, 2023 · 3 min · jiezi

关于paddle:飞桨特色产业级模型库助力AI开发与落地更简单

大家好,明天带来的分享是对于飞桨特色产业级模型库的内容~你在应用开源模型我的项目时是否也遇到以下问题呢? 算法和模型繁多,做模型抉择是个难题;模型成果不错,但产业落地时容易遇到资源限度和部署的问题;面对新场景无从下手,迫切希望有范例和教训作为参考。 针对以上问题,飞桨特色产业级模型库为开发者提供了三个方面针对性的解决方案,快来看看如何更好地利用飞桨特色产业级模型库解决懊恼吧! 算法汇聚,模型精选,为开发者提供600+精选算法;产业实际,深度优化,精心打造飞桨PP系列模型,更适宜产业落地;聚合产业范例与模型常识,打造笼罩金融、工业等多个行业的产业范例库。算法汇聚,模型精选针对模型抉择艰难的问题,飞桨提供600多个精选的官网算法,涵盖了自然语言解决、计算机视觉、举荐、语音、时序预测、文心大模型、强化学习、图神经网络、量子学习、生物计算以及科学计算等支流应用领域。 为了更好地承载模型的研发与利用,飞桨创新性地研发了开发套件产品,通过端到端的全流程,来撑持开发者的开发过程。 以PaddleDetection和PaddleOCR两个开发套件为例,开发套件能够反对开发者从数据筹备、模型训练到部署整个流程,同时还预置大量优化策略。开发者只需简略批改配置,就能够疾速实现利用,而且反对在丰盛的硬件上实现多种部署形式。 除了之前大家相熟的开发套件,近期飞桨新公布了若干模型库与开发套件。 深度时序建模库PaddleTS 飞桨新增深度时序建模库PaddleTS,专门针对开发者在时序预测方向的工作需要。 三维感知开发套件Paddle3D 3D方向目前也是比拟热门的场景。飞桨针对性开发了三维感知开发套件Paddle3D,其能够在智能驾驶、智能医疗、点云测绘等方面反对产业落地。 遥感影像智能解译开发套件PaddleRS 遥感影像智能解译开发套件PaddleRS的技术能力笼罩遥感场景中图像宰割、指标检测、变化检测、图像复原以及场景分类,非常适合遥感方向从业开发者进行产业利用落地。 综上,通过丰盛的模型库以及开发套件,能够很好地解决模型抉择艰难问题 产业实际,深度优化针对开发者对于产业实际深度优化的需要,飞桨建设了一批高质量的PP系列模型。目前PP特色模型曾经达到了42个,根本涵盖了各个领域的支流工作场景。PP系列模型的次要特色是精度与性能的均衡,依据产业用户的场景须要,兼顾模型精度和硬件推理速度。依据模型的大小、占用内存、显存这些限度条件进行综合优化,在保障精度根本满足工作需要的同时,兼顾在速度和性能上也能满足业务需要。 PP系列的典型模型PP-YOLOE+ PP系列的PP-StructureV2 自然语言解决畛域的ERNIE-UIE 自然语言解决畛域的ERNIE 3.0轻量级模型 聚合产业范例与模型常识针对开发者短少案例教训参考的问题,飞桨建设了产业实际范例库,积淀飞桨开发者、合作伙伴的优良教训,能够帮忙新用户和开发者疾速上手,所学即所用。 以火灾烟雾检测场景为例,产业实际范例提供了包含场景剖析、算法抉择、训练调优、推理部署等一套残缺流程,通过对这些过程的具体解说,能够帮忙开发者迅速我的项目落地。 飞桨产业实际范例库逐步积攒,范例数量由47个增至68个,笼罩金融、工业、交通、互联网、安防、教育等十个重点行业场景。通过内部企业场景单干和共建的形式,独特解决产业痛点,获取行业教训。飞桨产业实际范例库聚焦金融、工业、城市、交通四大行业,全方位助力行业智能化倒退。 针对模型抉择艰难、产业模型短少、落地教训稀缺等问题,咱们为开发者打造了全新的飞桨模型库,提供聚合模型常识与工具集的一站式体验计划。 在这里,开发者能够疾速体验模型的可视化成果和一键运行能力,联动飞桨官网、AI Studio、BML等平台实现多维度尝试。同时,汇合FastDeploy实现模型高性能本地部署,咱们也心愿与开发者一起一直打磨和塑造优良的AI模型一站式能力。 最初,飞桨产业级模型库的建设离不开泛滥社区开发者的奉献,也欢送更多的开发者退出飞桨队伍,共建AI社区,让AI开发与落地更简略。 相干链接 GitHub Modelshttps://github.com/PaddlePadd... 飞桨官网模型库https://www.paddlepaddle.org....

February 16, 2023 · 1 min · jiezi

关于paddle:飞桨助力南京邮电大学智能芯片测试团队斩获互联网大赛全国银奖

第八届中国国内“互联网+”大学生翻新守业大赛由教育部等十二部委与重庆市人民政府独特主办、重庆大学承办。自4月份报名启动以来,共有来自国内外111个国家和地区、4554所院校的340万个我的项目、1450万余人次报名参赛。全国仅有300支团队,可能入围产业赛道国赛,比例不超过万分之一。 2022年11月,官网正式颁布大赛获奖状况,飞桨命题队伍胜利摘取2个金奖、3个银奖和4个铜奖,总奖项数在“互联网+”产业赛道中位居全国命题单位前列。 近期,咱们对来自飞桨命题赛道的全国总决赛银奖团队——南京邮电大学“青柚量子”团队进行了采访。 “请介绍你们的团队与我的项目” 青柚量子是由南京邮电大学的优良学子组成的大学生科研先锋队。翻新团队正在开发基于金刚石NV色心的温度、电场、磁场和电磁场的高分辨精细测量技术,研制面向第三代半导体芯片测试的,基于量子传感的微米级光纤量子多物理场设施。团队涵盖了本硕博三个档次学生,共有成员80余名。南京邮电大学是教育部、工业和信息化部、国家邮政局与江苏省共建高校,国家“双一流”建设高校,是以电子信息为特色,工学门类为主体,多学科互相融合,本硕博等多层次教育协调倒退的重点大学。团队成员所在的通信与信息工程学院是南京邮电大学历史最久、规模最大、综合实力最强的学院,是国内最早发展信息与通信技术教学和钻研的单位之一。学院在信息通信畛域有较强的综合实力,相干业余在全国同类业余排名稳居前20名。 团队成员介绍因为精细零部件在质检环节,普遍存在产品批量大、品质要求高、操作流程要求标准严的特点,传统的人工形式老本高、稳定性低,特地是面对如芯片制作、精密仪器制作等畛域,则更须要高精度的质检解决方案。参赛团队提出采纳微米尺寸金刚石晶体作为传感外围单元,利用基于量子传感原理的多物理场测量方法,实现精细器件的质检和芯片的生效性剖析。为了进步探测速率,本产品更是实现了集成一体化量子调控与测量电路与疾速寻峰拟合算法,将软硬件协调集成优化,在减小探测安装体积的同时实现疾速测量。值得一提的是,在微波宽场成像这一部分中,咱们获取芯片扫描的原始数据后,基于飞桨PaddlePaddle,先后应用RNN神经网络以及GAN神经网络来辅助成像,在晋升成像分辨率的同时,使成像速度进一步晋升10倍,有利于将来对更先进制成的芯片进行大批量质检。同时也突破硬件提供分辨率的有限性,对测试技术带来了微小的性能晋升。 基于深度学习的微波宽场成像 “我的项目的外围翻新点”独创锥形光纤量子探头,对芯片逐点进行接触式无扰动扫描,使荧光收集效率晋升15倍,空间分辨率晋升至 0.9 微米; 首次提出量子态脉冲副载波调制办法,在疾速扫描的过程中尽可能减少噪声,将信噪比晋升 12dB 以上;提出基于深度学习的微波宽场成像。将芯片扫描原始数据通过飞桨PaddlePaddle进行分辨率晋升,同时使成像速度进一步晋升10倍,有利于将来对更先进制成的芯片进行大批量质检。同时也突破硬件提供分辨率的有限性,对测试技术带来了微小的性能晋升;采纳FPGA进行ADC信号处理和时序同步,使测量效率晋升了近百倍。 “飞桨在备赛过程中都提供了哪些反对?请谈一谈应用飞桨的体验”飞桨特地适宜初学者学习,有很多的中文教程和阐明,尤其是AI Studio外面的我的项目实际,有寰球开发者独特分享的许多优质我的项目,深入浅出,十分具体,可能帮忙大家疾速上手。比方,咱们的我的项目是基于量子传感的芯片智能测试零碎,较为要害的是最初的成像过程,业界也经常通过最初的成像来判断芯片生效点。为了使得芯片的测试反馈更加高效地领导芯片设计,芯片测试环节的成像速度和分辨率的晋升,是重中之重。 咱们正是在参考AI Studio我的项目板块里的《Paddle2.0尝鲜通过Sub-Pixel实现图像超分辨率》 ,基于我的项目提出的新CNN架构,进行相干模块的开发,最终后果可能无效地升高计算的复杂度,并且比其余基于CNN的办法快了一个数量级。咱们置信,作为十分优良的国产框架,飞桨在将来肯定能博得全世界开发者的青眼。 AI Studio我的项目 “请谈一谈加入飞桨产业赛道的感触”“互联网+”大赛是一个挑战与时机并存、艰难与心愿同在的舞台,也是一个和百度这样的龙头企业以及泛滥创业者一起交换的平台。它让大家更好地团结在一起,开辟视线,一直晋升自我,并以守业的视角对待本身的工作。在守业的视角下,光领有想法、创意和技术,是远远不够的;须要深刻产业考察,对整个行业有本人的了解。只有抓住行业痛点,隔靴搔痒改良本人的产品,才有机会作为一个“新人”怀才不遇。 “我的项目的将来产学研利用前景如何呢?”目前,咱们曾经通过基于量子传感的微米级光纤量子多物理场设施,构建了残缺的精密仪器高分辨精细测量服务,并能为测后芯片提供一套残缺的设计批改计划。在产学研方面,百度与南京邮电大学在2022年已有产业学院的单干,在产业学院平台建设过程中,单方将通过百度的弱小产业生态链和南京邮电大学行业劣势与人才培养特色,摸索建设人才培养、产业交换、招生待业、技术研发的区域性洼地,创立区域人工智能新技术研发与推广应用大平台。 “导师访谈”指导老师简介 杜关祥,南京邮电大学通信与信息工程学院传授,博士生导师。毕业于兰州大学,在中科院物理研究所取得凝聚态物理业余博士学位。他是日本学术振兴会特地研究员奖学金获得者,先后在日本东北大学、瑞士巴塞尔大学和德国马普生物物理化学研究所从事科研工作。 团队从事原子无线通信、芯片和新能源资料器件测试的开发和系统集成。联合工程学、精细光电子学、量子物理、半导体微纳加工技术和大数据人工智能算法,多学科穿插交融,倒退翻新的实用化量子精细测量技术,摸索其在原子无线通信、芯片测试和新能源电池资料测试上的利用。 指导老师领会 十分荣幸团队可能加入本届“互联网+”百度命题并取得全国银奖、江苏赛区一等奖的好问题,这离不开同学们的辛勤付出,也离不开百度的通力反对与单干。本次参赛,咱们针对百度提出的命题——高精度、多品种、疾速率的高端芯片瑕疵辨认,利用金刚石中的NV色心这一固态量子体系,联合基于飞桨PaddlePaddle在CV方面的检测及生成能力,开发了一套高空间分辨率、高灵敏度、高测量效率的多物理场量子传感设施,来对芯片外表电磁场和温度进行疾速扫描成像,实现芯片智能测试。本次参赛深切感触到了人工智能在多畛域的利用,与多学科穿插交融,可能施展出极大的效益,将来心愿持续与飞桨PaddlePaddle单干,进一步改良欠缺设施,进行商业化尝试,逐渐融入芯片产业链,服务产业、服务社会。 指导老师寄语 通过为期一年“互联网+”的备赛,从校赛到省赛再到国赛,一次次的批改、调整、欠缺,过五关斩六将,置信同学们在这过程中都学习了很多、成长了很多。不光是大家,我本人也学到了不少。我认为,作为一个工科学生,学好书本上的理论知识是远远不够的,敢于入手、动脑,将实践利用于理论,才可能更好地锤炼工科素养。 在较量中,同学们埋头于实验室一直尝试,在探讨和问难中一直磨砺自我,关怀产业和科技交融,大胆迈出翻新守业的步子,我眼看着你们的综合能力进步了很多,曾经从糊涂的大学生成长为国家所须要的翻新一代,我感觉这就是“互联网+”大赛的意义所在。心愿大家能够在这次较量积攒的教训根底上持续致力,不忘初心,在翻新守业的路线上更进一步。 高校产学研用单干征询邮箱paddle-up@baidu.com

February 15, 2023 · 1 min · jiezi

关于paddle:飞桨框架v24-API新升级全面支持稀疏计算图学习语音处理等任务

大家好,今日带来的是有对于飞桨框架v2.4 AP降级的内容~快来看看是不是你所期待的新内容吧!也欢送大家分享本人的认识哦。 2022年11月,飞桨框架2.4版本公布。相比飞桨框架2.3版本,飞桨框架v2.4减少了167个功能性API,新增稠密计算(paddle.sparse)、图学习(paddle.geometric)和语音解决(paddle.audio)等更多畛域API,同时也进一步欠缺了loss计算、张量计算、分布式和视觉变换等类别的API。上面咱们将为大家具体介绍每一类新增API及其利用场景示例,不便大家疾速理解和上手应用哦~ 全面反对支流模型稠密化训练及推理以后越来越多的场景有稠密计算的需要,例如3D点云图像处理和NLP中的稠密Attention等。神经网络的稠密化能够进步网络的性能,缩小计算量及内存/显存的占用,已成为深度学习的钻研热门之一。飞桨v2.4新增了如下稠密类API,反对支流稠密模型的训练和推理,并反对多种稠密Tensor格局及稠密Tensor与浓密Tensor的混合计算,同时其名称和应用形式与惯例浓密Tensor的API保持一致,不便记忆且容易上手。 稠密根底计算API: 一元计算:paddle.sparse.sin/sinh/tan/tanh/expm1/log1p/pow/square/sqrt/abs/cast/neg...二元计算:paddle.sparse.add/substract/multiply/divide...矩阵和向量计算:paddle.sparse.matmul/masked_matmul/addmm/mv...数据变形:paddle.sparse.transpose/reshape...稠密组网API: 网络层:paddle.sparse.nn.Conv3D/SubmConv3D/MaxPool3D/BatchNorm...激活层:paddle.sparse.nn.ReLU/ReLU6/LeakyReLU/Softmax...笼罩稠密计算支流利用场景3D点云指标检测CenterPoint是一种物体检测器,以点云作为输出,将三维物体在Bird-View下的中心点作为关键点,基于关键点检测的形式回归物体的尺寸、方向和速度。 飞桨框架v2.4残缺提供了这类模型须要的稠密SubmanifoldConv3D/Conv3D、稠密BatchNorm和稠密ReLU等API。模型的训练评估、动转静及推理的各项性能均已齐全实现,欢送试用。实测比业界同类竞品提速4%,训练精度晋升0.2%。 CenterPoint模型介绍https://github.com/PaddlePadd... Sparse Transformer稠密Transformer与经典的浓密Transformer相比,能反对更长的输出序列,失去更好的网络性能。 稠密Attention的外围计算逻辑为: 飞桨框架v2.4提供稠密矩阵乘、稠密softmax等运算,可残缺反对SparseTransformer的运算。在高稠密度场景下,相比应用DenseTensor提速105.75%,相比同类产品稠密计算提速4.01%~58.55%,极致节俭显存并晋升性能。 反对多种稠密Tensor格局及稠密Tensor与浓密Tensor的混合计算飞桨API反对最常应用的稠密数据COO和CSR格局。COO为稠密数据坐标格局,CSR为压缩行信息格式。不同格局的稠密数据应用场景不同,其中SparseConv3D更适宜解决COO格局的数据,SparseTransformer中有较多取整行的操作,更适宜解决CSR格局的数据,能更好升高计算复杂度。尽管这些API有不同的格局偏向,然而飞桨稠密API在设计时,每个都尽可能反对多种稠密格局,这样在不同模型场景下解决不同的数据格式时都能够应用雷同的API,不必批改代码,更灵便且更能极致晋升性能。 以ReLU激活函数为例,其反对解决不同的稠密Tensor: # 稠密COO Tensorcoo = paddle.sparse.sparse_coo_tensor(        indices = [[0, 1, 2],                    [1, 2, 0]],        values  = [1., 2., 3.],        shape   = [3, 3])out = paddle.sparse.nn.functional.relu(coo)# 稠密CSR Tensorcsr = paddle.sparse.sparse_csr_tensor(        crows  = [0, 1, 2, 3],        cols   = [1, 2, 0],        values = [1., 2., 3.],        shape  = [3, 3])out = paddle.sparse.nn.functional.relu(csr)除了反对不同的稠密格局外,对于二元计算及矩阵向量计算等API,还反对多种稠密格局和惯例的浓密格局(Dense Tessor)的混合计算,网络能够局部应用传统组网,局部应用稠密,更不便已有模型的优化: # COO与Dense矩阵乘,返回浓密Tensorcoo = paddle.sparse.sparse_coo_tensor(        indices = [[0, 1, 2],                    [1, 2, 0]],        values  = [1., 2., 3.],        shape   = [3, 3])dense = paddle.rand([3, 2])out = paddle.sparse.matmul(coo, dense)# CSR与Dense矩阵乘,返回浓密Tensorcsr = paddle.sparse.sparse_csr_tensor(        crows  = [0, 1, 2, 3],        cols   = [1, 2, 0],        values = [1., 2., 3.],        shape  = [3, 3])dense = paddle.rand([3, 2])out = paddle.sparse.matmul(csr, dense)# Dense与Dense矩阵乘,返回稠密Tensorx = paddle.rand([3, 5])y = paddle.rand([5, 4])mask = paddle.sparse.sparse_csr_tensor(        crows = [0, 2, 3, 5],        cols  = [1, 3, 2, 0, 1],        values= [1., 2., 3., 4., 5.],        shape = [3, 4])out = paddle.sparse.masked_matmul(x, y, mask)名称和应用形式与惯例浓密Tensor的API保持一致,不便记忆且容易上手个别模型中应用的API都是解决浓密数据(Dense Tensor)的API。飞桨SparseAPI在设计之初就思考尽可能升高了解老本,与惯例解决浓密数据(Dense Tensor)的API放弃格调统一,不便用户疾速上手。 以模型中一段ResNet稠密网络的代码为例: import paddlefrom paddle import sparsefrom paddle.sparse import nnclass SparseBasicBlock(paddle.nn.Layer):    def __init__(            self,            in_channels,            out_channels,            stride=1,            downsample=None,    ):        super(SparseBasicBlock, self).__init__()        self.conv1 = nn.SubmConv3D(                        in_channels,                        out_channels,                        kernel_size=3,                        stride=stride,                        padding=1)        self.bn1 = nn.BatchNorm(out_channels, epsilon=1e-3, momentum=0.01)        self.relu = nn.ReLU()        self.conv2 = nn.SubmConv3D(                        out_channels,                        out_channels,                        kernel_size=3,                        stride=stride,                        padding=1)        self.bn2 = nn.BatchNorm(out_channels, epsilon=1e-3, momentum=0.01)        self.downsample = downsample    def forward(self, x):        identity = x        out = self.conv1(x)        out = self.bn1(out)        out = self.relu(out)        out = self.conv2(out)        out = self.bn2(out)        if self.downsample is not None:            identity = self.downsample(x)        out = sparse.add(out, identity)        out = self.relu(out)        return out能够看到,ResNet稠密网络的代码和惯例ResNet网络代码简直没有差异,只须要通过paddle.sparse.代替paddle.即可,源于飞桨Sparse系列API在整体应用上与Dense系列API高度一致。如果可能减少import门路替换,甚至原网络代码都无需改变。例如通过frompaddle.sparseimportnn,则可放弃与原来的nn.*写法完全一致,更易于上手。 新增图学习类API,反对高效图学习计算近几年,图学习相干钻研倒退迅速,在自然语言解决、计算机视觉、举荐零碎、生物化学等畛域具备较为宽泛的利用和倒退。图学习逐步成为机器学习畛域的关键技术,本次飞桨框架v2.4新增paddle.geometric图学习类API,提供更好的图学习建模和高效图学习计算体验。 高效图消息传递现有的大多数图学习框架在进行图模型设计时,通常采纳图消息传递机制的经典范式。飞桨框架v2.4新增图学习消息传递API,反对高效图消息传递。其中,新增的send_u_recv、send_ue_recv、send_uv共计3个API,通过实现原子级别的音讯发送与接管,大大减少了冗余的两头显存变量占用,从而带来显著的显存收益。在浓密图场景下,GCN、GAT等经典图神经网络模型可节俭50%+的显存,并可进一步晋升训练速度约20%。各个send_recv系列API反对sum、mean、max、min共计4个音讯聚合形式,在节点特色与边特色交互时则反对add、sub、mul、div共计4种计算形式。应用形式示例如下: import paddlex = paddle.to_tensor([[0, 2, 3], [1, 4, 5], [2, 6, 7]], dtype="float32")y = paddle.to_tensor([1, 1, 1, 1], dtype="float32")indexes = paddle.to_tensor([[0, 1], [1, 2], [2, 1], [0, 0]], dtype="int32")src_index, dst_index = indexes[:, 0], indexes[:, 1]out = paddle.geometric.send_ue_recv(x, y, src_index, dst_index, message_op="add", reduce_op="sum")高性能图采样图采样步骤对于图采样模型特地是在大图场景下是十分有必要的,但同时也是图模型训练的性能瓶颈。本次新增了高性能图采样API,反对高并发图采样,放慢图采样模型采样和训练效率,经典图模型Graphsage的采样速度可晋升32~142倍,训练速度可晋升12~57倍。除了反对纯GPU采样和CPU采样之外,还能够反对借助UVA(Unified Virtual Addressing,对立虚构寻址)技术,将图构造搁置在内存中进行GPU采样,该实现形式在大图场景下十分无效。简略示例如下: import paddlefrom paddle.fluid import corerow = np.array([3, 7, 0, 9, 1, 4, 2, 9, 3, 9, 1, 9, 7])colptr = np.array([0, 2, 4, 5, 6, 7, 9, 11, 11, 13, 13])row = core.eager.to_uva_tensor(row)colptr = core.eager.to_uva_tensor(colptr)nodes = paddle.to_tensor([0, 8, 1, 2])sample_size = 2# 街坊采样API的输出要求图构造信息为CSC格局neighbors, neighbor_count = paddle.geometric.sample_neighbors(row, colptr, nodes, sample_size=sample_size)# 生成重编号后的边reindex_src, reindex_dst, out_nodes = paddle.geometric.reindex_graph(nodes, neighbors, neighbor_count)新增语音畛域类API近几年,智能语音畛域疾速迅速,深度学习畛域产生了很多语音训练解决根底能力的需要。本次飞桨框架v2.4新增paddle.audio类API提供了语音根底解决能力,晋升了语音建模和学习便捷性。 高效的特征提取模块特征提取模块是深度学习语音畛域最根底的模块,特地在大规模数据训练和推理过程中,其速度为一个性能瓶颈。本次新增MFCC、Spectrogram、LogMelSpectrogram等特征提取API,反对GPU计算,相比CPU实现解决性能晋升15倍以上,可大幅晋升语音模型训练GPU利用率,达到疾速训练和推理的成果。应用示例如下: import paddlefrom paddle.audio.features import LogMelSpectrogram#设置音频相干参数sample_rate = 16000wav_duration = 0.5num_channels = 1num_frames = sample_rate * wav_durationwav_data = paddle.linspace(-1.0, 1.0, num_frames) * 0.1waveform = wav_data.tile([num_channels, 1])#设置特色提起器相干参数feature_extractor = LogMelSpectrogram(sr=sample_rate, n_fft=512, window = 'hann', power = 1.0)feats = feature_extractor(waveform)音频解决根底模块深度学习语音畛域,除了传统的经典模型外,还有很多语音前端解决的试验须要进行,定制化语音特色的需要应运而生。本次新增窗函数、离散余弦变换等特征提取根底API,不便用户自定义语音特征提取,不便实现定制化需要。应用示例如下: import paddle#cosine窗函数示例n_fft = 512cosine_window = paddle.audio.functional.get_window('cosine', n_fft)#高斯窗函数std = 7gaussian_window = paddle.audio.functional.get_window(('gaussian',std), n_fft)#离散余弦变换示例n_mfcc = 23n_mels = 257dct = paddle.audio.functional.create_dct(n_mfcc, n_mels)语音IO模块对各种语音数据进行读取是音频解决的根底。事实场景中语音的编码格局各式各样,所以须要IO模块灵便地反对多种格局。飞桨框架v2.4新增语音IO模块,提供2种音频I/Obackend,反对6种编解码,便捷地实现语音数据的加载。应用示例如下: import osimport paddle#设置相干参数,生成示例音频sample_rate = 16000wav_duration = 0.5num_channels = 1num_frames = sample_rate * wav_durationwav_data = paddle.linspace(-1.0, 1.0, num_frames) * 0.1waveform = wav_data.tile([num_channels, 1])base_dir = os.getcwd()filepath = os.path.join(base_dir, "test.wav")#保留和提取音频信息paddle.audio.save(filepath, waveform, sample_rate)wav_info = paddle.audio.info(filepath)#wav_info中会有sample_rate, num_frames, num_channels等信息语音分类数据集在训练深度学习语音模型的时候,不便地下载解决数据集会为模型训练带来便捷。飞桨框架v2.4新增TESS、ESC50语音分类数据集。用户不用进行简单的预处理,能够不便地启动训练流程,便捷地实现训练。用户也能够按照此代码,不便定制本人的数据集。应用示例如下: import paddlemode = 'dev'esc50_dataset = paddle.audio.datasets.ESC50(mode=mode,                                        feat_type='raw')for idx in range(5):    audio, label = esc50_dataset[idx]    # do something with audio, label    print(audio.shape, label)    # [audio_data_length] , label_idesc50_dataset = paddle.audio.datasets.ESC50(mode=mode,                                        feat_type='mfcc',                                        n_mfcc=40)for idx in range(5):    audio, label = esc50_dataset[idx]    # do something with mfcc feature, label    print(audio.shape, label)    # [feature_dim, length] , label_id其它新增的API除了以上形容的几类新增API,飞桨框架v2.4还对已有的一些API类别进行了裁减。 loss计算API为了更不便地反对各种组网的loss计算需要,飞桨框架v2.4裁减了多个loss计算的API,包含: paddle.nn.functional.cosine_embedding_loss依据label类型,计算2个输出之间的CosineEmbedding损失。paddle.nn.functional.soft_margin_loss计算输出和label间的二分类softmargin损失。paddle.nn.functional.multi_label_soft_margin_loss计算输出和label间的多分类最大熵损失。paddle.nn.functional.triplet_margin_loss和paddle.nn.functional.triplet_margin_with_distance_loss计算输出与正样本和负样本之间的绝对相似性,后者可自定义间隔计算函数。张量计算API飞桨框架2.3之前的版本实现了很多根底的张量计算API,飞桨框架2.4版本基于这些根底API,通过组合的形式裁减了张量计算API,不便用户间接应用,包含: 新增paddle.sgn取复数的单位值和实数的符号。新增paddle.count_nonzero沿给定的轴统计输出张量中非零元素的个数。新增paddle.take将输出张量视为一维,返回指定索引上的元素汇合。新增paddle.bucketize依据给定的一维桶划分,失去输出张量对应的桶索引。新增paddle.triu_indices和paddle.tril_indices别离取二维张量(矩阵)中上/下三角矩阵元素的行列坐标。新增paddle.heaviside计算赫维赛德阶跃函数。新增paddle.nanmedian和paddle.nanquantile疏忽张量中的nan值,别离计算出中位数和分位数值。分布式API新增10个分布式通信API,如paddle.distributed.communication.stream.all_gather等,反对在主计算流上做通信,升高了在流切换、事件期待时的性能开销,可能使分布式GPT3模型训练提速11.35%。 视觉变换API基于飞桨根底API,裁减了paddle.vision.transforms中视觉变换API,包含: paddle.vision.transforms.affine和paddle.vision.transforms.RandomAffine对图像进行仿射变换,后者应用随机产生的仿射变换矩阵参数。paddle.vision.transforms.erase和paddle.vision.transforms.RandomErasing应用给定的值擦除输出图像中的像素,前者是选定区域,后者是随机区域。paddle.vision.transforms.perspective和paddle.vision.transforms.RandomPerspective对图像进行透视变换,前者是选定区域,后者是随机区域,两者都能够抉择插值办法。除了下面的介绍外,飞桨框架v2.4还裁减了一些组网类(如paddle.nn.ChannelShuffle)、辅助类(如paddle.iinfo)等API,具体列表可点击下方链接参考Release Note。 Release Note地址https://github.com/PaddlePadd... 结语飞桨框架的建设除了来自百度的工程师外,还有一批酷爱飞桨、酷爱开源的开发者,他们正在用本人的形式参加飞桨框架的建设,与飞桨独特成长。在飞桨框架v2.4中,有约三分之一的新增API由社区开发者奉献,飞桨的凋敝离不开宽广开发者的应用与反对。 飞桨框架v2.4逐步形成了成熟的API开发范式,框架的开发难度继续升高。配合官网提供的规范开发环境,飞桨社区开发者能够更加顺畅地实现飞桨API开发与奉献。具体体现在: 简化API开发步骤:飞桨框架v2.4实现了根底框架算子体系重构,结构高可复用的PHI算子库(Paddle HIgh reusability operator library),反对基于已有的算子内核以及Kernel Primitives API组合实现新的算子,反对插件式接入新硬件或者新减速库。PHI算子库的成熟,晋升了飞桨API的开发效率,并造成了通用的API开发流程,使得开发者能够更加简洁流畅地参加飞桨API的开发与奉献。公布规范API奉献指南:飞桨框架v2.4造成了规范的API奉献指南,包含奉献流程与操作指南、API设计文档模板、API代码模板、API文档写作标准,为飞桨社区开发者提供清晰的文档指引与辅助,使得开发者能够疾速上手。提供规范开发环境:飞桨AIStudio平台推出规范开发环境,为开发者提供飞桨镜像环境、在线IDE与专属GPU算力,登录即可开发调试,免去环境配置与算力限度,随时随地参加飞桨框架的开发与奉献。飞桨框架v2.4提供了更加丰盛的API体系,不仅更好地反对深度学习稠密计算、图学习、语音畛域的疾速迭代和翻新,而且一直扩大对3D点云、Sparse Transformer等场景利用的反对,同时也一直优化飞桨API的应用体验,更好地反对业界论文中模型的实现,减速翻新,让基于深度学习的利用开发更简略!

February 15, 2023 · 1 min · jiezi

关于paddle:中国计算机设计大赛来啦用飞桨驱动智慧救援机器狗

中国大学生计算机设计大赛是我国高校面向本科生最早的赛事之一,自2008年开赛至今,始终由教育部高校与计算机相关教指委等或独立或联结主办。大赛的目标是以赛促学、以赛促教、以赛促创,为国家造就德智体美劳全面倒退的创新型、复合型、应用型人才。 2022年,飞桨队伍胜利摘取4项国家级一等奖、15项国家级二等奖和20项国家级三等奖,预计24项省级一等奖、43项省级二等奖和66项省级三等奖。2023年,百度飞桨联结宇树科技独特承办了人工智能赛项的智慧救济赛道。 赛道介绍事实世界中,抢险地区往往环境简单,充斥各种未知挑战。利用深度学习技术来进行简单环境的感知,可能为抢险救灾工作提供实时智能剖析与决策反对,而相比于传统的轮式机器人,四足机器人面对简单地形更加有静止劣势。深度学习技术与四足机器狗的联合,是智慧救济场景的重要方面。 智慧救济场景示例图 本赛项为“智慧救济挑战赛”,正是将深度学习技术与四足机器狗相结合,将来自产业一线的“智慧救济”场景,提炼为国赛赛题,要求选手利用百度飞桨PaddlePaddle深度学习平台及宇树四足机器狗,打造面向简单环境的智能救济抢险机器狗,通过比赛来考评搭载飞桨深度学习框架的机器狗在简单环境下的智能感知能力及综合静止性能。 赛道工作较量分为校赛、省赛和国赛阶段。在校赛阶段(2月-4月),为线上打榜赛;在省赛阶段(4月-5月),分为线上打榜赛和线下地图赛;在总决赛阶段(6月-8月),为线下地图赛。 线上打榜赛,要求参赛者基于飞桨PaddlePaddle,利用企业提供的训练数据,实现一个可能对抢险救灾主题元素进行准确辨认的深度学习模型。最终,选手需上传训练模型和预测代码,以zip模式的压缩包,提交至AI Studio平台进行主动评测,失去分数。线下地图赛,要求参赛者搭载飞桨PaddlePaddle框架的宇树科技机器狗Go 1,在规定地图中实现若干工作,且确保工夫较短。参赛对象参赛对象为中国境内高校2023年在籍的所有本科生(含港、澳、台学生及留学生)。团队成员为1~5名,领导老师不多于2人。 高校资助政策面向全国高校,百度飞桨联结中国四足机器狗畛域的领军企业宇树科技,提供不少于150台机器狗的收费借用,助力中国高校学子科技实际程度的晋升及AI人才培养。 对于校赛人数大于300人的高校,官网将为该校冠军团队和校赛组织工作的负责人,别离提供一台宇树机器狗一学期的收费借用权(3月至9月) ,供参赛、科研及日常教学/流动等应用 ( 共计两台) !少于300人的高校,将并入全国范畴的成绩表进行排名,依据线上打榜赛问题,向规定比例内的团队收费借用一台宇树机器狗,供团队加入省赛及国赛地图赛。 校赛组织者请与官网分割,除了沟通机器狗申请事宜,无论校赛人数多少,飞桨AI Studio都将提供该校校赛的报名、问题评测及导出工作,助力高校通过线上打榜赛进行校赛提拔工作。请点击下方链接,填写中国计算机设计大赛校赛反对注销问卷: 中国计算机设计大赛校赛反对注销问卷https://iwenjuan.baidu.com/?c... 往届优良教程 《第十五届中国计算机设计大赛智慧导盲组基线零碎》3.4K Forkhttps://aistudio.baidu.com/ai... 《从入门到部署全流程剖析》53 Forkhttps://aistudio.baidu.com/ai... 《从0到1教会修狗走路》220 Forkhttps://aistudio.baidu.com/ai...

February 14, 2023 · 1 min · jiezi

关于paddle:文心ERNIE-30-Tiny新升级端侧压缩部署小-快-灵

大家好,明天带来的是无关文心ERNIE 3.0 Tiny新降级内容的文章。 近年来,随着深度学习技术的迅速倒退,大规模预训练范式通过一次又一次刷新各种评测基线证实了其卓越的学习与迁徙能力。在这个过程中,研究者们发现通过一直地扩充模型参数便能继续晋升深度学习模型的威力。然而,参数的指数级增长意味着模型体积增大、所需计算资源增多、计算耗时更长,而这无论出于业务线上响应效率的要求还是机器资源估算问题,都给大模型落地带来了极大的挑战。让咱们一起看看文心ERNIE 3.0 Tiny如何来解决这些问题的吧! 图:模型上线时精度、时延、内显存占用等多重需要示意 如何在保障成果的前提下压缩模型?如何适配 CPU、GPU 等多硬件的减速?如何在端侧场景着落地大模型?如何让减速工具触手可及?这是行业内亟待解决的课题。2022年6月,文心大模型中的轻量化技术加持的多个文心ERNIE 3.0 Tiny轻量级模型(下文简称文心ERNIE 3.0 Tiny v1)开源至飞桨自然语言解决模型库PaddleNLP中,该模型刷新了中文小模型的SOTA问题,配套模型动静裁剪和量化推理计划,被学术与工业界宽泛应用。 近期,文心ERNIE 3.0 Tiny升级版–––文心ERNIE 3.0 Tiny v2也开源了!相较于v1,文心ERNIE 3.0 Tiny v2在Out-domain(域外数据)、Low-resource(小样本数据)的上游工作上精度显著晋升,并且v2还开源了3L128H构造,5.99M参数量的小模型,更实用于端侧等低资源场景。 同时,PaddleNLP依靠PaddleSlim、Paddle Lite、FastDeploy开源了一整套端上语义了解压缩和部署计划。通过模型裁剪、量化感知训练、Embedding量化等压缩计划,在放弃模型精度不降的状况下,推理减速2.1倍,内存占用升高62.18%(升高2.6倍),体积放大92.2%(放大12.8倍)仅5.4M。再联合高性能NLP解决库FastTokenizer对分词阶段进行减速,使端到端推理性能显著晋升,从而将文心ERNIE 3.0 Tiny v2模型胜利部署至端侧。因为端侧部署对内存占用的要求比服务端更高,因而该计划也同样实用于服务端部署。 图:端侧设施示意 文心 ERNIE 3.0 Tiny v2开源百度文心大模型团队在2021年底公布了百亿级别大模型文心ERNIE 3.0和千亿级别的大模型文心ERNIE 3.0 Titan。为了让大模型的能力可能真正在一线业务施展威力,文心大模型团队推出多个轻量级模型,即文心ERNIE 3.0 Tiny系列,刷新了中文小模型的问题。除了在GPU上,这些模型也能在CPU上轻松调用,极大拓展了大模型的应用场景。本次开源的文心ERNIE 3.0 Tiny v2,使老师模型事后注入上游常识并参加多任务训练,大大提高了小模型在上游工作上的成果。 多任务学习晋升泛化性文心ERNIE 3.0 Tiny v1间接通过在线蒸馏技术将预训练大模型压缩成预训练小模型。在此基础上,文心ERNIE 3.0 Tiny v2 首先在多个上游工作中微调老师模型,让老师模型学习到上游工作相干常识,并将这些常识通过蒸馏的形式传导给学生模型。只管学生模型齐全没有见过上游数据,也可能蒸馏获取到上游工作的相干常识,进而使上游工作的成果失去晋升。因为老师模型是在多任务上进行微调的,多任务学习带来的强泛化性也能传递给学生模型,从而晋升小模型的泛化性,最终取得的学生模型相比文心ERNIE 3.0 Tiny v1在Out-domain和Low-resource数据集上取得大幅晋升。图:文心ERNIE 3.0 Tiny v2示意 文心ERNIE 3.0 Tiny v2 蕴含一系列不同尺寸的中文预训练模型,不便不同性能需求的利用场景应用: 文心ERNIE 3.0 Tiny-Base-v2 (12-layer, 768-hidden, 12-heads)文心ERNIE 3.0 Tiny-Medium-v2 (6-layer, 768-hidden, 12-heads)文心ERNIE 3.0 Tiny-Mini-v2 (6-layer, 384-hidden, 12-heads)文心ERNIE 3.0 Tiny-Micro-v2 (4-layer, 384-hidden, 12-heads)文心ERNIE 3.0 Tiny-Nano-v2 (4-layer, 312-hidden, 12-heads)文心ERNIE 3.0 Tiny-Pico-v2 (3-layer, 128-hidden, 2-heads)除以上中文模型外,本次还公布了英文版文心ERNIE 3.0 Tiny-Mini-v2,实用于各类英文工作。多任务学习的能力加持下,在文本分类、文本推理、实体抽取、问答等各种 NLU 工作上,文心ERNIE 3.0 Tiny v2相比文心ERNIE 3.0 Tiny v1在Out-domain、Low-resource数据上均取得显著的成果晋升,在In-domain上也有肯定晋升。 ...

February 14, 2023 · 2 min · jiezi

关于paddle:10w训练标签成本太高PaddleNLP情感分析赋能消费回暖

随着餐饮行业进入线上线下、堂食外卖并重的“双主场”时代,面对铺天盖地的用户评论数据,如何用数字化伎俩优化经营成为餐饮企业降本增效的要害。明天带来的分享案例是黑蚁资本如何借助PaddleNLP情感剖析技术开发了用户评论洞察零碎,实现降本增效的例子。一起来看看吧! 黑蚁资本,是一家来自上海的深耕生产畛域投资的企业,成立之初就信心让“投后服务”成为机构的外围能力之一,而“数字化”正是黑蚁服务被投企业的重要内容。为了帮忙被投企业晋升评估数据的解决效率,黑蚁投后数字化团队基于PaddleNLP情感剖析技术,开发了用户评论洞察零碎,帮忙品牌高效深刻理解用户反馈,主动抽取出高价值信息,实现量化统计分析,从而升高经营老本,优化产品和服务,晋升市场竞争力。 据悉,情感剖析技术(Sentiment Analysis Technology)是一种以后风行的旨在对带有情感色调的主观性文本进行剖析、解决、演绎和推理的技术,在生产决策、舆情剖析、个性化举荐等畛域都领有宽泛的利用前景。 情感剖析示意图 初衷:想以更低成本,凝听用户声音正如哈勃望远镜,哈勃舆情取“哈勃”二字是心愿通过工具看见他人所看不到的货色,其开发的最后灵感来源于黑蚁投后团队对生产行业数字化的洞察。 2021年初,黑蚁资本经营董事Jeru刘湛率领黑蚁投后数字化团队在对被投品牌做调研时发现,用户的反馈对驱动产品迭代、改良服务十分重要,然而凝听用户声音的老本却很高。 Jeru介绍,过来一个品牌想获取用户评论状况,如NPS净推荐值,包含举荐志愿和复购志愿,须要通过一系列的调研剖析:请第三方公司采纳问卷调查、实地拦挡、线下采访等形式进行调研;实现调研后再找打标签的公司,人工在产品用户评论下抽取约2000条评论,在Excel表格里打标签标记。 上述这种形式存在显著的问题。一方面,调研采集到的样本的数据量无限且真实性有待考据,大大影响后续剖析的客观性和准确性;另一方面,人工打标签的形式不仅标注不对立,主观性强,而且操作老本十分高。 Jeru回顾到,过后市场上大多数的产品只是单纯用古老的技术做评论剖析,精准度和精密度并不是很高。他就思考,如何将用户评论洞察自动化,让非结构化的评论数据变成结构化的数据呢?因为只有结构化的数据才不便量化统计分析,使经营者更直观快捷地理解用户,取得迷信的指引,从而实现精准的产品经营决策。 瓶颈: PaddleNLP解研发当务之急在通过半年的市场调研后,Jeru迅速组织技术专家投入到研发中,在团队共同努力下,历经两年工夫,黑蚁终于自主研发出用户评论洞察零碎哈勃舆情,截止到目前,黑蚁曾经公布了30多个零碎版本,基本上每周都会更新迭代一次。 哈勃舆情相似于一个智能化“顾客情感温度计”,它能从不同的维度来感知顾客在不同指标上的情绪并进行剖析,比方,用户会对某一种品牌的评估常常提到某一项(提及率,代表用户的心智),在一句评论中可能会表白多个“观点”,这些“观点”往往蕴含三要素:维度、观点词、情感。维度个别是名词(比方菜品、价格),观点词个别是形容词(比方辣、丰盛),两者合在一起表白的是一种某货色怎么样的观点,哈勃舆情能够判断顾客所表白观点情感是正向还是负向,最初将情绪指标得分以量化的模式出现给经营管理者,从而帮忙品牌商找到问题。 哈勃舆情零碎图研发过程并非一帆风顺。哈勃舆情刚开始研发模型做情感预测时,他们只能判断整句评论(粗粒度)的好坏,而无奈对多观点独立(细粒度)做预测情感,以致情感预测论断数据准确率不高,研发进入了瓶颈。 2022年5月,一次偶尔的机会,Jeru在GitHub上看到PaddleNLP开源了通用信息抽取技术UIE,他过后感觉UIE非常适合哈勃舆情的研发,或者能够解决困扰他们已久的难题。 据理解,UIE是一个大一统诸多工作的凋谢域信息抽取技术计划,创始了基于Prompt的信息抽取多任务对立建模形式。PaddleNLP联合文心大模型中的常识加强NLP大模型文心ERNIE 3.0,施展了UIE在中文工作上的弱小后劲,推出面向通用信息抽取的产业级技术计划。 因为PaddleNLP在情感剖析能力上体现优异,可能实现波及句子级情感极性分类、属性抽取、观点抽取、属性级情感极性分类等多项情感工作,并提供可视化能力,帮忙用户疾速剖析业务数据,这极大帮忙了黑蚁投后数字化团队开发哈勃舆情,也帮他们节俭了大量的训练老本。 “没有呈现通用模型之前,开发者须要分行业去训练模型,要晓得一个行业要用到10万以上量级的标签来训练模型,才会获得比拟好的成果。”Jeru感叹到训练老本太高。 Jeru进一步解释说,在预训练大模型进去之前,传统的技术计划下,简直所有的NLP公司都偏向于找打标签的人员通过打标签的形式来训练本人的模型。但有了预训练大模型后,整个行业的玩法产生了扭转。当初大家只须要应用一个通用的大模型,无需标注,或仅需大量标注,就能对独立观点进行精准情感预测,这样就极大升高了开发成本。同时基于UIE的技术计划不限定行业畛域和抽取指标,可零样本疾速冷启动各类信息抽取工作,加上强悍的小样本微调能力,使得观点抽取查全率与精准率大幅晋升。 具体来说,在UIE-base和fp32精度下,相较人工至多须要一天工夫来统计1000条样本的状况,该零碎的细粒度抽取观点效率约为30条/分钟,粗粒度情感断定约为135条/分钟,通过行业微调后的数据准确率达到了85%以上。 终极:心愿以交互方式答复人类问题据理解,哈勃舆情零碎不仅供黑蚁的投资团队用于行业剖析报告钻研,还帮忙黑蚁投资的诸多品牌聆听用户的声音,实现降本增效。 例如,黑蚁为被投企业某区域火锅品牌做菜品剖析时,零碎针对菜品建设专门指标体系,进行评估量化,逐月剖析菜品的变动,帮忙品牌找出了可优化的菜品,调整更新了口味、配方和原料,最终让火锅店用户对菜品的评分从60分进步到90分。 此外,黑蚁团队在发展县域中青年生产需要钻研时,将原野和定量调研回收的数据交由哈勃舆情来解决,凭借其弱小的语义解析AI模型帮忙团队更高效地理解具体品类下县域消费者心智。 对于将来的产品布局,黑蚁将花更多工夫精力针对不同行业进行样本微调,不断完善模型的辨认能力。 Jeru谈到,“咱们心愿零碎将来能以交互的形式给出答复。当我问零碎‘为什么某品牌的用户忠诚度更高‘的问题时,它不再是以词语的形式给出答案,而是以人类语言的形式组织观点,更直观地通知我答案,我认为这是一个终极。” 现在,利用人工智能技术促成经营转型曾经在生产行业取得越来越多的认可与推崇。餐饮、电商、批发……新生产浪潮下的各个品牌正在新品开发、品牌建设、销售服务等方面推动智能化降级,通过AI优化业务场景,致力与用户建设更有温度的联接,一直晋升企业的市场竞争力。 将来,飞桨将携手更多金融投资机构继续助力生产行业,在情感剖析能力方面,通过情感偏向剖析、评论观点抽取、对话情绪辨认等场景化能力,以AI技术赋能生产行业数字化转型,独特摸索“深度学习+”生产的翻新之路,为生产行业智能化降级注入更弱小能源。 参考 PaddleNLP 情感剖析计划https://github.com/PaddlePadd... PaddleNLP 我的项目地址https://github.com/PaddlePadd...

February 10, 2023 · 1 min · jiezi

关于paddle:模型推理耗时降低98PaddleTS又双叒叕带来重磅升级

大家好,飞桨时序模型库PaddleTS的重磅降级啦!明天为大家介绍带来的是PaddleTS此次降级的核心内容解读,快来看看有没有你所期待的新内容! 飞桨时序模型库PaddleTS具备对立的时序数据结构、全面的根底模型性能、丰盛的数据处理和剖析算子以及当先的深度时序算法,能够帮忙开发者实现时序数据处理、剖析、建模、预测全流程,在预测性保护、能耗剖析、价格销量预估等场景中有重要利用价值。 近期,PaddleTSv1.1版本重磅公布,带来了在模型推理、模型可解释性、新增模型算法等多方面的重要降级: 更高效的推理部署:基于Paddle Inference实现高吞吐、低时延的推理部署,MLP模型推理耗时升高98%!新增时序分类模块:笼罩更多利用场景需要,让开发者一站式解决时序分类问题!晋升模型解释能力:两种技术实现模型解释性,帮忙开发者更好了解模型后果!表征学习反对分类与聚类:针对先进的表征学习,提供即开即用的表征分类与聚类模型,进步开发效率!裁减深度学习模型:减少更多时序预测与异样检测模型,帮忙开发者摸索更多的当先模型! ⬇️GitHub 传送门 https://github.com/PaddlePadd... ⭐️欢送 Star 关注⭐️ 可利用Paddle Inference进行推理部署Paddle Inference是飞桨的原生推理库,作用于服务器和云端,提供高性能的推理能力。其针对不同平台不同的利用场景进行了深度的适配优化,提供了C、C++、Python、Golang四种API,实现做到高吞吐、低时延的推理部署。同时,通过对计算图的剖析,实现对计算图的一系列的优化,如OP的交融、内存/显存的优化、MKLDNN、TensorRT等底层减速库的反对等。 PaddleTSv1.1反对了原生飞桨Paddle Network模型的导出以及前序数据主动构建性能,实现PaddleTS模型在多零碎、多语言、多平台的适配。开发者利用Paddle Inference即可实现推理部署,减速PaddleTS模型利用的最初一公里,保障了PaddleTS模型在服务器端即训即用,疾速部署。 以MLP和Informer为例,应用Paddle Inference推理后,MLP模型推理耗时升高约98%,Informer模型推理耗时升高约50%。 直通车https://paddlets.readthedocs.... 减少时序分类模块工夫序列分类是时序预测工作中的一种,其目标是利用标记好的训练数据(每个工夫序列所属类别),预测将来工夫序列的分类,从而领导决策。工夫序列分类在一些工夫敏感的应用领域至关重要,例如衰弱信息学、异样检测、设施状态辨认等。 PaddleTSv1.1的时序分类模块,新增两个时序分类深度模型——经典的CNN以及当先的InceptionTime,同时提供ClassifyBaseModel基类,开发者可利用其构建时序分类模型。 同时,PaddleTSv1.1反对两种分类后果评估形式,既可间接应用PaddleTS中预置的accuracy_score函数,也可调用sklearn.metrics相干评估算子,实现模型分类成果的评估。 开发者能够应用PaddleTS构建时序分类模型,失去将来工夫序列的分类后果及每个分类的概率,如设施故障类型、患病类型等。也可用来辅助用于时序数据的预处理,如检测数据周期性并剔除,从而进行失常历史数据的学习或异样检测,实现预测或检测准确率的晋升。 直通车https://paddlets.readthedocs.... 晋升模型可解释能力近年来随着深度学习的倒退,深度时序模型逐渐超过了浅层模型获得了更好的成果。但深度模型因为其简单的网络结构,往往难以解释预测后果是如何产生的,给使用者带来困扰,由此,模型解释性技术应运而生。PaddleTSv1.1提供ante-hoc(模型相干)和post-hoc(模型无关)两种形式晋升模型可解释性。 ante-hoc(模型相干)ante-hoc是一种模型相干的办法,即开发者在模型设计阶段就思考了模型可解释性的问题,因而往往会设计非凡的模型构造或损失函数,便于对已训练好的模型进行评估。PaddleTSv1.1的ante-hoc模块引入了TFT模型,别离从特色权重、注意力评分角度对模型后果进行解释。 特色权重特色权重在把握模型的要害特色方面具备重要作用,特色权重越高,代表特色对预测后果的影响越大。TFT模型将时序特色能够分为动态特色、历史特色、将来特色三类,用户能够剖析不同类别下的特色权重。 注意力评分在进行工夫序列建模时,不同时刻点之间存在着肯定的相互依赖关系,自注意力机制能够最大水平上开掘任意两个点之间的关系,从而在进行时序预测时抽取强相干特色点的要害信息,使得预测更加精确。自注意力评分能够帮忙用户判断对于预测后果影响更大的工夫序列节点。以TFT模型为例,注意力评分反对从“单步多分位数预测”与“多步单分位数预测”两个角度给出注意力机制的分数权重的可视化展现,帮忙开发者更好地剖析工夫序列的周期模式。 post-hoc(模型无关)post-hoc是一种模型无关的办法,把模型视为一个黑盒,通过内部增加扰动或建设一个代理模型等办法,对已训练好的模型进行评估和解释。PaddleTSv1.1的post-hoc模块,基于SHAP办法实现了模型的特色归因,开发者仅需将模型和训练数据作为输出,即可失去不同工夫、协变量对输入后果的奉献,帮忙决策者了解模型后果、领导业务优化。 直通车https://paddlets.readthedocs.... 表征学习反对分类和聚类在历史版本中,PaddleTS提供了表征预测模型ReprForecaster,实现了表征学习和上游预测工作相结合的全流程封装,防止用户解决表征与上游工作联合的简单解决流程,在解决表征预测问题的同时升高开发者应用门槛,真正实现了模型的即开即用。 PaddleTSv1.1减少了表征分类模型ReprClassifier和表征聚类模型ReprCluster,针对时序分类和时序聚类问题也能够实现表征学习的疾速利用。 直通车https://paddlets.readthedocs.... ❤️以上就是本次PaddleTSv1.1降级的外围性能解读,更多新性能可点击下方链接查看,欢送大家踊跃试用。 PaddleTSv1.1性能概览https://github.com/PaddlePadd... 相干链接 我的项目GitHubhttps://github.com/PaddlePadd... 我的项目文档https://paddlets.readthedocs.io/ GitHub Issue反馈https://github.com/PaddlePadd...

February 10, 2023 · 1 min · jiezi

关于paddle:C到Python全搞定教你如何为FastDeploy贡献代码

大家好!明天为大家带来的是一篇教训帖文。本次分享的主人公是黑客松较量参赛者郑必城,他将为大家带来比赛项目“No.80瑞芯微RK3588:通过Paddle2ONNX买通5个飞桨模型的部署中如何为FastDeploy”工作中的一些心得体会,快来看看他是如何为FastDeploy奉献代码的吧!
RKNPU2是瑞芯微Rockchip推出的针对RK356X/RK3588/RV1103/RV1106的C++推理工具。在加入黑客松较量时,FastDeploy仓库[1]还没有集成RKNPU2的引擎。开发者须要应用RKNPU2从头编写代码。在加入完黑客松之后,我为FastDeploy仓库奉献了RKNPU2的后端推理引擎的代码,当初能间接应用FastDeploy疾速开发基于RKNPU2的代码。本次教程将以奉献SCRFD模型[2]为例,教你如何给FastDeploy奉献代码。 Zheng_Bicheng主页 https://github.com/Zheng-Bicheng No.80瑞芯微RK3588:通过Paddle2ONNX买通5个飞桨模型的部署链接 https://github.com/PaddlePadd... FastDeploy简介FastDeploy是一款全场景、易用灵便、极致高效的AI推理部署工具,提供开箱即用的云边端部署体验,反对超过150+文本、计算机视觉、语音和跨模态模型,并实现端到端的推理性能优化。其利用于图像分类、物体检测、图像宰割、人脸检测、人脸识别、关键点检测、抠图、OCR、NLP、TTS等工作,满足开发者多场景、多硬件、多平台的产业部署需要。同时,FastDeploy集成了多种后端推理引擎,其中就包含RKNPU2。开发者可能疾速基于现有的模型以及后端来进行开发。 很多开发者可能会有纳闷,为什么Rockchip提供了RKNPU2和rknn-toolkit2这两个别离面向C++和Python的推理引擎,咱们还要应用FastDeploy进行开发呢?简略来说,RKNPU2和rknn-toolkit2是推理引擎,它们侧重于推理;FastDeploy是推理部署工具侧重于部署。给RKNPU2输出一张图片,会失去一串数字。给FastDeploy输出一张图片,会间接失去通过后处理后的图片。这样就能大大减少开发者在我的项目落地过程中的一些艰难。 RKNPU2 https://github.com/rockchip-linux/rknpu2 rknn-toolkit2 https://github.com/rockchip-linux/rknn-toolkit2 奉献步骤给FastDeploy奉献代码,我个别按以下步骤进行,当然你能够依据本人的能力制订本人的开发步骤。 由上图所示,给FastDeploy奉献代码的步骤个别为编写C++代码、编写C++ example、编写Python代码、编写Python example代码、编写文档、提交PR。 奉献代码指南上面我以奉献SCRFD模型为例子,给大家具体介绍每个奉献环节中的注意事项。 转换模型不论你是在FastDeploy上开发C++还是Python的代码,转换模型都是你首先须要实现的工作。通常状况下,转换模型的工具个别应用rknn-toolkit2,然而这个工具API比拟多,用起来较为简单。为了让大家可能更疾速的转换模型,在FastDeploy中,我曾经编写了转换模型的代码并且提供了具体的文档。详情请查看FastDeploy RKNPU2模型转换文档。这里为了缩短篇幅,间接给出模型转换的配置文件以及模型转换的文档。大家能够参考这几个文档转换本人的模型。 FastDeploy RKNPU2模型转换文档 https://github.com/PaddlePaddle/FastDeploy/blob/develop/docs/cn/faq/rknpu2/export.md 模型转换的文档 https://github.com/PaddlePaddle/FastDeploy/tree/develop/examples/vision/facedet/scrfd/rknpu2 编写C++代码上文提到,SCRFD的C++代码须要在fastdeploy/vision/facedet/contrib这个目录下编写,因而我创立了scrfd.h和scrfd.cc这两个文件,实现模型具体代码。这里要留神与常见的文件命名模式不同,scrfd.cc这个C++代码文件的后缀不是 .cpp而是 .cc ,如果scrfd.cc改为scrfd.cpp将无奈胜利编译! 编写scrfd.hscrfd.h里定义了SCRFD模型的一些基本参数以及须要重定义的函数。其中定义的SCRFD模型须要继承FastDeployModel这个公共的模型类,为的是继承FastDeploy的一些公共个性。如上面的代码所示,在头文件中,咱们须要重写FastDeployModel中的以下几个函数,包含Initialize、Preprocess、Postprocess、Predict、ModelName。别离对应初始化、预处理、后处理、预测、模型名称。如果你须要残缺具体的代码,请拜访下方链接。 scrfd.h https://github.com/PaddlePaddle/FastDeploy/blob/develop/fastdeploy/vision/facedet/contrib/scrfd.h #pragma once#include <unordered_map>#include "fastdeploy/fastdeploy_model.h"#include "fastdeploy/vision/common/processors/transform.h"#include "fastdeploy/vision/common/result.h"namespace fastdeploy {namespace vision {namespace facedet {class FASTDEPLOY_DECL SCRFD : public FastDeployModel { public:  SCRFD(const std::string& model_file, const std::string& params_file = "",        const RuntimeOption& custom_option = RuntimeOption(), const ModelFormat& model_format = ModelFormat::ONNX);  std::string ModelName() const { return "scrfd"; }  virtual bool Predict(cv::Mat* im, FaceDetectionResult* result, float conf_threshold = 0.25f, float nms_iou_threshold = 0.4f); private:  bool Initialize();  bool Preprocess(Mat* mat, FDTensor* output, std::map<std::string, std::array<float, 2>>* im_info);  bool Postprocess(std::vector<FDTensor>& infer_result, FaceDetectionResult* result, const std::map<std::string, std::array<float, 2>>& im_info, float conf_threshold, float nms_iou_threshold);};}  // namespace facedet}  // namespace vision}  // namespace fastdeploy编写scrfd.ccscrfd.cc负责对在scrfd.h中申明的函数进行了实现。在编写预处理的过程中要留神,RKNPU2目前仅反对NHWC格局的输出数据,因而必须屏蔽Permute操作。我这里应用disable_permute_ 变量管制Permute操作。此外因为FastDeploy采纳的是RKNPU2的零拷贝流程来实现后端的解决和运算,因而能够思考将Normalize操作放在NPU上来做,晋升速度,我这里应用disable_normalize_ 变量管制Normalize的开关。如果须要具体的代码,请拜访以下链接。 代码链接 https://github.com/PaddlePaddle/FastDeploy/blob/develop/fastdeploy/vision/facedet/contrib/scrfd.cc #include "fastdeploy/vision/facedet/contrib/scrfd.h"#include "fastdeploy/utils/perf.h"#include "fastdeploy/vision/utils/utils.h"namespace fastdeploy {namespace vision {namespace facedet {bool SCRFD::Preprocess(Mat* mat, FDTensor* output, std::map<std::string, std::array<float, 2>>* im_info) {  return true;}bool SCRFD::Postprocess(std::vector<FDTensor>& infer_result, FaceDetectionResult* result, const std::map<std::string, std::array<float, 2>>& im_info, float conf_threshold, float nms_iou_threshold) {  return true;}bool SCRFD::Predict(cv::Mat* im, FaceDetectionResult* result, float conf_threshold, float nms_iou_threshold) {  return true;}}  // namespace facedet}  // namespace vision}  // namespace fastdeploy在vision.h中增加咱们的模型咱们编写完scrfd的代码之后,咱们还须要让FastDeploy晓得咱们曾经编写了scrfd代码,因而咱们须要在fastdeploy/vision.h文件中补充scrfd.h头文件的门路。 编译FastDeploy C++ SDK编写完C++代码后,咱们须要编译C++版本的FastDeploy。一是为了测试咱们编写的代码是否有程序上的破绽,二是为了后续编写example能够链接FastDeploy编译进去的动静库。编译的细节详情请参考FastDeploy C++代码编译指南。 FastDeploy C++代码编译指南 https://github.com/PaddlePaddle/FastDeploy/blob/develop/docs/cn/faq/rknpu2/build.md 这里间接给出编译时的命令: git clone https://github.com/PaddlePaddle/FastDeploy.gitcd FastDeploymkdir build && cd buildcmake ..  -DENABLE_ORT_BACKEND=ON \          -DENABLE_RKNPU2_BACKEND=ON \          -DENABLE_VISION=ON \          -DRKNN2_TARGET_SOC=RK3588 \          -DCMAKE_INSTALL_PREFIX=${PWD}/fastdeploy-0.0.3make -j8make install编写C++ example代码为了调试咱们曾经实现的C++代码,以及不便用户应用,在编写完上述代码之后,咱们须要编写对应example的代码来验证咱们的想法是否正确。在编写C++ example时,目录下的文件个别由infer_model_name.cc以及CMakeLists.txt组成。在CMakeLists.txt中须要对不同的infer_model_name.cc生成不同的infer_model_name程序。 编写infer.ccinfer.cc次要负责调用FastDeploy的C++代码来对SCRFD进行测试。在上文中,咱们提到vision.h能够让fastdeploy晓得咱们曾经编写了SCRFD模型。因而在编写example时,咱们只须要蕴含vision.h,即可让程序晓得,咱们曾经申明了FastDeploy所有曾经实现的视觉模型。针对RKNPU的测试,其流程个别为初始化模型,而后依据转换模型时的配置决定是否须要disable_normalize和disable_permute,随后输出测试图片,调用Predict函数进行解决,最初应用对应的可视化函数进行可视化。 #include <iostream>#include <string>#include "fastdeploy/vision.h"void RKNPU2Infer(const std::string& model_dir, const std::string& image_file) {  auto model = fastdeploy::vision::facedet::SCRFD(model_file, params_file, option, format);  model.Initialized();  model.DisableNormalize();  model.DisablePermute();  auto im = cv::imread(image_file);  fastdeploy::vision::FaceDetectionResult res;  model.Predict(&im, &res)  auto vis_im = fastdeploy::vision::VisFaceDetection(im, res);  cv::imwrite("infer_rknn.jpg", vis_im);  std::cout << "Visualized result saved in ./infer_rknn.jpg" << std::endl;}int main(int argc, char* argv[]) {  if (argc < 3) {    std::cout        << "Usage: infer_demo path/to/model_dir path/to/image run_option, "           "e.g ./infer_model ./picodet_model_dir ./test.jpeg"        << std::endl;    return -1;  }  RKNPU2Infer(argv[1], argv[2]);  return 0;}编写CMakeLists.txt编写完C++ example的代码后,咱们还须要编写CMakeLists.txt。CMakeLists.txt相当于编译时的配置文件,负责链接infer_model_name.cc和FastDeploy的动静库,并且把模型推理须要用到的货色集成在install目录下。 CMAKE_MINIMUM_REQUIRED(VERSION 3.10)project(rknpu_test)set(CMAKE_CXX_STANDARD 14)# 指定下载解压后的fastdeploy库门路set(FASTDEPLOY_INSTALL_DIR "thirdpartys/fastdeploy-0.7.0")include(${FASTDEPLOY_INSTALL_DIR}/FastDeployConfig.cmake)include_directories(${FastDeploy_INCLUDE_DIRS})add_executable(rknpu_test infer.cc)target_link_libraries(rknpu_test ${FastDeploy_LIBS})编写Python代码Python代码的编写次要包含pybind文件的编写以及py本体文件的编写。上文提到,在FastDeploy中,python代码通过调用pybind暴露出的C++ API来进行工作,因而咱们首先须要编写pybind.cc。 编写scrfd_pybind.ccpybind.cc次要负责提供可用的API给Python调用。scrfd_pybind.cc中对SCRFD C++的代码进行了裸露,代码如下: #include "fastdeploy/pybind/main.h"namespace fastdeploy {void BindSCRFD(pybind11::module& m) {  // Bind SCRFD  pybind11::class_<vision::facedet::SCRFD, FastDeployModel>(m, "SCRFD")      .def(pybind11::init<std::string, std::string, RuntimeOption,                          ModelFormat>())      .def("predict",           [](vision::facedet::SCRFD& self, pybind11::array& data,              float conf_threshold, float nms_iou_threshold) {             auto mat = PyArrayToCvMat(data);             vision::FaceDetectionResult res;             self.Predict(&mat, &res, conf_threshold, nms_iou_threshold);             return res;           })      .def("disable_normalize",&vision::facedet::SCRFD::DisableNormalize)      .def("disable_permute",&vision::facedet::SCRFD::DisablePermute);}}  // namespace fastdeploy在facedet_pybind.cc中增加申明和在vision.h文件中增加申明一样,在编写完pybind代码之后,咱们还须要在fastdeploy/vision/facedet/facedet_pybind.cc中增加申明。目标是通知编译器咱们曾经编写了pybind的代码,并且在编译Python时请把咱们的代码加上。外围代码如下: #include "fastdeploy/pybind/main.h"namespace fastdeploy {void BindSCRFD(pybind11::module& m);void BindFaceDet(pybind11::module& m) {  auto facedet_module = m.def_submodule("facedet", "Face detection models.");  BindSCRFD(facedet_module);}}编写scrfd.py编写完pybind.cc后,咱们还须要编写对应的py文件调用pybind裸露进去的C++ API。代码如下 from __future__ import absolute_importimport loggingfrom .... import FastDeployModel, ModelFormatfrom .... import c_lib_wrap as Cclass SCRFD(FastDeployModel):    def __init__(self,                 model_file,                 params_file="",                 runtime_option=None,                 model_format=ModelFormat.ONNX):        super(SCRFD, self).__init__(runtime_option)        self._model = C.vision.facedet.SCRFD(model_file, params_file, self._runtime_option, model_format)        assert self.initialized, "SCRFD initialize failed."    def predict(self, input_image, conf_threshold=0.7, nms_iou_threshold=0.3):        return self._model.predict(input_image, conf_threshold, nms_iou_threshold)编译FastDeploy Python SDK编写example之前咱们必定须要编译Python版本的FastDeploy代码,请参考FastDeploy RKNPU2编译指南编译Python版本的FastDeploy。 FastDeploy RKNPU2编译指南 https://github.com/PaddlePaddle/FastDeploy/blob/develop/docs/cn/faq/rknpu2/build.md 这里给出我常常应用的编译命令: cd FastDeploycd pythonexport ENABLE_ORT_BACKEND=ONexport ENABLE_RKNPU2_BACKEND=ONexport ENABLE_VISION=ONexport RKNN2_TARGET_SOC=RK3588python3 setup.py buildpython3 setup.py bdist_wheelcd distpip3 install fastdeploy_python-0.0.0-cp39-cp39-linux_aarch64.whl编写Python example代码为了调试咱们曾经实现的Python代码,以及不便用户应用,在编写完上述scrfd代码之后,咱们须要编写对应example的代码来验证咱们的想法是否正确。在编写Python example时,目录下的文件个别由infer_model_name.py组成。 ...

February 10, 2023 · 1 min · jiezi

关于paddle:让未来照进现实人工智能科学计算

作为首个“人机共创大会”,百度Create AI开发者大会(下称“Create大会”)利用AIGC(利用AI技术主动生成内容的生产方式)技术,发明、搭建、连贯了多个科技感爆棚的数字化演讲场景。Create大会每年都会吸引寰球开发者关注,不仅仅是中国的AI技术洼地,也是寰球新兴技术产业倒退的“风向标”。 大会中,百度创始人、董事长兼CEO李彦宏、百度CTO王海峰先后发表主题演讲。李彦宏率先解密“增长从何而来”,王海峰提出人工智能倒退进入“深度学习+”阶段。 此外,百度最强科技天团携十大“黑科技” 重磅亮相。九位科技大咖分享了百度在人工智能、主动驾驶、智能交通、智能搜寻、量子计算、人工智能科学计算等畛域的最新进展与思考。会上,百度卓越架构师胡晓光以《让将来照进事实:人工智能科学计算》为主题进行了分享。 分享实录全文1740字预计浏览5分钟 我是“百度技术”解说人胡晓光,我将为大家解说飞桨平台如何践行基础科学、根底钻研和底层技术的百度两基一底理念。量子计算的倒退,离不开人工智能技术的翻新利用,除了撑持量子计算这样的前沿畛域向产业化迈进,人工智能也同样帮忙许多畛域的科学家们减速科学研究的过程,这就是人工智能科学计算,英文叫AI for Science。AI正逐步利用在物理问题的求解与发现中。 工程制作畛域比方在工程制作畛域,AI能够用来减速飞行器和汽车的气动形状设计,用来预测及预防摩天大楼、跨海大桥等大型工程设施在台风等极其天气下的振动。 气象畛域在气象畛域,AI能够实现更快更精准的数值天气预报,包含预测强对流天气的短时邻近降水状况和揭示大尺度的台风造成和演变法则。 生命科学畛域在生命科学畛域,传统的科研办法面临生物类型试验数据少、计算工作简单、学科穿插多等挑战,而随着AI利用摸索的继续推动,AI已逐步在药物筛选、药物设计、靶点钻研、合成生物学、疾病机理钻研等方面实现落地和继续的提高。咱们能够看到人工智能科学计算,目前正处于从宽泛科研翻新逐渐走向规模化产业利用的阶段。AI for Science为解决迷信问题带来新办法的同时,也对人工智能根底软硬件和科研生态带来诸多新挑战。 首先,对迷信问题机理化的摸索,须要深度学习平台可能具备更加丰盛的各类计算表达能力,如高阶主动微分、复数微分、高阶优化器等;其次,迷信问题的求解往往须要超大规模的计算,这对深度学习平台与异构超算/智算核心适配及交融优化,神经网络编译器减速和大规模分布式训练提出了新的要求;此外,如何实现人工智能与传统科学计算工具链的协同,也是须要解决的问题。AI for Science作为一种新的科研范式,充分体现了AI与基础学科的穿插交融,这须要大量的跨畛域科研人才,造成稳固、优质的科研生态,来减速AI for Science的技术创新与利用落地。在根底软硬件层面,飞桨作为国内首个自主研发、功能丰富、开源凋谢的产业级深度学习平台,研发了通用高阶主动微分、神经网络编译器和大规模分布式计算等核心技术。深度适配超算、智算的异构算力,撑持AI办法与基础学科办法穿插交融,能够冲破基础学科中“管制方程数值求解”时所面临的维数高、计算量大等挑战,实现数据和物理机理驱动的微分方程疾速智能求解和跨尺度模仿仿真。针对科学计算问题的定义与求解,飞桨既提供灵便、高效的深度学习框架,反对开发者通过调用框架提供的根底开发接口,实现自定义物理方程、模型组网、仿真计算等过程;同时飞桨也提供了多畛域的工具组件,反对开发者通过调用工具组件提供的高层开发接口,实现物理问题求解。咱们公布了赛桨PaddleScience、螺旋桨PaddleHelix、量桨Paddle Quantum等科学计算开源工具组件。科学计算开源工具组件反对简单形状障碍物绕流、构造应力应变剖析、资料分子模仿等丰盛畛域算例,广泛支持AI加计算流体力学、生物计算、量子计算等前沿方向的科研摸索和产业利用。在科研生态层面,飞桨曾经与高校、科研机构等发展了计算流体力学、分子动力学、能源气象学等方面的范例建设,并造成了一些开放性的、多学科穿插的生态社区,包含飞桨非凡兴趣小组(PPSIG)、共创打算等,咱们也十分期待和各方一道进行技术联合开发、推广资源共享,生态商机共建。

February 8, 2023 · 1 min · jiezi

关于paddle:FastDeploy全场景高性能AI部署工具加速打通AI模型产业落地的最后一公里

碎片化。在部署过程中,因为深度学习框架、硬件与平台的多样化,开源社区以及各硬件厂商存在大量扩散的工具链,很难通过一款产品,同时满足开发者在服务端、挪动端和边缘端,以及服务化场景部署的需要。老本高。这与部署工具链碎片化的现状相干。开发者在不同推理引擎、不同硬件上部署的流程、代码API状态和体验都不尽相同,这带来了很高的学习老本。速度慢。部署中最大的问题是如何将模型在特定的硬件上实现高性能的优化。只管以后模型套件提供各种轻量级的模型,或开源社区各类推理引擎一直优化模型的推理速度。但在理论部署中,开发者更关注的是模型端到端的优化,包含预处理减速、模型压缩、量化等等。而目前的推理产品都短少这种端到端的体验。因而飞桨全新公布新一代部署产品——FastDeploy部署工具,为产业实际中须要推理部署的开发者提供最优解。 目前FastDeploy底层蕴含了飞桨的推理引擎、开源社区硬件厂商的推理引擎,联合飞桨对立硬件适配技术能够满足开发者将模型部署到支流AI硬件的需要。模型压缩与转换工具使得开发者通过对立的部署API实现多框架模型的推理,同时,飞桨自研的PaddleSlim为大家提供更易用、性能更强的模型自动化压缩性能。而在对立的部署API之上,咱们还提供了丰盛的多场景部署工程,满足开发者对于服务端、挪动端、网页端的端到端部署需要。FastDeploy三大特点:作为全场景高性能部署工具,FastDeploy致力于打造三个特点,与上述提及的三个痛点绝对应,别离是全场景、简略易用和极致高效。 01 全场景全场景是指FastDeploy的多端多引擎减速部署、多框架模型反对和多硬件部署能力。 多端部署FastDeploy反对模型在多种推理引擎上部署,底层的推理后端,包含服务端Paddle Inference、挪动端和边缘端的Paddle Lite以及网页前端的Paddle.js,并且在下层提供对立的多端部署API。这里以PaddleDetection的PP-YOLOE模型部署为例,用户只须要一行代码,便可实现在不同推理引擎后端间的灵便切换。应用Paddle Inference部署: import fastdeploy as fdimport cv2im = cv2.imread("test.jpg")# 通过RuntimeOption配置后端option = fd.RuntimeOption()option.use_paddle_infer_backend()# 加载飞桨PPYOLOE检测模型model = fd.vision.detection.PPYOLOE(“model.pdmodel”, “model.pdiparams”, “infer_cfg.yml”, runtime option=option)result = model.predict(im)应用OpenVINO部署: import fastdeploy as fdimport cv2im = cv2.imread("test.jpg")# 通过RuntimeOption配置后端option = fd.RuntimeOption()option.use_openvino_backend()# 加载飞桨PPYOLOE检测模型model = fd.vision.detection.PPYOLOE(“model.pdmodel”, “model.pdiparams”, “infer_cfg.yml”, runtime option=option)result = model.predict(im)多框架反对在多框架模型部署的反对上,FastDeploy集成了X2Paddle和Paddle2ONNX两款模型转换工具。截至目前,飞桨的转换工具反对多种深度学习框架及ONNX的替换格局。在百度公司外部以及开源社区,咱们反对了不同畛域300多种模型的转换,目前也在依据用户的需要继续迭代。在FastDeploy1.0正式版本中,飞桨对立了模型转换的性能入口。开发者只须要一行命令就能够实现其余深度学习框架到飞桨的转换,以及飞桨模型与ONNX替换格局的互转,帮忙开发者应用FastDeploy疾速体验飞桨的模型压缩,以及推理引擎端到端的优化成果。 多硬件适配飞桨硬件适配对立计划在多硬件适配上,FastDeploy基于飞桨硬件适配对立计划进行扩大,实现最大化AI模型部署通路。最大化AI模型部署通路在最新版本中,FastDeploy和英特尔、英伟达、瑞芯微和GraphCore等硬件厂商实现了硬件适配。期待更多硬件生态搭档应用FastDeploy拓展更多畛域,实现更多模型的端到端推理部署。 02 简略易用FastDeploy提供支流产业场景和SOTA模型端到端的部署,以及多端部署的对立开发体验。在FastDeploy的部署套件中,飞桨提供笼罩20多个支流AI场景,以及150多个SOTA产业模型的端到端部署示例,让开发者从场景动手,疾速通过自行训练或预训练模型实现部署工作。Python部署: import fastdeploy.vision as visionmodel = vision.detection.PPYOLOE(“model.pdmodel”, “model.pdiparams”, “infer_cfg.yml”)result = model.predict(im)C++部署: #include “fastdeploy/vision.h”namespace vision = fastdeploy::vision;int main(int argc, char* argv[]) { ... auto model = vision::detection::PPYOLOE(“model.pdmodel”, ”model.pdiparams”, ”infer_cfg.yml”) vision::DetectionResult result; model.Predict(image, &result); ...在开发体验上,FastDeploy从对立的角度设计了部署的API,确保在不同端和不同开发语言下,开发者可能领有对立的开发体验,并且应用尽可能少的代码实现模型端到端的高性能推理。 ...

February 1, 2023 · 1 min · jiezi

关于paddle:银行智能案防以AI技防堵住违规漏洞

全面防备和化解危险是银行永恒的主题。据银保监会统计,2022年银保监系统对银行业机构共开出2223张罚单,罚没金额达约15.85亿元,其中波及内控有余的违规成重灾区。例如,某农信社员工擅自转走储户贷款上千万元,被判处无期徒刑,银行被罚款数十万元。相似这样的守法案件在银行零碎虽非频发,但一旦产生,就会给银行造成微小的经济和名誉损失。 银行案防监督难,如何防备危险?为了预防相似案件,现阶段银行案防管控次要采取预先抽检的“人防”形式,即通过视频抽检进行日常监督,或是案发之后进行视频取证。但这种办法存在的较大问题是无奈做到全面实时的监管。以某城商行为例,该行有近500个网点,均匀每个网点有60个左右的摄像头,每日产生的视频时长为720,000小时,如此宏大的数量,如果投入人力去做监督,银行至多须要装备百人级的专岗团队能力实现,对银行来说,这无疑是一件投入产出比极低的事件。预先抽取还存在其余弊病。如发现违规事件时可能是一周、数月之后了,此时损失曾经产生。另外,因为人情和人的懈怠性等因素,监管容易流于形式,一些有侥幸心理的员工,感觉有破绽可钻,就容易逼上梁山。因此,银行内控形式从事后核查转变成事先预防、事中实时监测对于银行案件防控和化解系统性危险具备重大意义。自2020年起,银保监会就出台了一系列监管文件,要求银行业金融机构要增强现金管理,摸索利用技术手段,严防现金管理畛域违法犯罪行为。在“强监管、严问责”的政策指引下,银行案防管控工作被晋升到更为重要的议程。2020年,中国银保监会出台《对于预防银行业保险业从业人员金融违法犯罪的领导意见》 4个“数字员工”当起银行智防监督员基于对银行业务场景的粗浅洞察,专一于人工智能在行业中落地的四川仕虹腾飞信息技术有限公司(简称仕虹腾飞)研发团队于2018年开始,历经两年工夫,终于研发出了“银行数字员工零碎”。该零碎采纳端边云对立调度的设计方案,通过计算机视觉、行为辨认技术,将银行业务零碎与视频监控零碎进行交融剖析,开发了200+个算法模型,面向银行的不同业务场景分类,打造了现金督察员、服务质检员、交易复检员、厅堂助手4个“数字员工”,其模型均匀准确率达95%,为银行案件预防提供了高效的技术手段,帮忙银行实现全面、实时、事先的监督剖析。银行数字员工零碎图目前该零碎曾经在省级农信社、城商行、法人联社等5家银行、200多个网点胜利实现落地和利用。2022年6月,银行数字员工零碎在四川省科技厅受权的第三方机构组织的科技成果评估报告中,取得了国内领先水平的评估。据仕虹腾飞的研发经理胡雷介绍,银行数字员工零碎上线后,为银行的案防管控工作带来了显著晋升,开辟了银行智能案防的新模式: 以前银行几日才发现问题,当初10秒钟内就能生成一条预警信息,1分钟就能够做出反馈处理;以前上百人能力做到全面监控,当初只需2人就能实现数千路的视频监控工作;以前抽检只笼罩10%问题,当初能笼罩90%以上问题,还更精确;以前人看视频,带有主观性,难以发现一些轻微破绽,当初AI联合业务后,能够提取更多细节,将违规事件扼杀在摇篮里。胡雷谈到,“咱们心愿用最新的技术和行业教训,开发出银行真正须要的产品。银行数字员工零碎解决了银行在智能案防畛域从无到有的问题。因为零碎笼罩了银行的监控场景和全流程,做到7*24小时不停机,这种技防辅助人防的形式,彻底改变了银行内控监督形式,齐全能执行银行次要的监督工作,包含卡把、加钞、查库、交易过程、人员违规行为等,有助于全面晋升银行危险防控的能力,推动银行案件管控走向智能化。” 金融专家跨界AI借飞桨开发银行内控零碎专家经验胡雷自身经验比拟传奇,算是金融“科班出身”跨界到AI畛域的专家。2012年,胡雷从德国柏林工业大学经管类业余毕业后,一开始从事的经济财务方面工作,能够说「和技术一点关系都没有」,直到2015年,他在一家跨国公司做IT项目经理,因工作须要用到IT,他便决定自学计算机前后端、数据库、服务器技术。2018年底,一次偶尔机会,他加入了百度飞桨组织的AI快车道流动,接触到了飞桨,从那时起在飞桨的学习与实训社区AI Studio上进行学习,加入了50项课程后开始入门AI,并迅速成长为AI技术专家。跨行业背景让胡雷率领团队既能迅速捕捉到金融行业痛点,又能提出切实的技术解决方案。回顾其研发历程,胡雷感叹到每个环节都曾遇到不同水平的挑战。比方,AI模型和理论我的项目预期有差距,如何让算法模型上线后能获取更高的检出率、准确率指标,让客户更称心?如何让模型在低成本模式下进行复用?如何让模型更具鲁棒性去适应金融业务的不同场景?当然,更大的挑战还在于对于仕虹腾飞这样的小守业团队来说,仿佛并没有太多精力去开发每一个所需的工具。 抉择飞桨在屡次尝试比照后,他们看中了飞桨的PaddleDetection、PaddleVideo开发套件。作为计算机视觉畛域的利用工具,飞桨PaddleDetection、PaddleVideo体现优异。在视频间断帧中,基于间断帧判断的PaddleVideo适宜对人员的违规行为进行辨认;而PaddleDetection具备丰盛的模型和参数,不便调节参数,优化网络结构以及工程化部署,在动态帧高精度辨认的根底上反对不同跟踪算法,切入到不同的简单业务场景。同时,应用飞桨也合乎银行基础设施国产化的思路。这里延长一个计算机视觉的概念。计算机视觉是一种让机器代替人眼“看”世界取得图像的一种技术。其中指标检测和视频辨认与定位是计算机视觉畛域使用的关键技术,飞桨为计算机视觉开发者提供了方便快捷的模型套件。PaddleDetection是飞桨提供的端到端指标检测开发套件,不仅笼罩了支流的全系列通用指标检测算法,还笼罩旋转框检测、小指标检测、实例宰割、关键点检测、指标追踪、行人剖析、人脸检测、车辆剖析、静止剖析等垂类工作,能够帮忙开发者搭建出各种检测模型,高质量实现各类指标检测工作。PaddleVideo是飞桨开源模型库PaddleCV里提供的视频辨认与定位工具集,能帮忙开发者解决动作辨认/视频分类、指标追踪、视频-文本学习、视频宰割等方面的模型配置与训练难题,可广泛应用到工业、体育、医疗、媒体、平安等诸多畛域。 开发过程开发过程中,胡雷的研发团队将好用易用的飞桨套件工具与公司自研的AI中枢平台联合,使得视频流从摄像头解码,到实现图像预处理、模型推理、逻辑解决等全流程,都能在GPU中并行流转解决,且局部流程解决性能快至毫秒级。胡雷进一步解释,传统安防视频监控是一个动态视频帧所失去的动态图像,数字员工零碎因为对接银行的外围业务零碎,能统计传统安防的检测后果,同时收集多维度信息,造成间断视频帧;而后,通过自研的规定引擎对环境、动作行为、流程等进行场景化辨认检测,从而推导出检测指标在办理业务的属性,最终将长达几分钟的视频形象进去,提取相干的工夫、身份、环境等结构化的信息,失去是否违规的后果,以供银行监督人员判断和决策。比方,在交易监控场景中,零碎上线运行之后,在柜员办理交易的过程中,零碎会依据事后配置的须要监控的交易类型,对满足条件的交易按设定的模型进行危险探测,监测现场是否有现金、受权人员是否到位、客户是否在现场、资金快进快出、同一人员到不同网点高频交易等状况。一旦满足预警条件,零碎就会向平台实时推送预警信息,监管人员能够通过平台实时、精准、快捷的调取该笔交易的录像进行危险确认。据理解,胡雷退出百度飞桨AI Studio社区后,当了成都领航团的团长,2020年加入了百度AICA首席AI架构师培训。在与飞桨的更多接触和沟通中,仕虹腾飞与百度建设了更为亲密的单干关系。2021年,仕虹腾飞正式退出飞桨技术合作伙伴打算。在飞桨助力下,置信仕虹腾飞凭借本身的研发实力和金融行业的积淀,将一直深耕开辟金融科技市场,赋能金融行业智能化降级。

January 31, 2023 · 1 min · jiezi

关于paddle:飞桨时序建模库PaddleTS及产业应用实践

工夫序列:一种普遍存在的数据状态家喻户晓,工夫序列是一种普遍存在的数据状态,与咱们的日常生活及生产流动密切相关。如:股票指数、原油价格等金融市场数据;温度、湿度等天气数据;振动、转速等工业设施运行工况数据;以及电力负荷、新能源发电功率等电力数据;还有与咱们身材相干的血压、心率、血氧饱和度等衰弱监测数据,都属于工夫序列数据。概括起来,工夫序列能够被定义为一组或多组按产生工夫排列的随机变量。时序数据如此广泛,时序建模也始终都是诸多畛域所关注的重点问题。简言之,人们心愿在对历史数据进行深入分析的根底上预知数据将来的走势,并依据预测后果来影响或扭转决策。对时序数据进行钻研通常波及以下三类工作: 缺失值解决、异样值解决、归一化等数据处理工作;时域剖析、频域剖析、时序合成等数据分析工作;时序预测、时序异样检测、时序分类、时序聚类等建模工作;一个典型的时序利用场景,往往须要综合利用这些时序技术,能力无效解决问题并达到预期成果。 技术升级:深度学习推动时序建模进入新倒退阶段简略回顾一下时序技术的倒退历程,能够发现时序技术的演进次要经验了3个阶段。首先是从上个世纪50年代开始的统计学阶段,代表性的办法有简略滑动均匀、指数平滑、ARIMA等经典办法。从2000年开始,机器学习办法开始在时序建模中被宽泛应用,代表性的办法有XGBoost、LightGBM等Boosting Tree办法,因为其优异的成果和较好的可解释性,这类办法被很多开发者所青眼。从2017年开始,呈现了大量基于深度学习的时序建模办法。在每年人工智能畛域的顶级会议上,都会有代表性的工作被提出。比方,反对概率预测的DeepAR,具备可解释能力的Nbeats和TFT,时序表征学习TS2Vec和CoST等。能够看到,深度学习正在推动时序建模进入新的倒退阶段,能够无效解决多变量、非安稳、长时序等时序建模所面临的一系列技术挑战。  PaddleTS:基于飞桨的深度时序建模库为了使这些不断涌现的深度时序建模技术可能无门槛地惠及宽广行业用户和开发者,咱们打造了基于飞桨的深度时序建模算法库PaddleTS。顾名思义,这里TS就是Time Series的缩写。PaddleTS所蕴含的次要功能模块形成,如下图所示:最下方是TSDataset,它提供了对整个时序数据的对立表白,是PaddleTS各个模块最次要的数据操作对象。在TSDataset内,对不同属性、不同用处、不同类型的数据列进行辨别,不便模型算法按需对不同的数据列做不同解决。两头是一系列数据处理、数据分析、模型算法及高级建模能力相干的模块,其中模型算法以后次要包含时序预测、时序表征和时序异样检测这三类算法。最下面是流水线的反对,包含通用流水线和场景化流水线。流水线的设计,是为了满足各种十分典型的时序经营需要。 PaddleTS产品特色:简略易用、算法先进、开发者敌对在设计和开发PaddleTS的过程中,咱们始终保持3个根本准则:简略易用、算法先进以及开发者敌对,这3个准则也形成了PaddleTS的产品特色。 简略易用PaddleTS简略易用,心愿用户无门槛应用前沿的深度时序建模办法,来解决理论业务问题。为了实现这个指标,PaddleTS次要从对立时序数据结构、标准化编程接口、提供丰盛的数据处理能力动手,容许用户只编写大量代码就能够实现从数据加载到数据处理,再到建模的全过程。此外,咱们也提供了包含主动机器学习和集成学习这样的高级建模能力,这些性能能够帮忙用户获得更好的建模成果。咱们也提供了包含回测和穿插测验这样的实用工具。当然,针对所有的性能,咱们提供了十分详实的API文档和丰盛的示例教程,不便用户疾速学习并精通PaddleTS。 算法先进PaddleTS的另一特色就是算法先进。一方面咱们提供了对近几年支流深度时序算法的反对,同时通过对前沿钻研的跟踪,继续引入代表性的新算法,让用户可能在第一工夫就体验到学术界最新的算法成绩,并取得卓越的建模成果。以后PaddleTS次要反对3类深度时序模型,包含时序预测、时序表征、时序异样检测,曾经实现了10余种极具代表性的深度时序建模算法。 开发者敌对PaddleTS心愿可能继续引入前沿的模型算法来让宽广的用户受害。这个指标的实现离不开社区的积极参与。为了让社区开发者、时序技术钻研人员、行业从业人员都能够对模型算法的引入做出奉献,咱们对模型开发框架做了精心的封装,使得开发者在充沛了解算法的根底上,只须关注网络结构的实现。对于较为简单的模型,咱们也举荐进行层次化设计,比方常见的从Block到Module再到Network,这样实现的代码逻辑清晰,可读性强,也便于保护。开发者能够参考PaddleTS已有的模型实现,疾速相熟模型开发工作。 PaddleTS产业实际案例接下来咱们分享一则PaddleTS在电力行业的利用案例——电力母线负荷预测。精准的电力母线负荷预测是实现电网平安调度的重要根底。近年来,因为大量新能源发电的并网,显著增大了母线负荷的波动性,从而为电力母线负荷预测带来了新的挑战。基于对业务的深刻了解,咱们与电力调度畛域的专家一起提出了翻新的母线负荷预测技术计划,包含基于电网构造的负荷合成与重构、多变量深度时序预测技术、多母线对立建模技术以及归因剖析技术等。基于PaddleTS所提供的弱小的建模能力,通过充分利用历史负荷数据和气象预报信息、节假日信息等各类数据,实现了十分精准的预测成果,准确率超过98%。整个电力母线负荷预测零碎的投入使用也极大晋升了电网调度工作人员的工作效率,人效晋升5倍。除此之外,PaddleTS也在新能源发电功率预测、设施衰弱治理、水质预测等泛滥时序建模场景做了大量实际,均获得了很好的成果。很多来自不同行业的用户,曾经把PaddleTS用在各自的业务场景,也获得了十分不错的成果。最初,真挚心愿与宽广开发者、钻研人员、行业从业人员一起将PaddleTS建成简略易用、算法先进、成果卓越的深度时序建模库,独特促成产业数据智能倒退,迈上新的台阶。欢送退出PaddleTS社区,体验最新的产品个性。同时为PaddleTS的倒退献言献策,独特推动PaddleTS的迭代降级。PaddleTS社区网址:https://github.com/PaddlePadd...

January 31, 2023 · 1 min · jiezi