乐趣区

关于人工智能:连续霸榜丨EasyDL到底有多强

有没有需要,都能够试试 EasyDL。
近日,寰球权威咨询机构 IDC 公布调研报告显示,百度 EasyDL 再次获得亮眼问题,继间断两年位列中国机器学习平台市场份额第一之后,往年上半年持续放弃第一。
说起 EasyDL,可能公众还有些生疏。因为它尽管在人工智能(AI)的圈子里大红大紫,在机器学习的细分赛道被奉为“神器”,但对于一般公众来说,认知度不算高。
所以本文其实想答复的是两个问题,一是 EasyDL 到底是何方神圣,二是 EasyDL 为什么如此迅速的蹿红。
01.EasyDL 为什么继续霸榜
中国机器学习平台?
首先,要答复 EasyDL 为什么厉害,得先搞清楚它是个什么角色。
很多人把 AI 走进公众视线,归结为 AlphaGo 战败人类棋手,这确实没错。但这也让很多人产生一种认知,就是 AI 是遥不可及的、是人类顶尖智慧的殿堂。
某种意义上这种认识也没错,即便在区区几年、十来年前,AI 依然是最聪慧的一小群人可能应用的能力,因为它建造模型的过程十分的简单。
而 EasyDL 就像希腊神话里的普罗米修斯,盗来了天火,让每个人都能领有应用这种神奇能量的权力。
EasyDL,即 Easy Deep Learning 的缩写,简略来说,它是一个零门槛 AI 开发平台,其作用是让没有 AI 开发教训的人(并不仅仅是程序员)和有 AI 开发教训、但心愿更轻松应用 AI 能力的人,都能够便捷的应用这个平台,开发出本人须要的 AI 利用。
接下来,再解释下什么是零门槛 AI 开发平台。
东濒大西洋、大部地区丘岗起伏的美国马萨诸塞州,世界学府哈佛大学和麻省理工学院都位于该州,而驰名的全球性独立钻研、数据和咨询服务公司 Forrester,也发祥于此。低代码 / 零代码开发平台(Low-Code Development Platform)的概念,就是由 Forrester 正式提出的。
Forrester 敏锐的发现,在软件的开发过程中,有大量的工夫老本都节约在反复的性能编程上。于是,该机构在 2014 年首次提出低代码和零代码的概念——只需用很少甚至简直不须要代码就能够疾速开发出零碎,并能够将其疾速配置和部署的一种技术和工具。
看上去这是一个为 ” 懒人 ” 筹备的技术,其实,它极大的升高的不仅仅是开发的工夫,还因为可视化升高了不同需求方之间沟通的老本,所以一经问世就大红特红。
2021 年初,海内钻研机构 Infolob 示意,预计到 2022 年,低代码应用程序市场总规模达 212 亿美元;Gartner 则预测,到 2024 年,应用软件开发流动中,65% 将通过低代码形式实现。
在所有的编程工作中,为 AI 编写模型是一项难度极高的工作。因而,实现低代码化对于 AI 开发的意义并不止于降低成本,更大的意义在于,迅速地让许多没有 AI 开发能力的技术人员、甚至是非技术人员可能开发 AI 模型,迅速推广 AI 的利用。
然而,给 AI 筹备低代码开发可不仅仅像一般编程那么简略。
AI 的模型设计须要抉择模型、超参数调整、训练、部署,还须要调度 ” 云、管、边、端 ” 各方资源,还要兼顾语音、图像等异构数据的解决交互,还要适应不同的部署条件,可想而知,AI 的低代码化开发难度之大。
如果说一般编程的低代码化是让你用半成品做出一道红烧肉,那 AI 的低代码化就如同让你用半成品做出一道 ” 佛跳墙 ”。在等同的操作难度下,AI 的低代码化对后盾的要求更高。
但这挡不住人们谋求让 AI 利用开发减速进入产业界的信心,2013 年低代码工具 AutoWEKA 公布,2014 年的 ICML(国内机器学习大会)开始举办 AutoML 研讨会(AutoML 是主动机器学习的缩写,后文的 AutoDL,即主动深度学习)研讨会,AutoML 成为学术界的钻研热点之一;2018 年,谷歌将 AutoML 的概念产品化,引发产业界的全面关注。
然而,就在谷歌公布这一产品的前几个月,大洋彼岸的北京,百度于 2017 年 11 月公布了 EasyDL,百度也因而成为国内乃至寰球最早推出零门槛 AI 开发平台的公司。
其实,EasyDL 的低门槛、易用性是构建于飞桨深度学习开源平台这个松软的技术底座之上的。
如果你比较关心 AI 行业的动静,就会发现 – 在 EasyDL 获得市场份额第一的同期报告,IDC 公布的 2021 年上半年深度学习框架平台市场份额报告还显示,百度在中国深度学习平台市场中的综合份额持续增长,跃居第一。
这可是一个十分十分了不起的行业大新闻,因为作为市场三强中惟一的国产深度学习平台,百度飞桨可能超过谷歌、Facebook,冲上中国深度学习平台市场综合份额的头位,真的是一个大冲破。飞桨产业级深度学习平台逆袭,成为这个曾经有高水平竞争的市场的中国第一。
而 EasyDL 的使命,就是最大限度的开释飞桨的产业级 AI 的能力,它的所有能力,也都是基于飞桨如何赋能于产业而构建的。
02. 用 AI 发明 AI 的飞桨 ” 精华版 ”
往年的博鳌亚洲论坛 2021 年年会分论坛上,百度 CTO 王海峰分享了一个重要观点,人工智能开始利用于各行各业的时候,不是每个行业都有足够多精通人工智能算法的专家。因而,咱们须要有便捷易用的平台,可能让开发者专一于利用的开发,减速产业翻新。如百度研发的飞桨平台,解决了根底的开发、训练、部署和模型库、开发套件等问题,并且开源凋谢,让开发者无需每一个人都从第一行算法代码写起,能够间接调用。
这里,王海峰说的是飞桨,也包含飞桨企业版 EasyDL。
咱们说过,所有深度学习平台的共性,都是为了升高开发的门槛,不须要开发者从简单的神经网络开始编代码。
还是那个相熟的例子:如果间接编写模型的高阶 AI 巨匠是用画笔描摹世界的画家,那用深度学习框架开发模型的就是高超的 Photoshop 达人,而 EasyDL 的用户,就是用美图秀秀却也能做出不俗成果,且操作极度简便的普通人。
某种意义上说,EasyDL 其实能够看做是飞桨的 ” 精华版 ”。
它的模型库,内置的模型是从飞桨的模型库中精选进去的;它的训练和推理过程,也是来自飞桨教训的升华;而 EasyDL 的底层,联合的是飞桨自研的 AutoDL/AutoML 技术,基于大量数据就能取得杰出成果和性能的模型。
这也是咱们为什么说,EasyDL 的胜利首先是因为飞桨的胜利。
然而,EasyDL 绝不是躺赢的 ” 富二代 ”。飞桨是 EasyDL 胜利的前提,但 EasyDL 的胜利还是因为本人足够致力。这是因为,AutoDL 理念的工程化,切实是一个难度很高的工作,EasyDL 能做到明天的水平,是有飞桨开源底座的撑持再加上本人足够致力的后果。
EasyDL 绝不是把模型开发的几个过程整合在一起,而后提供一些选项让开发者打几个勾那么简略,尽管从外在模式上来说,这么形容也没大错,但背地的工程化难度之高,是难以想象的。
简略的说,EasyDL(以及各类的 AutoML/DL)的独特理念,就是 ” 用 AI 技术来帮忙人们设计 AI”。
换句话说,开发一个 AI 模型的流程中,波及的数据处理、特征提取、模型抉择、参数调节、训练部署等环节,都利用 AI 能力才实现了高度的自动化,这才达到了使得 EasyDL 在构建深度学习模型的过程中,在很少人工干预的状况下,即可简略的被利用。
而且,简略不等于简陋,依照谷歌 CEO 的说法,谷歌 AutoML 发明模型的水准,至多相当于一个 AI 业余博士生的程度,而从某种意义上来说,EasyDL 还要胜过于谷歌版的 AutoML,因为 EasyDL 设计模型的程度,就像高级工程师,这个且在前面讲。
当咱们关上 EasyDL 的界面时,确实给人的感觉就是极度简略,因为你所须要的模型分类曾经十分详尽的开列了:

\
▲EasyDL 上的模型类型

这前面的过程其实用几句话就能够讲完,在抉择模型后,零碎会要求你上传数据,过程不会比给一封电子邮件上传附件更简单;尔后,通过 Auto Augment(主动数据加强)、Auto Finetuner(主动超参搜寻)、NAS(主动网络架构搜寻)等自动化建模技术,进行模型主动调优,大大降低模型调优的老本,一个新的模型就跃然纸上了。
EasyDL 的价值,就在于用极简的交互体验与高度自动化的训练机制反对了整个 AI 开发全流程的运行,使 AI 开发能够全民化。
咱们看几个关键点,比方数据是所有模型的基石,但数据的标注和荡涤,是一个老本很高的工作,甚至还诞生了数据标注师这样的一个职业。
因而,EasyDL 公布了 EasyData 智能数据服务平台,提供一站式的数据采集、数据荡涤、数据标注、数据回流的残缺解决方案,助力开发者高效获取 AI 开发所需的高质量数据。
也就是说,哪怕你的数据只是用一般手机拍摄的照片、或者用家用摄像头在低照度下拍摄的一段视频,就像一件脏兮兮且占满油渍的衣服,扔进这台主动的 ” 洗衣机 ” 里,最初输入的后果几乎就像高级染烫店里精心干洗熨平过的一样。
接下来可能还要说到的是 ” 调参 ”,这是一个高难度、累死开发者的活儿,但也是模型打造的灵魂。
EasyDL 实现的是主动调参,也就是说针对一个指标,主动调节超参数,这里的超参数包含 batch_size、learning_rate 等等。
这前面的技术太深,也无需开展。简略说,主动优化波及的是一个利用数学的问题 – 就拿最近比拟火的贝叶斯优化来说,所谓优化,实际上就是数学中一个求极值的过程,贝叶斯优化可通过一种名为「代理优化(surrogate optimization)」的办法,通过无限的采样数据点来解决这一问题。
可能看到这里你有点想撤退了,那咱们讲故事来调剂一下。
举个例子,中国食品药品检定研究院心愿做一个中草药辨认的 AI 开发,这属于典型的定制化需要,一般来说,需要定制化越高,客户的标注数据就越无限,训练数据老本就越高。
而 EasyDL 的价值就在于,帮忙客户通过较少的数据,疾速取得可用且准确率较高的模型。
这种状况下,从头搭建模型不仅慢,也不合乎客户的理论状况,EasyDL 就会应用 ” 迁徙学习 ” 这个概念。大家都晓得,百度 APP 的 ” 拍照辨认动物 ” 的性能是十分弱小的,迁徙学习能够把百度曾经有的动物辨认模型迁徙到中草药辨认当中去,把百度曾经大规模标注的数据集用于预训练,这样就能把本来不可控的工夫变成几分钟甚至更短,从而大大提高效率。
事实证明,这个模型的准确率>97%、训练耗时<10 分钟、单图辨认速度<50 毫秒。
兴许有人问,超高精度训练成果仅仅是靠迁徙学习么?
也不尽然。
应该说,次要是靠百度的 AI 技术积攒和业务实际,EasyDL 外面的模型,是基于百度超大规模数据训练的预训练模型,包含超大规模视觉预训练模型,文本预训练模型文心 ERNIE 等等。
这就相当于用国宴厨师的教训来做一桌家常菜,属于典型的把高维技术下放应用,你用到的每一个模型、甚至是参数,都是百度十年千亿投资在 AI 上的技术外溢。
比方,青岛爱包花饰应用 EasyDL 代替 X 光和人力进行残留异物质检,训练时只采集了含有针、剪刀等异物和金属部件商品的 X 光图像,开发者在无需理解 AI 算法细节的前提下,就训练出了准确率 90% 的模型,箱包生产过程中残留异物的检出率和箱包的质检效率大大提高。
还有,厦门一家科技企业通过 EasyDL 打造出辨认超过 150 种果蔬的辨认模型,最终研发出果蔬辨认智能秤。以往人工查问菜品图片须要 2 - 3 秒,而智能视觉秤只需 0.2 秒内,同时配合主动称重,整体效率晋升超过 10 倍。
所以,EasyDL 里的每一步,都充斥了智慧,让 AI 发明 AI,是 EasyDL 的灵魂。
兴许你会问,相比于谷歌的 AutoML,百度的 EasyDL 如何呢?
这里咱们不比一些细节,而次要是看利用面。AutoML 的特点是针对 AI 落地中的特定环节,而 EasyDL 的特点是真正解决 AI 落地的全流程理论问题,基于 EasyDL 训练实现的模型,可公布为私有云 API、设施端 SDK、公有服务器部署、软硬一体计划,灵便适配各种应用场景及运行环境。
也就是说,用户无需关注模型转换、适配减速、服务部署等细节,就能取得可间接运行、部署的镜像及可进行二次开发的 SDK。
然而,这都不比不上本文结尾时,咱们说的理论的市场反馈更有说服力,在机器学习平台方面,百度 EasyDL 间断放弃市场份额第一。而咱们置信,只有飞桨始终放弃当初的发展势头,EasyDL 也有大概率继续霸榜。
03. 有没有需要,都能够试试 EasyDL!
这个问题你兴许会感觉奇怪,难道不是为了开发 AI 利用而应用 EasyDL 么?
答案还真的不是如此,无论有没有确切需要,都能够尝试用用 EasyDL。
为什么这么说呢,有这么几个理由:
第一,EasyDL 能够让每个人都零门槛的感触到 AI 的魅力。让每个人都感觉 AI 不是遥不可及的,而是触手可及、随时可用的。
第二,EasyDL 兴许会让你失去极大的惊喜。
比方你是一个大型企业的经营人员,这样规模的企业早就实现了信息化甚至是数字化,服务器里积攒的数据量,每 2 到 3 年工夫就会成倍增长。
然而依据钻研,尽管这些数据蕴含着微小的商业价值,但企业所关注、能利用的通常只是占总数据量的 2%~4% 左右的显性数据,远远谈不上最大化地利用已存在的数据资源,而你齐全能够利用这些宏大的数据,通过某种 AI 的状态进行数据的无效开掘,最终可能会产生远超出你预期的后果。
第三,EasyDL 在解决理论问题方面,能够说曾经大放异彩。限度你应用 EasyDL 的绝不是技术能力,而是你的想象力。
还记得前几年引发风投畛域触动的 ” 无人货架 ” 大战么?这次大战的次要败局,其实就是因为过后基本没有一种实用水平能够进入商用畛域的无人货架计划——RFID 形式老本太高、分量传感形式不够准确,而纯视觉计划过后又不成熟。
通过对无人货架大战失败教训的总结,卓因达基于 EasyDL 开发了纯视觉计划的无人药柜,它们的数据比拟丰盛,120 多种药品对应着 9000 多张图片,通过 EasyDL 中十分成熟的一个类目 ” 物体检测 ”,训练出了药品辨认模型。
因为数据品质较高,模型准确度近 100%,仅需 500ms 即可取得辨认后果,进而能够实现 C 端自助选药、扫码购药,24 小时不间断服务,随时满足用户应急购药需要。
如果这个技术在当年 ” 无人货架 ” 大战开始的时候就呈现,齐全可能开拓一个新的行业赛道,这也是百度信奉的 – 用科技让简单的世界更简略。
EasyDL 也正是在践行这样的愿景和能力 – 让 AI 开发不再是高级技术人员的专利,让不会代码的人也能领有用技术扭转世界的力量。
文章转发自 ” 智货色 ” 公众号

百度 AI 开发者社区 https://ai.baidu.com/forum,为全国各地开发者提供一个交换、分享、答疑解惑的平台,让开发者在研发路上不再“孤军奋战”,通过一直地交换与探讨找出更好的技术解决方案。如果你想尝试各种人工智能技术、开辟利用场景,赶快退出百度 AI 社区,你对 AI 的所有畅想,在这里都能够实现!

扫描下方二维码,增加小助手微信「京东卡、小度定制周边、神秘礼盒、行李箱」等更多福利你来拿~

退出移动版