共计 5318 个字符,预计需要花费 14 分钟才能阅读完成。
不写代码也能搞机器学习?!
这是亚马逊云科技在最近亚马逊云科技 re:Invent 大会上颁布的新工具,用于实现无代码可视化机器学习。
亚马逊云科技 re:Invent 大会堪称是云计算行业的“春晚”,IT 技术畛域风向标级流动,连他们自家的西雅图总部大厦也随其更名为大会名,品牌影响之强,可见一斑。
10 年来,这一流动上诞生了有数云计算乃至 AI 行业标杆产品,如 Amazon Mechanical Turk、Amazon Rekognition、Amazon SageMaker 等等。
往年亚马逊云科技 re:Invent 2021 同样信息量微小,最引人关注的,莫过亚马逊云科技的机器学习平台服务 Amazon SageMaker 迎来了一次“大暴发”。
不只有无代码开发机器学习模型这一道“菜品”,整个 AI 餐桌上,纵向看,亚马逊云科技的 12 项产品曾经笼罩了整个 AI 产业链——
再从横向看,从为集体开发者筹备的入门收费算力池,到大厂专业人士所需的 AI 模型优化工具,相应公布也一应俱全。甚至,思考到 AI 倒退迅猛的中国市场用户,亚马逊云科技还在 B 站提供带中文字幕的大会实录。
现场演讲中,CEO 还专门强调:「亚马逊云科技会提供最宽泛最残缺的全栈式机器学习服务」。
无妨跟着咱们一起回顾全程亮点,对亚马逊云科技的 AI 产品脉络有一番全面意识。
不必代码的机器学习
还是先探探一开始提及的无代码机器学习预测服务,看它是否真能让不懂代码的人上手。
按官网介绍,这款产品名为 Amazon SageMaker Canvas,面向零机器学习教训群体,他们中,兴许有人是业务分析师,兴许有人从事人力资源、财务或营销等工作。
可预感,上述群体中,少数人并没有机器学习教训,甚至对代码也毫无认知,却必定有通过数据来掂量以后策略、预测市场趋势的需要。
Amazon SageMaker Canvas 就是将机器学习模型的诸多步骤可视化为可交互的 UI,旨在解决他们的业务问题,号称:不写一行代码,疾速生成机器学习预测模型。
为了证实其有效性,亚马逊云科技的 AI/ML 部门本人分享了一个案例。
当中,该部门产品营销经理想通过 Amazon SageMaker Canvas 对以后营销流动进行评估,判断其是否具备足够影响力和有效性。
只需关上 Amazon SageMaker Canvas,上传数据。该过程中,平台还能主动纠正上传数据谬误,比方补充缺失值或删除反复的行和列。其技术不出意外,同样来自自家 AI/ML。
接下来,指定模型预测的指标,再点击「疾速生成」,所需模型即可训练失去。
从后果看,出现成果确是一个可视化图表,模型准确度为 93%。
生成模型后,还可共享给数据科学家等合作伙伴,帮业务人员来进一步查看或者优化这些的模型。
看完官网这一案例,该可视化界面确实有两把刷子——
那么合作方体验又如何?
目前,宝马团体已将亚马逊云科技 AI/ML 技术投入理论业务流程中的 600 多个利用中,涵盖生产线到销售端的多个场景,此外宝马还有 1500 万台互联汽车染指其中,一天产生数以百万公里数据均交由 Amazon SageMaker Canvas 剖析预测。
西门子能源也是上手吃螃蟹者之一。他们将 Amazon SageMaker Canvas 作为自家机器学习工具包的补充,一位利用部门的数据迷信组组长示意:Canvas 让咱们能与数据迷信团队共享合作,有助于生产更多机器学习模型,并确保模型合乎质量标准和标准。
还有很多名不见经传的巨头也是 Canvas 体验者,比方寰球最大的非上市公司科赫团体的子公司英威达,也曾经用 Amazon SageMaker Canvas 来辅助解决业务流程中的数据迷信问题。
多方评估及直观展现后果看完,大抵能够判断,此次 Amazon SageMaker Canvas 的确值得期待。毕竟图形界面相比代码开释生产力发明价值的定律在过来已被反复证明。
收费的线上 AI 实验室
前文提及,在年度重磅发布会亚马逊云科技放下豪言:提供最宽泛最残缺的全栈式机器学习服务,既然是「最宽泛最残缺」,仅靠一个 Amazon SageMaker Canvas 的公布当然不够——
对广大学研机构、AI 爱好者们,前沿技术伟人也须要对得起本人的口号。
总结下来,三个字,降门槛。
最直观的,提供算力资源。
近年来,昂扬的硬件价格、简单软件配置始终妨碍初学者入门 AI 的脚步,也是限度行业倒退,为更多人认知相熟的微小阻碍。
亚马逊云科技公布性能 Amazon Sagemaker Studio Lab 提供一大团可薅的「羊毛」。无需额定环境配置、无需注册账户、间接用电子邮件就能登录进去的线上实验室。
在这一环境中,任何人创立的我的项目,都能间接领有12 个小时的 CPU 计算工夫、4 小时的 GPU 计算工夫,以及 15GB 的存储空间:
这样的配置纵观整个行业,的确到位。
要晓得,在应用 Pandas 或 XGBoost 进行经典 ML 算法训练的数据预处理时,12 小时 CPU 工夫根本足够。对于深度学习训练,也可抉择 GPU 后端取得 4 小时计算工夫,足以在较小的数据集上进行训练或微调模型。
换句话说,对初学者阶段 AI 模型,拿着上述资源根本都能收费训练实现。
同时,当下最风行的机器学习工具、框架和库也被事后打包进去,提供给注册者,能自定义 Conda 环境,也可装置开源的 JupyterLab 和 Jupyter Server 扩大。上述试验环境与 GitHub 严密集成,使得创立的我的项目可能被轻松地复制和保留。
除收费“线上实验室”及算力资源,另一部分「羊毛」更直观——奖学金。
此番亚马逊云科技共拿出了 1000 万美金,推出一项 亚马逊云科技 AI&ML 奖学金打算,旨在帮忙 16 岁以上的高中、大学生,帮忙他们铺平通往机器学习相干职业之路。
除此之外,亚马逊云科技的 1:18 比例主动驾驶赛车 Amazon DeepRacer 也在面向主动驾驶、机器学习爱好者们,提供一种更乏味、门槛更低的形式帮忙他们入门机器学习,训练出可本人的强化学习模型。
Amazon DeepRacer 由强化学习驱动,并能将算法部署于云端的 3D 赛车模拟器中,也能够通过实体小车体验在真实世界中赛车的刺激感。
当然,体现优异者同样直通奖学金打算。
不仅本人发光发热,亚马逊云科技还拉上英特尔,Udacity 做起联名流动,面向 16 岁以上的经济艰难、残疾等社会弱势群体发放 2500 份奖学金。
取得经济反对之外,这些弱势人群们也能失去 Udacity 导师、亚马逊云科技和英特尔技术大咖长达一年工夫的领导和帮忙。
机器学习“工业化”重塑
无论零代码机器学习公布,还是面向更广人群的普惠,背地还是技术撑腰。毕竟性能开发须要粗浅场景了解及技术积淀,而「普惠」二字考验的,还是技术企业的降本程度。
相比上述两者,亚马逊云科技 re:Invent2021 面向业余从业者公布的 Amazon SageMaker 诸项新性能,更直观展示亚马逊云科技技术水准,从中,更可见技术巨头对 AI/ML 将来的筹划。
对于宽广的 MLer 来说,一套残缺的机器学习流程,包含数据筹备、数据标注、训练、推理、部署。最终模型推理成果如何,既依赖于开发者集体的程度,也会受架构、算力、数据这些外化因素的影响。
亚马逊云科技之所以这么做,是想要升高集体程度影响,用他们的话说:让 AI/ML 从手工作坊走向工业化。
具体来看,为一揽子解决问题,Amazon SageMaker 给出一套组合拳,涵盖机器学习全流程:
在 数据筹备 阶段,数据工程师经常须要来到以后开发环境,手动配置一个满足正在运行的模型或剖析要求的集群。
为此,Amazon SageMaker Studio 与 Amazon EMR 进行了集成,可间接从 Amazon SageMaker Studio Notebook 中应用 SparkUI 来监督和调试运行在 Amazon ECR 集群上的 Spark 作业。
鉴于无论执行数据预处理、开发还是模型部署,都不用来到这个环境,上述动作无疑向一个现实的齐全集成开发环境迈进了一步。
数据标注 阶段也在辞别劳动密集型,防止人工屈服于人工智能:
这一工作以前须要人力手动标注,或通过数据标注程序处理,但当初,在给出原始数据和需要之后,Amazon SageMaker Ground Truth Plus 会联合机器学习帮助的预标记,辅助人类专家进行标记。
这种形式能升高错误率,同时将标注的老本升高 40%,做到更高效地检测谬误,防止低质量标签的呈现。
训练阶段的晋升更为要害。
强如业界经典的深度学习模型 BERT,数以十亿级参数的简单神经网络,须要用 GPU 训练数千小时,即便调参优化,也依然须要几天的工夫训练。
但当初,亚马逊云科技提供的机器学习模型优化编译器 Amazon SageMaker Training Compiler,实现无需减少太多代码,即可晋升 GPU 实例训练速度。
借助该编译器,包含 BERT-base-cased、BERT-base-uncased、distilBERT-base-uncased 在内的诸多经典深度学习模型,训练速度都能间接晋升 50%。
增加两行代码就能应用 Amazon SageMaker 训练编译器
最初是 推理阶段 方面的晋升。亚马逊云科技拿出了之前一举成名的「无服务器」概念,提供了一套无服务器推理性能的 Serverless Inference。
该性能针对数据计算量波动性较强的状况,可能将资源分配交给云端,享受一个弹性资源空间服务。让程序员关注高级语言,而不必去关注底层硬件,让专业人士专一善于方向。
思考到事实中,很多客户有专项需要,但很难判断多少计算资源适合,另一性能 Amazon SageMaker Inference Recommender 则提供推理阶段中的配置和理论运行参数举荐,在老本和速度之间找到最佳平衡点。
从数据筹备到推理阶段,上述各个流程产品性能公布为全机器学习周期服务,而非单点拼凑而成,其目标在于:帮忙企业实现机器学习的大规模使用,点连成线,买通了一条 AI/ML 工业化规模利用流程。
那么这套组合拳的成果如何?
可见案例中,美国最大基金治理公司之一 Vanguard 部署工夫压缩 96%,医药巨头阿斯利康在 5 分钟内即可实现机器学习环境部署,理财企业 NerdWallet 在原有训练需要减少前提下,老本反降 75%。
除此之外,更多元的落地场景,也能看出亚马逊云科技对 AI/ML 的纵深开掘。
比方 DevOps Guru for RDS 能够用来帮忙开发者检测、诊断和解决 Amazon Aurora 中的性能和操作问题。
比方 CodeGuru Reviewer 来辨认源代码中的明码、API 密钥、SSH 密钥和拜访 token,进步代码审查的效率,帮忙传统软件行业晋升效力。
乏味的是,亚马逊云科技 re:Invent 2021 大会举办期间,CTO Werner Vogels 还忙里偷闲发表的一篇博客,文中裸露了这位技术男对 AI/ML 产业的高期待:
软件开发将从人力密集开始转变,人工智能反对的软件开发将占据主导地位。
最初硬件上,亚马逊云科技还公布了自研芯片,而且还是一口气推出了三款。
其中,CPU 芯片 Graviton3 就以机器学习为主打特色。
更有机器学习定制训练芯片 Trainium,反对 Trn1 实例,可能为用户在云中训练深度学习模型提供更高性价比和更快速度。
无论是买通 AI/ML 工业化规模利用流程,还是硬件自研芯片公布,更宏观层面看——
上述公布动作昭示了亚马逊云科技在 AI/ML 业务肉眼可见的延长。
亚马逊云科技正在拓展 AI 疆界
依据 IDC 的数据,从 2013 年至 2020 年的 7 年内,寰球 AI/ML 年收入规模从 0 迅速扩充到约 500 亿美元,该增速简直是亚马逊云科技老本行云计算的 2 倍。
正是看见这一趋势,亚马逊云科技多路出击仿佛也是必然。
从无代码机器学习、无服务器利用深刻 AI/ML,到底层算力持续降级,乃至诸多普惠打算…令人目迷五色的公布无不昭示亚马逊云科技正在从新划定机器学习的全新的疆界。
只管上述公布还未落地后果,其展现出的价值一般公众一时未必肉眼可见,但从另一个视角看,所谓谋求长期价值,所谓看重基础设施布局,不就不言而喻地写在亚马逊云科技 DNA 里么?
回忆 1997 年,贝索斯公布了那封广为人知的「致股东一封信」。
彼时初代互联网泡沫正在累积,「快钱」之于很多人尚且是全新概念,过后的 Amazon 就提出客户、销售和品牌增长无不为了长期价值服务,同样为长期价值,贝索斯强调了对「零碎及其它基础设施」的继续投入。
尔后,Amazon Web Services 独立运作,将云计算从「概念」变成实实在在的一个行业,更有 Amazon Redshift、Amazon Lambda 带出云原生数仓、无服务器路线倒退…
所有的所有,仿佛都早早写下序章。
当初亚马逊云科技带着同样心态继续押注 AI/ML 畛域,自身也就不令人意外了。
这既是身为技术巨头的责任所在,也确实让人有所期待,正响应往年亚马逊云科技 re:Invent 2021 的 Slogan:引领风向,重塑将来。
咱们已能看到,AI/ML 畛域人群笼罩在扩充,其行业场景在延长,其技术也相应持续深探,这一过程还在被行业技术探路者们继续推动。
将来,AI/ML 的疆域到底有多大?亚马逊云科技正在一点点划定新的轮廓。
大会残缺内容传送门(长按扫码):