关于机器学习:月度文章集锦2020年9月-AWS-人工智能精华内容一文速览

1次阅读

共计 2405 个字符,预计需要花费 7 分钟才能阅读完成。

金秋已至,又到了播种的节令。最近你都有哪些播种呢?手头的我的项目有什么停顿?

2020 年 9 月,咱们持续与大家分享了大量无关 Amazon Web Services(AWS)的 AI、机器学习、深度学习等技术文章,是时候简略回顾一下了。

Amazon SageMaker

医疗保险欺诈必然会导致消费者保费和自付费用升高,利益受损或保险覆盖面放大。将索赔认定为欺诈可能须要简单而详尽的考察。那么是否能够训练 Amazon SageMaker 模型来标记后付费医疗保险的住院异样索赔,并针对它们的欺诈嫌疑进行进一步考察?这个解决方案不须要标记数据,而是应用非监督机器学习(ML)创立模型来定位可疑的索赔。欢送浏览:Amazon SageMaker 实战上手:标记可疑的医疗保险索赔。

目前临床基于影像的肿瘤诊断和医治次要依赖于医生的集体教训和主观评判。然而,目前成像模态多样化,信息量也越来越大,凭借医生的集体判断也越发具备挑战性。如何通过 AI 技术对肿瘤影像数据进行全自动、精准的诊断和医治布局始终是钻研热点和难点。实际上,很多优良的医疗 +AI 用户正通过在 AWS 上疾速搭建服务平台,极大缩短了产品从构想、开发,再到部署的工夫。同时越来越多的用户发现 AWS 技术上的劣势能够让医疗 AI 用户的模型训练变得更为轻松。怎么做到的?欢送浏览:Amazon SageMaker 助力医学影像 AI 诊断技术。

表格类数据始终是泛滥行业(包含金融、医疗保健以及制造业等)所采取的次要数据存储办法。大多数机器学习(ML)用例也次要面向传统的结构化或表格数据。在应用机器学习解决表格数据时,咱们往往须要引入人工审核流程,帮助管理工作流中须要人工加以判断的敏感环节。在此类用例的工作流中,人工审核人员须要查看 ML 模型中以动态表格格局(通常被称为「数据框」)作为输出的全副或局部数字化特色,同时对输入后果中的某些行做出动静批改。如何借助 Amazon SageMaker 改良这个过程?欢送浏览:搞定基于表格数据的 ML 模型,有 Amazon SageMaker 就够了。

Kubeflow 是一款风行的开源机器学习工具包,实用于心愿构建自定义机器学习管道的 Kubernetes 用户。最近,AWS 正式颁布了实用于 Kubeflow Pipelines 的 Amazon SageMaker Components。借此,Amazon SageMaker Components 可能帮忙咱们在 Kubeflow Pipelines 上实现弱小的 Amazon SageMaker 性能,以全托管服务的模式反对数据标记、大规模超参数调优以及分布式训练作业、一键式平安可扩大模型部署,并通过 Amazon Elastic Compute Cloud (Amazon EC2) 竞价实例进行高老本效益训练等指标。具体理解:好消息:Amazon SageMaker 正式反对 Kubeflow 啦。

机器学习

很多胜利的在线销售型企业会为每个用户实现用户画像、为其产生个性化推送内容,进而实现精准营销。例如个性化产品举荐以及促销流动。为此,咱们能够应用 Apache MXNet 结构多标签分类模型,用于在数千类别里预测用户偏向。通过预测后果,能够发明一种个性化的内容,帮忙用户去抉择最好的商品。亲自试试:应用 DJL 在 Apache Spark 上实现基于 Amazon Retail System 的用户行为预测,实现精准营销。

在企业环境中,面对形形色色的 IT 零碎、文档库,以及其余品种各异的数据源,如何疾速找到须要的内容?搜寻就行。但假如须要的信息散布在几个甚至十几个不同的利用或零碎中,除了别离在这些中央进行搜寻,还有什么更好的方法吗?如果能有一种服务,就像互联网上的搜索引擎那样,能够给企业外部的各类数据源创立索引,并让咱们在一个地位,通过一次搜寻操作,全面搜寻内网中的各类数据源,并将后果对立出现在一起,那该多不便!具体浏览:外事不决有某度,内事不决问 Kendra—— 自建企业级搜索引擎,办法很简略。

作为 Amazon 旗下的云语音服务,Alexa 曾经以「智能助理」的模式呈现在各类设施和利用中,每天帮忙寰球大量用户取得更高工作效率和更便捷的生存。不过你有没有好奇过,面对寰球不同语言和文化的用户,TA 到底是如何在短时间内精通各种语言,并与用户交互的?具体浏览:Alexa,你是怎么那么疾速学会各种外语的。

借助 AWS DeepComposer,咱们能够应用事后训练好的音乐流派模型(如爵士、摇滚、风行、交响乐等)将咱们提供的旋律转换为相应流派的曲子。那么当你玩转这个服务后,有没有想过本人也「开宗立派」,通过肯定的参数训练出本人的流派选项?当然能够!只须要将音乐数据文件存储在 NumPy 对象中,随后训练一套自定义 GAN 模型中的训练步骤进行操作即可。亲自试试:自成一派,这个作曲巨匠的确货真价实。

深度学习

深度学习在大数据畛域上的利用日趋宽泛,可是在 Java/Scala 上的部署计划却比比皆是。亚马逊开源我的项目团队另辟蹊径,利用 DJL 帮忙用户部署深度学习利用在 Spark 上。只需 10 分钟,你就能够轻松部署 TensorFlow、PyTorch 以及 MXNet 的模型在大数据生产环境中。具体浏览:只需轻松几步,十分钟内用 Scala 在 Apache Spark 上部署深度学习模型。

许多 AWS 云服务的用户都在逐渐将机器学习和深度学习工作搭载在他们已有产品之上。只管机器学习利用广泛应用在其余语言中(例如 Python),然而对于宽广已有产品的开发者学习和集成老本仍然很高。试想一下,如果要用另一种语言集成在已有的 Java 服务中,从写代码,编译,测试到最初部署都要做出大量扭转。为解决用户在这方面上的痛点,咱们能够试着无需对已有资源和人员从新调配,间接部署机器学习利用在现有的服务中。看看该怎么做:几行代码,轻松实现目标检测和图像分类工作 —— 基于 Spring Boot 和 DJL 搭建企业级机器学习微服务。

正文完
 0