月度文章集锦2020年5月至6月-AWS-人工智能精华内容一文速览

30次阅读

共计 3635 个字符,预计需要花费 10 分钟才能阅读完成。

不知不觉间,我们已经和大家分享了与 Amazon Web Services (AWS) 有关的 AI、机器学习、深度学习等技术有关的内容。接下来,不妨通过本文进行一个简单的汇总,方便有不同需求的小伙伴们能够按图索骥,快速找到自己感兴趣的东西。

Amazon SageMaker

传统 ML 开发是一个复杂、昂贵、迭代的过程,而且市面上没有任何集成工具可用于整个机器学习工作流程,这让它难上加难,令很多开发者都望而却步。Amazon SageMaker 则是为了解决这些难题而生,它是一项完全托管的服务,可以帮助开发人员和数据科学家快速构建、训练和部署机器学习模型。具体是怎么做到的?欢迎阅读:如何不花一分钱用 Amazon SageMaker 高效构建 ML 模型?

作为一款统一了 ML 所需各类开发工具的服务,Amazon SageMaker 帮助开发人员在一个集成的可视界面中编写代码、跟踪实验、可视化数据以及进行调试和监控,从而极大地提高了开发人员的工作效率,那么该服务又该如何快速上手?欢迎阅读:如何快速上手 Amazon SageMaker?

命名实体的识别是机器学习过程中一个非常重要的技术,主要可用于识别文本中具有特定意义的实体,例如人名、地名、机构名、专有名词等。对于英文来说,由于英语中的命名实体具有比较明显的形式标志,所以实体边界识别相对容易;然而中文命名实体识别任务更复杂,而且相对于实体类别标注子任务,实体边界的识别更加困难。如何借助 Amazon SageMaker 解决这个问题?欢迎阅读:相比英文,中文命名实体的识别难在哪?又该如何解决?

机器学习技术让原本很多繁琐、耗时的操作都能自动实现,大幅提升工作和生活效率,然而为了实现这一点,首先需要有足够高质量的 ML 模型,要想获得这东西可并不容易。围绕这个问题,最近发布的 Amazon SageMaker Autopilot 可在完全控制和可见的情况下,自动创建最佳分类和回归机器学习模型,帮助我们轻松创建出高质量的 ML 模型。欢迎阅读:自动化更进一步,ML 模型也能自己生成。

深度学习

因为能从各类复杂数据(例如自由文本、图像、视频)中提取复杂模式,深度学习技术已经实现了非常广泛的应用。然而实践中会发现,很多数据集用图形(Graph)的方式更容易表达,例如社交网络上人们之间的相互关系等。实际上,借助开源的 Deep Graph Library,任何人都可以通过 Amazon SageMaker 针对图形数据进行深度学习。具体该怎么做?欢迎阅读:基于图形的深度学习应该怎样做?

不同时间收到的,用于描述一种或多种特征随时间发生变化的数据,通常可称为时间序列数据(Time Series Data)。借助这数据,我们可以通过过去产生的时间序列数据来预测未来。这种预测分为哪几种类型?可通过哪些算法实现?欢迎阅读:借助 SageMaker 搭建图形神经网络,深度学习能力再上新高。

深度学习中需要大量数据和计算资源,且需花费大量时间来训练模型,但在实际中难以满足这些需求。而使用迁移学习则能有效降低数据量、计算量和计算时间,并能定制在新场景的业务需求,可谓一大利器。在这篇文章中,我们在 Amazon SageMaker 中基于 MXNet 使用自己的数据来微调一个预训练的图像分类模型,并以较高准确率构建了一个车型号分类器。具体怎么做的?欢迎阅读:看图片识车型,自己写个这样的程序其实一点也不难。

在电商平台购物时,大家都见过个性化推荐系统。这类系统是建立在海量数据挖掘基础上的一种高级商务智能平台,可帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。实际上,借助微软联合亚马逊推出的开源深度学习库 Gluon,我们可以非常轻松地开发出这样的一个个性化推荐系统,具体做法欢迎阅读:「猜你喜欢」?摸清套路,自己也来 DIY 个推荐系统。

深度学习的爆发使得 Python 这个曾经小众的语言突然间变得炙手可热了。相比之下,尽管 Java 仍是最流行的语言之一,拥有为数众多的开发者,尤其在企业市场拥有最广泛的应用基础,但实际上我们很难找到合适的,用于深度学习的 Java 工具或框架。Deep Java Library 的出现改变了这一情况。欢迎阅读:后浪 Python 热力无限,前浪 Java 仍大有可为。

机器学习

机器学习在近 30 年里已发展为一门多领域交叉学科,并广泛应用于数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA 序列测序、语音和手写识别、战略游戏和机器人等领域。为了帮助大家更便捷的解决这些实际问题,AWS 推出了各式各样的机器学习工具,包括:ML 服务类、API 类、AI 服务工具类等。这些工具分别适合用于哪些场景?欢迎阅读:超棒的 AWS 机器学习工具包汇总。

生成对抗网络(Generative Adversarial Networks,GAN)是一种生成式机器学习模型,可用来创造虚构的人物、场景,模拟人脸老化和图像风格变换,甚至用于产生化学分子式等。在这篇文章中,我们介绍了一个能够利用这类技术用机器学习方法模仿手写字体的思路,欢迎阅读:没有肖像权的「肖像照」,自己生成,随便用别客气!

Amazon QuickSight 是个强大的服务,可以全面集成不同来源、不同格式的海量数据,进而通过基于机器学习的分析,并通过图形化的报表向用户揭示数据中蕴含的业务见解。Amazon QuickSight 到底有什么用?又该如何入门和上手?欢迎阅读:Amazon QuickSight 用户看这里:ML Insights 正式发布,更多业务见解触手可及。

ML 模型的训练需要大量时间和计算能力,这一点相信大家都深有体会。既然现在云计算那么普及,企业应用环境中的计算、存储、数据库之类的资源都可以跑在云中,那么对于机器学习项目,能否想办法把最耗费时间的模型训练工作也丢到云端去跑?借助 Amazon SageMaker 运行分布式 TensorFlow 训练就行,具体做法欢迎阅读:你专注 ML 算法就好,模型的训练交给它就行。

为了将机器学习与关系数据库中的数据结合使用,通常需要开发一个自定义应用程序来读取数据库中的数据,然后再应用机器学习模型。开发这样的应用程序需要多种技能才能和数据库进行交互并进行机器学习。那么我们能否更轻松地对关系数据库中数据应用机器学习?方法还是有的,欢迎阅读:不做数据「搬运工」,同样玩转机器学习。

很多时候,托管式服务能够帮我们省很多事。从应用开发到部署,到后续运维;从机器学习模型的创建到训练,再到最终运行…… 这些环节中,很多步骤都可以选择托管式云服务来帮助我们降低开发成本和工作量,让自己更专注于真正重要的任务。其实机器学习过程中的数据处理和模型评估,这些任务也能借助托管式服务搞定。欢迎阅读:玩转 ML,能托管就绝不自己搞,今天轮到数据处理和模型评估。

机器学习是一种高度迭代的过程。在单个项目的过程中,数据科学家和 ML 工程师通常会训练数千个不同模型,以寻求最大准确度。而在这过程中,所涉及到的算法、数据集和训练参数(又称为超参数)的组合数量是无限的…… 大家就如同大海捞针那样需要从中找出最优解。新近发布的 Amazon SageMaker Experiments 则能帮助用户组织、跟踪、比较和评估机器学习实验和模型版本,简化模型的创建和优化工作。欢迎阅读:数据大爆炸有大数据,ML 模型大爆炸怎么办。

Amazon SageMaker 模型监控器是 Amazon SageMaker 的一项新功能,可以自动监控生产中的机器学习模型,并在出现数据质量问题时发出警报,进而帮助我们快速了解 ML 模型中存在的质量问题。该功能是如何使用的?欢迎阅读:这位课代表,今后监督大家学习的重任就交给你啦。

人工智能

AI 的应用已经非常广泛了,但如果被人问起,你该如何用最通俗易懂的语言,向对技术完全不了解的人说清楚到底什么是 AI?欢迎阅读:用通俗易懂的语言,给身边的「小神兽」讲讲什么是 AI。

一直以来,AWS 一直努力通过计算机视觉和语言等领域的创新,为用户提供预训练的人工智能服务,帮助用户在不需要具备机器学习领域专业知识的前提下也能顺利使用。本文要介绍的 Amplify Framework 在此基础上,帮助开发者只需几行代码,就可以给任何 Web 或移动应用程序添加和配置人工智能 / 机器学习能力。具体该怎么做?欢迎阅读:这样做,让你的应用程序学会「学习」的能力。

无论工作或生活中,AI 都能在很多方面给我们提供巨大帮助。不过你有没有想过,借助先进的 AI 能力,我们每个人都能成为一个作曲家,在 AI 的帮助下谱写华美乐章。欢迎阅读:当音乐遇上人工智能 — 歌手们都在「云竞演」,作曲家就不想试试「云谱曲」。

本文构建了一种解决方案,充分利用 AWS 的各项服务帮助我们轻松创建具备互动能力,以增强显示技术呈现的汽车产品使用手册。这种技术有多强大,能给消费者带来怎样的革新体验?欢迎阅读:AI 成熟了,AR 产品手册这样自己写出来。

正文完
 0