关于机器学习:2022年最重要的机器学习趋势Top5

5次阅读

共计 3468 个字符,预计需要花费 9 分钟才能阅读完成。

机器学习畛域正在疾速的产生着变动,对机器学习和人工智能技术的需要也一劳永逸。作为 ML 工程师,咱们必须寻求 更高效 更无效 的办法来 筹备数据 构建模型

无论你是机器学习畛域的专家还是老手,你都必须对这个畛域的最新倒退放弃凋谢的心态。上面是一些最新的机器学习技术。它们在很多场景中都有乏味的利用。

01 Automated Machine Learning

Automated Machine Learning(AutoML)是机器学习中的一个十分重要的问题。它的第一个钻研小组于2013 ` 年由弗莱堡大学的弗兰克·赫特传授成立。

主动机器学习(AutoML)是将机器学习模型开发中波及的耗时且反复的工作自动化的过程。应用 AutoML,您能够设计无效且可继续的模型,帮忙提高效率和生产力。

传统的机器学习包含几个工作,包含清理数据、抉择适合的特色、指定模型族、优化模型超参数、设计神经网络拓扑、解决模型和剖析后果。

这些工作十分的耗时,须要大量的机器学习专业知识。然而,AutoML 引入了现成的机器学习办法来帮忙自动化整个过程。它在解决大量数据时特地有用。

Google AutoML 代码示例:

from google.cloud import automl

# TODO(developer): Uncomment and set the following variables
# project_id =“YOUR_PROJECT_ID”# dataset_id =“YOUR_DATASET_ID”# display_name =“YOUR_MODEL_NAME”client = automl.AutoMlClient()

# A resource that represents Google Cloud Platform location.
project_location = f"projects/{project_id}/locations/us-central1"

# Leave model unset to use the default base model provided by Google
metadata = automl.TextClassificationModelMetadata()
model = automl.Model(
 display_name=display_name,
 dataset_id=dataset_id,
 text_classification_model_metadata=metadata,
)

# Create a model with the model metadata in the region.
response = client.create_model(parent=project_location, model=model)
print(“Training operation name: {}”.format(response.operation.name))
print(“Training started…”)

自动化 ML 使机器学习更加的敌对,并使那些没有编程语言教训的人也可能实现 ML 的解决方案。它容许更快、更精确的输入、麻利的问题解决,并能做出最佳的实际成绩。

这里我提供几个 AutoML 的软件平台供你应用。它们包含:Google AutoML、Azure 主动机器学习、Auto Keras 和 Auto sklearn。

02 Machine Learning Operationalization Management

受传统 DevOps 的启发,MLOps 寻求打消传统软件开发和机器学习软件开发之间的 gap。

Machine Learning Operationalization Management (MLOps)是机器学习的一个性能,它旨在简化机器学习模型的生产、保护和监控。它使数据科学家和机器学习工程师可能合作并改良模型开发和生产。

MLOps 确保在机器学习生命周期中施行继续集成和部署的(CI/CD)实际。它实用于每个阶段,包含数据收集和剖析、模型训练和部署、模型监控和再训练等。

MLOps 架构设计:

家喻户晓,机器学习开发还存在团队沟通、开发治理流程的构建、可扩展性和大规模敏感数据治理等问题。MLOps 办法能够帮忙简化治理过程呈现的各种问题,并且自动化机器学习利用的部署。

MLOps 复现性准则:

在机器学习我的项目中,有许多工具能够实现 MLOp。你能够从开源、专有软件、Saas 和本地 MLOps 工具中进行抉择。一些最好的 MLOps 工具包含 Comet[https://www.comet.ml/site/]、Amazon SageMaker、Azure 机器学习和谷歌云人工智能平台。

03 TinyML

TinyML 的创始人皮特·沃登(Pete Warden)和晚期的 TinyML 工程师丹尼尔·西图纳亚克(Daniel Situnayake)推广了 TinyML。

TinyML 致力于机器学习算法的开发,该算法能够在小型或低功耗设施(如微控制器)上运行。边缘设施上的机器学习模型可能实现低提早、低功耗、低带宽,并确保用户隐衷。

TinyML 容许物联网设施应用无限的资源和计算能力剖析数据,并且只收集有用的数据。这对于高能耗和收集本地设施上的无用数据而言,是一个有用的解决方案。它有助于整合机器学习和物联网。

物联网边缘设施的 ML 框架:

微控制器非常适合将机器学习引入边缘设施。它们价格低廉,耗电很少。它们还容许咱们以十分便宜的价格收集和剖析大量数据。然而,它们须要开发 ML 算法,这些算法能够在很少的本地内存或计算能力下运行。

一些边缘设施及其硬件规格:

比方“Ok Google”、“Alexa”和“Hey Siri”之类的唤醒词就是 TinyML 的例子。专家们置信,将来几年将有更多的 ML 模型在边缘设施上承受训练。Arduino Nano 33 BLE Sense 和 TensorFlow Lite Micro 是用于在边缘部署 ML 模型的一些最风行的硬件和框架。

4. General Adversarial Networks

General Adversarial Networks(GANs)由 Ian Goodfellow 及其共事于 2014 年在蒙特利尔大学开创。

GAN 是一种新的机器学习趋势,它产生样本,并且可能应用网络来分别网络,可能删除不须要的内容。就像政府部门一样,GAN 能提供制衡,以确保准确性和可靠性。

GAN 是一种生成性建模办法(一种无监督学习办法,其中模型学习发现输出数据中的模式)。他们以应用卷积神经网络来辨认、剖析和分类视觉图像而闻名。

GAN 构造:

生成反抗网络 (GAN) 通过将问题出现为具备两个子模型的监督学习问题,帮忙训练生成模型。上面是它们的工作原理:

  • 生成模型 (The Generator Model)
    这被训练为生成新的数据集,例如生成与实在数据类似的输入。

生成器训练中的反向流传:

  • 判断模型 (The Discriminator Model)
    它被训练来比拟和辨别生成的数据和实在数据。

鉴别器训练中的反向流传。

这两个子模型通常在对抗性零和游戏中一起训练,直到鉴别器模型绝大多数工夫被坑骗了,这表明生成器模型正在生成令人信服的示例。

GAN 正在迅速倒退,因为其了解和从新创立视觉内容的能力,目前正用于许多应用程序。它们能够用于从文本生成真切的图像、创立深度假视频、从轮廓填充图像等。

05 Reinforcement Learning

理查德·萨顿被称为“强化学习之父”

强化学习是处分冀望行为和惩办消极行为的 ML 办法。它应用了一种基于神经网络的强化学习代理算法。然而,代理人能够通过尝试和谬误来学习,也能够感知和解释环境。

在强化学习中,踊跃值会调配给冀望的行为,消极值会调配给不冀望的行为。咱们对代理人进行编程,以寻求最大的回报并实现所有必要的指标。只有可能设计处分,这能够在任何机器学习零碎中应用。

强化学习的根本框架:

只管强化学习曾经引起了人们的趣味,但它在事实世界中的利用和利用却很少。强化学习目前的一些用例包含游戏模仿、资源管理、个性化举荐、机器人技术、基于仿真的优化等。

强化学习很难部署,因为它依赖于对学习环境的摸索。这在事实环境中可能会造成问题,因为事件可能非常复杂并且具备很强的动态性。一些强化学习的算法包含 Q-learning、深度 Q-Networks 和状态动作 - 处分 - 状态动作(SARSA)。

总结

机器学习利用正在增长,机器学习办法和工具也在增长。下面提到的五大机器学习趋势应该让你更理解该畛域的倒退方向。数据迷信和机器学习有有限的可能性,这是十分乏味、刺激的事件!

本文由 mdnice 多平台公布

正文完
 0