2018最有用的六个机器学习项目

54次阅读

共计 1725 个字符,预计需要花费 5 分钟才能阅读完成。

摘要:用了这六个机器学习开源项目,你的项目一定进行的 666!
2018 年又是人工智能和机器学习快速发展的一年。许多新的机器学习的项目正在以非常高的影响力影响着诸多领域,特别是医疗保健、金融、语音识别、增强现实和更复杂 3D 视频渲染。
这一年,我们看到了更多的应用驱动研究,而不是理论研究。虽然这可能有其缺点,但它在短时间内产生了一些巨大的积极影响,产生了可以迅速转化为业务和客户创造价值的新研发,这一趋势在 ML 开源项目中得到了强烈反映。
让我们来看看过去一年中最实用的 6 个 ML 项目。这些项目都公开发布了代码和数据集,允许个别开发人员和小型团队学习并创造价值。它们可能不是理论上最具开创性的作品,但它们很实用!
Fast.ai
Fast.ai 库的编写是为了使用现代最佳实践方法以简化且快速准确进行神经网络训练,它抽象了在实践中实施深度神经网络可能带来的所有细节工作。而且它非常易于使用,并且设计它的人有应用程序构建思维。它最初是为 Fast.ai 课程的学生创建的,该库以简洁易懂的方式编写在易于使用的 Pytorch 库之上。

Detectron
Detectron 是 Facebook AI 用于物体检测和实例分割研究的研究平台,系统是用 Caffe2 编写。它包含各种对象检测算法的实现,包括:

Mask R-CNN:使用更快的 R -CNN 结构的对象检测和实例分割;

RetinaNet:一个基于 (Feature Pyramid Network) 算法的网络,具有独特的 Focal Loss 来处理难题;

Faster R-CNN:对象检测网络最常见的结构;

所有网络都可以使用以下几种可选的分类主干之一:

ResNeXt {50101152};

RESNET {50101152};

Feature Pyramid Network(使用 ResNet/ResNeXt);

VGG16;

更重要的是,所有上述这些模型都是带有 COCO 数据集上的预训练模型,因此你可以立即使用它们!他们已经在 Detectron 模型动物园中使用标准评估指标进行了测试。

FastText
这是另一个来自 Facebook 的研究,fastText 库专为文本表示和分类而设计。它配备了预先训练的 150 多种语言的词向量模型,这些单词向量可用于许多任务,包括文本分类,摘要和翻译等。

Auto-Keras
Auto-Keras 是一个用于自动机器学习(AutoML)的开源软件库。它由 Texas A&M 大学的 DATA 实验室和社区贡献者开发。AutoML 的最终目标是为具有有限数据科学或机器学习背景的开发工程师提供易于访问的深度学习工具。Auto-Keras 提供自动搜索深度学习模型的最佳架构和超参数的功能。

Dopamine
Dopamine 是由 Google 基于强化学习创建的快速原型设计的研究框架,它旨在灵活且易于使用,实现标准 RL 算法,指标和基准。
根据 Dopamine 的文档,他们的设计原则是:

简单的测试:帮助新用户运行基准测试;
灵活的开发:为新用户提供新的创新想法;
可靠:为一些较旧和更流行的算法提供实现;
可重复性:确保结果是可重复;

vid2vid
vid2vid 项目是在 Pytorch 上实现的 Nvidia 最先进的视频到视频合成的模型。视频到视频合成的目标是学习从输入源视频(例如,一系列语义分割掩模)到精确描绘源视频内容的输出照片拟真视频的映射函数。
这个库的好处在于它的选择:它提供了几种不同的 vid2vid 应用程序,包括自动驾驶 / 城市场景,人脸和人体姿势。它还附带了丰富的指令和功能,包括数据集加载、任务评估、训练功能和多 GPU!
其他一些有价值的项目:

ChatterBot:用于对话引擎和创建聊天机器人的机器学习模型;

Kubeflow:Kubernetes 的机器学习工具包;

imgaug:用于深度学习的图像增强;

imbalanced-learn:scikit 下的 python 包,专门用于修复不平衡数据集;

mlflow:用于管理 ML 生命周期的开源平台:包括测试,可重复性和部署;

AirSim:基于虚幻引擎 /Unity 的自动驾驶汽车模拟器,来自 Microsoft AI 和 Research;

本文作者:【方向】阅读原文
本文为云栖社区原创内容,未经允许不得转载。

正文完
 0