共计 674 个字符,预计需要花费 2 分钟才能阅读完成。
尽管机器学习的倒退每天都在增长,然而来自 Algorithmia 的一项考察显示,大多数企业破费 8 到 90 天的工夫来部署 ML 模型。大多数人将责任归咎于无奈扩大,其次是模型可重复性方面的挑战,例如不足官网认可和工具有余。
而 LinkedIn 最近开源的 Dagli,是一种用于 Java 和其余 JVM 语言的机器学习库。该库使您能够轻松起草抗谬误,可了解,可批改,可保护和可部署的模型管道,而不会导致技术累赘。
Dagli 环境具备大量的工作管线组件(pipeline components),蕴含神经网路、逻辑回归、梯度晋升决策树、FastText、穿插验证、穿插训练、特征选择、数据读取器、评估、特色转换等。而 Dagli 环境提供工作管线定义、动态类型、不变性等个性,从根本上防止大部分的逻辑谬误。此外,Dagli 也提供高度可移植性,开发者能利用于伺服器、Hadoop、CLI、IDE,与其余典型的 JVM 环境中工作。
对资深的机器学习工程师来说,Dagli 提供开发高效能且生产就绪的模型,可能长期保护,也能裁减,与当初基于 JVM 技术的重叠整合。对于机器学习老手工程师,Dagli 提供直观的 API,能联合相熟的 JVM 工具应用,并防止常见的逻辑谬误。
LinkedIn 的自然语言解决钻研科学家 Jeff Pasternack 示意,机器学习模型通常是集成管道的一部分。这使生产管道的建设,培训和部署更具挑战性。为了兼顾训练和推理,通常须要反复或内部工作来产生使模型的将来倒退和保护变得复杂的无弹性胶粘代码。
GitHub:https : //github.com/linkedin/dagli
正文完