乐趣区

关于人工智能:机器学习下一个万亿级的增长从哪来

简介: 果机器学习无望发明可观的价值,那么问题来了:这些价值将在哪里产生呢? 在本文中,笔者将介绍三种类型的公司发明并获取价值的形式:利用机器学习的传统公司、构建无行业属性机器学习工具的公司以及构建垂直集成机器学习利用的公司。

在“哈利. 波特”的世界中,分院帽是一种算法,能够取得学生的行为历史、爱好和性情等方面的数据,而后据此作出决定,确定学生应该进入霍格沃茨学校里的哪一个分院。如果事实世界里存在这样的分院帽的话,它应该会是机器学习应用程序,能够依据简单的数据集自主地做出决策。现在,机器学习正在推动数万亿规模的寰球产业,例如医疗保健、平安和农业等。

如果机器学习无望发明可观的价值,那么问题来了:这些价值将在哪里产生呢? 在本文中,笔者将介绍三种类型的公司发明并获取价值的形式:利用机器学习的传统公司、构建无行业属性机器学习工具的公司以及构建垂直集成机器学习利用的公司。

机器学习不仅仅是科技巨头的游戏

科技巨头在机器学习方面的翻新广为人知,从新闻推送到举荐引擎不一而足,然而绝大部分人还没有意识到传统行业对机器学习的需要正在日益增长。预计到 2023 年,寰球人工智能零碎收入将达到 980 亿美元,比 2019 年收入规模的 2.5 倍还要多,其中金融服务,批发和汽车畛域处于领先地位。

比方,主持了超过 7 万亿美元资产的投资治理公司黑石 (Blackrock) 在 2018 年推出了几款机器学习撑持的 ETF 产品。而目前,机器学习也曾经在医疗保健行业引发了宽泛的关注,波及医疗影像、诊断和药物发现的机器学习解决方案的估算无望在将来三年内达到 100 亿美元的规模。

在这些企业客户中,呈现了三个宽泛的客户群:软件工程师、数据科学家和业务分析师,业务分析师有时也被称为“公民数据科学家”。只管业务分析师受过的技术培训程度较低,然而他们形成了一个宏大并且一直增长的用户群体,这个群体正在利用机器学习帮忙他们的企业利用自身一直增长的数据存储库。

机器学习工具曾经浸透进入各行各业

为了适应这些客户群体,心愿在这轮淘金热中卖镐的公司数量一直激增。已经在特斯拉和 Snap 负责过工程副总裁的 Stuart Bowers 示意:“挑战并不在于让机器学习变得通明,而是让苦楚的局部 (例如日志记录、数据管理、部署和可再现性) 变得容易,而后让模型训练变得高效并且可调试。”

作为销售更多基础架构服务策略的一部分,现存的供应商——特地是那些私有云供应商曾经采纳了“端到端平台”的形式。对于巨头来说,销售机器学习工具是一种推动其客户减少基础设施收入的形式,这意味着他们有能力以很低的老本提供这些工具。

然而,企业从业人员们开始要求“同类最佳”解决方案,而不是那些意在吸引他们购买更多基础架构的工具。为了解决这个问题,下一代的守业企业将会谋求更具针对性的办法。和以后各大现有平台宽泛采纳的模式相同,初创企业能够抉择特定问题并开发专用工具,这样能够更无效地解决这些问题。在机器学习工具畛域,当初存在着三大问题对用户形成了重大挑战。

数据集治理

尽管机器学习的后果可能看起来很优雅,但实际上,从业人员要将大部分的工夫花在数据清理、整顿和转换工作上。因为数据越来越多地以各种不同的格局扩散在多台机器和云之中,因而将数据变成同一种可生产的格局,让团队可能轻松应用并且将其用于合作是十分艰难的一件事。

为了解决这个问题,Tecton 的联结创始人兼首席执行官 Mike Del Balso 正在通过他新的守业公司使他在 Uber 提倡的最佳实际民主化。他示意:“被毁坏的数据是导致生产机器学习零碎呈现问题的最常见起因。建模人员将大部分工夫都花在训练时抉择和转换性能,而后建设管道,将这些性能传递到生产模型之中。”Tecton 构建了一个平台来治理这些“性能”,并以这种形式来简化数据层的复杂性,从企业原始数据中收集到的智能实时信号对于优化机器学习至关重要。

在更上游,Liquidata 正在为数据库构建开源的 GitHub 等效项。在我与 Liquidata 的联结创始人兼首席执行官 Tim Sehn (他已经是 Snap 的前工程副总裁)的谈话中,他强调“就像开源软件一样,咱们须要在凋谢数据方面进行合作——在互联网级别。这就是为什么咱们创立了 DoltHub 的起因,DoltHub 是互联网上收费存储、托管和合作数据的中央。”

试验跟踪和版本控制

另一个常见的问题是后果之间不足可重复性。机器学习模型版本控制的缺位让试验变得很难复现。

正如 Weights and Biases 的联结创始人兼首席执行官 Lukas Biewald 在承受咱们的采访时分享的那样,“现在,最大的苦楚是不足根本的软件和最佳实际来治理全新的编码格调。你无奈应用蹩脚的画笔很好地作画,你没有方法在蹩脚的 IDE (集成开发环境)中很好地编写代码,你也无奈应用咱们当初领有的工具构建和部署很棒的深度学习模型。”他的公司于 2018 年推出了一个试验跟踪解决方案,让 OpenAI 等客户可能将见解从单个钻研人员扩散到整个团队。

模型可扩大

对于这个正在成熟的市场来说或,建设基础架构以在生产中扩大模型部署并监控后果是另一个重要的问题。

Anyscale 是开源框架 Ray 背地的公司,这家初创公司曾经形象出了分布式应用程序和可扩大机器学习的基础架构。在我同 Anyscale 的联结创始人兼首席执行官 Robert Nishihara 的交谈中,他分享了本人的想法,“就像微软的操作系统为开发人员工具和应用程序发明了一个生态系统一样,咱们也在发明基础架构,以反对应用程序和库的富生态系统,从模型训练到部署,让开发人员能够轻松地扩大机器学习应用程序。”

在自然语言解决或者被称为 NLP 的畛域中,可扩展性也在飞速发展。Hugging Face 建设了一个开源库来构建、训练和共享 NLP 模型。该公司的联结创始人兼首席执行官 ClémentDelangue 示意:“过来三年中产生了范式转变,NLP 的转换学习开始极大地扭转了将 NLP 集成到业务应用程序中的可用性和准确性。”他示意:“咱们让企业有可能在一周而不是几个月之内,将最新钻研的 NLP 模型利用于生产。”

其余有前途的初创公司包含 Streamlit,该公司让开发人员能够仅仅应用几行 Python 就创立机器学习利用并立即进行部署。OctoML 为机器学习利用了附加的智能层,是零碎变得更加易于优化和部署。Fiddler Labs 曾经建设了 Explainable AI Platform (可解释的人工智能平台),能够不间断地解释和监控生产后果。

要想在与老牌公司的强烈竞争中建设起长期巩固的公司,初创公司必须问本人两个问题:对于哪些客户来说咱们是必不可少的? 接触这些客户的最佳形式是什么?

很多初创公司会提出想法,要在某个大市场中占据 1% 的份额,然而通常来说,这些大市场就算没有适度拥挤,其中的需要也曾经失去了很好地满足。专一于博得外围客户群的公司必须展现出弱小的晚期吸引力,这将转化为长期扩大后劲。为了吸引这些客户,Databricks 和 Datarobot 等大多数成型企业都采纳了自上而下的企业销售形式。与咱们在开发人员工具畛域中看到的状况相似,我期待着机器学习初创企业最终将从单纯的企业销售倒退为推动自下而上的采纳,并取得更多劣势,胜过当今以企业为核心的成型公司。

垂直集成的机器学习应用程序正在颠覆现状

机器学习畛域中一些最令人兴奋的公司正在开辟新的商业模式以颠覆整个行业。汽车行业就是个最显著的例子,仅仅在 2019 年一年,就有 100 亿美元的资金投入到了这个行业。机器学习也将产生革命性影响的下一代垂直市场还包含医疗保健、工业、平安和农业。

Salesforce 的首席科学家 Richard Socher 示意:“在‘机器学习 + X’的模式下,机器学习最为无效。”他示意,“最好的机器学习公司都有着清晰的垂直重点。他们甚至不会将本人定义为机器学习公司。”他认为医疗保健畛域是一个十分独特的畛域,极有前途:Athelas 已将机器学习利用于免疫监测,通过收集病人白血球数量的数据帮忙他们优化药物摄入。Curai 利用机器学习技术来进步医生举荐的效率和品质,让他们能够把更多的工夫花在医治患者的工作上。Zebra 和 AIdoc 通过训练数据集来更快地确定医疗情况,从而进步了放射科医生的工作能力。

在工业和物流畛域,Covariant 是一家联合了强化学习和神经网络的初创公司,该公司让机器人可能治理大型仓库设施中的物体;Agility and Dexterity 同样在构建机器人,以越来越简单的形式适应各种不可预测的状况;Interos 利用机器学习技术评估寰球供应链网络,帮忙企业围绕供应商治理、业务连续性和危险做出要害决策。

在平安和国防畛域,Verkada 通过智能地剖析实时视频并从中学习,从新构想了企业物理平安;Anduril 建设了一个机器学习骨干,该骨干能够集成来自传感器塔的数据,以加强国家平安的智能;Shield AI 的软件让无人零碎能够解释信号,并且在战场上智能口头。

农业是另一个从机器学习技术中取得微小收益的垂直畛域。John Deere 收买了 Blue River Technology,后者是一家开发智能农作物喷洒设施的初创公司。合并后的公司 Intelligent Solutions Group 的首席科学家 Lee Redden 示意:“咱们引入 计算机视觉技术 来辨认单株动物并针对单株动物采取行动,通过这种形式扭转了农业世界。”其余驰名的农科企业还包含 Indigo,该公司将机器学习用于“精准农业”,利用数据,以更有利可图、更具可持续性的形式生产食品。

咱们将何去何从?

总结来说,机器学习曾经悄悄成为咱们日常生活的一部分,撑持咱们的汽车,医院的经营并保障咱们所吃的食物。到目前为止,大型企业孵化了最先进的技术,然而真正的心愿存在于下一波机器学习应用程序和工具,将围绕着机器智能各种金玉其外; 败絮其中的炒作从哈利. 波特式的空想转化为无形的社会价值。

对于机器学习可能在将来几年内发明的价值,咱们有很多理由放弃乐观。传统企业将训练数以百万计的公民数据科学家,将破碎的行业重塑为更高效的行业。机器学习工具将升高构建智能应用程序的门槛,推动数以百万计的新想法变成产品。垂直机器学习业务模型将让人们取得衰弱的食品,牢靠的人身安全保障和负担得起的医疗保健服务,这是一个民主化的过程。

咱们将在这些中央找到机器学习的真正价值。

文章起源:https://yqh.aliyun.com/detail/17328

退出移动版