赛默飞世尔(Thermo Fisher)是迷信服务畛域的世界领导者。其使命是帮忙客户使世界更衰弱、更清洁、更平安。该公司会帮忙客户减速生命科学畛域的钻研、解决在剖析畛域所遇到的简单问题与挑战、促成医疗诊断和医治的倒退、进步实验室生产力。
生命科学钻研人员在一个正在疾速变动的行业里从事着越来越简单的工作。随着最近对 COVID-19 大风行的关注,世界各地的科学家都在显微镜下致力工作以便提供无效的医治计划。赛默飞世尔的准则是,向这些钻研人员以及像他们一样的人,向他们提供钻研世界最紧迫问题所需的工具和资料。该公司销售的业余产品始终须要个性化的客户体验。他们销售简直所有与迷信工作相干的产品,从实验室器具和化学试剂等日常必需品到基因测序的专门仪器。
基于传统解决形式,该公司由专门商业销售团队通过培训,而后让销售人员针对特定产品采纳特定的营销形式。在当今世界中,客户数据来源于许多不同的中央,这使得销售团队越来越难以理解客户须要哪些产品用于他们的钻研工作。在过来的三年中,该公司的团队为这些销售团队保护了一个自定义门户,他们能够在其中查看客户的全面的数据信息。这种疾速变动的环境为赛默飞世尔提供了一个独特的机会,让他们利用数据迷信,在正确的工夫为正确的客户提供个性化的产品举荐。
本文由赛默飞世尔的大卫·史密斯撰写,将介绍赛默飞世尔为什么决定应用 Amazon Personalize,以及是如何应用的,并如何将决策受权给团队,以及如何在一直倒退的生态系统中提供高度个性化的多渠道内容。
第一代举荐零碎
咱们的团队最后开发了基于规定的举荐零碎,该零碎基于外部科学家畛域常识构建的内容,并在 Amazon Redshift 集群中应用 SQL 进行查问。咱们这个零碎曾经构建并应用了一年,而且运行良好,但随着数据量的增长,咱们的团队破费了越来越多的工夫来保护这个零碎。咱们感觉目前的基础架构无奈跟不上趋势,因而心愿迁徙到齐全无服务器(Serverless)的基础架构,以进步可扩展性和容错性。下图展现了咱们的举荐零碎架构。
咱们发现的另一个危险是,为了了解产品与客户的适配关系,咱们的举荐必须依赖于外部的内容创立流程。尽管这个工具很弱小,然而咱们始终在努力提高新产品或最近推出的产品的举荐成果。对于举荐零碎来说,这是一个典型的「冷启动」问题,咱们对任何新零碎的要求之一就是,它能够在不减少保护老本的状况下可能实现新产品的举荐。
自定义举荐零碎
咱们的团队最后是找的第三方供应商来帮忙咱们改良举荐零碎。然而,咱们发现购买解决方案施行老本昂扬,而且咱们还须要就义在商业组织中经营所需的一些灵活性。咱们最终决定不购买现成的解决方案。最终得出的论断是,咱们将从头开始构建一个基于自定义机器学习(ML)的零碎。咱们尝试了几个不同的选项,包含分层循环神经网络(HRNN)模型。最终,咱们确定了一个分理化机器(factorization machine)模型,它能够作为性能、易于实现和可扩展性的最佳组合。
个性化举荐
大概 8 周后,咱们完结了模型开发和验证的初始阶段,新零碎运行良好。新零碎大大改良了咱们的预测,并且咱们从咱们发送的一些示例倡议中收到了良好的反馈。当咱们的团队理解 Amazon Personalize 时,咱们正筹备用新解决方案降级咱们的举荐零碎。两个月前咱们评估了现成的解决方案,在理解 Amazon Personalize 之后咱们立刻发现 Amazon Personalize 在灵活性、可扩展性和可度量性之间领有现实的均衡。起初咱们决定应用 Amazon Personalize 测试运行一些初始测试,以查看它在实在数据上的体现,并理解实现它须要付出多少致力。咱们花了 2 天工夫筹备数据、训练模型并开始生成高质量的举荐。
无服务器基础架构
在为迷信产品倡议设计基础架构时,可扩展性和容错性是咱们的首要任务。咱们还想要一个零碎,使咱们可能直观地监控进度和跟踪谬误。咱们抉择应用 Amazon Step Function 构建咱们的举荐推理流程的骨干,应用定制的 Amazon Lambda 函数从咱们的 Amazon Redshift 集群中提取数据,为 Amazon Personalize 引入数据集做好筹备,并触发和监控 Amazon Personalize 作业。下图阐明了此推理流程。
一直变动的世界中的灵活性
与许多公司一样,当 COVID-19 大风行袭来,世界各地的企业转向在家工作政策时,咱们的客户的习惯也产生了显著的扭转。他们对应用电子邮件广告流动,实现多渠道营销的需要明显增加。咱们的团队收到应用咱们基于 Amazon Personalize 构建的举荐零碎以实现特定产品电子邮件举荐的需要。只管咱们从未为此打算过,但咱们只用了一周工夫就将现有的无服务器推理流程进行了批改,以构建、测试和验证一个专门为电子邮件举荐而构建的全新推理流程。需要的疾速变动总是具备挑战性的,但咱们致力于构建可扩大且灵便的基础架构,这使咱们可能克服团队在治理 ML 部署和基础架构时所面临的许多传统挑战。下图展现了电子邮件推理流程的体系结构。
只管需要的开发工夫短,但咱们依据这些举荐发送的电子邮件所产生的成果显著要好于之前的基线规范。让咱们再回头看下,这是不言而喻的,如果咱们抉择部署自定义的分理化机器模型而不是应用 Amazon Personalize,那么满足此次需要的的难度会大大增加。
总结
赛默飞世尔始终致力帮忙世界各地的科学家解决咱们面临的一些最大挑战。借助 Amazon Personalize,咱们极大地提高了咱们理解客户工作的能力,并通过多种渠道为他们提供个性化体验。应用 Amazon Personalize 使咱们可能专一于解决难题,而不是治理 ML 基础架构。