共计 4119 个字符,预计需要花费 11 分钟才能阅读完成。
本次跟大家分享的是哈啰逆风车智能交易体系建设。上篇,咱们介绍了哈啰逆风车的业务背景和智能利用中的订单匹配。
算法利用
订单匹配
首先介绍一下多任务模型,业务背景是咱们要做发完单的预测,预测的越准,做排序的时候也就越准。但在做发完单预测的过程中,咱们的数据量是绝对无限的,之前讲了因为咱们是一个漏斗,在发单到接单的过程当中,会产生大量的数据,这部分数据实际上是失落的。如果可能把这部分数据用上的话,对进步咱们模型的性能会有帮忙。所以咱们依据这个状况,设计了一个双塔构造的模型,咱们把发单和接单模型训练成了独自的模型,相当于是一个辅助的工作和主工作拼接在一起进行训练。这样训练后的模型,就可能利用更多的数据,当然过程中咱们也设计了一些定制化的损失函数。通过这样的办法训练下来,咱们给这个模型起了个名字叫 WDMM 模型,它比 Wide&Deep 模型效率晋升了 2.65%。
接下来介绍一下实时序列模型,咱们对司机的行为模式进行辨认,司机根本能够分为职业司机和非职业司机,但实际上司机还有很多不同的状态,所以咱们对司机在地图上的各种流动,把他的行为序列做了向量化。咱们应用 Attention 的交互去做,把它映射成了一个向量,而后把这个向量和其余的特色拼接起来,再放到模型外面去,这样就可能更好的去体现司机的行为模式。最初咱们去跟 Wide&Deep 模型比拟,能够看到效率晋升了 3%。
接下来介绍一下策略优化,是顺路度的革新。在咱们的举荐列表上是有一些顺路度的,它间接显示在下面,会对司机的接单决策产生影响。起初的顺路度是天文上的顺路度,能够看到右边的图是某竞品 APP 的顺路度,顺路度显示的都是一样的,这样就不能疏导点击举荐列表上最高位的那一个,而举荐列表上最高的那一位才是完单概率最高的。所以依据这个状况,咱们就对物理的顺路度进行了一些革新,融入了更多与完单概率相似的一些因子,比方工夫是否匹配,接驾的终点起点是否匹配,以及把共享里程与绕路度都加进去了。做完了之后,咱们能够看到顺路度的逻辑基本上与举荐列表的逻辑是统一的,这样能晋升司机的决策信念,大盘的增幅超过了 5%。
接下来介绍一下召回,方才也提到了跟其余广告零碎去比拟的话,咱们召回的特点首先是实时性,就是咱们须要实时计算门路等信息。第二个特点是同质性,与视频网站能够给用户举荐不同性质的视频不同的是,咱们的零碎推的基本上是订单,类型并不会有太大的差异。第三是均匀数量适中,数量差别大。召回是举荐的底盘,所以咱们会依据找到的问题,制订不同的应答办法。第一点是因为咱们是实时计算的,所以不可能做向量化。第二点是咱们能够依照地理分布、工夫散布等策略形式进行召回。第三点是范畴能够适度进行扩充,此外不同的城市会进行不同策略的召回。总体来说召回就是尽量多的把想要召回的召回,如果召回太多,性能又会受不了,所以咱们须要去预判什么样的状况性能还能接受。在咱们做了一些召回策略上的调试之后,大盘会有 2% 左右的晋升。
最初是咱们订单匹配的工程计划,咱们要实现这样的计划还须要依赖一些工程能力。之前提到咱们工夫的要求十分高,这里依赖了搜索引擎的算法插件零碎和高性能 Rank Service 零碎,此外还要依赖司乘同显服务的能力。由算法和工程的一些底层能力,独特形成了这样的一套计划,可能帮忙咱们实现订单匹配的工作。
营销和定价
咱们的定价形式有根底定价、城市差别定价、感知竞对变动,最终咱们心愿可能做到智能定价。当初咱们根本还在第二个阶段,也就是城市差别定价。影响的因素首先是供需,能够看到价格一直进步的话,我的需要就会升高,供应就会减少。咱们进行不合理的定价和最正当的定价,产生的业务量是不一样的。另外一个因素是竞争,咱们的竞争对手给市场定下的价值,也会造就市场上司机和乘客的意识,对咱们也是有影响的。此外工夫地点对咱们也是有影响的。
定价完了之后,咱们把定价和营销放在一起来说,营销实际上也是做了定价的工作。咱们能够看到上图,咱们补贴了一些金额让需要曲线往上挪动。在给乘客进行补贴的时候,咱们取得了业务量的减少。具体到一次营销流动,咱们能够看到算法策略的价值比经营策略的价值高一些,也就是咱们营销所带来的增量的价值,这就是咱们的背景。
接下来介绍一下智能定价,这里的智能定价实际上也是一种营销。咱们并没有同时对两边进行调整,而会把当中的差额本人提供补贴给用户,所以它也是一种营销。实际上这是在打车业务里去做的,跟逆风车相似,咱们心愿在业务的场景里去放弃每个区域外面的供需的比例基本一致。所以咱们会去发现供需失衡的场景,而后再圈选哪些人须要进行补贴,并对他进行个性化的补贴。能够看到在这种状况下,算法是做了差异化的策略,如果没有做差异化的策略,它的钱效就会低 30%,这也是咱们的算法带来的增量。
接下来是智能营销的利用,其实它就是要保护咱们司乘全生命周期的过程,尽量多的让更多的司机和乘客在咱们的零碎里,咱们有拉新、促活、防散失、散失挽回这样的过程。对于新司机如何开掘,如果新司机注册了想要激活,那就有新车主的奖励金。如果你曾经变成新车主了,咱们有司机多单任务,晋升司机在平台的实现工作的数量。如果他要散失了,咱们会进行返现,或者对他做一些散失召回。对于乘客也是相似的,在他的生命周期中进行一些触达以保护乘客。
最初是咱们的智能营销计划,次要用到了 response 模型、uplift 模型和运筹优化。咱们要做的事件就是决定在什么工夫,对哪些人做什么样的营销流动,并且要满足咱们估算的要求。目前咱们的营销效率绝对于经营来说,整体晋升的效率在 20% 左右。
智能仲裁
智能仲裁咱们目前并没有大规模的应用,但模型实际上曾经上线。在业务中,咱们的用户会产生一些投诉的状况,当投诉产生的时候,他就会把 Request 发到咱们智能判责的引擎外面。智能判责引擎是依据历史情绪反馈的正负样本去进行建模的,就是以往产生了投诉之后,咱们判责的案例就会作为正负样本,到底是司机有责还是乘客有责,咱们会把路上的一些轨迹信息、录音的信息、用户和司机历史的状况,各种各样的行为都作为特色放到这个模型外面进行训练,构建出了这样的一套模型,会主动对一些比拟显著的案例进行判罚,如果是十分不确定的话,就会给到客服那边。
接下来介绍一下智能仲裁的典型场景,比方咱们判责的利用有车主催车费判责,是因为咱们车主有很多曾经到了起点,然而乘客没有点击界面上的曾经达到起点。这个时候咱们以往的做法就是要隔很长的工夫,才会把款打给车主,会引发车主的情绪。这种状况产生,咱们能够依据轨迹的信息进行判责,看是否他曾经把乘客送到起点,曾经有的话就能够把钱款尽早打给司机,这样就能够缩小投诉率。相似的也有司机早退判责等。这类问题都存在一些共性的问题,比方打标数据难以获得、成果难以验证、和次要业务指标抵触。比如说进行处罚之后,他可能就不能完单,这对业务会有负面作用。如何去均衡用户体验和业务增长的指标,须要多与业务和产品进行探讨。
办法总结
算法我的项目的推动形式
首先要更正当的定义问题,就是咱们要预测的是什么,咱们的业务指标是什么。这里有一个例子,比方咱们要去晋升大盘完单完单率,但如果接完率有进步,发完率有升高,这种状况下它有很多的两头指标,有可能最终的指标是没有晋升的,然而两头指标有晋升,咱们怎么样去发现更多的有意义的价值,可能从外面提炼进去,这也是十分重要的。定义好问题之后,接下来是更正当的利用数据。这里须要 domian、expert 输出,就是业务同学的很多教训对咱们是有用的,比方方才提到的职业司机和非职业司机,实际上也是来源于咱们业务的教训,他会对咱们的司机群体的个性有一些判断,这些都可能帮忙咱们去构建构建一些特色和数据。第三步是抉择更适合的模型和策略。基本上对于咱们的模型来说,缩小了偏差和方差这两种谬误。咱们的模型要选树模型、深度模型、多任务模型等就会绝对独立一点。然而后面两步如果咱们做的不好,即便前面做的再好,算法也会呈现一些问题。
MLOps 实际
MLOps 就是咱们整个训练中怎么流程化、复用、可重现,部署上怎么进行模型治理、注册、上线,运维上咱们怎么样可能追踪过程中的指标,比如说用户数、提早,以及咱们怎么样可能告警,比如说线上业务有模型、数据的漂移,怎么样可能及时发现。还有自动化,指的是咱们的模型怎么样可能依据不同的状况,阈值有不同的变动。这里有一篇 2015 年的论文,讲的是机器学习零碎外面一些隐形的技术栈,机器学习的 code 实际上只是整个机器学习解决方案 code 外面很小的一块,在咱们四周实际上还有大量的代码,比如说数据怎么样收集、特色怎么样提取、数据怎么校验、机器资源怎么监控,怎么样去剖析、流程怎么治理、上线之后底层的服务怎么样去监管,以及整个服务的运行状态怎么样去监控,这些在以前并没有系统地去进行治理,但实际上咱们整个模型上线之后,它呈现了种种问题,最终都会反馈到咱们这里来。所以这也迫使咱们必须做好这些事件。拿告警来说,咱们以前可能没有留神到会产生一些问题,比如说做营销的时候,补贴可能很快就发完了。咱们也不晓得呈现了什么样的问题,可能就是上游的数据一个字段没有传过来,这就阐明数据产生了一些漂移。起初咱们就加了一些监控,就看咱们模型每天数据的 auc 是否有大幅的稳定,如果有大幅的稳定就阐明可能数据有了问题,或者模型有了问题。模型漂移的问题就阐明咱们用户的群体可能不一样了,用户的行为模式就会不一样,所以咱们这个模型也须要主动地去更新,主动地去反抗市场的变动。这些基本上在咱们的订单匹配零碎里都做到了,咱们的模型每个星期都会主动去进行训练,会和最新训练的数据去进行验证,auc 进行比拟,更好的模型才会主动上线。
最初总结一下,本次分享首先是对逆风车业务进行介绍,包含订单匹配、营销定价和仲裁。并且依据这几个方向做了几个利用,包含智能订单匹配、智能营销定价和智能仲裁。最初介绍了两个教训,包含我的项目推动的形式和 MLOps 实践经验。
(本文作者:王凡)
本文系哈啰技术团队出品,未经许可,不得进行商业性转载或者应用。非商业目标转载或应用本文内容,敬请注明“内容转载自哈啰技术团队”。