本文介绍如何将机器学习预测能力迁徙至es外部,加强排序能力, 构建一个高性能、分布式搜排一体零碎,并通过落地更多简单模型特色和更深的计算,为业务带来新的增长点,咱们将LR->树模型实现全量排序,给外围业务带来1.2%的ab增长。

背景介绍

咱们团队次要负责哈啰四轮司乘匹配的召回排序,在逆风车司乘匹配场景中,司机发单后零碎会从订单池中筛选展现适合的乘客订单,促成司机发单到完单,带来营收。整个过程排序是一个十分要害的环节,目前咱们底层的排序架构是用了经典粗排-精排重排级联排序。

在粗排阶段,咱们应用LR(Logistic Regression)算法对数千个订单进行排序。而在精排阶段,咱们筛选出前300名订单,并应用rankservice实现深度排序。在重排阶段,咱们再选取10个订单进入业务相干重排。

咱们团队在精排阶段将模型由树模型升级成深度模型,并获得了不错的业务成果,同时也积淀了肯定的技术。因而咱们开始思考将粗排也进行精排化,即采取更加简单的模型和更多的特色。参考行业教训以及业务场景的特点,如路线匹配路线和算法离线评估,咱们决定将粗排从LR降级为成果更好的树模型。

在达成这个指标的同时,也会解决历史中存在的技术问题。之前的树模型受限于技术,单机只能反对300排序 -> 降级到es外部实现全排序。LR的迭代全副手写代码->编程配置化,减速迭代,减少稳定性。

整体计划

机器学习在线预测流程

须要在程序中获取一批特色inputs传入模型,返回模型预测分数output。在这个过程中,依据起源分成以下几种类型:

  • 实时特色
  • 上下文特色  
  • 离线特色    
  • 组合特色

每种类型特色都须要对应一套技术解决方案。

具体计划

咱们将整个机器学习以插件的模式嵌入es外部,其中蕴含多个重要的组件。

1.特色获取计划

  • 实时特色
    司机的实时特色由flink计算后上游查问从接口传入,订单的实时特色由flink写入索引。
  • 上下文特色
    司机的实时特色由调用传参带入。
  • 离线特色
    由kkv零碎实现离线特色的加载、查问、更新,能够反对到分钟级别。
  • 组合特色
    咱们外部设计了一套DSL,通过配置即可实现特色生成,蕴含了组合特色。

2.重要组件简介

  • kkv:
    在线获取离线特色。
  • 热加载:
    es脚本插件须要重启整个集群能力实现更新,咱们在它的底层接口进行了一层形象,借助热加载的能力实现对业务插件的更新。
  • 执行引擎:
    执行引擎次要用来对模型的加载、预测,底层反对多种算法模型预测。
  • 文件散发零碎:
    次要用于将文件更新到整个集群,触发业务回调,算法同学在训练平台玩实现kv训练,模型训练以及配置文件设置,会通过文件散发零碎实时同步到整个es集群,实现更新,触发业务回调。
  • 特色生成:
    特色配置生成零碎,通过自定义DSL获取全副的模型入参特色。
  • DEBUG:
    用于疾速验证在es外部机器学习模型预测的准确性。

要害组件

执行引擎

执行引擎次要用于对模型的加载预测。

算法训练常见的模型有树模型、深度模型,还有局部自定义。不同的模型框架,算法可能须要工程做独自的适配,咱们冀望有一种通用的执行引擎能够解决掉简单的适配问题,既能够反对在sparkml 的模型,也能够反对深度学习。咱们抉择了mleap,它是一种通用的执行引擎,算法同学应用sparkML实现模型的训练,应用mleap进行序列化,生成对立的模型,在线上应用mleap的api 进行加载预测。

kkv零碎

次要用于离线特色的加载和查问,咱们会面对一些海量离线特色存储查问的挑战。

挑战:

  • 检索rt要求高
    举个例子,假如本次检索命中了1000个订单,模型有100个离线特色,单位工夫kv检索达到10w次。近程io无奈反对,所以做成特色本地化。
  • 特色量大
    咱们的特色曾经达到百亿级别,传统的加载无奈反对,这块咱们的解决方案是应用mmap内存映射技术,读取二进制实时反序列化,这个解决方案es的docvalue 底层是一样的。

咱们调研了一些常见mmap解决实现, ohc mapdb rocksdb paldb , 发现paldb在性能、存储和索引速度都是最快的。

线上数据:

(数据均来自精排的深度学习)

hive表 50G -> 索引文件 20G -> 映射内存 10G

查问速率:获取390订单,100纬度离线100组合50上下文的特色数据,耗时5.6ms。

(总rt 18.5  tf预测: 12.5  特色: 6)

文件散发零碎

dragonfly次要用于更新文件触发业务回调。

咱们有配置文件 jar 模型 kv 文件,须要被散发到es外部,触发回调。咱们针对共性的需要开发了一个散发零碎。

逻辑很简略,文件通过dragonlfy 上传到存储系统中(OSS,HDFS等),批改meta,consumer 监听近程文件,发现meta变更主动下载文件->校验md5->触发回调用。

性能:

  • 文件变更主动下载最新文件,触发业务回调;
  • 极速MD5校验本地记录MD5;
  • 易用性,反对注解驱动;
  • 反对灰度加载,可与任意配置核心整合 apollo,自定义配置;
  • 更新回调状态,用于监控;
  • 反对多环境,采纳虚拟环境;
  • 反对多回调等等。

以下为rankservice与spring整合的截图。

 //文件监听  @Dragonfly(storagePath = "model/lo_cc_deep_model_v1.tar.gz")    public void getDeepFMModel(File file, String path) throws IOException {        super.getDeepFMModel(file,path);    }  //多回调  @Dragonfly(storagePath = "model/lo_cc_deep_model_v1.tar.gz")    public void test(File file, String path) throws IOException {        System.out.println("单体测试3");    }  //目录监听  @Dragonfly(dirPathMonitor = "model/deep",filterBean = ApolloFilter.class )    public void getDeepFMModel(File file, String path) throws IOException {        super.getDeepFMModel(file, path);    }

热加载

不须要重启整个集群即可实现插件更新的性能。

es启动的时候就会进行热加载插件的加载,通过dragonfly监听/回调业务.jar,装载实现进入插件库,es query 中指定相干的实现即可实现对业务执行。

jar外面蕴含了多种类型插件实现:

  • filter实现:eta过滤,夹角过滤,沿途间隔过滤等
  • sort实现:排序有顺路度,mleap排序(树模型排序,tf排序)
  • script_field实现:字段插件有顺路度

插件开发tips:

  • 是否存在内部资源
    须要手动敞开
  • 是否存在第三方jar,存在内存透露
    热加载常见问题内存透露,能够通过压测来发现
  • 提前加载预热,避免突刺
    对class提前初始化,存在资源加载的状况
    模型提前预热
  • 分层热加载
    轻资源 class的加载和卸载
    重资源独立,不参加热加载,比方 kv 热加载会导致之前的kv pagecache淘汰,从新reload,会耗费系统资源
  • 谬误日志限度输入
    es 文档计算是row by row,有多少文档输入多少次日志,重大耗费零碎cpu,导致服务不稳固
    限度一次申请只能输入一个谬误日志

配置化的迭代

咱们冀望特色迭代配置化,算法工程同学不写一行代码。

难点:特色组合(特色穿插),特色解决的逻辑变幻无穷,须要设计一套计划来解决特色灵便变换的问题。

介绍:如何获取一个组合特色

如图所示, 原始user 特色+原始item特色,通过特色组合或者穿插,生成模型特色。

咱们看下之前的解决方案:每个特色都须要手写代码,一个模型有几百个特色,十分麻烦,并且容易出错。咱们的解决方案:应用自定义算子+原始特色,利用反射来实现特色生成。

咱们外部自研了一套dsl,通过配置就实现模型任意类型特色的生成。(实时 kv 上下文 组合)

咱们会将验证精确的特色配置录入到特色表中,算法同学在录入模型特色的时候主动出提醒,保障录入的准确性与效率,如果是模型微调v2版本,间接复制v1 批改几个特色即可。整个算法特色被治理起来,保障同组应用的唯一性。

DEBUG

在ES外部疾速实现机器学习debug。

解决方案:
ES外部有一个API
org.elasticsearch.script.ScoreScript#execute(ExplanationHolderexplanation explanation)
咱们将计算每个item预测过程进行对外输入。

比方以下例子:蕴含了策略名称,申请入参数,模型入参数

explanation.set(String.format("mleap(policyName=%s,params=%s,detail=%s)", this.sortPolicy, params,tempMap));

如图所示:能够对匹配到的订单进行debug

能够取得:原始user特色,原始item特色,模型入参特色详细信息,这样就能够对模型的精确进行校验。

稳定性

欠缺压测计划

每次新上线模型前除了惯例的fat、uat环境测试,上了pre环境会进行压测回归&新性能验证。

针对存在的危险点进行极限压测

波及变更点:业务插件,模型,特色;

要求:新老插件交替,模型特色重置,保障不呈现抖动,在任意变更点保障服务都是稳固的;

计划:天级别变更为分钟级别变更;

后果:通过一周的压测,服务整体稳固,没有呈现内存泄露,根本判断计划成了。

灰度变更

稳定性三板斧:可灰度,可监控,可回滚。因为新上模型,须要做变更灰度。咱们借助dragonfly程序加载&灰度来实现。

dragonfly优先监听加载灰度文件,针对灰度文件配置加载其余文件。

如上图所示:

  • 模型1:容许2台机器加载
  • 模型2:只容许节点为ES1进行加载
  • jar:容许两台机器加载

机器学习分组加载

各个业务的模型不一样,须要的特色也不一样,咱们冀望针对每一个模型进行分组加载,而不是让每台机器全量加载。这里咱们借助的是es的分组个性和index的模板。

咱们在创立index的时候会间接绑定这个index在哪些机器上生成,如index1在group1上,index2在group2上,index3在group3上,通过文件散发零碎来实现对整个机器学习的分组加载。同时,咱们也能够通过对每个业务模型特色,进行分组加载来缩小不必要的开销。例如,某些业务可能只须要局部特色进行训练,kkv零碎反对按需进行索引局部字段提供线上查问,这样就能够缩小特色的维度,从而升高了计算成本,晋升了零碎性能。

模型预测减速

咱们从三个维度进行机器学习的性能减速。首先是申请缓存,第一个是user特色的缓存,计算一次后可重复使用。第二个是对象复用,因为es的计算是row by row的计算,咱们计算完一个row后,它的模型入参inputs能够持续复用,下一个计算开始的时候间接对item维度特色批改即可。

其次是模型缓存,即模型预测减速。咱们固定了输出/输入的schema,并预调配足够的内存空间用于存储所有的后果数据,从而防止了多余的计算和内存空间动态分配的开销。同时,咱们也采纳了模型入参缩小key的输出优化形式,进一步缩短了计算工夫。

接下来是全局缓存,咱们通过mmap内存映射技术做整个kv的减速,还有一些做特色减速。咱们会有一些高频的特色,比方某个特色的均值、方差、最大值、最小值等,具备量小、高频拜访个性,所以咱们能够把它长驻堆内。

上线后业务上的体现

1.反对spark 全副的模型;
2.模型迭代,免开发,通过特色配置化、热加载、压测、灰度能够疾速稳固上线;
3.算法插件组件化、可插拔、灵便编排和反对多轮排序;

这里是一个常见的例子,es召回实现之后,间接进行级联排序,模型B进行score,模型C进行rescore。其次是灵便编排,咱们整个模型库可能有ABCDEF的模型,假如在第一阶段有10000个订单,咱们应用模型ABC同时进行排序,排序后组合取Top1000进行模型D排序,排序后取300个进行模型E排序,整个过程非常灵活。

4.热加载,特色模型 jar实时更新,无抖动;
5.火焰图,单核心场景,排序只占到7%的cpu耗费;
6.在单机单分片场景 1500深度下,  树模型相比LR 多了10ms,全场景 LR  -> 树模型,逆风车外围ab 减少 1.2%。

后续动作

短期指标:后续咱们打算会补齐es的排序短板,反对深度学习。

目前次要的问题在于es的计算是row by row的,没有方法应用TF的batch计算,每一次计算TF都要开启session,这是十分耗资源的。这块将来会通过es rescore插件来解决。

同时咱们会去整合openvino,目前在业内有很多机器学习框架,如Tensorflow、飞桨、Pytorch、Caffe等,算法又有这方面的诉求,须要工程同学去做每一个框架适配,咱们在思考有没有对立的解决方案,能够将支流的DL框架收拢起来,应用一个API就能实现预测。咱们发现能够应用openvino来解决这个问题。目前曾经在做相干的技术调研,预计下半年能够上到咱们的rankservice中,稳固半年以上就会开始迁徙到ES。

咱们最终冀望实现的指标是将所有排序都在es外部实现,能够达到一排到底,做到极致的性能及高度的灵便。

问题:排序零碎为什不独自做?

咱们抉择将排序零碎与搜寻零碎联合在一起,次要是为了在无限的资源内兼顾性能和业务成果。

这样做的劣势包含:

  • 性能弱小:咱们将搜排零碎交融在一起,使得排序零碎具备极强的性能。
  • 开发、保护和运维成本低:与独自构建排序零碎相比,咱们不须要关注数据品质、存储、分片、查问mapreduce等问题,因为搜寻零碎曾经提供了这些性能,因而咱们所需关注的就是排序办法,这使得咱们的排序零碎更加灵便并易于保护,相当于了实现Serverless运行。
  • Lucene的欠缺反对:咱们的排序零碎应用Lucene作为根底,并利用其丰盛的性能(例如function_score、score、rescore和debug),这使得咱们能够进行灵便编排和反对多轮排序的操作。
  • 稳固&效率:咱们的排序零碎应用特色配置化的形式来进行开发,通过标准化的上线流程、压测、灰度和分组等一系列措施来保障其稳定性,这能够使得咱们的零碎更加易于治理和调试。

综上所述,将排序零碎和搜寻零碎联合在一起,能够实现性能优良、保护成本低、功能丰富、操作灵便和稳定性高的排序零碎,这正是咱们所须要的。

(本文作者:彭晟)