共计 4214 个字符,预计需要花费 11 分钟才能阅读完成。
1. 背景
随着闲鱼用户快速增长,运营活动越来越趋于精细和个性化,运营会根据用户偏好为其投放合适的活动,如下图所示在闲鱼首页商品展示时,会在商品的列表中插入活动 Banner,通过这些活动 banner 引导用户进入到相应活动会场,实现会场导流。闲鱼投放系统负责闲鱼运营活动的配置、管理、投放。
主要解决了以下几个问题
1. 配置环境隔离问题,根据开发规范,任何线上业务必须先进行线下环境发布,测试验证通过后再发布上线。所以提供的管理平台需要拥有线上和线下环境隔离的能力。
2. 检索中的性能问题,在同一资源位下会配置多个活动,每次检索时需要把该资源位下的所有活动拉出来,按照条件进行筛选出符合要求的活动,这个过程会随着资源位下的活动增多检索遇到性能瓶颈。
3. 人群管理问题,在活动中会配置投放的人群,每次检索活动时人群作为活动的检索条件,需要验证用户是否属于当前活动的人群,所以需要解决用户和人群关系的管理。
4.AB 测试问题,运营投放的活动往往需要进行 AB 测试比较不同策略的表现,此时需要提供 AB 测试的能力。下面将通过介绍闲鱼投放系统设计、技术方案设计和实现过程,进一步阐述如何解决上面提出的四个问题。
2. 系统架构设计
闲鱼投放系统是一个配置管理和配置检索的系统,换句话讲他不生产任何活动素材,他只是活动素材的搬运工。下面介绍闲鱼投放的系统设计。
如上图所示闲鱼投放系统共分为了活动素材层、投放配置层、业务流程层和应用层四个层次。
活动素材层是对在闲鱼投放系统中所有素材源的汇总,目前闲鱼投放中主要汇集了三种素材鲁班素材、马赫素材、TPP 素材,鲁班素材提供了用户个性化 Banner 的能力,他的原理是根据用户的行为获取到偏好的商品,然后把商品图和素材模板组合为一个 Banner;马赫素材提供规则圈选商品,他的原理是利用规则引擎把规则转换为 SQL 语句,然后利用该 SQL 在商品表中捞出符合规则的商品,同时马赫利用流计算能力对增量商品也实现了实时的规则圈选。TPP 素材提个性化商品推荐,例如首页的商品推荐和猜你喜欢的商品推荐,TPP 作为个性化推荐平台,可以根据不同的算法实现不同的推荐策略。
投放配置层是开放给运营能力的汇总,包含活动配置、环境隔离、数据报表三种能力。活动配置是对一个资源位下所有投放行为的具体配置,如下图所示
每个资源位会投放多个活动,活动与活动之间需要进行排期,每个投放活动中包含人群和素材两类信息,人群用来确定该活动投放的对象,素材用来确定该活动投放的内容,同时在人群下支持 AB 的能力。环境隔离是为了能够区分线上和线下业务,保证线上的投放环境在线下充分验证后再进行上线。数据报表是对所有投放活动关键指标的数据汇总。
业务流程层是闲鱼投放系统的关键,主要负责投放活动的检索,根据调用方传入的用户信息和资源位信息,返回该资源位下符合该用户的活动。
具体的检索逻辑如上图所示,首先在 DB 中查询当前资源位下的所有在线活动,然后依次过滤每个活动下的人群信息是否符合当前用户,从符合该用户的活动列表中选取一个活动,如果该活动下有 AB 测试,需要请求 AB 测试平台获取 AB 测试中配置的素材信息,最后返回该活动下的素材内容,客户端拿到活动素材后进行展示。
应用层是对客户端能力的汇总,包括获取素材、素材样式展示、数据埋点。素材展示是直接与用户交互的部分,需要前端提供多种展示样式,数据埋点是为了验证 AB 策略和收集活动关键指标数据。
3. 技术方案设计
在上文中我们提到闲鱼投放面临四个需要解决的问题,分别是环境隔离问题、活动检索问题、人群管理问题、AB 能力问题。下面将分别从这几个问题出发介绍解决的方法。
3.1 人群管理问题
人群管理使用的是集团内的奥格人群平台,他为我们提供了人群圈选和人群验证的能力,在很大程度上解放了闲鱼投放的人群管理,下面简单的介绍一下该平台的实现原理。
如上图所示展示了奥格几个核心功能点,实现原理是这样的,首先平台会提供给用户可选择的规则,然后利用规则引擎把所选的规则,生成 SQL 查询语句和流计算规则,SQL 查询语句用来离线圈选用户和流计算规则用来实时筛选新增用户,通过离线规则和在线规则实现了奥格的人群圈选,在人群验证阶段,首先利用倒排检索的思想,用户和人群的关系利用倒排数据结构标识,该方法解决了单用户与多人群关系验证的效率问题,最后利用多级缓存和热点数据本地缓存的方式解决人群检索 RT 问题。
3.2 AB 测试管理问题
AB 测试是用来验证方案的常用方法,常用的 AB 测试方案大多是用户唯一属性取模的方式按比例划分用户,但是会面临很多复杂的问题 1. 按照用户的 id 进行取模计算,对于未登录用户处理是一个常被忽略的问题。2. 测试白名单管理,在 AB 测试时需要把特定人员划分到特定测试桶里。3. 多个 AB 正交测试,如果有多个 AB 测试,此时需要正交测试时会出现更复杂的情况。在闲鱼投放中使用了集团的一休 AB 平台,一休提供基于用户、设备等多维度 AB 策略,同时支持白名单与正交 AB 测试的复杂场景,在 AB 基本能力的基础上提供了数据分析的能力,实现了调用到数据管理的一体化。
3.3 环境隔离问题
解决环境隔离问题主要是为了方便测试,先在线下看效果,然后再把数据配置到线上。为了实现环境隔离迭代两次技术方案。
首先介绍第一个方案,依照总体功能设计我希望平台中每个模块都可以灵活复用,可以利用已有模块,快速搭建出满足业务要求的投放活动,所以从业务角度进行了抽象,把能拆分的模块尽可能的抽象出来,最终的实体关系如下图所示。从业务逻辑角度共抽象了 6 个实体分别是资源位(Resource)、活动(Activity)、人群(Crowd)、素材(Data Source)、资源位和活动的关系(Resource Plan)、活动和人群素材的关系(Activity Plan)实体,每个模块之间可以按照下图的关系进行自由组合成一个投放活动。
在该方案中利用每个实体中的 env 字段解决环境隔离问题,无论是在投放活动配置还是在检索过程中,只可以利用相同 env 字段的实体,该方法完全实现了环境隔离,但是在实际的应用中效果却不是很好,因为利用一份数据表中的 env 字段实现环境隔离,所以线上和线下对应的 Resource Plan 和 Activity Plan 关系表中关联的实体 ID 不同,那么将无法实现线下配置直接拷贝到线上,此时需要在线下和线上两次配置,由于配置过于复杂增加错误风险。
下面介绍第二个方案,第二个技术方案中对方案一中提出的问题进行优化。具体的设计如下图所示:
如上图所示,实体对象由 6 个转换为 4 个,下面一次介绍这些实体和如何解决环境隔离问题。
首先介绍新引入的 Data Schema 实体,DataSchema 是由开发同学负责,提供了一个配置好的 JSON 配置模板,他与 Resource 进行关联,意味着当前 Resource 下的所有 DataSource 都将按照该 DataSchema 提供的 JSON 模板进行配置,同时在解析时也按照当前的 DataSchema 进行解析
Resource 不再区分线上和线下环境,因为 Resource 无论是线上和线下他总是存在的并且不会改变的,所以区分线上和线下是没有必要的。
DataSource 不再用 env 字段区分线上和线下环境,利用 preData 和 onlineData 进行区分线上和线下配置,由于引入了 DataSchema 模板,所以彻底解放了 DataSource,他不再需要进行繁琐的配置,只需按照 DataSchema 把所有的需要字段都配置到对应的 Schema 中即可。这样在线上和线下 DataSource 是一条数据主键不再改变。
Activity 实体是 DataSource 和 Resource 的关系实体,同时包括活动的人群、起止时间等属性。由于 DataSource 和 Resource 实体线上和线下环境中主键 ID 都不会改变,那么意味着 Activity 可以把线下的配置直接同步到线上,在同步过程中需要做的是如果线上没有配置就插入一条如果存在就更新。那么怎么映射 Activity 线下和线上的关系呢,在 Activity 里面引入了 mapId 字段,线下的 Activity 实体在 mapId 中存储线上 Activity 实体的主键 Id,利用这种映射关系实现了线下和线上的映射。
具体的如上图所示,通过这种表和表之间映射关系,实现了环境隔离问题,同时简化了业务中的实体,让配置更简单更易用。
3.4 活动检索问题
在实际应用中,我们遇到了检索能力的性能瓶颈,根据每次检索时都需要拉出当前资源位下的全部活动,然后按照起止时间、人群作为过滤条件,筛选出满足当前用户的活动列表。以上过程中每次检索都会发生与数据库的 IO 操作。当资源位和访问 QPS 增多时,数据库 IO 操作将成倍数增长,此时会成为检索的瓶颈,所以在以上的技术方案中,需要一个完备的缓存方案支撑检索的正常运行。按照常规的缓存设计方案进行了如下的缓存方案设计。
所有的查询都是先进行缓存查询,如果未命中再查询数据库,把查询到的数据回写到缓存中。对于所有的更新操作,都是先更新数据库,然后再失效缓存,在更新活动时,需要在失效活动缓存的同时,也要失效该活动对应资源位下活动列表的缓存。
但是在使用过程中遇到了一个问题,资源位下的活动列表存储采用了 kv 结构,key 为资源位 ID,value 为活动列表的 JSON 序列化,当资源位下的活动增多时 value 也会随着膨胀最后超出阈值,所以把活动对象进行了简化仅存储活动 Id 和人群 Id。优化后检索过程将有所变化如下图所示:
4. 总结与展望
4.1 总结
通过以上的整体功能设计、技术方案设计、代码实现,介绍了一个投放平台从设计到实现过程中遇到的问题点和解决方案。目前投放平台已经在闲鱼的用户实时触达、首页 feeds 投放、淘宝闲鱼小程序投放中使用,完美支持运营根据人群精准投放活动。
4.2 展望
闲鱼素材投放平台但仍有需要持续完善的地方,首先是精准人群的个性化,例如在首页的投放中,针对圈选的人群透出的 Banner 图片都是一样的,目前我们的投放最小粒度是人群未来将会做到个人。然后是投放能力自优化,目前活动针对资源位的争夺还是利用权重、人群、起止时间作为前置条件,未来将会通过投放数据回流利用算法计算其关键指标实现投放的自优化。同时闲鱼素材投放将对接集团内部的更多优秀的素材提供源丰富闲鱼的活动。
本文作者:闲鱼技术 - 齐悟阅读原文
本文为云栖社区原创内容,未经允许不得转载。