消息点击率翻倍的背后闲鱼无侵入可扩展IFTTT系统

107次阅读

共计 3285 个字符,预计需要花费 9 分钟才能阅读完成。

一、面临问题

在闲鱼生态里,用户之间会有很多种关系。其中大部分关系是由买家触发,联系到卖家,比如买家通过搜索、收藏、聊天等动作与卖家产生联系;另外一部分是平台与用户之间的关系。对这些关系分析之后我们发现这些关系中存在两个问题:

  • 用户产生关系的层次不够丰富;
    现有系统只维护了一部分用户关系,包括收藏、点赞等,用户关系的层次还不够丰富。
  • 用户之间关系是单向且不够实时;
    在现有的玩法中,买家可以通过多种行为与卖家产生联系,但卖家不能主动与买家发生关系和互动;而且平台计算的关系都是离线的,对用户的吸引力不足。

上面提到的场景经过抽象归纳之后都是同一个范式:当某个条件被满足之后,就会触发相对应的动作。这个范式是 IFTTT 的基本理念,而闲鱼 IFTTT 就是对这些问题的解决方案。

二、IFTTT 概念

IFTTT 是一个被称为“网络自动化神器”的创新型互联网服务理念,它很实用而且概念很简单。IFTTT 全称是 If this then that,意思是如果满足“this”条件,则触发执行“that”动作。IFTTT 由三部分构成,分别为 Trigger、Action 和 Recipe。

可以看出 IFTTT 本身概念并不复杂,它的真正魔力在于“由简单组成的复杂”,也就是由众多简单的 IFTTT 流程相互衔接成跨越整个互联网、跨越多平台、跨越多设备的状态机。

2.1、闲鱼 IFTTT

闲鱼 IFTTT 是基于闲鱼的业务场景与 IFTTT 理念结合后产生的,提供 IFTTT 标准协议封装,对业务无侵入可扩展的服务编排系统。

闲鱼 IFTTT 的两个特性对应上述两个问题,分别是:

  • 多维用户关系感知

多维指的是覆盖面,闲鱼 IFTTT 通过更多维度的挖掘,抽象并维护了更丰富的用户关系。基于用户关系数据,我们可以产出用户画像,并通过更有效的方式触达用户。

  • 实时用户双向互动

闲鱼 IFTTT 底层具有对用户关系大数据的高效存储和处理能力,以支持上层业务中用户关系实时处理;闲鱼 IFTTT 不仅支持买家到卖家关系,而且通过设计天生支持卖家到买家关系。

闲鱼 IFTTT 把之前平台与用户的互动、买家到卖家的联系,切换称闲鱼用户之间天然的关系互动,对用户骚扰更少且激活拉回的效果更好,我们基于这个场景设计闲鱼 IFTTT 的技术方案。

三、技术方案

首先按照 IFTTT 规范对业务进行建模,分为 Channel、Trigger 和 Action 层,其中 Channel 层是数据底层,将 Trigger 和 Action 关联后组成标准 Recipe。

  • Channel
    Channel 层在闲鱼 IFTTT 的作用是保存和管理用户关系数据,Channel 层定义了用户关系的元数据结构,包括关系类型、源账户和目标账户。Channel 层是闲鱼 IFTTT 的基石,Trigger 和 Action 均基于用户关系数据进一步抽象业务逻辑。
  • Trigger
    Trigger 是业务上自定义的触发事件,与业务息息相关,可能是关注的人上新、浏览宝贝降价或者是参加的百币夺宝活动开奖等。当 Trigger 触发后,闲鱼 IFTTT 会根据 Trigger 类型和配置的关系类型计算用户名单,并调用 Action 层进行处理。
  • Action
    Action 层处理对象是 Trigger 触发后计算的用户名单,可以给名单里的用户发 Push,发权益或者其他定制逻辑。Action 本身是标准化、可插拔的组件,业务上可以利用 Action 组件对用户名单做 AB 测试,快速实验不同 Action 策略。

接下来我们说一下闲鱼 IFTTT 详细技术方案,方案如下:

整体技术方案按照业务建模的结构图细化,补充依赖的技术组件。整体流程不再细述,针对流程中重点模块详细说明。

3.1、场景快速接入

设计场景快速接入的目的是让业务对接入闲鱼 IFTTT 无感知,因为在最开始的设计中,场景接入是准备通过在业务逻辑里增加 AOP 切面,将业务数据和场景上报。但因为这种方式对业务本身有一定侵入,增加业务执行的 RT 而且不够灵活,最终被否决。

而现在的场景快速接入方案解决了这些问题,通过 SLS 接入所有应用的海量网络请求日志,记录请求的 URL、参数和响应;将 SLS 作为 Blink 流计算任务的数据源;根据 diamond 动态下发的规则实时筛选网络请求 URL 和参数,把数据按照指定格式组装后上报给 Channel 层。

场景快速接入方案将业务逻辑与场景接入解耦,支持快速接入,灵活变更且延迟低,是针对大数据场景接入的高性能解决方案。

3.2、计算用户名单

计算用户名单模块采用责任链模式设计,因为在不同 Trigger 场景中,业务对用户名单的计算和筛选逻辑都是不同的。通过责任链模式,将主流程与业务筛选逻辑解耦,并支持各业务灵活定制筛选逻辑,互不干扰。

3.3、PushAction

Action 层是闲鱼 IFTTT 中最重要的一环,会直接触达到用户,Action 的逻辑会直接影响用户对平台的直观感受和活跃率。消息 Push 是 Action 中最常见的逻辑,更要防止用户被骚扰,PushAction 逻辑如下:

  • 敏感人群过滤;
  • 疲劳度校验;
  • 对发送人群进行 AB 实验;
  • 组装消息;
  • 将 Action 各节点日志同步到 SLS,方便检索和排查问题;
  • 统计消息发送数据及点击数据,为业务后续决策提供依据;

3.3.1、疲劳度

疲劳度是防止用户被骚扰的关键,我们针对疲劳度进行了分层设计,分为三层,第一层为用户级别疲劳度,控制一个用户在一个周期内收到消息数量;第二层是业务维度,控制用户在一个周期内收到某个业务的消息数量;第三层是目标级别,控制用户在一个周期内收到同一个发送者消息数量。

在业务维度层面,支持灵活控制多个业务联合疲劳度,保证用户不会被消息过度骚扰。

3.4、用户关系存储

用户关系数据是闲鱼 IFTTT 的基石,它的特点是存储量级大,达到 TB 级别;而且对存储和查询的性能要求高,TPS 和 QPS 的峰值都在一万以上。经过调研,我们发现集团内部开发的 Lindorm 可以满足需求。

Lindorm 是阿里内部基于 Hbase 自研的高性能 KV 存储数据库,对 Hbase 的性能和稳定性均有一定优化。闲鱼 IFTTT 采用 Lindorm 作为用户关系数据存储,经性能测试验证数据读取 QPS 达到 7 万,数据存储 TPS 在 10 万以上。Lindorm 本身性能优异,为闲鱼 IFTTT 高性能奠定基础。

四、效果验证

闲鱼 IFTTT 自上线以来,已支持关注上新、浏览宝贝降价和租房小区上新等多个业务场景,提供买卖双方实时双向互动能力,平均每天处理关系数据数亿条,处理 Trigger 量达到上千万,处理 Action 量达到亿级别,消息点击率较离线 push 提高 1 倍以上。

闲鱼 IFTTT 目前支持的是用户互动场景,后续我们将结合闲鱼自身业务特点,对 IFTTT 进行更高维度抽象,封装标准 Recipe 接口,将闲鱼 IFTTT 打造成提供流程编排、管理能力的服务平台。

在我看来,IFTTT 从 2010 年推出以来,在国外有很大的热度,在互联网和物联网领域都有专门的公司和团队在研发,IFTTT 的概念虽然简单,却通过标准化协议满足用户的强需求 - 让各种互联网产品为用户服务。这其实也给我们互联网从业者一些思考:在新机遇面前,究竟是快速投入比较重要还是抽象标准协议解决一类问题更加有效?

五、名词注解

  • SLS:https://cn.aliyun.com/product/sls
  • Diamond:阿里内部研发的持久配置管理中间件;
  • Blink:https://data.aliyun.com/product/sc?spm=5176.10695662.1131226.1.bf495006EWuVAB
  • MetaQ:阿里内部研发的分布式、队列模型的消息中间件;
  • Lindorm:阿里内部基于 HBase 研发的新一代分布式 NoSQL 数据库,阿里云类似产品:https://www.aliyun.com/product/ots?spm=a2c4g.11174283.cwnn_jpze.59.2f5a15c3NH30me;
  • Tair:阿里内部研发的高性能、分布式、可扩展、高可靠的 Key-Value 结构存储系统;

本文作者:闲鱼技术 - 剑辛

阅读原文

本文为云栖社区原创内容,未经允许不得转载。

正文完
 0

消息点击率翻倍的背后闲鱼无侵入可扩展IFTTT系统

109次阅读

共计 3284 个字符,预计需要花费 9 分钟才能阅读完成。

一、面临问题

在闲鱼生态里,用户之间会有很多种关系。其中大部分关系是由买家触发,联系到卖家,比如买家通过搜索、收藏、聊天等动作与卖家产生联系;另外一部分是平台与用户之间的关系。对这些关系分析之后我们发现这些关系中存在两个问题:

  • 用户产生关系的层次不够丰富;
    现有系统只维护了一部分用户关系,包括收藏、点赞等,用户关系的层次还不够丰富。
  • 用户之间关系是单向且不够实时;
    在现有的玩法中,买家可以通过多种行为与卖家产生联系,但卖家不能主动与买家发生关系和互动;而且平台计算的关系都是离线的,对用户的吸引力不足。

上面提到的场景经过抽象归纳之后都是同一个范式:当某个条件被满足之后,就会触发相对应的动作。这个范式是 IFTTT 的基本理念,而闲鱼 IFTTT 就是对这些问题的解决方案。

二、IFTTT 概念

IFTTT 是一个被称为“网络自动化神器”的创新型互联网服务理念,它很实用而且概念很简单。IFTTT 全称是

If this then that

,意思是如果满足“this”条件,则触发执行“that”动作。IFTTT 由三部分构成,分别为 Trigger、Action 和 Recipe。

可以看出 IFTTT 本身概念并不复杂,它的真正魔力在于“由简单组成的复杂”,也就是由众多简单的 IFTTT 流程相互衔接成跨越整个互联网、跨越多平台、跨越多设备的状态机。

2.1、闲鱼 IFTTT

闲鱼 IFTTT 是基于闲鱼的业务场景与 IFTTT 理念结合后产生的,提供 IFTTT 标准协议封装,对业务无侵入可扩展的服务编排系统。

闲鱼 IFTTT 的两个特性对应上述两个问题,分别是:

  • 多维用户关系感知

多维指的是覆盖面,闲鱼 IFTTT 通过更多维度的挖掘,抽象并维护了更丰富的用户关系。基于用户关系数据,我们可以产出用户画像,并通过更有效的方式触达用户。

  • 实时用户双向互动

闲鱼 IFTTT 底层具有对用户关系大数据的高效存储和处理能力,以支持上层业务中用户关系实时处理;闲鱼 IFTTT 不仅支持买家到卖家关系,而且通过设计天生支持卖家到买家关系。

闲鱼 IFTTT 把之前平台与用户的互动、买家到卖家的联系,切换称闲鱼用户之间天然的关系互动,对用户骚扰更少且激活拉回的效果更好,我们基于这个场景设计闲鱼 IFTTT 的技术方案。

三、技术方案

首先按照 IFTTT 规范对业务进行建模,分为 Channel、Trigger 和 Action 层,其中 Channel 层是数据底层,将 Trigger 和 Action 关联后组成标准 Recipe。

  • Channel
    Channel 层在闲鱼 IFTTT 的作用是保存和管理用户关系数据,Channel 层定义了用户关系的元数据结构,包括关系类型、源账户和目标账户。Channel 层是闲鱼 IFTTT 的基石,Trigger 和 Action 均基于用户关系数据进一步抽象业务逻辑。
  • Trigger
    Trigger 是业务上自定义的触发事件,与业务息息相关,可能是关注的人上新、浏览宝贝降价或者是参加的百币夺宝活动开奖等。当 Trigger 触发后,闲鱼 IFTTT 会根据 Trigger 类型和配置的关系类型计算用户名单,并调用 Action 层进行处理。
  • Action
    Action 层处理对象是 Trigger 触发后计算的用户名单,可以给名单里的用户发 Push,发权益或者其他定制逻辑。Action 本身是标准化、可插拔的组件,业务上可以利用 Action 组件对用户名单做 AB 测试,快速实验不同 Action 策略。

接下来我们说一下闲鱼 IFTTT 详细技术方案,方案如下:

整体技术方案按照业务建模的结构图细化,补充依赖的技术组件。整体流程不再细述,针对流程中重点模块详细说明。

3.1、场景快速接入

设计场景快速接入的目的是让业务对接入闲鱼 IFTTT 无感知,因为在最开始的设计中,场景接入是准备通过在业务逻辑里增加 AOP 切面,将业务数据和场景上报。但因为这种方式对业务本身有一定侵入,增加业务执行的 RT 而且不够灵活,最终被否决。

而现在的场景快速接入方案解决了这些问题,通过 SLS 接入所有应用的海量网络请求日志,记录请求的 URL、参数和响应;将 SLS 作为 Blink 流计算任务的数据源;根据 diamond 动态下发的规则实时筛选网络请求 URL 和参数,把数据按照指定格式组装后上报给 Channel 层。

场景快速接入方案将业务逻辑与场景接入解耦,支持快速接入,灵活变更且延迟低,是针对大数据场景接入的高性能解决方案。

3.2、计算用户名单

计算用户名单模块采用责任链模式设计,因为在不同 Trigger 场景中,业务对用户名单的计算和筛选逻辑都是不同的。通过责任链模式,将主流程与业务筛选逻辑解耦,并支持各业务灵活定制筛选逻辑,互不干扰。

3.3、PushAction

Action 层是闲鱼 IFTTT 中最重要的一环,会直接触达到用户,Action 的逻辑会直接影响用户对平台的直观感受和活跃率。消息 Push 是 Action 中最常见的逻辑,更要防止用户被骚扰,PushAction 逻辑如下:

  • 敏感人群过滤;
  • 疲劳度校验;
  • 对发送人群进行 AB 实验;
  • 组装消息;
  • 将 Action 各节点日志同步到 SLS,方便检索和排查问题;
  • 统计消息发送数据及点击数据,为业务后续决策提供依据;

3.3.1、疲劳度

疲劳度是防止用户被骚扰的关键,我们针对疲劳度进行了分层设计,分为三层,第一层为用户级别疲劳度,控制一个用户在一个周期内收到消息数量;第二层是业务维度,控制用户在一个周期内收到某个业务的消息数量;第三层是目标级别,控制用户在一个周期内收到同一个发送者消息数量。

在业务维度层面,支持灵活控制多个业务联合疲劳度,保证用户不会被消息过度骚扰。

3.4、用户关系存储

用户关系数据是闲鱼 IFTTT 的基石,它的特点是存储量级大,达到 TB 级别;而且对存储和查询的性能要求高,TPS 和 QPS 的峰值都在一万以上。经过调研,我们发现集团内部开发的 Lindorm 可以满足需求。

Lindorm 是阿里内部基于 Hbase 自研的高性能 KV 存储数据库,对 Hbase 的性能和稳定性均有一定优化。闲鱼 IFTTT 采用 Lindorm 作为用户关系数据存储,经性能测试验证数据读取 QPS 达到 7 万,数据存储 TPS 在 10 万以上。Lindorm 本身性能优异,为闲鱼 IFTTT 高性能奠定基础。

四、效果验证

闲鱼 IFTTT 自上线以来,已支持关注上新、浏览宝贝降价和租房小区上新等多个业务场景,提供买卖双方实时双向互动能力,平均每天处理关系数据数亿条,处理 Trigger 量达到上千万,处理 Action 量达到亿级别,消息点击率较离线 push 提高 1 倍以上。

闲鱼 IFTTT 目前支持的是用户互动场景,后续我们将结合闲鱼自身业务特点,对 IFTTT 进行更高维度抽象,封装标准 Recipe 接口,将闲鱼 IFTTT 打造成提供流程编排、管理能力的服务平台。

在我看来,IFTTT 从 2010 年推出以来,在国外有很大的热度,在互联网和物联网领域都有专门的公司和团队在研发,IFTTT 的概念虽然简单,却通过标准化协议满足用户的强需求 - 让各种互联网产品为用户服务。这其实也给我们互联网从业者一些思考:在新机遇面前,究竟是快速投入比较重要还是抽象标准协议解决一类问题更加有效?

五、名词注解

  • SLS:https://cn.aliyun.com/product/sls
  • Diamond:阿里内部研发的持久配置管理中间件;
  • Blink:https://data.aliyun.com/product/sc?spm=5176.10695662.1131226.1.bf495006EWuVAB
  • MetaQ:阿里内部研发的分布式、队列模型的消息中间件;
  • Lindorm:阿里内部基于 HBase 研发的新一代分布式 NoSQL 数据库,阿里云类似产品:https://www.aliyun.com/product/ots?spm=a2c4g.11174283.cwnn_jpze.59.2f5a15c3NH30me;
  • Tair:阿里内部研发的高性能、分布式、可扩展、高可靠的 Key-Value 结构存储系统;

本文作者:闲鱼技术 - 剑辛

原文链接

本文为云栖社区原创内容,未经允许不得转载。

正文完
 0