关于大数据:揭秘阿里巴巴的客群画像

37次阅读

共计 3120 个字符,预计需要花费 8 分钟才能阅读完成。

阿里巴巴始终在面向未来摸索 B 类新电商模式,并从 2019 年开始重点构建“新供应、新链接、新营销”三新体系。买家是三新体系的外围,短少买家维度的数字化经营体系是不残缺的。平台场景目标群体及场景间买家差异性尚不明确,客群矩阵就是为场景中控解决这一业务痛点、进步场货散发效力而专门设置的算法钻研主题。同时,客群矩阵也是用户增长和算法特色的外围数据。鉴于客群矩阵如此重要且领有诸多利用,其构建火烧眉毛。

阿里巴巴意在将客群矩阵打造成平台的一个风向标,以便业务有指标、有档次、有差别、高效地选品和进行场景经营及商家经营,为用户增长和算法模型优化提供能源,为数字化经营提供根据。咱们次要围绕人、货、场、商 4 个维度构建,客群矩阵详情如图 1 所示。

客群矩阵同场景矩阵叠加,在构建场景指标用户、掂量场景差异性的同时,也能进步场景效力,无效疏导指标流量,进而为各类业务场景的算法建模提供底层数据根底。

1 洽购力

B 类买家不像 C 类买家有明确的年龄、性别等根底坐标维度,B 类用户多是企业或者批发商,如何刻画 B 类特色的客群矩阵,这对于 B 类电商十分重要,也是 B 类电商“小二”始终在思考的问题。

既然 B 类用户群体次要是企业和批发商,那么如何精确地形容客群矩阵呢?洽购力就是突出的表征,洽购力蕴含洽购金额和洽购频率,从洽购力能够看出用户的经营规模和耗费能力。因而,咱们将洽购力作为根底坐标维度,分层提供精准差异化服务。

洽购金额次要是肯定周期内用户洽购的金额。为了躲避不同品类价格差别较大带来的分层烦扰,首先分类目对洽购金额划档,而后再依照金额档不分类目看,占比最多的金额档就是此用户的洽购金额档层。

洽购频率是肯定周期内用户的洽购频次。将用户依照洽购工夫排序,而后计算用户在肯定工夫周期内洽购的频次。将所有用户依照高斯分布比例划分出高、中、低档,作为洽购频率的分层品位。

2 生命周期

包含新装机、新用户、低活、中活、中高活、高活、沉睡、散失等阶段,该生命周期次要是依照用户在电商平台的活跃度来划分的,其中也融入了局部业务知识。例如,新装机用户是指刚装机的用户,新用户是指成交在 2 单以内的用户,低活是指一个月拜访天数在 2 天以内的用户等。

从交易周期剖析用户生命周期,如图 2 所示,包含新装机激活用户、登录用户、首单用户、沉闷买家(高洽购力买家、后劲买家)、潜睡买家、深睡买家等阶段,各个生命周期阶段之间的转换关系在图中也有直观出现。精准化用户经营依据买家生命周期阶段不同而调整指标,所采取的策略也会相应调整。

理解了用户生命周期,就能够有针对性地做用户拉新、促活、留存,以进步用户黏性:对于新装机和新用户,次要是进步他们的用户体验,造就用户的生产习惯,做留存转化;对于中低活用户,次要是促活、留存;对于中高活用户,次要是维持用户的习惯,增强黏性;对于沉睡和散失用户,次要是通过红包权利等形式促活。用户生命周期的保护对于电商继续用户增长施展着至关重要的作用。

3 外围主营

CBU 作为 B2B 电商平台的典型代表,始终致力于服务寰球亿万 B 类买家用户。用户核实身份与主营类目(如进口母婴店店主、精品女装店店主、微商兼职、小超市店主等)作为 B 类用户画像最为外围的属性之一,不仅代表着用户的线下实体身份,还间接影响着用户在电商平台上的行为偏好、洽购周期及对商家服务能力的诉求等,因而始终是 B 类电商平台致力于深耕与经营的外围用户画像属性之一。

大多数 C 类用户画像属性能够间接基于用户在网站上的历史行为进行建模,但 B 类用户画像则不同。因为要核实用户核身身份以及对主营类目有精准性的要求,个别 B 类电商平台次要以用户自填表单的模式进行用户核实身份的确定。这种用户自填形式后果准确度较高,但地位荫蔽、链路简短、没有利益点的疏导,不仅用户填写率低,而且与场景结合力有余。

为解决原表单式核身用户操作老本高的问题,阿里巴巴 CBU 电商平台通过用户核身组件借力算法模型对用户核身进行预测,根据置信度排序,为用户推出 Top K 个选项供用户点选。整体算法解决方案如下。

01 数据源

1)用户站内行为

用户站内行为是用户需要与偏好的第一反馈基地,是算法须要着重去开掘的数据源。绝对其余偏好类画像属性来说,用户核身是一个绝对稳固和长期的用户属性,因而在算法利用中,咱们选取了用户最近半年的站内全域行为作为底层数据。定义半年的长时间窗口选取次要有两方面思考:一是目前网站商品丰盛、优质,搜寻与举荐算法日渐精进,用户浏览各类商品的老本较低,所以 B 类用户在网站上的注意力难以放弃专一,用户 B 类 / C 类的需要与行为混淆,数据较脏,较长的工夫窗口有利于滤除烦扰,捕捉用户更为长期和稳固的需要;二是用户行为数据,特地是洽购行为,绝对稠密,然而 B 类用户的洽购行为是反映用户核身身份最为外围的特色之一,且用户洽购行为又具备肯定的周期性,因而长期的工夫窗口可能帮忙算法更加全面地意识用户。

2)用户站外上下游身份

不同于很多偏好类用户画像属性,用户核身身份可能与用户在事实中的身份产生实在的映射关系,如奶茶店店主—喜茶店主、烘焙店店主—宝岛金典店主、精品女装店店主—淘宝女装店店主等。因而,用户站外上下游的身份映射关系,可能辅助咱们进一步欠缺用户核身身份的预测,进步覆盖率和准确率。

3)行业常识

鉴于用户在网站上 B 类 / C 类行为混淆,噪声较多,B 类用户核身偏好易受网站热门类目与商品的烦扰,因而咱们也引入了大量行业常识作为领导来帮助实现 B 类用户核身身份的预测,并基于此积淀下来一份核身偏好类目数据。

02 算法计划

利用以上用户站内行为、站外上下游身份和行业常识的数据,算法端能够通过以下几个步骤实现用户核身身份的预测工作,预测流程如图 3 所示。

图 3 用户核身预测流程图

1)种子用户圈选

种子用户次要定义为站内已核身用户及站外上下游有映射关系的核身信息的用户。

2)行业常识领导

咱们基于种子用户最近一段时间的站内行为数据,开掘辨认显著性特色,提供给经营共事,对种子用户再进行一轮划拨,把日常外围行为与行业偏好显著不合乎的用户排除,优化种子用户的圈选。

3)种子商品圈选

以行业偏好类目作为门槛,筛选出种子用户在门槛下最近半年内洽购过的商品作为种子商品。

4)种子商品扩大

基于团队积淀现有商品的 I2I 表,利用种子商品作为 trigger 触发 Key,对种子商品进行扩大,扩大种子商品的偏好分等于商品 I2I 类似分与 trigger 种子商品偏好分的乘积。

5)用户核身预测

对于一个用户的核身预测,咱们选取其最近半年的行为数据进行建模打分。而后基于打好分的用户行为商品计算用户对每一个可能的核身身份的偏好置信度,并用以辨别用户的集体洽购行为和 B 类洽购行为,升高用户的集体洽购行为对预测后果的影响,加大用户的 B 类洽购行为的权重。

本文摘编于《阿里巴巴 B2B 电商算法实战》经出版商受权公布。

本书是阿里巴巴 CBU 技术部(1688.com)深耕 B2B 电商 15 年的经验总结。阿里巴巴 B2B 在策略状态上经验了信息平台、交易平台和营销平台的降级迭代,本书聚焦营销平台商业状态背地的算法和技术能力,试图从技术和商业互为驱动的视角论述技术如何赋能业务,并联合阿里巴巴团体在根底设域和算法翻新上的积淀,打造出智能 B2B 商业操作系统。

阿里巴巴 B2B 电商算法实战
作者:阿里团体, 新批发技术事业部,CBU 技术部

举荐浏览

《用户画像:方法论与工程化解决方案》

这是一本从技术、产品和经营 3 个角度解说如何从 0 到 1 构建用户画像零碎的著述,同时它还为如何利用用户画像零碎驱动企业的营收增长给出了解决方案。

用户画像:方法论与工程化解决方案
作者:赵宏田

关注“实时流式计算”后盾回复“0814”参加抽奖

将于 8 月 15 号中午 12:00 开奖 共送出两本图书 欢送大家参加~

正文完
 0