乐趣区

关于r语言:R语言使用马尔可夫链对营销中的渠道归因建模

原文链接:http://tecdat.cn/?p=5383

介绍

在这篇文章中,咱们看看什么是渠道归因,以及它如何与马尔可夫链的概念分割起来。咱们还将通过一个电子商务公司的案例钻研来了解这个概念在实践上和实际上如何运作(应用 R)。

什么是渠道归因?

Google Analytics 为归因建模提供了一套规范规定。依据 Google 的说法,“归因模型是决定销售和转化功绩如何调配给转化门路中的接触点的规定或一组规定。例如,Google Analytics 中的最初一次互动模型会为紧接销售或转化之前的最终接触点(即,点击次数)调配 100%的功绩。相比之下,第一个互动模型为启动转化门路的接触点调配 100%的功绩。“

咱们将在本文前面看到最初一个交互模型和第一个交互模型。在此之前,让咱们举一个小例子,进一步理解渠道归因。假如咱们有一个转换图,如下所示:

在上述情况下,客户能够通过频道 ’C1’ 或频道 ’C2’ 开始他们的旅程。以 C1 或 C2 开始的概率为 50%(或 0.5)。咱们首先计算转换的总体概率,而后进一步查看每个通道的影响。

P(转换)= P(C1→C2→C3→转换)+ P(C2→C3→转换)

= 0.5 * 0.5 * 1 * 0.6 + 0.5 * 1 * 0.6

= 0.15 + 0.3

= 0.45

马尔可夫链

马尔可夫链是一个过程,它映射静止并给出概率分布,从一个状态转移到另一个状态。马尔可夫链由三个属性定义:

状态空间 – 解决可能存在的所有状态的汇合

转换操作符 – 从一个状态转移到另一个状态的概率

以后状态概率分布 – 在过程开始时处于任何一个状态的概率分布

咱们晓得咱们能够通过的阶段,从每条门路挪动的概率以及咱们晓得以后状态的可能性。这看起来与马尔可夫链类似,不是吗?

事实上,这是一个马尔可夫链的利用。咱们稍后会回来; 当初让咱们保持咱们的例子。如果咱们要弄清楚渠道 1 在咱们的客户从始至终转换的旅程中的奉献,咱们将应用去除成果的准则。去除成果准则说,如果咱们想要在客户旅程中找到每个频道的奉献,咱们能够通过删除每个频道并查看在没有该频道的状况下产生了多少次转化。

例如,咱们假如咱们必须计算通道 C1 的奉献。咱们将从模型中删除通道 C1,并查看图片中没有 C1 的状况下产生了多少次转换,即所有通道完整无缺时的总转换次数。咱们计算通道 C1:

P(去除 C1 后的转换)= P(C2→C3→转换)

= 0.5 * 1 * 0.6

= 0.3

30%的客户互动能够在没有 C1 频道的状况下进行转换; 而 C1 完整无缺,45%的互动能够转换。所以,C1 的去除成果是

0.3 / 0.45 = 0.666。

C2 和 C3 的去除成果为 1(您能够尝试计算,但直觉地认为,如果咱们要删除或者 C2 或 C3,咱们将可能实现任何转换?)。

这是马尔可夫链的一个十分有用的利用。在上述情况下,所有通道 –C1,C2,C3(在不同阶段)被称为转换状态 ; 而从一个信道挪动到另一个信道的概率称为转移概率。

客户旅程是一系列渠道,能够看作是一个有向马尔可夫图中的一个链,其中每个顶点都是一个状态(渠道 / 接触点),每条边示意从一个状态挪动到另一个状态的转移概率。因为达到状态的概率仅取决于以前的状态,因而能够将其视为无记忆马尔可夫链。

电子商务公司案例钻研

让咱们进行实在案例钻研,看看咱们如何施行渠道归因建模。

一家电子商务公司进行了一项考察并收集了客户的数据。这能够被认为是具备代表性的人群。在考察中,公司收集了无关客户拜访各种触点的数据,最终在其网站上购买该产品。

总共有 19 个渠道,客户能够遇到产品或产品广告。在 19 个频道之后,还有三种状况:

#20 – 客户决定购买哪种设施;

#21 – 客户曾经做出最终购买,并且;

#22 – 客户尚未决定。

渠道的总体分类如下:

类别渠道

网站(1,2,3)公司网站或竞争对手的网站

钻研报告(4,5,6,7,8)行业征询钻研报告

在线 / 评论(9,10)有机搜寻,论坛

价格比拟(11)聚合

敌人(12,13)社交网络

专家(14)专家在线或离线

零售店(15,16,17)物理商店

杂项。(18,19)其余如促销流动在不同的地点

当初,咱们须要帮忙电子商务公司确定投资营销渠道的正确策略。应该关注哪些渠道?公司应该投资哪些渠道?咱们将在下一节中应用 R 来解决这个问题。

应用 R 的实现

让咱们继续前进,尝试在 R 中的实现并查看后果。

输入:

R05A.01R05A.02R05A.03R05A.04... ..R05A.18R05A.19R05A.201643 NANANA21910NANANA9132016NANANA8152021NANANA1691320NANANA11184NANANA

咱们将进行一些数据处理,将其带入一个阶段,咱们能够将其用作模型中的输出。而后,咱们将确定哪些客户旅程已进行最终转换(在咱们的状况下,所有旅程都已达到最终转换状态)。

咱们将创立一个特定格局的变量 ’ 门路 ’,能够作为模型的输出。另外,咱们将应用“dplyr”包找出每条门路的总产生次数。

门路转变

1> 1> 1> 2011> 1> 12> 1211> 1> 14> 13> 12> 2011> 1> 3> 13> 3> 2011> 1> 3> 17> 171> 1> 6> 1> 12> 20> 121

输入:

门路转变

1> 1> 1> 2011> 1> 12> 1211> 1> 14> 13> 12> 2011> 1> 3> 13> 3> 2011> 1> 3> 17> 1711> 1> 6> 1> 12> 20> 121

当初,咱们将创立一个启发式模型和一个马尔科夫模型,将两者联合起来,而后查看最终后果。

输入:

CHANNEL_NAMEfirst_touch_conversions... ..linear_touch_conversionslinear_touch_value113073.77366173.773661200473.998171473.998171127576.12786376.127863143456.33574456.33574413320204.039552204.0395523168117.609677117.609677173176.58384776.58384765054.70712454.70712485653.67786253.67786210547211.822393211.8223931166107.109048107.10904816111156.049086156.049086219994.11166894.1116684231250.784033250.78403372633.43599133.435991

输入:

CHANNEL_NAMEtotal_conversiontotal_conversion_value182.48296182.48296120432.40615432.406151283.94258783.9425871463.0867663.0867613195.751556195.7515563122.973752122.9737521783.86672483.866724663.28082863.280828861.01611561.01611510209.035208209.03520811118.563707118.56370716158.692238158.692238298.06719998.0671994223.709091223.709091741.91924841.919248

在进一步探讨之前,咱们先来理解一下咱们下面看到的一些术语的含意。

第一次触摸转换:当该频道是客户的第一个触摸点时,通过频道进行的转换。第一个触点取得 100%的功绩。

上次触摸转换:当该频道是客户的最初一个接触点时,通过频道产生的转化。100%信用给予最初的接触点。

回到 R 代码,让咱们合并这两个模型,并以更容易了解的视觉吸引人的形式示意输入。

从上图中能够分明地看到情景。从第一次触摸转换角度来看,频道 10,频道 13,频道 2,频道 4 和频道 9 十分重要; 而从最初接触的角度来看,第 20 频道是最重要的(在咱们的例子中,应该是因为客户决定购买哪种产品)。就线性触摸转换而言,通道 20,通道 4 和通道 9 是重要的。从总转换角度来看,频道 10,13,20,4 和 9 十分重要。

完结

在下面的图表中,咱们曾经可能找出哪些是咱们关注的重要渠道,哪些能够被疏忽或漠视。这种状况使咱们对客户剖析畛域马尔可夫链模型的利用有了很好的理解。电子商务公司当初能够自信地创立他们的营销策略,并应用数据驱动的见解调配他们的营销估算。

退出移动版