数据仓库系列文章
- 数仓架构发展史
- 数仓建模方法论
- 数仓建模分层实践
- 数仓建模—宽表的设计
- 数仓建模—指标体系
- 一文搞懂 ETL 和 ELT 的区别
- 数据湖知识点
- 技术选型 | OLAP 大数据技术哪家强?
- 数仓相干面试题
- 从 0 到 1 学习 Presto,这一篇就够了!
- 元数据管理在数据仓库的实际利用
- 做中台 2 年多了,中台到底是什么呢?万字长文来聊一聊中台
- 数据仓库之拉链表
- sqoop 用法之 mysql 与 hive 数据导入导出
关注公众号:
大数据技术派
,回复材料
,支付1024G
材料。
指标体系
提起指标这个词,每个人仿佛都能够说出几个指标,像常常在工作中会听到的日活、月活、注册率、转化率、交易量等 事实上指标就是用 来量化事物的一个工具,帮忙咱们去将一些形象的事件得出一个轮廓上的形容 。例如咱们能够从指标上判断一个产品的好坏,用户粘性等等,例如咱们通过日活能去判断出咱们整个产品的用户量, 从而能反馈出咱们这个产品的一个衰弱水平,也就是否处于增长过程中。
一个好的数据指标体系能够助力业务疾速的解构业务、了解业务、发现业务问题,疾速定位起因,并且找到最合适的解决方案。因而学习搭建一个好的数据指标体系是数据助力业务决策的灵魂。
指标,实际上就是一种度量。大到用于监控和评估商业过程的状态,小到掂量某个功能模块的状况,或者是本人的流动成果。指标体系的构建,是为了让业务指标 可度量、可形容、可拆解,所以咱们的指标是基于业务指标抽取和评估的数据维度,这些数据为度能够用来帮忙达到业务指标。
从而进行业务状况的监控、找到以后业务问题、评估业务可改良的中央,找出下一步工作的方向。
其实小到集体,大到国家都有各种各样的指标,就连数字中国最要害的也是各种指标指数的定义和修改机制的建设!
指标建设过程中遇到的问题
指标没有重点、没有思路,构建实现后也只是一组数据,各有用途,合起来却起不到作用;
指标空洞,粗看有模型又有分类,细看流程中却没有几个具体的指标,无奈落地
指标不足数据,导致业务上线了又开始增加指标、减少维度,最初报表变得臃肿,数据参差不齐,影响工作推动
指标建设方法论
上面是常见的指标体系建设办法,咱们比拟罕用的是 OSM+UJM 模型,当然这也不是相对的,次要还是得看咱们的业务场景和业务指标
北极星指标
人货场指标体系
目前阶段互联网业务比拟风行的一种通用形象场景“人、货、场”,理论就是咱们日常所说的用户、产品、场景,在艰深点讲就是谁在什么场景下应用了什么产品,不同的商业模式会有不同的组合模式。
以滴滴理论场景为例:哪些场景(此处场景定义为终端,如 Native,微信,支付宝)的什么人(乘客)在平台上应用了哪些货(平台业务线,如慢车 / 专车等),进而为评估用户增长的价值和成果。
“人”的视角
从“人”的视角,咱们比较关心的是什么乘客在什么工夫打的车,排了多长时间,等了多长时间上车,周期内第几次打车,打车花了多少钱,是否有投诉和勾销行为,具体到数据指标次要看发单用户数、完单用户数、客单价、周期内完单订单数、勾销订单数、评估订单数等
“货 ” 的视角
从“货”的视角,咱们比较关心的就是成交了多少,交易额多少,花了多少,到具体数据指标次要会看 GMV、成交率、勾销率指标,在进一步会细分到城市、区域,一级品类、二级品类。数据的成果通过指标比照,横向比照、历史比拟等形式进行剖析确定。
“场”的视角
从“场”的视角,咱们比较关心的就是哪个渠道用户点击量大曝光率大,带来了多少新用户,实现多少交易订单,客单价是多少;或者是哪个流动拉新或促活成果怎么样转化率多少,联合场景数据理论状况制订对应策略。
以上别离从“人”、“货”、“场”三个角度进行了数据指标和剖析维度的提炼,上面咱们把三类指标联合指标分级办法进行合成关联。
OSM+UJM 模型
OSM+ AARRR 海盗模型
指标分级办法
指标分级次要是指标内容纵向的思考,依据企业战略目标、组织及业务过程进行自上而下的指标分级,对指标进行层层分析,次要分为三级 T1、T2、T3。
T1 指标:公司策略层面指标
用于掂量公司整体指标达成状况的指标,次要是决策类指标,T1 指标应用通常服务于公司策略决策层
T2 指标:业务策略层面指标
为达成 T1 指标的指标,公司会对指标拆解到业务线或事业群,并有针对性做出一系列经营策略,T2 指标通常反映的是策略后果属于支持性指标同时也是业务线或事业群的外围指标。T2 指标是 T1 指标的纵向的门路拆解,便于 T1 指标的问题定位,T2 指标应用通常服务业务线或事业群
T3 指标:业务执行层面指标
T3 指标是对 T2 指标的拆解,用于定位 T2 指标的问题。T3 指标通常也是业务过程中最多的指标。依据各职能部门指标的不同,其关注的指标也各有差别。T3 指标的应用通常能够领导一线经营或剖析人员发展工作,内容偏过程性指标,能够疾速疏导一线人员做出相应的动作。
指标的形成
指标 = 业务维度形容 + 技术维度形容
指标,是反映某种事物或景象,形容在肯定工夫和条件下的规模、水平、比例、构造等概念,通常由指标名称和指标数值组成。
指标分类
简略计数型指标
- 简略计数型指标是指可通过反复加 1 这一数学行为而取得数值的指标,如 UV(Unique Visit , 独立访客数)、PV(Page View,页面浏览量)
复合型指标
通过若干个根底指标计算得来的指标,在业务角度无奈再拆解的指标
- 复合型指标是由简略计数型指标经四则运算后失去的,如跳出率、购买转化率。
- 在计算指标时,咱们还会波及绝对数、相对数;百分比、百分点;频率、频数;比例、比率等计算形式。
根底指标
- 不能再进一步拆解的指标,能够间接计算出来的指标,如“订单数”、“交易额”
衍生指标
- 在根底指标的根底上,通过某个非凡维度计算出的指标,如“微信订单数”、“支付宝订单数”
指标分级
在进行整个指标分级的时候,咱们须要先思考:一级二级指标,是否反馈产品以后的经营状况;三级四级指标是否帮忙一线人员定位问题,领导经营工作。
数据自身是分层的,咱们在思考指标的时候,也应该有一个层级的概念,而不是现阶段关怀什么,咱们就放什么;指标分级能够帮忙咱们更高效的去定位问题,去验证你的方法论,无需每次都要思考要去看哪些指标
公司策略层面指标
- 用于掂量公司整体指标达成状况,通常设定在 5 - 8 个指标。
- 这类指标是与业务紧密结合,依照行业标准进行制订,有可参考的行业标准指标,且这类指标针对全公司所有员工均具备外围的指导意义。
- 比方某游戏公司的一级指标:新增账号、留存率、DAU/MAU、付费人数(率)、支出金额等。
业务策略层面指标
- 为了实现一级指标,企业会做出一些策略,二级指标通常与这些策略有所关联。
- 能够简略了解为一级指标的实现门路,用于更快定位一级指标的问题。
某游戏公司一级指标是游戏支出,那么二级指标能够设定为不同游戏物品的支出。一级指标是 DAU,那么二级指标设定为分服务器的 DAU 等。这样当一级指标呈现问题的时候,咱们能够疾速查问到问题的所在点。
业务执行层面指标
- 三级指标是对二级指标的 门路拆解,用于定位二级指标的问题。
- 三级指标的应用通常是 能够领导一线人员发展工作的指标内容。
- 三级指标的要求是:一线人员看到指标后,能够疾速做出相应的动作。
游戏公司的二级指标是 XX 区服的 DAU,那么三级指标则能够设定为游戏时长、游戏频次、游戏等级散布、游戏关卡散失状况等。通过观察这些数据,能够去针对性地做调整,如某个关卡散失的用户特地高,那么尝试升高难度。
如何设立指标体系
为什么要建设数据指标体系
- 当咱们的业务呈现数据异样时,因为数据很多,往往会一遍遍地从这些数据中去寻找能够定位起因的相干指标,这不仅会节约很多工夫,还会使人心疲
力竭。「指标」是一种度量,它用于追踪和评估商业过程的状态,确保我的项目务在正确的轨道上经营,同时验证方法论,一直地学习。指标监控体系最大的价值就是帮忙大家高效利用工夫,把工夫花在解决问题上,而不是寻找问题上,从而进步团队整体的人效
- 指标也是指标,没有指标就不晓得做什么,搭建指标体系是为了更好地发现用户的问题,并且去解决。所以咱们须要站在用户的场景去思考整体的内容。
首先咱们来看下为什么咱们须要一个好的数据指标体系。这边给大家看一个故事,预计大家都会比拟有体感:大家有没有在中午收到过老板的信息,问为什么业务上的外围指标 GMV 降落了?而后这里边咱们产品同学小六就会连忙把电脑关上,然而他所有能获取的信息就只有一个 Dashboard,里边只有一个 GMV 外围指标,环比同比同时降落,这个时候他怎么答复老板的问题?
后果根本靠猜,是不是竞对做了一些流动?是不是某个主播停播了?另外一种可能性的状况是小六同学手里边有一百多张报表,这一百多张报表里边,有四百多个指标,而后每一个指标都在降落,那在这种状况下,也没有方法答复老板的问题,为什么这个外围指标降落,到底是 DAU 降落了,还是用户满意度降落了,还是转化效率降落了等等?
另外一种状况是老板同样提了这样一个问题,而后另外一个产品同学小快不紧不慢的拿出了一张这样的一个报表体系,他说:“老板,我认为 GMV 降落会跟整个业务流程都有相关性,咱们从业务角度进行了这样的一个拆解,发现在流量入口,和最初的人均生产来看的话,其实并没有降落,次要降落起源其实来源于列表页转化效率的降落。再往下拆解,发现高价的商品的曝光占比和高价的曝光占比并不太均衡。高价商品的一个曝光占比比拟高,然而它的转化效率却是低的,所以从这个角度来讲,我认为可能在列表页来外面的不同价格的商品的散发策略或者曝光策略须要进行优化,而后通过 A /B test 去看一下咱们这个策略调整的成果是什么样子的”。
咱们看到数据指标体系能够帮忙咱们 整体了解业务、全面理解问题、疾速定位起因、迅速落地计划,咱们说的指标体系不止是指标,还有指标治理和指标监控
如何建设指标体系 OSM 模型
OSM 模型(Obejective,Strategy,Measurement)别离代表业务指标、业务策略、业务度量
O:用户应用产品的指标是什么?产品满足了用户的什么需要?咱们的经营指标是什么
如果你是公司的负责人,想一想公司的外围指标是什么,可能是公司往年的利润额。如果你是产品部门负责人,那你须要思考将来几年的产品布局
S:为了达成上述指标我采取的策略是什么?这些策略往往是一些列的
M:这些策略随之带来的数据指标变动有哪些?它用于掂量咱们的策略是否无效,反映指标的达成状况。「业务度量」波及到以下两个概念:一个是 KPI,用来直
接掂量策略的有效性;一个是 Target,是事后给出的值,用来判断是否达到预期。
而后在这个指标 Objective 的方向上,咱们能够应用 UJM(User Journey Map)去拆解绝对应的这个业务策略(Strategy)。UJM 的逻辑是从业务的外围指标登程,拆解整个业务流程上咱们为用户提供价值点,以及这些价值点触达用户的整体门路都有哪些。
知乎的例子
以知乎为例,依照 OSM 模型,它的指标是什么样的,其实你会看到这个指标不仅仅是企业自身的盈利指标,也可能是解决用户的指标
O:用户来应用知乎这个产品,指标是什么
这里波及两个不同的用户——内容分享者和内容消费者,这里简略介绍内容生产者的剖析思路
- 用户需要:分享常识观点(公布观点),建设行业影响力(内容受到反馈)
- 那么,如何让用户感触到本人的需要被满足了呢?
S:知乎做的策略是:内容点赞评论、内容打赏、盐值减少、XX 话题优良回答者
M:须要针对这些用户动作去做指标,在这外面咱们的指标会有两个,别离是后果指标和过程指标
后果指标:用于掂量用户产生某个动作后所产生的后果,通常是延后晓得的,很难进行干涉。
过程指标:用户在做某个动作时候所产生的指标,能够通过某些经营策略来影响这个过程指标,从而影响最终的后果。
还是以内容生产者为例:
后果性指标:公布文章数、公布文章的人数、文章点赞 / 评论数、被打赏人数、被打赏金额、优良回答者人数、新增优良回答者人数等。
过程性指标:应用内容导入人数、内容公布转化率、文章互动率、评论折叠率等。
通常咱们会在指定指标的过程中应用 OSM 的模型,去针对用户在不同场景下产生的动作,以及这个动作可能带来的后果,用户在这个动作中会呈现什么样的数据变动。之后再联合数据,针对性地去调整咱们的经营策略或者产品性能。
简略了解:后果性指标更多的是监控数据异样,或者是监控某个场景下用户需要是否被满足。而过程性指标则是更加关注用户的需要为什么被满足(没被满足)。
滴滴的例子
O:用户应用滴滴这个产品,指标是什么?
能够疾速打到车,平安达到目的地。那么,如何让用户感触到本人的需要被满足了呢
S:滴滴做的策略是:
- 慢车、拼车、优享等多种车型,解决不同用户诉求;
- 依据早晚顶峰进步热点区域运力,缩小用户排队工夫;
- 司机准入机制、全程录音等形式进步安全性。
M:针对这些策略去做指标,失去的后果指标和过程指标别离是:
- 后果指标:渠道转化完成率、乘客勾销率、供需比、司机服务分
- 过程指标:渠道发复数、渠道完复数、排队乘客数、乘客排队时长、司机好评率、司机接单量、司机勾销数等
进步 GMV(Gross Merchandise Volume)
GMV= 1 销售额 + 2 勾销订单金额 + 3 拒收订单金额 + 4 退货订单金额 *
GMV 是流水,只有你下了订单,生成订单号,就算了 GMV, GMV 某种意义阐明了平台的市场份额,然而对于商家来说,没有实际意义
拼多多的百亿补贴次要就是进步客单价,销售高端产品,这次要是因为拼多多早起走的是性价比路线,在用户数的扩张到肯定规模之后,遇到了瓶颈期,所以调整了业务方向,也就是进步客单价走高端路线。
非标住宿
上面以「非标住宿」平台为例分享一下,如何去选取正确的指标;或者说,负责搜寻性能的产品经理如何利用 OSM 模型搭建数据监控指标体系。非标住宿有个特点,就是产品个性化。比如说咱们住宿的时候抉择情侣房等个性化住房,其数量是无限的,同一个格调的房源个别不会超过 5 间
从发动搜寻到搜寻后果页,再到产品详情页,最初填写订单、预订胜利,这是该非标住宿搜寻预订的残缺门路。在这整个业务流程中,咱们该如何搭建数据监控体系,通过数据分析领导业务增长呢?
指标掂量的是什么
在这个例子中,选定指标使用了 2 种视角:
- 第一种,用户视角,让用户通过搜寻高效地找到心仪的住宿产品。
- 第二种,业务视角,进步从搜寻到最初胜利下单的转化率。
为了进步这个转化率,咱们会采取什么样的策略呢?
- 第一,返回与用户搜寻值相匹配的搜寻后果。
- 第二,提供无效的搜寻后果排序。对于非标类产品,咱们须要思考
- 怎么把用户感兴趣的产品放在第一屏或者前三位,可能让用户一眼就看到他想搜寻的产品。
- 第三,当搜寻没有后果或者后果有余时,咱们就要做无效的举荐。
如何无效掂量“什么”
第一步,抉择适合的 OSM 指标度量。
针对从搜寻到下单的整个流程,能够拆解 2 个 KPI 指标。KPI 1 是搜寻到详情页的转化率,咱们设置的 Target 是 30%。在这一步,用户通过搜寻得出想要的后果,才会点击产品的详情页。KPI 2 是详情页到下单的转化率,Target 也是 30%。在这一步,如果用户看的产品详情页是合乎情意的,才可能会产生订购,达到最初的预约胜利。
第二步,留神后果性指标和过程性指标。
后果性指标,就比方电商场景下的 GMV 或订单量,它通常是业务漏斗的底部,是一个不可更改的、后验性的指标。
过程性指标,能够简略了解为达到这个后果之前通过的门路,以及通过这个门路去掂量转化好坏的过程,它是可干涉的,而且通常是“用户行为”。
如何掂量指标的好坏
咱们须要设定 Target 来掂量指标的好坏,这基于咱们外部的历史数据和行业的 benchmark,其设定准则是:要对外部有肯定的挑战性,但又不是遥不可及的。
例如从开始搜寻到商品详情页,转化率是 23.2%;从商品详情页到最初预约胜利,转化率是 23.8%,两者比拟靠近。这个时候咱们抉择 30% 作为 Target 是比拟适合的
明确业务目标 确定外围指标
指标的选取是很外围的一步。如果咱们抉择了正确的指标,它就像一个晴雨表,能很好地掂量业务的健康状况。如果咱们抉择了一个谬误的或者是虚荣的指标,它可能会把咱们疏导到一个谬误的门路下来,这是一个很大的陷阱。
业务指标其实是和咱们的产品非亲非故的,咱们能够大抵将咱们的产品划分到上面四类中去
针对每一类的产品,咱们都能够形象出上面的一些比拟通用的指标
工具类业务
帮忙用户节省时间,产品本身提供价值。如墨迹天气、TEA。外围指标应该聚焦到判断工具的使用率。
比如说为用户提供工具类型业务策略,个别是为了让用户节省时间,疾速的定位到所须要的信息或者实现某一种工作,那么这种策略外围的价值就在于晋升效率,个别的掂量指标是:使用量,指标达成率,频次;以电商的例子来讲的话,就是第一步中的流量举荐位,以及搜寻性能是不是可能让用户疾速的定位到它所感兴趣的直播内容,那这种状况下做优化流量位的内容和搜寻匹配优化我的衡量标准就是它的效率,曝光,点击,转化效率。
内容类业务
比如说为了用户提供消遣的内容,让用户能够消磨工夫,那么这种策略的外围价值就在于为了用户提供丰盛的高质量的内容,不论是短视频,直播,或者流动玩法。那么这种策略的外围的价值就在于为用户提供内容的量与质,个别掂量指标是:生产人数,生产广度,消费市场,以及用户与内容的互动,用来掂量用户对于内容的青睐。比方 B 站的弹幕就是一种用户对于内容认可的更高层次的情感表白。
交易类业务
帮忙用户节省时间,产品通过链接其余资源提供价值。如淘宝、京东金融。外围指标应该聚焦到转化率。
那么这种策略的外围价值就在于为用户提供好的购物体验,可能晋升付费页面转化效率,晋升购买的总规模,客单价以及复购率。
社交类业务
杀掉用户工夫,产品通过链接其余资源提供价值。如 Soul、探探。外围指标应该聚焦到用户的沉闷水平。
比如说为了用户提供与其他人的情感连贯,促成用户和用户之间的关系积淀,进而让用户对于平台或者对于业务更有依赖性,促成用户的沉闷和互动,个别的掂量指标是:内容的发布量,用户和用户之间的互动量,积淀下来的关系对数
微信,是用户和用户之间的一个情感的连贯,那掂量这种连贯的紧密性次要是人与人之间的互动量,点评赞数量,积淀的关系的数量
拆解外围指标
明确业务类型和业务指标之后,咱们要结合实际业务,将次要关注的指标拆解到 可口头的水平,前面咱们再解释可口头的水平到底是什么意思,也就是如何评估指标的环节
上面就是一个常见的指标拆解示意图,咱们将咱们公司的一级指标也就是策略指标进行拆解,而后拆解到各个部门、各个环节,直到能够定位到集体,这样能力充分发挥人员的价值与能力
按场景拆分成多个子指标的和
DAU ≈ 日新增用户 + 留存用户 + 回流用户;
按肯定的关系拆分成多个子指标的积
- GMV(总消费额)≈ 用户数 x 购买频次 x 客单价;
- 销售额 ≈ 用户总量 x 付费率 x 客单价;
- LTV(生命周期总价值,life time value)=LT(生命周期,life time)x ARPU(每个用户的均匀破费,Average Revenue Per Use)
指标迭代
一个好的指标必定不是能一鼓作气就能够实现的,须要一直的迭代,而这个过程须要多方进行配合。
评估指标体系
在理解了好的数据指标体系的必要性之后,咱们来看一下到底什么样的指标体系是一个好的数据指标体系。大家在做一些数据分析的时候,咱们都会看到列出来的一些规范:数据指标必须是精确的,是可能周期性统计,当然这只是一方面,另外一方面就是业务层面是有价值,可掂量业务真实情况,并且还要简略可执行。
从技术层面来看,一个好的指标,对立具备四个特点:容易收集疾速掂量;准确度高;可被多维度合成;繁多数据源。就像咱们常常应用的掂量 APP 产品启动人数,应用 UUID 或者是 COOKIE 往往比应用 IP 更加精确。
但很多时候,因为技术或者是业务本身的起因,咱们往往很难找到很完满的指标。那么这个时候咱们最重要的就是统一口径进行剖析,更多地察看数据的稳定状况。
咱们能够从上面几个方面去评估指标体系的好坏,其实次要还是分为两大类,一是实在贴合业务,能够反映业务;二是能够疾速定位问题,提供解决方案
系统性
可能发现部分与整体的关系及问题定位,当数据产生异动时,通过指标体系的逻辑拆解,能迅速定位到大抵的异动模块及起因
全面性
能满足不同数据应用方的日常需要,对产品经营及倒退状况有整体理解;
认知对立
指标体系服务于不同角色群体,简略迷信可解释,合乎公众认知,大家都独特认可。
真实性
指标体系要能反映产品真实情况,杜绝金玉其外; 败絮其中的虚荣指标;
据指标是为了让公司,业务,或者我的项目的成员围绕着一个可量化的指标开展一系列的工作的。如果数据指标没有贴合业务外围指标的话,那么给公司,业务或者我的项目带来的会是微小的损失。
可迭代
指标体系随不同生命周期阶段而扭转,指标体系要在倒退中放弃迭代
可操作
如果能从工夫纵向比照、或者从其余维度比方用户群体、产品、地区等不同角度进行横向比拟,能够更好地察看业务的发展趋势,定位问题,找到起因,以及改善业务中须要改善的环节。
- KPI 达标率:如果你的外围指标是 KPI 指标,那就间接依据 KPI 达标率来判断即可。这个应该是最常见的一种形式。
- 竞品对标:如果你能从靠谱渠道收集到竞品相干数据,那以竞品为参照物进行判断。
- 环比比照:查看环比数据,如果业务走势呈显著周期性,抉择一个历史数据较为不错的数据进行比照。
- 同比比照:查看同比数据,预估每个周期增长多少个百分点,与上一周期数据进行比照,看是否达标。
在两头过程如果任何一个指标呈现了问题,第一是可能提前断定这个业务的衰弱度是什么样子的,是不是呈现问题了。第二个益处在于这些两头过程的指标能够拆分到负责的团队里边,定位到负责人。业务下面如果呈现问题的话,能够第一工夫负责人,之后进行下一步的优化措施的拆解。
GMV 咱们拆分到 IPV 乘以付费转化效率再乘以绝对应的 APPU(人均付费值),这个是行业内十分常见的一个拆解形式,从用户的角度去进行拆分,那这种状况下的 IPV 就有由对应的搜寻团队或者是举荐团队负责,他须要去优化整个页面的一个规模或者说到访用户的规模,付费转化效率由产品团队负责,去进行绝对应的一些产品优化,缩小摩擦点,可能晋升咱们付费转化效率;APPU 值这一块更多的是由经营的团队去负责,因为经营团队须要去做一些流动,或者是通过一些优惠券的形式可能促成用户买了再买,购了再购。
指标治理
公司层面有公司最关注的 KPI,比方:日活、GMV、订单量等等;不同的部门又有不同的关注 KPI,比方:新用户数、复购人数等等,有了 KPI,咱们就能够依据 KPI 来考查部门的体现,也就是绩效。这也是数字化转型,所有的治理、绩效都数字化。
下面讲的都是如何去定义指标,定义指标之后如何评估指标,上面咱们看一下如何治理指标。
就数据平台来说,指标算是元数据的一种,指标的保护和治理是有套路的,上面就简略分享下对于指标的治理——指标字典。然而开始之前咱们先说一下为什么要进行指标治理。
指标作为业务和数据的联合,它根底是数据统计,指标也是量化业务成果的根据 。既然和业务挂钩那就会有说不明道不清的变动, 其实着也是咱们做指标治理的次要起因,业务在疾速倒退,所以在这个过程中业务的口径和逻辑都在发生变化,如果不对立进行治理和保护的话就会呈现指标口径含糊逻辑不清。
咱们能够从从业务、技术、产品三个视角来看:
-
业务视角
业务剖析场景指标、维度不明确;
频繁的需要变更和重复迭代,数据报表臃肿,数据参差不齐;
用户剖析具体业务问题找数据、核查确认数据老本较高。
-
技术视角
指标定义,指标命名凌乱,指标不惟一,指标保护口径不统一;
指标生产,反复建设;数据汇算老本较高;
指标生产,数据进口不对立,反复输入,输入口径不统一;
-
产品视角
不足零碎产品化反对从生产到生产数据流没有零碎产品层面买通
还有一个起因就是因为一个公司的指标自身就有很多,所以在这个过程中呈现的指标名称凌乱,指标不惟一 所以咱们在定义指标的时候就须要参考已有指标的,从而防止命名和含意上的抵触,做好数据有序地和有构造地分类组织和存储也是防止底层数据的反复建设、数据统计起源的不惟一的重要伎俩
指标管理系统只不是为了更好的治理指标引入的一套工具,当然只好好的工具配合好的理念才行,也就是说如果没有指标管理系统你也能够做指标治理。
指标的治理—指标字典
- 指标字典,其实就是对指标的治理,指标多了当前,为了共享和对立批改和保护,咱们会在 Excel 中保护所有的指标。当然,Excel 对于共享和版本控制也不是很不便,有条件的话,能够开发个简略的指标管理系统,再配合上血缘关系,就更不便追踪数据流转了。
指标编码
- 为了不便查找和治理,咱们会对指标定义一套编码
业务口径
- 指标最重要的就是,明确指标的统计口径,就是这个指标是怎么算进去的,口径对立了,才不会产生歧义
口径梳理
- 一开始指标的梳理是很麻烦的,因为要对立一个口径,须要和不同的部门去沟通协调;
- 还有可能会有各种各样的指标呈现,须要去判断是否真的须要这个指标,是否能够用其余指标来代替;指标与指标之间的关系也须要理分明。
迭代保护
- 而且第一版指标梳理好之后,须要进行推广和保护,一直地迭代,继续推动,让公司所有部门都对立站在一个视角关注问题。
计算公式
- 对业务口径的翻译,须要业务方告知你从哪里的数据去计算
指标模板
- 数据域
指面向业务剖析,将业务过程或者维度进行形象的汇合。其中,业务过程能够概括为一个个不拆分的行为事件,在业务过程之下,能够定义指标;维度,是度量的环境,如乘客呼单事件,呼单类型是维度。为了保障整个体系的生命力,数据域是须要形象提炼,并且长期保护更新的,变动需执行变更流程。 -
业务过程
指公司的业务流动事件,如,呼单、领取都是业务过程。其中,业务过程不可拆分。
-
工夫周期
用来明确统计的工夫范畴或者工夫点,如最近 30 天、天然周、截止当日等。
-
润饰类型
是对修饰词的一种形象划分。润饰类型从属于某个业务域,如日志域的拜访终端类型涵盖 APP 端、PC 端等修饰词。
-
修饰词
指的是统计维度以外指标的业务场景限定形象,修饰词属于一种润饰类型,如在日志域的拜访终端类型下,有修饰词 APP、PC 端等。
-
度量 / 原子指标
原子指标和度量含意雷同,基于某一业务事件行为下的度量,是业务定义中不可再拆分的指标,具备明确业务含意的名称,如领取金额。
-
维度
维度是度量的环境,用来反映业务的一类属性,这类属性的汇合形成一个维度,也能够称为实体对象。维度属于一个数据域,如天文维度(其中包含国家、地区、省市等)、工夫维度(其中包含年、季、月、周、日等级别内容)。
-
维度属性
维度属性隶属于一个维度,如天文维度外面的国家名称、国家 ID、省份名称等都属于维度属性。
-
指标分类
次要分为原子指标、派生指标、衍生指标
-
原子指标
基于某一业务事件行为下的度量,是业务定义中不可再拆分的指标,具备明确业务含意的名称,如呼单量、交易金额
-
派生指标
是 1 个原子指标 + 多个修饰词(可选)+ 工夫周期,是原子指标业务统计范畴的圈定。派生指标又分以下二种类型:
-
-
- 事务型指标
指对业务过程进行掂量的指标。例如,呼单量、订单领取金额,这类指标须要保护原子指标以及修饰词,在此基础上创立派生指标。
- 事务型指标
-
-
存量型指标
是指对实体对象某些状态的统计,例如注册司机总数、注册乘客总数,这类指标须要保护原子指标以及修饰词,在此基础上创立派生指标,对应的工夫周期个别为“历史截止以后某个工夫
- 衍生指标
是在事务性指标和存量型指标的根底上复合成的。次要有比率型、比例型、统计型均值
-
指标的治理—指标管理系统
有了下面的指标字典,指标字典其实相当于是咱们的底层逻辑,其实实现这个底层逻辑咱们能够应用 word、excel 等工具都能够去实现,然而为了可能更加不便的治理,咱们能够开发一套零碎,也就是咱们的指标管理系统。
指标作为数据平台上的外围数据资产,咱们也能够将其做到咱们的资产治理平台中去。
场景落地
直播电商
酒旅业务
理财产品
共享单车
网站业务
总结
建设指标体系,须要答复以下几个问题
- 为什么建设数据指标体系
- 如何评估数据指标体系,一个好的数据指标体系是要须要答复两个问题,它是不是有助于业务倒退,以及说这个指标体系拆解是不是可具备、可落地、可实操的可能性。
- 如何建设数据指标体系,这就须要咱们的建设方法论了
- 如何保护和治理指标,指标的保护和治理是有套路的,最简略的指标治理办法——指标字典,咱们在此基础上能够做指标管理系统
OSM 实现了业务指标结构化,UJM 实现了业务指标流程化。
数据指标体系其实只是数据赋能业务的万里长征的第一步。将来如果心愿更加泛化地去反对到更多的业务场景,其实是须要去做一些产品化的积淀的,把一些固化下来的指标体系或者剖析框架积淀下来,去赋能更多的业务人员,能够应用绝对应的数据产品,帮忙他们去做绝对应的业务决策。进一步晋升他们决策的效率,同时升高应用数据的一个门槛。
交换群
加我微信:ddxygq
,回复“加群”,我拉你进群。
猜你喜爱
数仓建模—宽表的设计
Spark SQL 知识点与实战
Hive 计算最大间断登陆天数
Hadoop 数据迁徙用法详解
Flink 计算 pv 和 uv 的通用办法