从事数据分析工作的你真的读懂数据了吗

35次阅读

共计 3116 个字符,预计需要花费 8 分钟才能阅读完成。

作者 | 陈老师
来源 | 接地气学堂

经常有同学抱怨,在公司里,总被催着问:通过数据,你看到了什么?可实际数据就几个曲线而已,也不知道咋解读。也没有人教,自己好不容易写了几句,又被嫌弃:“你这都是废话,我们要深层次含义”。咋办?今天系统解答一下。就举个最简单的例子,下边是某公司一周销量数据,你看到了什么?

错误的数据解读示例

1、高了表扬低了骂。数据解读,写的是:周一到周五很高,周六、周日低,所以要!搞!高!……这么解读当然会被说:你这都是废话啊!业务又不是瞎子,看不到数字是周六日低吗。

2、哪里跌了哪搞高。因为周六跌了 48%,所以要搞高……这个是废话 * 2 和上一种说法是一个模子里刻出来的。

3、加减乘除算不停。平均值 95.2,最大值 125,最小值 35……这个是废话 *3。平均 95.2 所以呢?最大值 125 所以呢?这还是在把数字复述一遍而已,没有讲出任何含义。

解读的关键是理清业务含义

以上三种错误的共同点,是:就数论数,止于数据。没有读出数据背后的业务意义。其实数据解读一点都不高深,我们每月每天都在用,比如:

业务部门做决策也一样。他们想听的是:不划算、不喜欢、买不起。他们更想听的是:“今天中午预算只有人均 50,在这家川菜馆既管饱又好吃”,他们想听的绝不是“2 公里内共 28 家餐厅,平均价格 63 元,最高价 725 元,最低价 13 元,较上个月价格提升了 10%”——这真的是一点意义都没有。

想要得出这种判断,需要三个条件:1、了解数据代表的现实含义 2、了解数据大小代表的现实区别 3、明确判断标准

比如大众点评上饭店人均金额 185 元。它不是一个孤零零的数字,而是填肚子的成本,这是人均金额的现实含义。成本低了可以接受,高了就吃不起,这是数据大小的现实区别。比如我一个月餐费预算只有 3000 块,意味着每天只有 100 块钱,这就有了标准。那这一顿 185,明天就得吃土了。这就形成了判断:太贵了,得换个地方。

解读企业数据也如此,不能只见数据,不见业务。同样三点:1、业务含义:数据反映的是什么业务

2、业绩走势:通过数据形态,解读业务发展走势

3、判断标准:到底什么算好,什么算不好

下边我们一个个看一下

从理解业务含义开始

回到开头的例子,“销售业绩”这个指标本身有很多含义。

  • 直接含义:销售队伍的努力程度
  • 销售业绩 + 成本:企业的盈利情况
  • 销售业绩 + 产品:产品畅销程度
  • 销售业绩 + 用户分层:用户的需求
  • 销售业绩 + 库存:产品进销存管理质量

但是注意:这里并没有标准,因此无法判断是好是坏。这也是为什么直接下结论:业绩低了要搞高,是非常错误的行为。销售业绩直观反映的是销售队伍的努力程度,想知道这个数值是好是坏,我们可以直接去问“销售队伍的 KPI 达标了多少?”;也可以从业绩曲线走势来判断。这就需要做第二步:观察业绩走势。

观察业绩走势

一个问题:“什么样的产品会卖出这种曲线?”因为有七天的数据,所以可能代表了三种走势:

1、这是 自然周期 性变化。七天代表了一周,周一到周五是工作日,周六周日是休息日,所以这是一个工作日销售多,休息日没销售的产品——是滴,你很自然联想到,这可能是 B2B 的交易,工作日上班了才有大把生意,周日都休息了。或者是围绕 B2B 的衍生生意,比如 CBD 的餐厅一类。

2、这是 生命周期 性变化。有可能某个主打商品销售到了生命周期末尾,正在退市,下一款新的马上要上,暂时变化。注意,一般看生命周期数据,是从生命周期开始做 T + N 天的图来看,不是看自然日。

3、这是 突发性 变化。有可能刚好周六日出了问题,交易系统 down 机,有可能刚好促销活动到周六日结束,有可能刚好周六日恶劣天气。

通过对走势的判断,可以建立初步的标准。如果是周期性变化,那很有可能是正常波动,我们初步判做“正常”。如果是突发 + 下跌,那很有可能是异常且坏的波动,我们可以初步判做“问题”。有了标准,就能下判断,只是三种假设都有可能,需要进一步验证。

列出假设做验证

想知道自己思考的对不对,就得去验证假设。验证假设的办法有两种:第一,可以和业务部门沟通,了解实际情况。第二,可以参考过往数据,验证判断,同时反向验证业务部门是不是撒谎了。数据验证可以做的很复杂,但也能做的很简单。不需要很复杂的逻辑,只要一根曲线就够了。如下图。

只要延长时间,靠一根业绩走势 + 业务表现,也可以解读出变化的原因。如果过往一直都是有周期性波动,那拉长时间就能看出来周期规律。

实际企业经营中,也经常出现上边三种情形,只是形态更复杂,往往是三种混合。比如 B2C 零售和 B2B 销售是反着的:

1、自然周期性:周五到周日高,其他工作日低;

2、生命周期性:新品上市到下市有季节性规律 3、突发事件:大促销(猛涨)恶劣天气(猛跌)

在看数据的时候,往往会在业绩曲线上打上标签,比如一个日期是否节假日,是否某重点产品生命周期结束,是否突发情况。这样,可以从看似无规律的曲线里区分出规律来。这也是为啥很多经验丰富的业务人员,即使没有专门的数据分析,也能快速判断形势的原因。因为他们很了解业务上发生了啥事,了解过往业绩曲线形态。结合业务表现看走势,比盲目的算同比、环比、平均数,中位数要有用得多。

深入细节看问题

做完上一步,只是帮大家理解了数据含义,并没解答什么问题。如果止于上一步,就会变成业务的应声虫:“业绩下降是因为下大暴雨了”“这是正常波动,周末肯定要跌啦”……只是单纯的这么解读,很有可能会换来一句:“我早知道了”。实际上,往往人们都会注意到突发性急病,容易缺失的是对慢性病的观察。比如下图:

如果只看日数据,会感觉似乎每天波动不大,只能略微感到月头比月尾似乎高那么一点。但是如果拉长看周数据,就会发现问题。为什么在业绩好的月份,最后一周不冲刺业绩了?上月业绩好 + 月底不冲刺 + 本月开局格外好,这个曲线走势不和规律,很有可能是这就是 B2B 销售中的“藏业绩”行为。这时候,做数据分析的也能对一线业务说:我早知道了。甚至还能从下个月初吐出多少单,反推出来他们每个人藏了多少业绩。

这也是为啥实际企业经营中,我们不止看孤零零一个数,而是搭一个数据指标体系,还要做日报、周报、月报的原因。日报用来关联业务动作,反应突发问题,周报和月报用来追踪趋势,发现更深层次的问题。深层次的问题,再由专题分析解决。这样就构成了数据分析体系,系统化作战,才有威力。当然,实际分析场景会更复杂。有可能经过数据解读,我们得出的是:“销售在藏单,真实业绩比数据体现的更好”这种结论,但到底是不是藏了,真实的又是多少,还得成立专项,深入分析。但无论如何,我们都比只回复一句:“要搞高!”要进步了很多,也能赢得业务的尊重。

解读数据是个硬技能

有同学会说:既然让数据分析师自己猜这么难,为什么不直接沟通业务的需求呢?是滴,理论上最佳的状态,是业务和数据之间有定期沟通,业务陈述需求,数据反馈结论。不过大部分企业,这个状态不存在。大部分企业都是大家各忙各的,数据忙于爬表出数应付日常各种报表,业务忙着干活撕逼。部门之间深沟高垒,几乎没有沟通,越大的公司越是如此。

再加上,很多人对数据分析本身认识不清,还停留在“一个仙风鹤骨的道长掐指一算,口出出惊世憾俗之言”的印象中。共同作用,导致了文章开头的问题。因此数据分析师不能单纯指望业务把什么问题都梳理好了丢给自己,还是得有主动解读的能力的。

如果您是以下几种情况之一:

1、想了解更多大数据分析、数据挖掘、数据科学、人工智能领域的内容;
2、职业遭遇瓶颈,想提升自己在数据分析或人工智能领域的硬件技能;
3、寻求新出路、新发展,有意向转行到数据分析行业或人工智能领域。

可前往我们的网站,获取更多有效信息和专业帮助:https://www.cda.cn/?seo-segme…

正文完
 0