关于互联网:干货和你谈谈数据分析报告

10次阅读

共计 4475 个字符,预计需要花费 12 分钟才能阅读完成。

前言:
- 更多对于数智化转型、数据中台内容请退出 阿里云数据中台交换群—数智俱乐部(文末扫描二维码或点此退出)

- 阿里云数据中台官网 https://dp.alibaba.com/index

(作者:数智从业者)

在当今企业纷纷推动数字化经营的背景下,“No Data, No BB”成了职场人的口头禅。做一份好的数据分析报告,大到成为是否帮忙企业做出正确的商业决策,小到成为是否压服老板获取业务资源的关键因素。因而做出一份高质量的数据分析报告是一个职场人必备的利器。

有人说,数据分析报告,不就是一堆的饼图、柱状图、散点图放到 PPT 上吗?咱们尝试从这个人人司空见惯的操作中看看是否有不变的门道。

注:本文中图表通过“阿里云 QuickBI”实现,中国首个入选 Gartner 魔力象限的 BI 产品

表白主题决定了咱们的图表模式

决定剖析报告图表模式的并不是领有的数据是什么,而是你所须要表白的主题是什么。

图 1 和图 2 是依据一份雷同的数据,展示的 2 个不同的图表:

上图能够发现对于雷同的数据,因为咱们所需表白的主题的差别,也将出现齐全不同的展示形式。图 1 表白的主题是爽肤水和沐浴露两个品类在不同城市的销量排名,图 2 次要表白的主题是在雷同城市在两个不同的品类的销量差别。

因而在下笔做剖析报告之前,先认真想好本人要表白的主题是什么。

在进行了残缺的剖析后,要抵制住把所有向听众展现的激动,而应该把所有注意力集中到须要表白的主题重点上来,因为这些才是听众所须要理解的信息。

为了找到咱们剖析的主题,须要理解剖析报告针对的对象。具体的理解听众的背景和观点,并思考分明咱们冀望听众对咱们的认识。在内容上,心愿听众理解什么,理解了当前有什么口头。理解了听众和内容后,再确认数据的表达形式,只展示能反对主题的数据。

整篇剖析报告要能通过三分钟说得分明,每页报告都能一句话概括分明。

不要放弃“题目”这个绝佳的地位

有些图表的题目就和猜谜一样,例如:公司销售趋势、分公司销售散布状况。齐全没有指出图表的重点,公司销售趋势是怎么样的?分公司销售散布又是如何?

别把咱们须要强调的重点当做机密一样不肯走漏,而应该把它放在图表最后面,缩小听众误会的可能性,并让他们的注意力集中到咱们所想强调的数据上。

如下图,这张图到底是为了表白全量销售金额没有显著的增长呢?还是为了表白 2 月份销售金额断崖式上涨?还是为了表白其它什么主题呢。请在题目上明确的通知听众。

解决“成分比照”的关系

成分比照次要体现在对与一个整体的每个局部的百分比的比照。经常呈现“份额”、“百分比”等词汇。成分比照通常应用饼图来展示:

饼图在应用中倡议不超过 6 个局部,如果超过 6 个局部,能够把残余局部归类到“其它”项中。另外因为人们看数据习惯顺时针看数据,因而可把最重要局部放到 12 点地位,并用对比度强烈的色彩突出显示。

饼图次要在标识繁多整体各局部比例,如果须要比拟两个整体的成分时,重点思考柱状图(图 3)。因为如果应用饼图(图 4)会导致读者眼帘须要在不同图表间来回挪动:

成分剖析可能包含子成分剖析,须要把整体的一部分再作为整体进行剖析,这时可将饼图放在开始的中央,百分比的柱状图放在前面:

咱们要尽可能少应用饼图,饼图占整体的比例个别不超过 5%。尽量不应用 3D 饼图或甜甜圈饼图。永远记住,图表只是为了让咱们听众更好了解咱们的数据,而不是图表有多不同凡响。

解决“我的项目间比照”的关系

我的项目间比照次要是比拟不同我的项目间的状况。经常呈现“排名”、“大小”等词汇。我的项目间比照通常应用条形图来展现:

咱们对于条形图的程序须要三思而行,如果人造是有序的则按人造的程序,例如人生阶段婴儿、少年、青年、中年、老年。然而如果没有这种人造程序,须要思考什么程序对于咱们数据主题是最有意义的。

依据咱们所须要突出的主题,抉择条形图的排序形式。展示条形图数值的形式包含刻度尺或在条形图上显示数字,可依据状况抉择其中一种形式,然而不要两处都显示,多余容易导致图形的凌乱。同时标识数字时,把小数点后的数值去掉,3% 总是比 3.1415% 容易被听众记住。

对于我的项目间比照有时也会通过柱状图来代替,然而条形图相较于柱状图有两点明细的劣势:第一,缩小听众与工夫序列比照的混同;第二,条形图有较大的空间填写各项目标名称。

我的项目间比照,还能够通过背离式条形图,往往能够形象的将无利与不利的状况拆散开来:

我的项目间还可能针对一个范畴进行比照,这时可应用范畴条形图:

当比拟的我的项目由多个局部组成,可通过沉积条形图,必须将最重要的成分放在凑近基线的中央,因为只有这部分才可被精确度量:

解决“工夫序列比照”的关系

工夫序列比照关怀的是随工夫变动的比照。经常呈现“变动”、“增长”、“降落”等词汇。工夫序列比照通常应用柱状图或折线图来展现,如果工夫点不多时能够应用柱状图,如果工夫点是很长一段时间范畴应用折线图更为适合:

对于折线图,趋势线肯定要比背景线粗。当存在同一张折线图存在多条折线时,须要将最关注的线加粗加亮。然而当呈现十分多折线时,咱们的折线图就会呈现出“方便面式”图表,往往导致图表凌乱。如下图:

解决“方便面式”图表的形式可通过将折线图拆分到不同的小的折线图中,尽管图表变多了,然而所须要表白的主题也能更加清晰:

在工夫序列比照中,可通过箭头、线条、暗影等形式强调数据的某一部分,将听众的注意力集中到你所期待关注的点上:

同样,工夫序列比照也能够通过刻度的正负来辨别侧面状况和负面状况:

咱们经常在工夫序列中,可能包含理论值和预计值,可通过将理论值设置为实线,将预计值设置为虚线的形式:

当一个折线图的数值,是可通过一个公式生成的,可将公式中的计算因子别离拆分到计算树中,使听众可清晰看到每局部计算因子的变动状况:

如果只有两个工夫点,可展示两组数据之间各维度的晋升和升高的差别,造成斜率图,连贯的线条能够直观的感触到晋升与升高的水平:

不同的刻度基线会产出齐全相同的数据主题解读。看以下 2 张图,同样都是对杭州房价的形容:

同样的数据,产出的图表给人截然不同的感觉。那么咱们到底应该如何定义刻度呢。其实要害取决于咱们对于变动的了解,100 块钱对于房价来说可能微不足道,然而对于动车票价格可能就是至关重要。咱们应该抉择一个刻度,能精确反映对变动重要性的了解。如果通过应用不适合的刻度基线来误导听众,只有有分别能力的听众都能发现问题,那么咱们的整套舆论和信用就会被鄙弃。

解决“频率散布比照”的关系

频率散布比照体现的是数据分布范畴状况。经常呈现“范畴”、“密度”、“散布”等词汇。频率散布比照通常应用柱状图或折线图来展现,当比拟范畴数量较多时可应用折线图,较少时可通过柱状图:

频率散布的范畴大小十分重要,既不能太大也不能太小,倡议 5 到 20 个分组。不同分组的大小应雷同,否则会造成数据扭曲。

对于即须要展现频率散布,又须要进行我的项目间比照,可将散布柱状图进行组合,其中一个散布柱状图作为另一个的背景图:

解决“相关性比照”的关系

相关性比照体现的是不同变量之间的关系。经常呈现“与 XX 无关”、“随 XX 增长”等词汇。相关性比照通常应用散点图或双条形图来展现。如下图:

在双条形图中,咱们将独立变量按程序排在右边,而把对比值放在左边,如果冀望模式与理论模式统一时,左边的条形图就会变成右边的条形图的镜像,如上面左图。当关系不合乎预期时,两组条形图则会产生偏离,如上面右图:

解决“多重比照”关系

比照可能不仅仅是一种比照关系,有可能是联合上文所说的成分、我的项目间、工夫序列、频率散布、相关性比照中的一种或多种组合而成,咱们称之为“多重比照”。例如“销售额在过来 10 年内稳步增长,但利润却没有同步增长”,这案例第一局部“销售额在过来 10 年内稳步增长”属于“工夫序列比照”,第二局部“但利润却没有同步增长”属于我的项目间比照。对于这种状况,咱们须要确定哪一种关系是次要的,哪一种是主要的。案例中,第一局部随工夫变动是次要的,而销售额与利润我的项目间比照是主要的,因而最好抉择以工夫变动比照的折线图,并为每一个我的项目画一条干线的形式实现,如下图:

不仅仅只有图表

当然,对于数据分析报告,可定量信息咱们能够通过图表构建,然而对于不可定量的信息,咱们能够通过一些几何图形造成概念性视觉图像,或通过一些日常事务作视觉比喻。例如说到指标,能够造成平地这样的视觉图像。这须要施展本人的想象力,平时多注意写优良的海报广告,在生活中寻找灵感,在报告中可能做到与听众产生共鸣的成果。

打消认知负荷

听众在承受咱们剖析报告信息时,须要耗费脑力去学习新常识,脑力是无限的,因而须要打消听众无关紧要的脑力耗费。造成无关紧要脑力耗费最大的问题就是“芜杂”,因而打消芜杂是数据分析报告须要重点关注的。

通过将文字从原来居中对齐调为左对齐,进行相干的无关数据的淡化的解决,能缩小听众的认知负荷,把关注点转移到咱们的重点上::

通过将网格线打消、标记点打消、金额度量转换、间接标记数据等伎俩升高认知负荷,右图是批改后的图表:

通过打消一些烦扰,能突出咱们所须要表白的重点。所有的数据不是雷同重要,打消不须要关注的元素,或将不间接影响内容的元素融入背景。去掉这个货色会有什么变动?如果不会,那么就去掉吧。

同时要突出咱们须要吸引听众实现的中央。在文字中可通过加粗、色彩、斜体、大小、空间隔离、下划线等伎俩突出文字关键词。在图表中次要通过色彩、大小突出须要强调的内容。在应用色彩时需谨慎抉择,不能在一张图中有太多色彩,造成视觉烦扰;能够应用色彩的不同饱和度来强调数据;依据剖析报告背景,可抉择对于的互补色来做内容的突出强调。

讲好剖析报告

剖析报告做好了,还须要以更好的语言表达形式出现给听众。能够把剖析报告当做一个故事来说,能更加引人入胜。

首先对整个背景做设定,接着介绍什么因素上下文驱动情节的演进,举例说明产生了什么样的抵触,基于这些抵触有哪些假如,再基于这些假如如何做数据验证,最初通过什么形式带来什么解决方案。

为了保障整个剖析报告的逻辑清晰,能够构建相似金字塔的逻辑构造,以某一个核心论点为塔尖,在其以下分支出不同论点的数据分析撑持。让听众对咱们的剖析报告有个清晰的逻辑构造。

最初,心愿每个职场人都能用数据分析报告关上一个新的天地。广大数据天地,大有可为。

工欲善其事必先利其器,BI 工具,举荐“QuickBI”,泛滥可视化组件拖拖拽拽就实现了,人人都是数据分析师。


数据中台是企业数智化的新基建,阿里巴巴认为数据中台是集方法论、工具、组织于一体的,“快”、“准”、“全”、“统”、“通”的智能大数据体系。目前正通过阿里云数据中台解决方案对外输入,包含批发、金融、互联网、政务等畛域,其中外围产品有:

  • Dataphin,一站式、智能化的数据构建及治理平台;
  • Quick BI,随时随地 智能决策;
  • Quick Audience,全方位洞察、全域营销、智能增长;
  • Quick A+,跨多端全域利用体验剖析及洞察的一站式数据化经营平台;

官方站点:
数据中台官网 https://dp.alibaba.com

正文完
 0