关于数据分析,在这之前你可能听过这样的故事:
奥克兰“运动家球队”一反传统球队依据击球率选拔球员,通过数据分析依据“高上垒率”选取了所需的低价球员,取得 20 连胜最终夺冠;
零售帝国沃尔玛在一次例行的数据分析之后发现:跟尿布一起搭配购买最多的商品,竟是啤酒!
Target 超市给女孩邮寄婴儿服装和孕妇服装的优惠券,比女孩的父亲更先知道了该女孩怀孕;
一头刚出生 30 天的猪,数据预测它的生长周期,进而看到“人为刀俎,我为鱼肉”;
在这背后都是大量技术人员专业的规律统计、数据预测和相关性分析。
专业的数据分析还是有一定技术门槛的。但是近两年,很多公司的业务都已经结合着数据分析去开展,比如产品运营需要做运营数据分析,财务管理需要做财务分析,库存管理需要分析产品流转存储,这其中最普遍应用的就是 BI。
BI 全称商业智能(Business Intelligence),在传统企业中,它是一套完整的解决方案。将企业的数据有效整合,快速制作出报表以作出决策,涉及数据仓库,ETL,OLAP,权限控制等模块。
BI 工具主要有两种用途。
一种是利用 BI 制作自动化报表,数据类工作每天都会接触大量数据,并且需要整理汇总,这是一块很大的工作量。这部分工作可以交给 BI 自动化完成,从数据规整、建模到下载。
另外一种是使用其可视化功能进行分析,BI 的优点在于它提供比 Excel 更丰富的可视化功能,操作简单上手,而且美观,如果大家每天作图需要两小时,BI 会缩短一半时间。
在这里,本文想强势安利一款数据 BI——FineBI,探索性的分析操作、分析图表、数据挖掘,能引导数据走向真相,关键不需要写代码就能直接上手。
以下是介绍纲要:
- 海纳百川,支持各种数据
- 10 秒钟清洗数据,规整数据
- 自动分析,推荐图表
- OLAP:多角度深入分析
- 现成的数据挖掘模型
- 令人眼前一亮的可视化
海纳百川,支持各种数据
一般要分析的数据五花八门,数据量小可以用 Excel 解决。数据量大,大到错综复杂各式各样亿万级数据量的企业数据库,Oracel、DB2、SAP HANA\ 大数据 kylin、hadoop 等,FineBI 都能直接连接,或者直接导入本地 Excel 分析也行。
10 秒钟清洗数据,规整数据
这里假设我已经连接好了数据源,之后要开始分析。我们来看下 FineBI 是如何操作一个数据分析的:
1、准备数据:选数据表和要用到的数据字段
自助数据集这个功能里,可以自行选择数据表和需要用到的数据字段。数据太多,不知道如何入手,所以在开始分析之前,尽可能明确你的分析目标是什么,然后选择作用的数据。
2、清洗数据:数据加工,规整数据
好的数据是数据分析成功的基础。一般来说,我们拿到数据之后,数据并不是那么完美,对于本身质量很差的数据进行分析往往是南辕北辙的,得出来的分析结果也是错误的,进步还会误导我们对事情本身的判断,做出错误的决策。所以可能我们在开始拿到数据后,需要对数据进行梳理,这也就是我们通常所说的数据清洗。比如某些数据缺失,比如增加一些数据字段,比如列重命名、数据类型转换、异常值处理、合并数据等等。
在 FineBI 自助数据集功能里,可以对数据实现过滤、分组汇总、新增列、字段设置、排序、合并等等操作,可以把数据进行规整。
不明白可以看下方的示意:
如果还不能明白,FineBI 设置了自动数据清洗的功能,通过点击鼠标就能够完成你对有缺陷数据的清洗。
探索性分析、自动推荐图表
1、智能推荐图表
图表展示数据一定是最直观的。但实际上我们可能不明白为什么要选用柱状图,不知道选用了漏斗图是什么意思。当你想分析两个或者两个以上数据字段的相关性时,FineBI 会自动为你选择最合适的图表,每种图表背后都有很强的数据分析算法,可以帮助你先初步了解你的数据情况,迈出数据分析的第一步。不用再花时间想用什么图表,随便拖拽就好了,所思即所见,所见即所得。
2、可视化不仅是为了美,更是帮助分析
FineBI 基于著名的图形语法 (The Grammar Of Graphics) 设计改良,提供了无限的视觉分析可能,我们称之为“无限图表类型”。FineBI 取消了传统图表类型的概念,取代以 ’ 形状 ’ 和形状对应的 ’ 颜色 ’,’ 大小 ’,’ 提示 ’,‘标签’等属性;取消了 ’ 分类 ’、’ 系列 ’ 等概念,取代以 ’ 横轴 ’、‘ 纵轴 ’ 两个方向。
上面这句话是官方的,比较拗口。简单来讲就是,FineBI 既让你保留了传统固定图表的分析习惯,你可以基于智能推荐的结果去调整对应图表类型,但更打破了传统,鼓励你去基于你的思考去形成你的分析,所有形状、颜色、大小、提示、标签、图表、警戒标识都将是你思考点的体现,而不再用图表去限制你的思考。
什么意思呢,以上面所取的数据为例,来看一个大区销售额的对比分析:
拖拽字段,智能推荐了最常用的柱状图。
我们可能更习惯横向去看具体销售额的数值,从上到下去看对比情况,这时我们希望横纵轴切换一下分析维度,直接一键切换,可以看到切换后意外地发现形成了我们熟悉的条形图。
甚至可以设置形状的颜色不同来区分大区,设置形状的大小来表示销售额,甚至直接替换形状。
以上几个步骤,就是 FineBI 的基础操作,可以初步的丢手头的数据有个大致的了解,初步形成分析思路。
接下来就要讲讲计算处理数据的部分。
OLAP:多角度深入分析
OLAP 分析,老生常谈的分析技术,对数据进行钻取、放大、过滤、维度切换、跳转、联动、导出、复用等等。
通过 FineBI 的 OALP 分析,可以轻松玩转你的数据,从大到小,由浅及深,探索数据之间的深层关联。
比如对区域 - 门店 - 品牌 - 销售额不同维度之间,快速进行特定区域、门店 - 品牌的销售额分析。
现成的数据挖掘模型
1、搭建各种业务分析模型
真正的数据分析工具,必定脱离不了数据分析模型。长期以来,数据分析的先驱和专家们,沉淀出了不计其数经典的数据分析模型,在诸多领域和行业中得到了广泛的应用,也带来了实质的业务价值,同时,经典的数据分析模型,有利于我们快速上手数据分析,减少自我探索过程中的弯路。
由于 FineBI 可以各种处理数据:新建数据字段、介入计算公式、过滤等等,所以能再分析时搭建各种业务模型,诸如金字塔模型、KANO 分析模型、RFM 模型、购物篮分析模型、四象限模型等等。
以 RFM 模型搭建为例,从最基础的数据(下图 1)到成功搭建一个 RFM 模型(下图 2),再到进行模型应用(下图 3),只要不到 10 分钟的实际。之前研究过 RFM 客户价值模型,在市面上寻找体验了许多分析工具,FineBI 绝对是国内制作 RFM 模型最高效便捷的软件。
顾客购买的原始数据:
经过数据处理快速搭建出 RFM 价值模型:
2、数据挖掘和 R 语言
数据挖掘是结合数学统计知识,更深入的挖掘数据之间的内在联系。比如面向过去,发现潜藏在数据表面之下的历史规律或模式,称之为描述性分析;或面向未来,对未来趋势进行预测,称之为预测性分析。
FineBI 提供了 5 种现成的数据挖掘模型,时序预测、聚类、分类预测、回归和关联分析。也就是说,如果你想预测未来的销售额,你想智能地给用户群分类,或者你想知道短信发给哪个用户获得的反馈可能性比较大,将会成为现实。
除此之外和集成了 R 语言,可以直接在 FineBI 中进行 R 语言编译,实现更多数据挖掘分析需求,一手写法,一手用 FineBI 出可视化报告。
预测 1:基于过去的航空公司乘客数据预测未来十个月的乘客数量:
预测 2:基于已有会员数据预测未注册客户的会员等级
预测 3:根据花萼长度和宽度、花瓣长度和宽度来对花卉种类分类:
令人眼前一亮的可视化
好马配好鞍,最终的数据分析结果自然少不了一副好的皮囊。作为一款专业的数据分析工具来讲,FineBI 的可视化功能也十分强大,可以制作各种可视化的报告,为数据分析锦上添花。最终数据分析的结果自然要来贴上几张可视化的图,直接来查看下 FIneBI 数据可视化的效果: