共计 1849 个字符,预计需要花费 5 分钟才能阅读完成。
提及数据分析工具置信小伙伴们都不生疏,然而很多人都会有个纳闷?
数据分析工具这么多,它们有什么区别?哪个更好?哪个更强?我应该学习哪个?数据分析工具的应用还是看需要,每个企业应用的抉择和形式都不同。数据分析的概念很广,站在 IT 的角度,理论利用中能够把数据分析工具分成两个维度:
第一维度:数据存储层——数据报表层——数据分析层——数据展示层
第二维度:用户级——部门级——企业级——BI 级
1、数据存储层
数据存储波及到数据库的概念和数据库语言,这方面不肯定要深钻研,但至多要了解数据的存储形式,数据的根本构造和数据类型。SQL 查询语言必不可少,精通最好。可从罕用的 selece 查问,update 批改,delete 删除,insert 插入的根本构造和读取动手。
Access2003、Access07等,这是最根本的集体数据库,常常用于集体或局部根本的数据存储;MySQL 数据库,这个对于部门级或者互联网的数据库利用是必要的,这个时候要害把握数据库的库构造和 SQL 语言的数据查问能力。
SQL Server2005或更高版本,对中小企业,一些大型企业也能够采纳 SQL Server 数据库,其实这个时候自身除了数据存储,也包含了数据报表和数据分析了,甚至数据挖掘工具都在其中了;
DB2,Oracle 数据库 都是大型数据库,次要是企业级,特地是大型企业或者对数据海量存储需要的就是必须的了,个别大型数据库公司都提供十分好的数据整合利用平台;
BI 级别,实际上这个不是数据库,而是建设在后面数据库根底上的,企业级利用的数据仓库。Data Warehouse,建设在 DW 机上的数据存储基本上都是商业智能平台,整合了各种数据分析,报表、剖析和展示,BI 级别的数据仓库联合 BI 产品也是近几年的大趋势。
2、报表 /BI 层
企业存储了数据须要读取,须要展示,报表工具是最广泛利用的工具,尤其是在国内。过来传统报表大多解决的是展示问题,现在像思迈特软件 Smartbi 的企业报表平台,也会和其余利用穿插,做数据分析报表,通过接口凋谢性能、填报、决策报表性能,可能做到买通数据的进出,涵盖了晚期商业智能的性能。
可视化 BI 工具,可分在报表层也可分为数据展示层,涵盖了数据整合、数据分析和数据展示。近年来陆陆续续也呈现过很多 BI 工具,可作为可视化数据分析软件,目前较为罕用的Smartbi 和 Tableau,Smartbi 是使用者上传数据,Smartbi 再从数据库中取数进行报表和可视化剖析。若是比拟谋求可视化方面则是 Tableau 更优,但 Smartbi 不仅仅只有可视化这一方面,在大数据处理方面的能力更胜一筹。
3、数据分析层
这个层其实有很多剖析工具,当然咱们最罕用的就是 Excel。
Excel 软件:首先版本越高越好用这是必定的;当然对 excel 来讲很多人只是把握了 5%Excel 性能,Excel 性能十分弱小,甚至能够实现所有的统计分析工作!然而我也常说,有能力把 Excel 玩成统计工具不如专门学会统计软件;
SPSS 软件:以后版本是 18,名字也改成了 PASW Statistics;我从 3.0 开始 Dos 环境下编程剖析,到当初版本的变迁也能够看出 SPSS 社会科学统计软件包的变动,从器重医学、化学等开始越来越器重商业剖析,当初曾经成为了预测剖析软件;
SAS 软件:SAS 绝对 SPSS 其实性能更弱小,SAS 是平台化的,EM 开掘模块平台整合,绝对来讲,SAS 比拟难学些,但如果把握了 SAS 会更有价值,比方离散抉择模型,抽样问题,正交实验设计等还是 SAS 比拟好用,另外,SAS 的学习材料比拟多,也公开,会有播种的!
JMP 剖析:SAS 的一个剖析分支
XLstat:Excel 的插件,能够实现大部分 SPSS 统计分析性能
4、体现层
体现层也叫数据可视化,以上每种工具都简直提供了一点展示性能。Smartbi 和 Tableau 的可视化性能上文有提过。其实,近年来 Excel 的可视化越来越棒,配上一些插件,应用感更佳。
PPT:办公罕用,用来写数据分析报告;
Xmind& 百度脑图:梳理流程,帮忙思考剖析,展示数据分析的档次;
Xcelsius 软件:Dashboard 制作和数据可视化报表工具,能够间接读取数据库,在 Excel 里建模,互联网展示,最大特色还是能够在 PPT 中实现动静报表。
最初,须要阐明的是,这样的分类并不是辨别软件,只是想阐明软件的利用。有时候咱们把数据库就用来进行报表剖析,有时候报表就是剖析,有时候剖析就是展示;当然有时候展示就是剖析,剖析也是报表,报表就是数据存储了!