提及数据分析工具置信小伙伴们都不生疏,然而很多人都会有个纳闷?
数据分析工具这么多,它们有什么区别?哪个更好?哪个更强?我应该学习哪个?数据分析工具的应用还是看需要,每个企业应用的抉择和形式都不同。数据分析的概念很广,站在IT的角度,理论利用中能够把数据分析工具分成两个维度:
第一维度:数据存储层——数据报表层——数据分析层——数据展示层
第二维度:用户级——部门级——企业级——BI级
1、数据存储层
数据存储波及到数据库的概念和数据库语言,这方面不肯定要深钻研,但至多要了解数据的存储形式,数据的根本构造和数据类型。SQL查询语言必不可少,精通最好。可从罕用的selece查问,update批改,delete删除,insert插入的根本构造和读取动手。
Access2003、Access07等,这是最根本的集体数据库,常常用于集体或局部根本的数据存储;MySQL数据库,这个对于部门级或者互联网的数据库利用是必要的,这个时候要害把握数据库的库构造和SQL语言的数据查问能力。
SQL Server2005或更高版本,对中小企业,一些大型企业也能够采纳SQL Server数据库,其实这个时候自身除了数据存储,也包含了数据报表和数据分析了,甚至数据挖掘工具都在其中了;
DB2,Oracle数据库都是大型数据库,次要是企业级,特地是大型企业或者对数据海量存储需要的就是必须的了,个别大型数据库公司都提供十分好的数据整合利用平台;
BI级别,实际上这个不是数据库,而是建设在后面数据库根底上的,企业级利用的数据仓库。Data Warehouse,建设在DW机上的数据存储基本上都是商业智能平台,整合了各种数据分析,报表、剖析和展示,BI级别的数据仓库联合BI产品也是近几年的大趋势。
2、报表/BI层
企业存储了数据须要读取,须要展示,报表工具是最广泛利用的工具,尤其是在国内。过来传统报表大多解决的是展示问题,现在像思迈特软件Smartbi的企业报表平台,也会和其余利用穿插,做数据分析报表,通过接口凋谢性能、填报、决策报表性能,可能做到买通数据的进出,涵盖了晚期商业智能的性能。
可视化BI工具,可分在报表层也可分为数据展示层,涵盖了数据整合、数据分析和数据展示。近年来陆陆续续也呈现过很多BI工具,可作为可视化数据分析软件,目前较为罕用的Smartbi和Tableau,Smartbi是使用者上传数据,Smartbi再从数据库中取数进行报表和可视化剖析。若是比拟谋求可视化方面则是Tableau更优,但Smartbi不仅仅只有可视化这一方面,在大数据处理方面的能力更胜一筹。
3、数据分析层
这个层其实有很多剖析工具,当然咱们最罕用的就是Excel。
Excel软件:首先版本越高越好用这是必定的;当然对excel来讲很多人只是把握了5%Excel性能,Excel性能十分弱小,甚至能够实现所有的统计分析工作!然而我也常说,有能力把Excel玩成统计工具不如专门学会统计软件;
SPSS软件:以后版本是18,名字也改成了PASW Statistics;我从3.0开始Dos环境下编程剖析,到当初版本的变迁也能够看出SPSS社会科学统计软件包的变动,从器重医学、化学等开始越来越器重商业剖析,当初曾经成为了预测剖析软件;
SAS软件:SAS绝对SPSS其实性能更弱小,SAS是平台化的,EM开掘模块平台整合,绝对来讲,SAS比拟难学些,但如果把握了SAS会更有价值,比方离散抉择模型,抽样问题,正交实验设计等还是SAS比拟好用,另外,SAS的学习材料比拟多,也公开,会有播种的!
JMP剖析:SAS的一个剖析分支
XLstat:Excel的插件,能够实现大部分SPSS统计分析性能
4、体现层
体现层也叫数据可视化,以上每种工具都简直提供了一点展示性能。Smartbi和Tableau的可视化性能上文有提过。其实,近年来Excel的可视化越来越棒,配上一些插件,应用感更佳。
PPT:办公罕用,用来写数据分析报告;
Xmind&百度脑图:梳理流程,帮忙思考剖析,展示数据分析的档次;
Xcelsius软件:Dashboard制作和数据可视化报表工具,能够间接读取数据库,在Excel里建模,互联网展示,最大特色还是能够在PPT中实现动静报表。
最初,须要阐明的是,这样的分类并不是辨别软件,只是想阐明软件的利用。有时候咱们把数据库就用来进行报表剖析,有时候报表就是剖析,有时候剖析就是展示;当然有时候展示就是剖析,剖析也是报表,报表就是数据存储了!
发表回复