乐趣区

关于大数据:大数据分析时代掌握这些你也可以成为数据科学家

这是国外数据迷信学习平台 DataCamp 成员写的一篇图文《8 步成为数据科学家》。咱们具体来看下有哪些学习内容和学习资源。

这里说的 8 步,不是你用 8 周就能够实现,而是一种学习的办法。这些步骤尽管没有那么简略,然而都是可操作,可实际的。只有你投入工夫去学习,置信工夫的积攒力量,就能够把握这些常识。

首先,什么是大数据科学家?

数据科学家是一个跨学科人才,是比软件工程师更善于统计学,比统计学家更善于软件工程的人。须要把握的常识有数学统计,编程能力,机器学习,钻研能力等。

目前,数据科学家大部分是本科或者硕士学历(本科 37%,硕士 31%)。然而不要放心,从考察数据来看,有 5% 高中毕业的人也成为了数据科学家。这足以证实,只有你致力去提供本人,英雄是不问出处的。

01 第 1 步:学好统计、数学和机器学习

上面给出了学习这些常识的资源。如果感觉这些资源学起来太难,能够从《赤裸裸的统计学》、《深入浅出统计学》这两本书入门。

02 第 2 步:学会编程

把握计算机科学的基础知识,学会零碎开发的整个过程(end-to-end development),因为你做的货色会成为其余零碎的一部分。

抉择一种数据分析的编程语言,例如开源软件的 R , Python 语言等,或者商业软件的 SAS, SPSS 等。

在学习过程中能够用 DataCamp, tryR, Codecademy 或 Google Class 进行交互式学习。

03 第 3 步:了解数据库

在大部分的理论数据分析我的项目中,数据大部分是存储在数据库中的,所以你得学会数据库的操作,如关系数据库 MySQL, 非关系型数据库 MongoDB 等。

04 第 4 步:学会数据预处理、可视化和报表制作

  1. 数据预处理:在数据分析师的工作中,有多达 60% 的工夫都花在了理论剖析前数据的筹备上。数据预处理的指标是为了把数据扭转成咱们喜爱的样子,以便于前期的剖析解决。这就好比,当初很多女孩照相喜爱用美图秀秀,眼睛不大,那我就用美图秀秀把眼睛变大。变成本人喜爱的样子。

数据预处理可自学 Coursera 中《Getting and Cleaning Data》的 课程(作者:John Hopkins)。也能够用工具 DataWrangler、R 语言的 data.table 和 dply 包。

  1. 数据可视化:数据可视化是将数据分析的结果显示进去,便于展现。实用工具有 ggvis, D3, vega。
  2. 数据报表:作为数据分析的最初一步,是将数据分析和后果制作成易于了解的报告。实用工具有 Tableau, Spotfire 和 R Markdown。

05 第 5 步:晋升到大数据级别

当你开始解决海量规模的数据时,绝大多数的数据科学家要解决的问题,都无奈在单机上实现,须要用分布式解决大数据集,应用的工具有 Hadoop,Apache Spark。

06 第 6 步:多实际,与数据科学家大牛多交换

幸好是互联网时代,咱们能够通过网络意识大牛,并从他们分享的常识内容中学到更多教训常识。当然,你也能够通过加入较量,做小我的项目取得更多的实践经验。

07 第 7 步:实习、实战、或找份工作

判断本人是不是一个真正的数据科学家的最佳路径,就是用你新学的常识迎难而上,进入数据分析的工作畛域。

08 第 8 步:通过业余社区学到更多

数据分析的网站有:DataTau, Kdnuggets, fivethirtyeight, datascience101, r-bloggers。

能够看这些数据迷信大牛的博客:Hilary Mason, David Smith, Nate Silver, dj patil。

能够从 quandl 上获取数据。

以上就是成为数据科学家的 8 步,你在哪一步呢?

对于思迈特软件

广州思迈特软件有限公司致力于为企业客户提供一站式商业智能解决方案。

通过 Smartbi 产品为客户提供报表、数据可视化、数据挖掘等成熟性能;通过 Smartbi 利用商店为客户提供场景化、行业化数据分析利用。通过十余年的倒退,已在金融、电信、政府、制作等行业取得 2000 多家当先客户认可,口碑良好。在寰球财产 500 强的 10 家国内银行,有 8 家选用了 Smartbi。

退出移动版