乐趣区

关于阿里云:阿里云大数据ACA认证考试总结

刚加入完阿里云大数据助理工程师认证(ACA)考试,趁还有点记忆,总结一下。在官网上没有找到 ACA 的考试纲要和样题,遂看了 ACP 的,后果有点误导。ACP 考试纲要说 maxcompute 占 55%,dataworks 占 20%,其余占 25%,后果我就花了大半工夫看 maxcompute,然而考试一开始就全是 Dataworks,而且考的很细,坑。

次要考的知识点或题目

一、剖析型数据库

1. 表组的概念

2. 维度表和一般表(事实表)的概念、个性。例如维度表是主动生成,不能批改及删除;维度表能够与任意表关联;一般表的分区设置等。

3. 如果表里的某一列被频繁查问,应该如何做

4. 剖析型数据库没有事务的概念,反对规范 mysql 协定。

5. 配置 maxcompute 数据源的细节

6. 判断:剖析型数据库是基于 maxcompute 之上的

7.multivalue 多值列的查问

二、Dataworks

1. 工作图是怎么展现的

2. 角色和权限。运维人员的权限:公布及线上运维

3. 任务调度依赖关系

4. 某个工作要执行的三个前提条件

5. 多节点之间串行的工作是什么工作

6. 生产环境、测试环境和开发环境的隔离与关联

因为这部分的题目我不太会,所以没记得几道。。。

三、Maxcompute

1. 数据类型:bigint、string、boolean、double、datetime、edecimal

2. 客户端工具。考题:有图形化界面的客户端是哪几个

3.tunnle 上传下载。重点:语法格局;分区表的上传下载;列分隔符、行分隔符和转义字符分隔符

4.maxcompute 应用场景,适宜做数据挖掘等实时性不强的业务。

5.task 和 instance 的概念及关系

6. 创立表时 as 和 like 的区别

7. 更新数据:insert into/overwrite

8.mapjoin 的特点:只容许 and 关联的等值条件

9. 内置函数。日期运算类:日期相加 dateadd 日期相减 datediff。字符串函数:字符串连贯 contac 的后果

10.Graph 计算框架:次要用来解决网络关系数据

11. 用户、角色受权。admin 用户的权限。

12. 我的项目空间爱护。管制本我的项目内的数据是否流入别的我的项目,project protection 开启爱护,add trustproject prj2; 减少信赖我的项目。只能在本我的项目里受权他人,单向受权。

四、Quick BI

1. 在某个场景下应该用什么图表,具体是比照两个用户的购买转化率,应该用旋风漏斗图。

2. 当上传本地文件到 Quick BI 中展示时,数据被保留到了 Quick BI 自带的摸索空间。

五、Datav

不记得

六、机器学习 API

考了两道对于分类算法和聚类算法的题。分类算法是有监督,例如决策树、KNN、RandomForest;聚类算法是无监督,K-Means、DBSCAN。

七、其余

比方阿尔法围棋(AlphaGo)的胜利标记着什么,谷歌大数据的三驾马车等基础知识,可视化的准则等。

总的来说考的知识点比拟细也比拟杂,备考一是要看视频做试验,二是要看产品文档,三是有根本的大数据相干常识。再次强调一下 Dataworks 肯定要多看。

退出移动版