刚加入完阿里云大数据助理工程师认证(ACA)考试,趁还有点记忆,总结一下。在官网上没有找到 ACA 的考试纲要和样题,遂看了 ACP 的,后果有点误导。ACP 考试纲要说 maxcompute 占 55%,dataworks 占 20%,其余占 25%,后果我就花了大半工夫看 maxcompute,然而考试一开始就全是 Dataworks,而且考的很细,坑。
次要考的知识点或题目
一、剖析型数据库
1. 表组的概念
2. 维度表和一般表(事实表)的概念、个性。例如维度表是主动生成,不能批改及删除;维度表能够与任意表关联;一般表的分区设置等。
3. 如果表里的某一列被频繁查问,应该如何做
4. 剖析型数据库没有事务的概念,反对规范 mysql 协定。
5. 配置 maxcompute 数据源的细节
6. 判断:剖析型数据库是基于 maxcompute 之上的
7.multivalue 多值列的查问
二、Dataworks
1. 工作图是怎么展现的
2. 角色和权限。运维人员的权限:公布及线上运维
3. 任务调度依赖关系
4. 某个工作要执行的三个前提条件
5. 多节点之间串行的工作是什么工作
6. 生产环境、测试环境和开发环境的隔离与关联
因为这部分的题目我不太会,所以没记得几道。。。
三、Maxcompute
1. 数据类型:bigint、string、boolean、double、datetime、edecimal
2. 客户端工具。考题:有图形化界面的客户端是哪几个
3.tunnle 上传下载。重点:语法格局;分区表的上传下载;列分隔符、行分隔符和转义字符分隔符
4.maxcompute 应用场景,适宜做数据挖掘等实时性不强的业务。
5.task 和 instance 的概念及关系
6. 创立表时 as 和 like 的区别
7. 更新数据:insert into/overwrite
8.mapjoin 的特点:只容许 and 关联的等值条件
9. 内置函数。日期运算类:日期相加 dateadd 日期相减 datediff。字符串函数:字符串连贯 contac 的后果
10.Graph 计算框架:次要用来解决网络关系数据
11. 用户、角色受权。admin 用户的权限。
12. 我的项目空间爱护。管制本我的项目内的数据是否流入别的我的项目,project protection 开启爱护,add trustproject prj2; 减少信赖我的项目。只能在本我的项目里受权他人,单向受权。
四、Quick BI
1. 在某个场景下应该用什么图表,具体是比照两个用户的购买转化率,应该用旋风漏斗图。
2. 当上传本地文件到 Quick BI 中展示时,数据被保留到了 Quick BI 自带的摸索空间。
五、Datav
不记得
六、机器学习 API
考了两道对于分类算法和聚类算法的题。分类算法是有监督,例如决策树、KNN、RandomForest;聚类算法是无监督,K-Means、DBSCAN。
七、其余
比方阿尔法围棋(AlphaGo)的胜利标记着什么,谷歌大数据的三驾马车等基础知识,可视化的准则等。
总的来说考的知识点比拟细也比拟杂,备考一是要看视频做试验,二是要看产品文档,三是有根本的大数据相干常识。再次强调一下 Dataworks 肯定要多看。