刚加入完阿里云大数据助理工程师认证(ACA)考试,趁还有点记忆,总结一下。在官网上没有找到ACA的考试纲要和样题,遂看了ACP的,后果有点误导。ACP考试纲要说maxcompute占55%,dataworks占20%,其余占25%,后果我就花了大半工夫看maxcompute,然而考试一开始就全是Dataworks,而且考的很细,坑。
次要考的知识点或题目
一、剖析型数据库
1.表组的概念
2.维度表和一般表(事实表)的概念、个性。例如维度表是主动生成,不能批改及删除;维度表能够与任意表关联;一般表的分区设置等。
3.如果表里的某一列被频繁查问,应该如何做
4.剖析型数据库没有事务的概念,反对规范mysql协定。
5.配置maxcompute数据源的细节
6.判断:剖析型数据库是基于maxcompute之上的
7.multivalue多值列的查问
二、Dataworks
1.工作图是怎么展现的
2.角色和权限。运维人员的权限:公布及线上运维
3.任务调度依赖关系
4.某个工作要执行的三个前提条件
5.多节点之间串行的工作是什么工作
6.生产环境、测试环境和开发环境的隔离与关联
因为这部分的题目我不太会,所以没记得几道。。。
三、Maxcompute
1.数据类型:bigint、string、boolean、double、datetime、edecimal
2.客户端工具。考题:有图形化界面的客户端是哪几个
3.tunnle上传下载。重点:语法格局;分区表的上传下载;列分隔符、行分隔符和转义字符分隔符
4.maxcompute应用场景,适宜做数据挖掘等实时性不强的业务。
5.task和instance的概念及关系
6.创立表时as和like的区别
7.更新数据:insert into/overwrite
8.mapjoin的特点:只容许and关联的等值条件
9.内置函数。日期运算类:日期相加dateadd日期相减datediff。字符串函数:字符串连贯contac的后果
10.Graph计算框架:次要用来解决网络关系数据
11.用户、角色受权。admin用户的权限。
12.我的项目空间爱护。管制本我的项目内的数据是否流入别的我的项目,project protection开启爱护,add trustproject prj2;减少信赖我的项目。只能在本我的项目里受权他人,单向受权。
四、Quick BI
1.在某个场景下应该用什么图表,具体是比照两个用户的购买转化率,应该用旋风漏斗图。
2.当上传本地文件到Quick BI中展示时,数据被保留到了Quick BI自带的摸索空间。
五、Datav
不记得
六、机器学习API
考了两道对于分类算法和聚类算法的题。分类算法是有监督,例如决策树、KNN、RandomForest;聚类算法是无监督,K-Means、DBSCAN。
七、其余
比方阿尔法围棋(AlphaGo)的胜利标记着什么,谷歌大数据的三驾马车等基础知识,可视化的准则等。
总的来说考的知识点比拟细也比拟杂,备考一是要看视频做试验,二是要看产品文档,三是有根本的大数据相干常识。再次强调一下Dataworks肯定要多看。