分类: 大数据
-
关于大数据:大数据开发技术面试注意哪些方面
顾名思义大数据是一个以数据为外围的产业。大数据产业从数据的生命周期的传导和演变上可分为这几个局部:数据收集、数…
-
关于大数据:Hadoop原理与源码
Hadoop最早起源于Nutch。Nutch的设计指标是一个网络爬虫引擎,但随着抓取网页数据量的增大,Nutc…
-
关于大数据:极光笔记丨Spark-SQL-在极光的建设实践
Spark在2018开始在极光大数据平台部署应用,历经多个版本的迭代,逐渐成为离线计算的外围引擎。以后在极光大…
-
关于大数据:大数据开发之数据仓库Hive
1.数据仓库的基本概念数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库的目标是…
-
关于大数据:Flink-Yarn的2种任务提交方式
Pre-Job模式介绍每次应用flink run运行工作的时候,Yarn都会从新申请Flink集群资源(Job…
-
关于大数据:大数据开发之Spark-SQL执行性能的提升
Catalyst是Spark SQL外围优化器,晚期次要基于规定的优化器RBO,前期又引入基于代价进行优化的C…
-
关于大数据:十大最热门的大数据技术
随着大数据分析市场疾速渗透到各行各业,哪些大数据技术是刚需?哪些技术有极大的潜在价值?依据弗雷斯特钻研公司公布…
-
关于大数据:大数据开发之Hive解析Json数组
在Hive中会有很多数据是用Json格局来存储的,如开发人员对APP上的页面进行埋点时,会将多个字段寄存在一个…
-
关于大数据:导致数据挖掘失败的几个常见原因
加入过大数据培训的人肯定都晓得在大数据中数据挖掘是重要的一环也是必学课程。在大数据培训学习过程中咱们会在数据挖…
-
关于大数据:HashMap-和-Hashtable-区别
HashMap和Hashtable都实现了Map接口,但决定用哪一个之前先要弄清楚它们之间的别离。次要的区别有…