分类: hadoop
-
Hive元数据管理
众所周知,hive表中的数据是HDFS上的文件,可是hive怎么知道这些文件的内容都对应哪个字段,对应哪个分区…
-
基于-ZooKeeper-搭建-Hadoop-高可用集群
Hadoop 高可用 (High Availability) 分为 HDFS 高可用和 YARN 高可用,两者…
-
大数据入门指南GitHub开源项目
项目GitHub地址:[链接] 前 言 大数据技术栈思维导图 大数据常用软件安装指南 一、Hadoop 分布式…
-
Spark的安装及配置
本文作者:foochane 本文链接:[链接] 1 安装说明 在安装spark之前,需要安装hadoop集群环…
-
PySpark-SQL-相关知识介绍
大数据是这个时代最热门的话题之一。但是什么是大数据呢?它描述了一个庞大的数据集,并且正在以惊人的速度增长。大数…
-
Hive的安装及配置
title: Hive的安装及配置summary: 关键词:Hive ubuntu 安装和配置 Derby M…
-
Hadoop分布式集群的搭建
title: Hadoop分布式集群的搭建summary: 关键词: Hadoop ubuntu 分布式集群 …
-
优酷背后的大数据秘密
在本文中优酷数据中台的数据技术专家门德亮分享了优酷从Hadoop迁移到阿里云MaxCompute后对业务及平台…
-
王真催的面试题
hive中shuffle的优化 压缩压缩可以使磁盘上存储的数据量变小,通过降低I/O来提高查询速度。 对hiv…
-
hadoop277安装和集群适用hadoop312和docker容器
vi /etc/profile.d/hadoop.sh {代码…} mapred-env.sh hadoo…