分类: 大数据
-
关于大数据:携手世界环境服务巨头DataPipeline助力其亚洲区业务数据实时融合
近日,DataPipeline助力某世界环境服务巨头打造的团体“亚洲区实时数据管理平台”正式上线,借助数字化晋…
-
关于大数据:技术人生第6篇技术同学应该如何理解业务
简介: 本文以大量实践阐述解析业务,并提供多种基于不同场景的实操办法,帮忙技术同学以迷信、正当的形式发展日常工…
-
关于大数据:DataPipeline亮相2021世界计算大会实时数据管理打造产业数字化升级加速器
9月17日上午,由工业和信息化部、湖南省人民政府主办的“2021世界计算大会”在湖南长沙国际会议中心揭幕。大会…
-
关于大数据:Hive实现自增序列及元数据问题
Hive实现自增序列在利用数据仓库进行数据处理时,通常有这样一个业务场景,为一个Hive表新增一列自增字段(比…
-
关于大数据:如何实现一款毫秒级实时数据分析引擎
随着 Shopee 业务一直扩张,为了更加理解用户对产品的行为反馈,更好地决策产品个性,各团队外部涌现出大量数…
-
关于大数据:大数据开发技术之Spark-Job物理执行解析
代码贴在本章最初。给定这样一个简单数据依赖图,如何正当划分 stage,并未确定 task 的类型和个数?一个…
-
关于大数据:ClickHouse单机和分片集群安装与特点介绍
介绍ClickHouse 是俄罗斯的Yandex于2016年开源的列式存储数据库(DBMS),应用C++语言编…
-
关于大数据:大数据开发技术之Spark-SQL的多种使用方法
Spark SQL反对多种数据源,如JDBC、HDFS、HBase。它的外部组件,如SQL的语法解析器、分析器…
-
关于大数据:大数据开发之Hive-SQL优化思路分享
Hive的优化次要分为:配置优化、SQL语句优化、工作优化等计划。其中在开发过程中次要波及到的可能是SQL优化…
-
关于大数据:大数据开发面试之数据仓库
数据仓库的定义?首先,用于反对决策,面向剖析型数据处理;其次,对多个异构的数据源无效集成,集成后依照主题进行重…