分类: 大数据
-
魔盒大数据协作平台是如何实现离线计算任务的工作流调度
魔盒是禧云自研的大数据开发协作平台,前一篇介绍了魔盒在离线任务打包过程中怎么提高RabbitMQ消费速度; 数…
-
个推成立西湖数据智能研究院打造中国数据智能研究领域领头雁
近日,国内专业数据智能A股上市公司每日互动(个推)成立了“西湖数据智能研究院”。该研究院将为构建新时代数据智能…
-
万亿级数据如何高效进行数据治理
在数据智能时代,对企业而言,“数据驱动业务”或者“数据即是业务”的理念逐渐成为业界的一种共识。然而,数据孤岛、…
-
10大HBase常见运维工具整理
摘要:HBase自带许多运维工具,为用户提供管理、分析、修复和调试功能。本文将列举一些常用HBase工具,开发…
-
大数据实践解析下Spark的读写流程分析
众所周知,在大数据/数据库领域,数据的存储格式直接影响着系统的读写性能。spark是一种基于内存的快速、通用、…
-
从0到1打造数据可信的数据产品解析数据治理在过程可信变革中的运作流程
摘要:本文针对“数据牵引改进,工具固化规范”这一思路在业务团队落地过程中的动作流程进行详细阐述,并明确了支撑整…
-
赵强老师大数据工作流引擎Oozie
工作流(WorkFlow)就是工作流程的计算模型,即将工作流程中的工作如何前后组织在一起的逻辑和规则在计算机中…
-
赵强老师Kafka的持久化
Kakfa 依赖文件系统来存储和缓存消息。对于硬盘的传统观念是硬盘总是很慢,基于文件系统的架构能否提供优异的性…
-
一文入门Kafka必知必会的概念通通搞定
Kakfa在大数据消息引擎领域,绝对是没有争议的国民老公。 这是kafka系列的第一篇文章。预计共出20篇系列…
-
没了IDE你的Java项目还能Run起来吗~
计算机只能识别机器码0101…编程语言->能执行的机器码 需要经过 预处理->编译->汇…