标签: 大数据
-
MapReduce精髓
MapReduce是一种重视容错性的分布式并行计算模式,它把分布式并行计算分为map和reduce两个阶段:
-
优秀的数据工程师,怎么用 Spark 在 TiDB 上做 OLAP 分析
TiDB 是一款定位于在线事务处理/在线分析处理的融合型数据库产品,实现了一键水平伸缩,强一致性的多副本数据安…
-
Spark in action on Kubernetes – Playground搭建与架构浅析
Spark是非常流行的大数据处理引擎,数据科学家们使用Spark以及相关生态的大数据套件完成了大量又丰富场景的…
-
阿里云MWC 2019发布7款重磅产品,助力全球企业迈向智能化
当地时间2月25日,在巴塞罗那举行的MWC 2019上,阿里云面向全球发布了7款重磅产品,涵盖无服务器计算、高…
-
《从0到1学习Flink》—— Flink 读取 Kafka 数据批量写入到 MySQL
之前其实在 《从0到1学习Flink》—— 如何自定义 Data Sink ? 文章中其实已经写了点将数据写入…
-
大数据驱动的运营创新和探索
摘要:以“数字金融新原力(The New Force of Digital Finance)”为主题,蚂蚁金服…
-
警报:线上事故之CountDownLatch的威力
我们有这样一个业务场景:用户提供各种数据源配置信息,然后基于数据源配置的模板,再者在模板基础上构建报表,而大数…
-
如何评估深度学习模型效果?阿里工程师这么做
小叽导读:复杂的深度模型中,如果效果不好,是因为网络设计的欠缺?还是数据天然缺陷?是训练代码的bug?还是Te…
-
Netty源码解析-概述篇
本文是由code4craft发表在博客上的,原文基于Netty3.7的版本,源码部分对buffer、Pipel…