标签：大数据

MapReduce精髓

MapReduce是一种重视容错性的分布式并行计算模式，它把分布式并行计算分为map和reduce两个阶段：

2019年3月1日
数据流被污染？数据质量不高？蚂蚁金服数据资产管理平台了解一下

今年年初，蚂蚁金服ATEC城市峰会在上海举办。金融智能专场分论坛上，蚂蚁金服数据平台部高级数据技术专家李俊华做…

2019年2月28日
优秀的数据工程师，怎么用 Spark 在 TiDB 上做 OLAP 分析

TiDB 是一款定位于在线事务处理/在线分析处理的融合型数据库产品，实现了一键水平伸缩，强一致性的多副本数据安…

2019年2月28日
Spark in action on Kubernetes – Playground搭建与架构浅析

Spark是非常流行的大数据处理引擎，数据科学家们使用Spark以及相关生态的大数据套件完成了大量又丰富场景的…

2019年2月26日
阿里云MWC 2019发布7款重磅产品，助力全球企业迈向智能化

当地时间2月25日，在巴塞罗那举行的MWC 2019上，阿里云面向全球发布了7款重磅产品，涵盖无服务器计算、高…

2019年2月26日
《从0到1学习Flink》—— Flink 读取 Kafka 数据批量写入到 MySQL

之前其实在《从0到1学习Flink》—— 如何自定义 Data Sink ？文章中其实已经写了点将数据写入…

2019年2月24日
大数据驱动的运营创新和探索

摘要：以“数字金融新原力(The New Force of Digital Finance)”为主题，蚂蚁金服…

2019年2月23日
警报：线上事故之CountDownLatch的威力

我们有这样一个业务场景：用户提供各种数据源配置信息，然后基于数据源配置的模板，再者在模板基础上构建报表，而大数…

2019年2月22日
如何评估深度学习模型效果？阿里工程师这么做

小叽导读：复杂的深度模型中，如果效果不好，是因为网络设计的欠缺？还是数据天然缺陷？是训练代码的bug？还是Te…

2019年2月22日
Netty源码解析-概述篇

本文是由code4craft发表在博客上的，原文基于Netty3.7的版本，源码部分对buffer、Pipel…

2019年2月22日

标签： 大数据

标签：大数据