关于程序员:大数据MapReduce是什么

40次阅读

共计 1732 个字符,预计需要花费 5 分钟才能阅读完成。

大数据是咱们生存中十分常见的一个利用,大数据自身也曾经渗透到了咱们生存中的方方面面。那么华为云的大数据的外围劣势在哪?有哪些咱们还不晓得的科技在这当中呢?上面我将给大家介绍华为云大数据的重点:MapReduce 服务 MRS。

MapReduce 服务 MRS 是什么呢?

云原生数据湖 MRS(MapReduce Service)为客户提供 Hudi、ClickHouse、Spark、Flink、Kafka、HBase 等 Hadoop 生 态的高性能大数据组件,反对数据湖、数据仓库、BI、AI 交融等能力。MRS 同时反对混合云和私有云两种状态:混合云 版本,一个架构实现离线、实时、逻辑三种数据湖,以云原生架构助力客户智能降级;私有云版本,帮助客户疾速构建 低成本、灵便凋谢、安全可靠的一站式大数据平台。

晓得了云原生数据湖 MRS 那就不得不讲一讲这个零碎的劣势在哪。

  1. 存算拆散架构 计算和存储拆散,对立数据湖,打消数据孤岛,一份数据,无需 屡次拷贝,多种计算引擎,存储 和计算资源灵便配比,各自按需 扩缩,性价比当先业界 30%。
  2. 极致性能体验 通过联合硬件、数据组织、计算 引擎、AI 智能调优四级垂直优化,全栈式性能减速,同时具备 百万规模元数据毫秒级响应,为用户提供极致性能体验
  3. 当先开源技术 支流引擎 Spark、Hive、Flink 等 深度革新,领有索引、缓存、元 数据等关键技术;自研 CarbonData 毫秒级点查,Superior 调度冲破单集群 20000 节点 +。
  4. 高平安高可用 反对单集群跨 AZ 高可用,无单 点故障,滚动补丁 / 降级,工作 断链重连,业务 0 中断;具备网 络资源隔离、账号平安、数据安 全管控等多级平安保障能力。

MapReduce 服务与自建 Hadoop 集群比照




咱们晓得了 MapReduce 服务的劣势所在,又明确了他相比于咱们自建 Hadoop 集群劣势大的多,那么有多少企业在应用咱们华为云的 MapReduce 服务呢?

美图公司。

 美图公司是中国当先的影像解决及社交平台,在寰球领有 20.8 亿用户,月均沉闷用户超过 2.95 亿,每月因美而生超过 60 亿照片和视频。通过与华为云单干,革新后的美图外围业务拜访时 延低至 1s,运维效率晋升约 70%。

那么美图在进行业务拓展降职的时候遇到的挑战是什么呢?

数据库服务稳固可靠性有余 美图数据库架构大多一主多从,主从库均依赖 DNS 域名做负载平衡,容易呈现热点问题、负载不均等稳定性问题;无奈齐全自动化全量 备份和复原,无奈增量同步和限速,满足不了 业务多样化的场景。

大数据集群资源利用率低 随着数据量一直增大,大数据占比靠近一半,且计算资源和存储资源绑定,无奈依据计算和存储的不同增长状况别离动静扩容。数据多份 拷贝,存储节约,网络传输频繁。

运维工作量大老本高 美图的 DBA 人均保护数据库和实例多达 100+,人力严重不足,大量数据库日常运维 工作挤满 DBA 工夫。采纳的开源 Hadoop 自建 大数据平台,开源 Bug 和性能问题解决、集群 扩容等场景,均须要投入大量运维成

那么华为云是怎么解决的呢?

云原生助力美图 7 大业务模块平滑上云 基于对业务高性能的迫切需要,美图公司与华为启动策略单干,首先将业务底座降级为云原生基础设施,实现性能、弹性伸缩能 力的极大晋升,并通过云数据库 + 存算拆散大数据的专属组合解 决计划,将 7 大业务模块平滑顺利迁徙至华为私有云,实现了数 据库 & 大数据性能的极大晋升和稳固运行 云数据库多项能力协同,提供多种容灾形式 基于华为云提供的关系型数据库服务读写拆散、分布式高可用等 能力,散发申请压力,负载平衡,加强数据库稳定性和可靠性。日常运维工作均通过数据库管控零碎自动化平台实现,极大解放 了美图 DBA 沉重运维压力,对数据迁徙、同步、订阅、灾备四 种场景做了适配,满足美图多方面业务需要,为数据安全保驾护 航 存算拆散撑持大数据平台全面上云 华为云 BigData Pro 存算拆散大数据解决方案,帮忙美图实现 AI 和大数据共云原生基础设施,计算和存储资源齐全解耦,独立灵 活扩容;MRS 大数据服务采纳高性价比多核算力,100% 兼容开 源生态,原有业务平滑上云,整体迁徙“代码 0 批改,业务 0 中 断”;OBS 多协定数据湖底座对立存储,一份数据自在流动,避 免反复拷贝。

本文由博客群发一文多发等经营工具平台 OpenWrite 公布

正文完
 0