关于大数据处理:UCloud一站式智能大数据平台USDP免费版正式发布

55次阅读

共计 2801 个字符,预计需要花费 8 分钟才能阅读完成。

背景

在大数据业务零碎中,所有技术栈生态均是围绕着存储进行扩大的,目前开源的支流存储技术栈次要蕴含如下 3 种类型:

· HDFS:Hadoop 系列套件,蕴含 Hive、HBase、Phoenix 等;

· ElasticSearch:蕴含 Logstash、ElasticSearch、Kibana 等;

· Kudu:蕴含 Impala 等;

无论针对哪种存储生态,其外层负责数据计算的技术栈很多都是通用的,例如 Spark、Flink 简直反对读写所有存储生态中的数据。对于生产环境而言,抉择哪一种存储生态,往往取决于业务状态以及业务部门对不同技术栈的熟练程度。

针对大数据生态中的泛滥服务,Cloudera(CDH,反对 HDFS、Kudu 生态)与 Ambari(HDP,反对 HDFS 生态)提供了部署、治理、监控、运维大数据服务组件与大数据节点的能力。但随着 Cloudera 与 Ambari 合二为一,CDH 与 HDP 合并为 CDP 发行版,在后续的版本中不再提供免费版性能。这对于国内企业的大数据业务无疑减少了不少开发、运维老本,如果持续应用收费的旧版本,将无奈失去新个性的更新反对和 BUG 的及时修复。

在此背景下,UCloud 基于多年大数据平台开发教训,近日全新公布了针对私有化部署场景下的一站式智能大数据平台 USDP 免费版。免费版 USDP 反对 HDFS、Kudu、ES 全生态,助力企业晋升大数据开发、运维效率,疾速构建大数据业务的剖析解决能力。


兼容最广的一站式智能大数据平台

USDP 涵盖了 HDFS、Hive、HBase、Spark、Flink、Presto、Atlas、Ranger 等泛滥开源大数据组件,反对对这些组件进行运维、中台建设、数据开发、业务可视化等全栈式大数据开发运维治理。USDP 通过轻量、易用、傻瓜式的状态交付给用户,反对对不同模块进行拆分,从而实现高度定制化,灵便匹配各垂直行业场景下的需要。

目前,UCloud 一站式智能大数据平台 USDP 所反对的服务如表格所示,同时还在继续拓展更多开源生态组件服务。

相比 Cloudera(CDH、CDP)、Ambari(HDP),USDP 反对更多丰盛的大数据服务包含 Flink、Kylin、Livy、Phoenix、Tez、Elasticsearch、Kibana、Azkaban、Presto、Atlas、Kafka Eagle、ZKUI 等,简直涵盖了所有支流技术框架,且所反对的大数据服务之间齐全兼容,用户能够灵便抉择、按需应用。此外,UCloud 大数据技术团队继续跟进开源社区停顿以及产品反馈,对潜在的 Bug 进行及时修复,用户无需再思考大数据服务之间的适配问题。在 CDH 订阅付费模式下,免费版 USDP 无疑是当下大数据开发运维的最佳抉择!

自研治理组件,平安可靠性更高

USDP 作为 UCloud 大数据团队自主研发的一站式智能大数据平台,其整体架构如下图所示:

上图中,Manager Server 为 USDP 治理端服务,需装备一个 MySQL 实例存储集群相干的元数据信息。Agent 为 USDP 从节点管制端服务,用于治理、操作所在节点以及所在节点上的大数据服务。其中 BigData Service 为各类大数据服务(例如:HDFS、YARN 等)。

InfluxDB、Prometheus、Grafana 作为监控服务,用于汇总并展现整个集群的监控数据。

USDP 反对起码 3 个节点,最多上千节点的集群规模,同时,容许 Manager Server 与 Agent 等相干服务部署在雷同的节点上,这样满足大型业务的同时,也尽可能帮忙用户应用较小的老本满足小型业务对数据分析的诉求。

USDP 一站式智能大数据平台的外围劣势

无需放心业务绑定

USDP 中所蕴含的大数据服务、组件,均满足 Apache 2.0 开源协定,UCloud 大数据团队在做过大量兼容性测试后,踊跃回馈社区,并将编译后的兼容包全面公开公布。因为自身紧跟开源社区的步调,用户能够随时进行自主替换、自主建设、自主数据迁徙、集群迁徙等,因而无需放心大数据业务与闭源服务绑定。

傻瓜式部署形式

为了能让用户体验到极简的大数据部署运维、治理计划,USDP 提供了丰盛具体的部署、操作文档,并且用户无需放心装置时筹备泛滥内容,初始化环境只须要简略几步,即可主动实现配置。

1- 环境查看


2- 服务部署

全面丰盛的监控指标

USDP 预置的监控指标次要蕴含三局部内容:

• JMX 全量指标采集

• Http 罕用指标采集

• 自定义指标采集

以上三局部监控数据最终将汇总于 USDP 的 Promethues 中,并在每个服务的概览页面中,展现最罕用的监控指标,同时,在 Grafana 中,通过 USDP 官网预置的监控模板(Dashboard),用户能够查看最具体监控指标。如果 USDP 预置的监控图标无奈满足业务需要,用户也能够自定义增加所需的监控图表。

灵便便捷的告警服务

USDP 提供预置的告警模板,用户只须要疏导进行简略配置,即可实现向不同指标(微信、钉钉、邮件、接口调用等)发送集群指标告警的需要。与监控指标的设计类似,如果用户认为预置的告警模板无奈满足业务需要,也能够自定义对告警模板进行批改,或增加新的告警规定。

业余的技术支持

UCloud 大数据团队积淀了多年私有云大数据运维和业务调优教训,通过继续更新的文档知识库,为用户提供专家级技术支持,解决应用 USDP 的后顾之忧。

反哺开源社区

USDP 免费版中所应用的开源、全面兼容优化后的服务包,将反哺回开源社区,为开发者提供收费的下载渠道。

USDP 解锁丰盛的大数据场景

应用 USDP 一站式智能大数据平台,能够在各行各业中实现如下利用场景。

数据仓库

目前国内罕用的数仓模型为维度数仓,即依照事实表、维度表来构建数据仓库、数据集市。通过 USDP 一站式智能大数据平台,用户能够部署构建维度数仓所需的各项服务,帮忙企业疾速构建数据中台。

机器学习

机器学习通过算法对大量数据进行剖析,挖掘出其中蕴含的法则,并用于事物预测或者分类,有大量的计算需要。通过 USDP 一站式智能大数据平台反对的 Spark、Flink 等分布式运算框架,能够高效的进行机器学习利用开发。

信息检索

从海量数据中疾速检索到所需信息,始终是数据利用的重要畛域,USDP 一站式智能大数据平台集成了分布式搜寻和剖析引擎 Elasticsearch 以及实时检索数据库 HBase、数仓服务 Kylin 等,可能提供高效的数据检索能力,可用于构建企业级搜索引擎、日志管理系统等。

最初,敲黑板划重点:UCloud 一站式智能大数据平台 USDP 免费版诚邀大家参考以下形式下载应用。

附 USDP 资源下载地址:

• US3:

https://s3-cn-bj.ufileos.com/…

• 百度网盘:

链接:

https://pan.baidu.com/s/1mlic…

提取码:spp9

扫码增加 UCloud 大数据技术专家

备注 “USDP”

邀请您退出大数据产品技术交换群

正文完
 0