关于大数据:数据系统架构6BI数据展示平台

3次阅读

共计 1832 个字符,预计需要花费 5 分钟才能阅读完成。

6.BI 数据展现平台

一、序

在有了数仓、实时、离线的数据之后,咱们须要一个数据展现剖析的平台。如果为了节约老本这部分咱们能够是应用一些开源的 BI 平台,比方 cboard、或者在此基础之上做一些定制化二次开发;另外能够应用一些商用的 BI 零碎,比方 FineBI、Tableau、Power BI 等一些比拟成熟的 BI 平台;当然咱们也能够本人研发 BI 平台,应用 echarts、highcharts、D3 等数据图表展现工具,来设计本人的 BI 零碎。三种形式的比照如下:

自由度 :自研 > 开源 BI> 商用 BI
开发成本 :自研 > 商用 BI> 开源 BI
难度:自研 > 开源 BI> 商用 BI

在理论工作过程中,须要依据公司状况抉择适合的 BI 零碎,在三类当中做取舍。咱们这边采纳了自研 BI 与开源 BI 零碎相结合的形式,做数据的展现与剖析,最大水平上保证系统的可控度,来反对一些特定性能的开发与反对。

二、BI 分类

  • 自研型

须要投入肯定的开发资源,设计与开发对应的展现零碎,解决各种数据查问与展现问题,这种最大的长处就是所有性能都能够设计与定制化,前期保护起来比拟不便,学习老本绝对较低。如果对应的零碎做的通用性比拟好,那么之后能够倒退成商用 BI 或开源 BI。

  • 开源 BI


(上图为 cboard)
开源的零碎次要是应用起来比拟不便,服务部署上开箱即用,如果没有什么非凡的需要,那么间接就能够投入生产应用。同时也防止了开发资源的投入,反复造轮子。在开源 BI 上做二次开发,也能够满足一些定制化的需要,学习老本略微高一点。

  • 商用 BI 零碎

商用的各类 BI 零碎,曾经绝对比拟成熟了,性能非常弱小,通过配置各类数据源,能够进行各种多维摸索式剖析。商用 BI 是体验与应用最不便的,定制化最不不便的一类,如果须要定制化性能那可能价格不菲。

三、自研 BI 零碎设计

做自研的 BI 零碎,个别都是从定制化开发的报表开始的,一个报表对应一套前端后端性能,这样堆砌的性能不方便管理与前期保护,所以咱们要设计一套生成配置报表展现的零碎,也就是自研 BI 零碎。

BI 零碎个别设计都是先配置数据源、定义数据集、配置数据报表、组合成看板,由这 4 个步骤来实现数据的展现看板的配置,最终由对应的业务人员来应用对应的报表来剖析业务,为业务决策提供数据反对。

1. 离线

第一版:面向指标

最开始咱们设计了一版,应用指标来组成报表,反对各类图表展现。整体关系如上图所示,咱们保护了库、表、表字段、指标的信息。而后通过咱们配置的信息自定义图表展现,组合成看板。

指标关联:对于雷同维度的表下的指标能够自由组合造成数据报表,判断维度雷同须要保障 2 个数据表的维度个数、维度具体字典配置等信息雷同。

最终在这套元信息的根底上造成了外围看板、数据分析看板等,实时看板的配置是一样的逻辑,减少了数据定时刷新的机制。另外目前只反对 mysql 的数据源配置,实时局部后续大部分数据存储在了 hbase 当中,应用另外一套元数据管理与实时统计局部买通实现实时数据元信息保护与报表配置。

整体成果如下:

第二版:面向数据表 / 数据集

第一版设计的面向指标管理系统,因为指标治理没有推广应用,没有从根本上解决指标口径的问题,如果可能推广和齐全依照标准应用,那么这套指标管理系统最终就演化成是之前介绍的数据系统架构 -4. 指标定义零碎

因为在应用的过程中,面向指标的指标没有理论应用起来,在后续的配置应用过程当中指标的配置就变的冗余与鸡肋,所以在第二版当中咱们把一个数据表当成一个数据集,通过数据集之间的组合配置造成数据报表。

2. 实时

实时看板的配置剖析,因为存储数据源的不同,咱们依据存储的不同设计对接了不同的数据源,比方 hbase 数据源,定义了形容 hbase 数据源的元信息。对接了实时统计零碎的数据后果。如果大量实时数据存储在 mysql 当中,能够应用离线的看板配置去配置展现看板,反对定时刷新数据。

3. 挪动端优化兼容

因为挪动端看数据的需要一直加强,为此咱们对挪动端展现页面进行了优化,更加的贴合挪动端数据展现,晋升整体用户的数据感官体验。成果如下:

四、数据散发

BI 平台除了提供报表的配置展现之外,还须要反对数据的散发,触达到数据应用方的各个终端,满足多样化的数据应用场景。比方依据须要能够 定制报表邮件 短信揭示 企业微信数据播报 等。

五、优化降级

  • presto:前期咱们引入了 presto 减少数据查问与剖析能力;
  • 数据规范对接服务:打造一套标准化的数据进口服务,能够对接各类数据利用、提供给线上业务应用。

上一篇《数据系统架构 -5. 实时离线统计零碎》

正文完
 0