一、写在后面
2016 年,数栈开始正式投入研发,倒退至今,曾经领有了:实时开发、离线开发、算法开发这些开发平台;数据资产、数据品质这些资产平台;以及数据服务、智能标签这些服务平台,这些不同类型的产品,见证了咱们产品体系逐渐走向多样性、完整性的过程。
从开始到当初,踊跃的迭代新性能,推出新产品,欠缺整体的产品体系架构,满足越来越多的客户需要场景,始终是咱们不变的指标。
明天咱们为大家带来数栈产品的重磅预报,没错,数栈的新产品,指标治理平台 EasyIndex 就要来了!小伙伴们速速敲锣打鼓,奔走相告啦~
二、背景
随着社会的一直倒退,大数据、云计算等古代信息技术带来的改革显而易见。高效精确及时的数据统计形式逐步代替传统统计工作,成为大数据市场环境下,治理部门掌握业务现状、辅助剖析决策的支流形式。
这里咱们引入一个名词——“指标”,指标是掂量指标的参数,指的是预期中打算达到的指数、规格、规范。
在古代市场利用中,指标是业务和数据的联合,疾速精确的指标后果,使得业务指标可形容、可度量、可拆解,有助于更好地施展数据的价值。目前指标作为量化理论业务成果的重要依据,正方方面面地充斥在工作生存中:
1、统计报表
(图源网络,侵删)
2、剖析报告
(图源网络,侵删)
不论是报表也好,还是统计分析报告,都须要大量的数据指标去撑持验证其论断的可信度,这时候,疾速精确的指标后果就显得尤为重要。
指标治理平台就在这种背景下应运而生。
三、EasyIndex 是什么
因为是新产品,带着平台是做什么的、为什么做、为什么是 EasyIndex 这些问题,在开始前,先为大家简略介绍一下这个产品。
数栈指标治理平台 EasyIndex,作为数据指标的综合管理中心,它承载了指标的业务需要、技术需要以及治理需要。通过指标的规范化定义、标准化开发,搭建企业数据指标体系,落地指标数据后果,同时提供指标的查问、服务等利用,打消数据二义性,升高业务与技术的沟通老本,最终实现指标数据的可视、可用、可管。
艰深地讲:就是有了咱们产品后,不论是开发指标、查问指标、计算指标还是治理指标,都可能通过平台在线实现,简略、快捷、灵便、易上手。
四、为什么要做 EasyIndex
作为开发人员和业务剖析人员,在对接指标数据计算需要,实现需要的过程中,可能都会遇到以下问题:
1、指标开发和应用拆散
既懂业务又懂数据分析技术的人员不多,技术人员和业务人员须要一直地去对接需要,周期长、响应慢、效率低。
2、指标名称口径不统一
同样的指标名称,当技术人员去指标库中查问时,发现存在名称的指标,然而计算口径和需要不统一,还是须要从新开发。
3、指标计算逻辑不清晰
技术人员基于数仓环境开发指标的过程中,因为波及到的表以及逻辑不清晰,导致开发进去的指标可信度不高。
4、大量指标反复开发:
雷同的指标需要,可能存在另一个技术人员曾经开发过了,因为两者相互之间的信息孤岛,所以存在反复开发的状况。
五、EasyIndex 能带来什么
指标治理平台,就是为解决上述的这些场景而生:
1、一站式的指标开发服务
笼罩指标治理从定义、开发、调度、落地、公布、利用的全过程,提供一站式的指标开发服务,通过平台可能实现指标治理中的各个过程,落地指标治理全流程,对立指标治理标准,积淀指标资产。
2、双视角精准服务
针对传统指标开发方式技术和业务不互通的状况,平台别离提供面向业务人员和技术人员双视角的指标治理服务。
3、指标治理规范方法论
通过指标的分类,联合指标的开发方式搭建企业规范指标体系。
4、可视化轻代码开发
可视化的指标操作配置界面,不便在线开发配置指标,升高指标开发的技术门槛,让不懂统计 sql 的用户也可能根据业务逻辑,通过平台简略的操作实现指标的开发生成。
5、版本历史留痕
保护每个指标的历史版本记录,不便溯源获取历史版本的信息,理解指标变更的生命周期。
6、在线综合查问
在线综合查问所有指标,获取指标的详细信息,同时反对选中指标进行后果查问,在线查问获取后果数据。
数栈是云原生—站式数据中台 PaaS,咱们在 github 和 gitee 上有一个乏味的开源我的项目:FlinkX,FlinkX 是一个基于 Flink 的批流对立的数据同步工具,既能够采集动态的数据,也能够采集实时变动的数据,是全域、异构、批流一体的数据同步引擎。大家喜爱的话请给咱们点个 star!star!star!
github 开源我的项目:https://github.com/DTStack/fl…
gitee 开源我的项目:https://gitee.com/dtstack_dev…