关于大数据:火山引擎DataLeap3步打造指标管理体系幸福里数据中心是这么做的

7次阅读

共计 3192 个字符,预计需要花费 8 分钟才能阅读完成。

更多技术交换、求职机会,欢送关注字节跳动数据平台微信公众号,回复【1】进入官网交换群

一家企业,为什么要搭建指标体系?
一句话总结来说,全面、正当的指标体系能够帮忙企业对立指标,将业务环节量化,帮忙策略执行落地、定位问题、调整方向。但指标体系建构并非易事,指标如何保护和更新、如何对立指标口径、指标如何能迷信领导业务决策,是企业构建指标体系遇到的常见问题。
幸福里 APP 是抖音团体旗下集内容、社区、工具于一体的房产信息综合平台,致力于提供多样化房产资讯、定制找房需要。数据建设是幸福里数据 BP 的外围工作,其中指标建设与治理是其中重要一环。指标是量化剖析和构建策略的根底,是业务决策重要依据之一,也是数据团队重要的数据资产,因而幸福里指标治理是团队关注的重点之一。
本篇文章将从业务背景、业务痛点、幸福里指标数据实际、成果收益四个方面,介绍幸福里如何通过火山引擎 DataLeap、DataWind 等数据产品,从 0 - 1 实现指标体系搭建,并取得显著收益。

一、业务背景

幸福里指标治理经验了两个阶段:

  • 第一个阶段:幸福里业务疾速迭代,数据侧以响应需要,疾速反对业务迭代为主,指标没有对立的标准,粗放式治理,短少指标拆解规范以及分类规范,导致指标一词多义、反复开发、指标冗余,容易呈现数据品质问题。
  • 第二个阶段:幸福里整体业务倒退趋于稳定,精细化经营对数据提出了更大的挑战。以后,数据侧以解决数据效率和品质问题为优先,进一步增强体系化建设,制订指标建设标准。
    幸福里指标体系建设和落地离不开数据工具的反对。一方面,幸福里须要将不同数据源的指标进行建模,造成数据集,以便满足可视化查问的须要;一方面,也须要对立的平台规范化指标治理流程,晋升数据模型的复用性,保障外围指标口径统一,进步业务方应用体验的成果。
    作为火山引擎数智平台旗下的产品,DataWind 反对业务线创立我的项目来存放数据集,反对对指标数据的可视化查问,而 DataLeap 具备一体化指标体系建设和治理的能力,提供指标命名及口径治理的工具,反对导入多种数据源构建模型以及灵便抉择指标构建形式,通过一个平台即可实现指标治理。
    由此,DataLeap 和 DataWind 成为幸福里团队构建指标体系首选。

二、业务痛点

第一,线下文档保护指标体系,格局不对立、更新不及时、保护老本高

  • 晚期幸福里指标字典次要通过线下文档人工保护,并没有专门人员对立负责指标的治理;
  • 指标保护碎片化,不同业务模块保护各自指标库,指标字典文档格局不对立;
  • 相干人员短少保护能源,新增或批改指标不及时,指标信息共享局限,无奈触达幸福里所有用户。
    以上问题给相干人员造成指标利用与治理上的压力,因而幸福里须要一个对立治理指标的平台,解决指标治理上的痛点。

    第二,短少指标分类和治理标准

    在幸福里业务疾速迭代过程中,数据侧为谋求需要的疾速反对,短少指标的拆解或分类标准,存在反复开发、指标芜杂、一词多义、一义多词的问题,同时指标口径也没有在接口或数据做好透传,导致上游应用方不理解指标加工细节,进而可能使得数据品质问题频发。

三、利用实际

为什么要引入火山引擎 DataLeap?

  • 通过 DataLeap 实现指标建设流程线上化、规范化,实现指标命名、指标新增与变更流程;
  • DataLeap 性能上更加全面和丰盛,反对指标拆解、维度治理、词根治理等操作;
  • 对业务侧应用更加敌对,指标提需、口径变更进行流程化治理,能够串联起数据 BP、分析师和业务独特保护指标。

LOOK 数据中心实际:指标 100% 笼罩

LOOK 是幸福里外部效率管理系统,除作业功能模块外,销售人员作业数据分析也是 LOOK 重要性能,通过数据及时监控外部员工作业效率,反馈外围大盘数据。该零碎下新房数据整体通过 DataLeap 同步 DataWind 数据集形式提供数据服务。

步骤一:提需流程

确定数据 BP 和业务团队指标开发单干机制,以后幸福里数据 BP 和业务团队单干模式如下:

指标开发数据 BP 须要进行业务指标和剖析维度的拆分,对于指标需先思考指标字典中是否存在 (避免反复开发),如果不存在, 须要拆解为原子指标 + 工夫周期 + 修饰词, 并落入到指标平台;依据理论利用场景采纳 DataWind 数据集或数据接口输入指标。指标治理由数据 BP 和 DA(或业务人员)独特保护。
业务人员保护指标的业务口径并进行分类,业务定义将在 DataWind 看板或产品页面展现露出。数据 BP 保护指标技术口径,进行指标模型关联,提供数据利用。
通过 DataLeap 造成了数据 BP 和分析师协同治理指标的诉求,同时对立指标查问平台。

步骤二:指标录入与保护

幸福里以离线数仓主题划分数据域,同时将 DataLeap 词根治理性能进行利用,标准指标命名。针对需要波及指标将指标拆解并划分适合的数据域,便于责任人对立治理。指标拆解流程

指标拆解实现后,对原子指标、衍生指标和复合指标进行创立和技术口径保护,联合需要创立数据模型买通 DataWind 数据集和 mfs 数据服务。DataLeap 的业务管理模块由数据分析师或产品进行保护,次要是治理指标的业务分类和定义业务口径。业务定义将在 DataWind 看板或产品页面展现露出。其中生产信息能够查看以后指标的模型利用,方面后续指标应用剖析。

通过业务侧指标保护和指标的生产信息模块,便于业务侧查问和应用指标,同时对外展现便于各方了解。词根治理目前在录入指标过程中发现存在关键字定义不统一,一个中文名称有多个英文名称或者一个英文名称在不同业务线下有不同的中文含意。
为解决此类问题,幸福里对词根进行保护,录入指标之前先在词根治理的字段治理模块查看对应关键字是否已存在。

通过词根治理,将外围字段命名进行标准,防止命名不对立,解决了一词多义和一义多词的问题。

步骤三:指标利用 & 口径透传权限

买通同步 DataWind 数据集与数据受权,数据受权操作只需在 DataWind 数据集进行。

口径透传 DataLeap 同步 DataWind 数据集后,上游配置的数据看板能够将指标口径进行展现,也反对指标平台的跳转,便于上游应用方理解指标加工细节。

通过以上三个步骤,幸福里实现以下几个方面晋升:

  • LOOK 数据模块整体通过指标平台提供指标服务,看板上查看看板波及的指标的口径,升高 DA 口径同步的老本。
  • 通过 DataLeap 缩小数据 BP 反复开发、一词多义的问题,对应指标有相应责任人进行开发和治理,进步指标整体复用度。
  • 观测数据时,用户能够通过指标平台理解每个展现指标的含意,整体进步数据的准确性。
  • 指标字典从线下文档迁徙到 DataLeap,通过线上配置化治理,升高数据分析师保护老本。
  • 以前,数据集指标口径不分明须要找数仓人员确认,再通过代码获取指标技术生产逻辑;当初,DataLeap 配置指标口径,反对在看板间接展现,节俭解释指标口径的工夫。
  • DataLeap 具备指标分组的能力,让指标更有层级性,不便查找和治理,晋升效率。

四、成果收益:数据 oncall 解决超 40%

通过 DataLeap 指标平台,幸福里数据团队实现交易平台新房方向 p0 指标 100% 笼罩,包含指标定义、模型配置、责任人等元信息保护。
DataLeap 指标平台和 DataWind 买通,便于应用方理解指标加工逻辑,通过 DataWind 看板对应按钮跳转 DataLeap 间接查看指标口径形容和绑定模型状况。
上面是目前幸福里在 DataLeap 的应用数据状况:

  • 从数据上看,幸福里以后总录入指标数 504 个,模型数 28 个,交易平台整体指标覆盖率 60%。模型建设门路偏差业务驱动;业务保护率为 60%,和 DA 造成了肯定的联动;还需进一步在业务侧增强推广,晋升指标生产热度。
  • 业务应用上,反对指标口径在看板和线上页面展现透出,便于上游理解指标加工细节,数据口径反馈问题缩小 40%。另外,指标平台作为幸福里各方查指标用指标的对立平台,进步指标查问和生产效率。

点击跳转火山引擎 DataLeap 理解更多

正文完
 0