乐趣区

关于数据库:从13-天到0-天延时揭秘火山引擎-DataLeap-SLA-保障最佳实践

更多技术交换、求职机会,欢送关注字节跳动数据平台微信公众号,回复【1】进入官网交换群

在数据治理中,如何实现 SLA 保障始终是“老大难”问题。随着某房产 APP 稳固倒退,楼盘、房源、经纪人、营销等数据不断扩大,在数据工作开发场景中,业务多样化、数据量大、数据工作简单等问题,导致数据工作链路依赖简单、链路长、依赖多。

其中,异样突出的是离线数仓 SLA 提早大,居然高达“13 天”。

在字节跳动外部,“0987”高质量服务评估体系被广泛应用于数据服务场景。“0987”即从多个维度综合论证数据中台的价值,位列第一的“0”,指的是数据中台必须保障数据稳固,实现 SLA 故障清零。

在“0987”服务规范的领导下,这款房产 APP 通过火山引擎大数据研发治理套件 DataLeap 实现 SLA 提早从“13 天”缩短为“0 天”。据房产 APP 数据研发人员介绍,“火山引擎 DataLeap 具备数据开发、数据治理、数据品质全链能力,能够串联成一套连贯、可复用的治理计划,最终造成 SLA 保障高效治理。”

房产 APP 团队工作签订 SLA 步骤

具体来说,他们次要通过以下三个步骤疾速实现 SLA“零延时”。首先,数据研发团队依据业务需要,圈定出须要被 SLA 保障的外围工作,包含线上外围工作、治理驾驶舱数据以及周报、月报等重点业务外围看板。

其次,制订全局保障计划。在 SLA 治理环节,存在外围工作 SLA 保障有余,有产生线上业务事变的隐患问题。除此之外,SLA 工作运维报警能力有余或者 SLA 签订工夫不合理等,有 SLA 提早隐患,造成破线事变。

基于火山引擎 DataLeap 数据治理性能,数据开发人员能够通过申报单签订的模式达成 SLA 协定,在申报签订环节中,各个环节的变动将通过告诉模块传递信息给相应负责人,实时告诉升高信息交换老本,减速了 SLA 的达成。

数据品质整体策略

另外,火山引擎 DataLeap 反对对卡点工作的监控,保障 SLA 及时性及工作准确性。举个例子来说,APP 平台有一个关系到经纪人外围利益分值指标。当经纪人实现相应工作时,分值减少。

但当维表中数据缺失,在前台反映的后果则是分值不更新,对经纪人造成困扰。另外,之前还呈现过这样的案例:小李在数据库中的外围维度是“经纪人”,但在维表中,可能测试数据误导入或反复数据导入,导致小李对应到多个门店或对应到谬误房源。

在这种状况下,基于火山引擎 DataLeap,房产 APP 数据研发团队能够实现外围工作的数据稳定监控、异样报警,防止因为数据品质导致的数据失信、决策失误等事变。

最初,我的项目中的外围数据指标如 SLA 工作数量、报警数、起夜率等都能体现在火山引擎 DataLeap 的大盘展板中,量化我的项目推动成果,为危险判断、后续措施提供数据反对,成为数据治理指标重要参照起源。

最终我的项目成果不仅仅体现在解决离线 SLA 保障的当务之急,更为该房产 APP 团队造成了一套规范流程和标准。

在事先,应用申报流程,标准 SLA 签订;在事中,欠缺报警及时性和准确性,升高误报率;在预先,及时跟踪报警状况,欠缺问题复盘及监控机制,积淀公共解决方案,推动 SLA 治理衰弱、可继续倒退。

数据品质施行过程随着数字化转型进一步深刻,火山引擎 DataLeap 将进一步帮忙企业晋升数据研发效率、升高治理老本,为企业数字化实际提供无力撑持。

点击跳转 大数据研发治理套件 DataLeap 理解更多

退出移动版