关于ai开发:揭开KPI异常检测顶级AI模型面纱

44次阅读

共计 2092 个字符,预计需要花费 6 分钟才能阅读完成。

摘要:2020GDE 寰球开发者大赛 -KPI 异样检测告一段落,来自深圳福田莲花街道的“原从入门到精通”有幸获得了 总榜 TOP1 的问题,在这里跟大家分享深圳福田莲花街道在本次较量的解决方案。

背景介绍

核心网在挪动运营商网络中占据无足轻重的位置,其异样往往会导致呼叫失败、网络提早等现网故障,对全网的服务质量带来重大的负面影响,多则影响十数万用户,并引发大面积投诉 [1]。因而须要疾速及时地发现核心网的异样危险,在影响扩充之前及时打消故障。
KPI 是一类可能反映网络性能与设施运行状态的指标,本赛题提供某运营商核心网的 KPI 实在数据,数据模式为 KPI 工夫序列,采样距离为 1 小时,选手须要应用[2019-08-01,2019-09-23) 的数据进行建模,应用训练好的模型对将来 7 天的数据进行预测,辨认将来一周 KPI 序列中的异样点。

评估指标:

本赛题采纳 F1 作为评估指标,具体计算公式如下:

P = TP/(TP+FP)

R = TP/(TP+FN)

F1 = 2PR/(P+R)

数据摸索

数据 ** 有 20 个不同的 KPI,不同的 KPI 物理意义不同,代表了不同的核心网指标,因为赛题须要对将来 7 天的数据进行预测,因而对于建模样本也进行周级别的散布查看。从 Fig1 中能够显著看到训练集中前三周的异样率显著低于后续几周。进一步剖析能够发现尽管赛题提供了 [2019-08-01,2019-09-23) 的全副数据,但 2019-08-15 之前所有 20 个 KPI 均毫无异样,第一个异样点是从 2019-08-15 02:00:00 开始呈现的(Fig2),因而揣测 8.15 前的数据分布不同于后续样本,或 8.15 之前存在标注异样的问题。试验中剔除 8.15 之前的样本建模成果也优于保留该时间段样本,进一步验证了该揣测。

摘要:2020GDE 寰球开发者大赛 -KPI 异样检测告一段落,来自深圳福田莲花街道的“原从入门到精通”有幸获得了 总榜 TOP1 的问题,在这里跟大家分享深圳福田莲花街道在本次较量的解决方案。

背景介绍

核心网在挪动运营商网络中占据无足轻重的位置,其异样往往会导致呼叫失败、网络提早等现网故障,对全网的服务质量带来重大的负面影响,多则影响十数万用户,并引发大面积投诉 [1]。因而须要疾速及时地发现核心网的异样危险,在影响扩充之前及时打消故障。
KPI 是一类可能反映网络性能与设施运行状态的指标,本赛题提供某运营商核心网的 KPI 实在数据,数据模式为 KPI 工夫序列,采样距离为 1 小时,选手须要应用 2019-08-01,2019-09-23) 的数据进行建模,应用训练好的模[源码交易型对将来 7 天的数据进行预测,辨认将来一周 KPI 序列中的异样点。

评估指标:

本赛题采纳 F1 作为评估指标,具体计算公式如下:

P = TP/(TP+FP)

R = TP/(TP+FN)

F1 = 2PR/(P+R)

数据摸索

数据 ** 有 20 个不同的 KPI,不同的 KPI 物理意义不同,代表了不同的核心网指标,因为赛题须要对将来 7 天的数据进行预测,因而对于建模样本也进行周级别的散布查看。从 Fig1 中能够显著看到训练集中前三周的异样率显著低于后续几周。进一步剖析能够发现尽管赛题提供了 [2019-08-01,2019-09-23) 的全副数据,但 2019-08-15 之前所有 20 个 KPI 均毫无异样,第一个异样点是从 2019-08-15 02:00:00 开始呈现的(Fig2),因而揣测 8.15 前的数据分布不同于后续样本,或 8.15 之前存在标注异样的问题。试验中剔除 8.15 之前的样本建模成果也优于保留该时间段样本,进一步验证了该揣测。

背景介绍

核心网在挪动运营商网络中占据无足轻重的位置,其异样往往会导致呼叫失败、网络提早等现网故障,对全网的服务质量带来重大的负面影响,多则影响十数万用户,并引发大面积投诉 [1]。因而须要疾速及时地发现核心网的异样危险,在影响扩充之前及时打消故障。
KPI 是一类可能反映网络性能与设施运行状态的指标,本赛题提供某运营商核心网的 KPI 实在数据,数据模式为 KPI 工夫序列,采样距离为 1 小时,选手须要应用[2019-08-01,2019-09-23) 的数据进行建模,应用训练好的模型对将来 7 天的数据进行预测,辨认将来一周 KPI 序列中的异样点。

评估指标:

本赛题采纳 F1 作为评估指标,具体计算公式如下:

P = TP/(TP+FP)

R = TP/(TP+FN)

F1 = 2PR/(P+R)

数据摸索

数据 ** 有 20 个不同的 KPI,不同的 KPI 物理意义不同,代表了不同的核心网指标,因为赛题须要对将来 7 天的数据进行预测,因而对于建模样本也进行周级别的散布查看。从 Fig1 中能够显著看到训练集中前三周的异样率显著低于后续几周。进一步剖析能够发现尽管赛题提供了 [2019-08-01,2019-09-23) 的全副数据,但 2019-08-15 之前所有 20 个 KPI 均毫无异样,第一个异样点是从 2019-08-15 02:00:00 开始呈现的(Fig2),因而揣测 8.15 前的数据分布不同于后续样本,或 8.15 之前存在标注异样的问题。试验中剔除 8.15 之前的样本建模成果也优于保留该时间段样本,进一步验证了该揣测。

正文完
 0