摘要:2020GDE寰球开发者大赛-KPI异样检测告一段落,来自深圳福田莲花街道的“原从入门到精通”有幸获得了 总榜TOP1的问题,在这里跟大家分享深圳福田莲花街道在本次较量的解决方案。

背景介绍

核心网在挪动运营商网络中占据无足轻重的位置,其异样往往会导致呼叫失败、网络提早等现网故障,对全网的服务质量带来重大的负面影响,多则影响十数万用户,并引发大面积投诉[1]。因而须要疾速及时地发现核心网的异样危险,在影响扩充之前及时打消故障。
KPI是一类可能反映网络性能与设施运行状态的指标,本赛题提供某运营商核心网的KPI实在数据,数据模式为KPI工夫序列,采样距离为1小时,选手须要应用[2019-08-01,2019-09-23)的数据进行建模,应用训练好的模型对将来7天的数据进行预测,辨认将来一周KPI序列中的异样点。

评估指标:

本赛题采纳F1作为评估指标,具体计算公式如下:

P = TP/(TP+FP)

R = TP/(TP+FN)

F1 = 2PR/(P+R)

数据摸索

数据**有20个不同的KPI,不同的KPI物理意义不同,代表了不同的核心网指标,因为赛题须要对将来7天的数据进行预测,因而对于建模样本也进行周级别的散布查看。从Fig1中能够显著看到训练集中前三周的异样率显著低于后续几周。进一步剖析能够发现尽管赛题提供了[2019-08-01,2019-09-23)的全副数据,但2019-08-15之前所有20个KPI均毫无异样,第一个异样点是从2019-08-15 02:00:00开始呈现的(Fig2),因而揣测8.15前的数据分布不同于后续样本,或8.15之前存在标注异样的问题。试验中剔除8.15之前的样本建模成果也优于保留该时间段样本,进一步验证了该揣测。

摘要:2020GDE寰球开发者大赛-KPI异样检测告一段落,来自深圳福田莲花街道的“原从入门到精通”有幸获得了 总榜TOP1的问题,在这里跟大家分享深圳福田莲花街道在本次较量的解决方案。

背景介绍

核心网在挪动运营商网络中占据无足轻重的位置,其异样往往会导致呼叫失败、网络提早等现网故障,对全网的服务质量带来重大的负面影响,多则影响十数万用户,并引发大面积投诉[1]。因而须要疾速及时地发现核心网的异样危险,在影响扩充之前及时打消故障。
KPI是一类可能反映网络性能与设施运行状态的指标,本赛题提供某运营商核心网的KPI实在数据,数据模式为KPI工夫序列,采样距离为1小时,选手须要应用2019-08-01,2019-09-23)的数据进行建模,应用训练好的模[源码交易型对将来7天的数据进行预测,辨认将来一周KPI序列中的异样点。

评估指标:

本赛题采纳F1作为评估指标,具体计算公式如下:

P = TP/(TP+FP)

R = TP/(TP+FN)

F1 = 2PR/(P+R)

数据摸索

数据**有20个不同的KPI,不同的KPI物理意义不同,代表了不同的核心网指标,因为赛题须要对将来7天的数据进行预测,因而对于建模样本也进行周级别的散布查看。从Fig1中能够显著看到训练集中前三周的异样率显著低于后续几周。进一步剖析能够发现尽管赛题提供了[2019-08-01,2019-09-23)的全副数据,但2019-08-15之前所有20个KPI均毫无异样,第一个异样点是从2019-08-15 02:00:00开始呈现的(Fig2),因而揣测8.15前的数据分布不同于后续样本,或8.15之前存在标注异样的问题。试验中剔除8.15之前的样本建模成果也优于保留该时间段样本,进一步验证了该揣测。

背景介绍

核心网在挪动运营商网络中占据无足轻重的位置,其异样往往会导致呼叫失败、网络提早等现网故障,对全网的服务质量带来重大的负面影响,多则影响十数万用户,并引发大面积投诉[1]。因而须要疾速及时地发现核心网的异样危险,在影响扩充之前及时打消故障。
KPI是一类可能反映网络性能与设施运行状态的指标,本赛题提供某运营商核心网的KPI实在数据,数据模式为KPI工夫序列,采样距离为1小时,选手须要应用[2019-08-01,2019-09-23)的数据进行建模,应用训练好的模型对将来7天的数据进行预测,辨认将来一周KPI序列中的异样点。

评估指标:

本赛题采纳F1作为评估指标,具体计算公式如下:

P = TP/(TP+FP)

R = TP/(TP+FN)

F1 = 2PR/(P+R)

数据摸索

数据**有20个不同的KPI,不同的KPI物理意义不同,代表了不同的核心网指标,因为赛题须要对将来7天的数据进行预测,因而对于建模样本也进行周级别的散布查看。从Fig1中能够显著看到训练集中前三周的异样率显著低于后续几周。进一步剖析能够发现尽管赛题提供了[2019-08-01,2019-09-23)的全副数据,但2019-08-15之前所有20个KPI均毫无异样,第一个异样点是从2019-08-15 02:00:00开始呈现的(Fig2),因而揣测8.15前的数据分布不同于后续样本,或8.15之前存在标注异样的问题。试验中剔除8.15之前的样本建模成果也优于保留该时间段样本,进一步验证了该揣测。