关于数据挖掘:Python路面平整度检测车辆数据速度修正

58次阅读

共计 2554 个字符,预计需要花费 7 分钟才能阅读完成。

全文链接:http://tecdat.cn/?p=31268

原文出处:拓端数据部落公众号

分析师:Bohao Zhan

目前支流的轻量化路面平整度检测技术计划为:应用车载加速度传感器采集车辆在路面上行驶时的竖向振动数据,并依照每 100 米计算竖向振动数据统计指标:均方根值 RMS,并建设 RMS 与路面平整度指标:IRI 之间的回归模型。检测前须要将车辆行驶至规范路段(即已知 IRI 真值的路段)上来回行驶对传感器进行标定,实现标定后驾驶车辆返回待检测路段进行平整度检测。

目前该技术计划的难点在于,对于同一 IRI 值的路面,若驾驶同一车辆以不同的行驶速度驶过,测得的振动数据统计指标也会不同,即车辆行驶速度是影响检测后果的次要因素之一。在标定工作中,车辆会被要求已恒定速度行驶进行标定,而理论测量时,车辆的速度往往会随道路交通情况、路况、天气等因素无奈维持恒定的速度,导致车辆在检测过程中时的车辆行驶速度时快时慢,重大影响检测后果精度。因而,对检测数据后果进行速度修改(行将车辆某一检测速度下的测量值转换成当量速度下的测量值),是一件急切且必须的事件。

解决方案

工作指标

基于不同车速下的平整度检测车辆振动数据后果,探索车速与检测后果之间的关系,依据此关系进行速度修改,将不同车速下的检测后果转换成当量速度下的检测后果。

应用到的工具 / 语言

Matlab、Python、Mysql、Navicat。

数据 获取

平整度检测车辆每天会在上海外环高速固定某一路段上进行检测,检测数据(包含振动加速度数据、GPS 定位数据、图像数据等)会定时上传至数据库内,须要从数据库中将检测数据批量下载至本地进行剖析,其中,须要下载的数据表包含 acc 表、gps 表、stake_info 表。

图 1 MySQL 数据库中数据

(a)

(b)

图 2 从数据库抓取数据 Python 脚本(局部)

编写 python 脚本从数据库中抓取指定工夫的数据,脚本中包含局部 mysql 语句用于筛选数据。应用表关联命令将 acc 与 gps 表以工夫为 key 关联起来,并保留至本地。共从数据库中抓取 57 天检测数据用于后续剖析。

数据荡涤

将 57 天车辆轨迹散点(红)画于图中,同时标注待检测路段桩号点(蓝),发现检测车辆并不是齐全依照预约路线进行检测,有诸多路段是多检路段,将影响后续计算结果。将相邻桩号点连贯造成若干个线段。对于车辆每一个轨迹散点,找到离该点最近的桩号线段,并计算该点到桩号线段的间隔,设定阈值,将阈值外的轨迹散点剔除,保留阈值范畴内轨迹散点(蓝)。

图 3 检测车辆轨迹散点与桩号点

(横坐标:经度,纵坐标:纬度)

此外,还包含的数据预处理包含加速度数据去均值与车辆轨迹散点桩号重计算。对车辆每一个轨迹散点的桩号进行修改。

数据处理与剖析

对于每一天的车辆轨迹数据,依照上述办法进行数据荡涤,从桩号终点至桩号起点,每 100 米划分小路段并编号,选出该路段范畴内的加速度数据并计算统计指标 RMS。计算第 k 天数据后将后果表格与第 k + 1 天后果表格依照小路段编号进行关联。失去各小路段在不同天下车辆的检测数据,且每一天的车辆行驶速度均是不同的,也就失去了对于同一路段(即雷同 IRI 值路面),不同车辆行驶速度下的振动数据统计指标。将两者散点画于图中,不同路段局部后果如下所示。

(c)

图 4 速度与 RMS 散点图

(横坐标:速度(km/h)、纵坐标:RMS)

建设模型

从每一路段速度与 RMS 散点图中可看出二者之间存在较强的线性关系,建设两者之间线性模型,所有路段散点图与线性拟合后果如下图所示。从图中可看出不同 IRI 值路面,检测车辆速度与检测后果统计指标 RMS 均存在较强的线性关系,对于不同的 IRI 值路面,其体现出线性的斜率不同。从下图中可看出所有直线的截距尽管次要集中于 0~0.1 范畴内,但仍体现较为扩散。依照常理,对于不同 IRI 值路面,当测量速度为 0 时,此时车辆振动仅由车辆发动机提供,因而体现出的统计指标 RMS 该当为同一值。剖析起因,认为因为外环路线等级为高速公路,故数据中低速样本较少所致。

图 5 速度 -RMS 散点图与拟合直线

(横坐标:速度(km/h)、纵坐标:RMS)

模型优化

统计每一条直线截距值,画出其散布直方图(图 6),发现截距在 0.05 至 0.1 区间内频率最高,取频率最高值 0.07 作为所有直线的独特截距,从新对各条路段数据进行线性拟合,拟合后果如图 7 所示。

图 6 拟合直线截距散布直方图

图 7 改良后的拟合后果

得出平整度检测车辆检测后果速度修改计划,对于每一条路段在不同车辆速度下的振动数据统计指标 RMS,减去同一截距 0.07。取当量速度为 70km/h,依照各路段线性拟合直线斜率将不同速度下的检测后果修改至 70km/ h 速度下的检测值。

对于作者

在此对 Bohao Zhan 对本文所作的奉献示意诚挚感激,他在同济大学实现了控制工程硕士学位,善于数据采集、数据分析。


最受欢迎的见解

1.[](http://tecdat.cn/r%e8%af%ad%e…)R 语言多元 Logistic 逻辑回归 利用案例

2.[](http://tecdat.cn/r%e8%af%ad%e…)面板平滑转移回归 (PSTR) 剖析案例实现

3.[](http://tecdat.cn/r%e8%af%ad%e…)matlab 中的偏最小二乘回归(PLSR)和主成分回归(PCR)

4.[](http://tecdat.cn/r%e8%af%ad%e…)R 语言泊松 Poisson 回归模型剖析案例

5.[](http://tecdat.cn/r%e8%af%ad%e…) R 语言混合效应逻辑回归 Logistic 模型剖析肺癌

6.[](http://tecdat.cn/r%e8%af%ad%e…)r 语言中对 LASSO 回归,Ridge 岭回归和 Elastic Net 模型实现

7.[](http://tecdat.cn/r-%e8%af%ad%…) R 语言逻辑回归、Naive Bayes 贝叶斯、决策树、随机森林算法预测心脏病

8.[](http://tecdat.cn/r%e8%af%ad%e…)python 用线性回归预测股票价格

9.[](http://tecdat.cn/r%e8%af%ad%e…) R 语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测

正文完
 0