关于高德地图:机器学习在高德地图轨迹分类的探索和应用

1. 背景

当咱们关上导航，开车驶向目的地的过程中，有时候会碰到这样的问题：后方明明没有路，可能在施工关闭，可是导航依然让咱们往前开车，以至于咱们无奈顺利达到目的地。全国路线千千万，每天都有巨量的路线变得不可通行，那么如何动静的辨认出哪些路线走不通了呢？

图中所示即为因封路事件导致的导航路线扭转

路线不通往往导致该条路线汽车流量忽然升高。监控汽车流量的变动是开掘封路事件的重要指标。然而，目前业务中遇到的一个重要问题是，针对汽车无奈通行的封路事件，行人、自行车可能都能够穿行，这些行人、自行车等的噪声流量大大减弱了路线流量变动。

因而，如果可能对行人、自行车、汽车的轨迹进行分类，就能够对路线流量的噪声进行过滤，仅仅关注汽车流量，流量随着封路事件的变动将更为显著，从而便于路线关闭的开掘。本文次要针对非机动车、机动车分类摸索轨迹分类问题。

2. 样本获取与标签制订

因为轨迹数据短少原始真值，咱们将用户导航模式作为轨迹分类的伪标签。例如过后用户采纳汽车导航，其轨迹对应的标签即为汽车。因为汽车导航数据远远多于非机动车，不同伪标签样本比例差别微小，存在重大的样本不均衡问题。此外，用户导航模式与用户理论出行形式可能并不统一。比方有些用户能够依据汽车导航步行达到目的地。下文介绍的标签 - 概率混合贝叶斯模型将剖析并试图解决上述 2 个问题。

3. 特征分析

能够将轨迹分类相干特色划分为 5 类。别离是：

轨迹详情特色集，包含轨迹耗时、轨迹长度、轨迹开始工夫等。
速度相干特色集，包含最大速度、平均速度、速度标准差等。
工夫相干特色集，包含路线末端期待红灯工夫，调头工夫，左转工夫等。
行为相干特色集，包含调头行为，往返流动，左转减右转工夫等。
用户画像特色集，包含用户职业、有车概率。

上面以轨迹开始工夫特色为例，解释该特色的物理意义。其概率密度函数如下所示（drv，汽车；byc，自行车；wlk，步行）：

晚上（5:00~10:00）汽车轨迹概率较高，可能是早顶峰导致。

午时（11:00~13:00）自行车轨迹概率较高，可能是因为外卖送餐。

黄昏（17:00~20:00）步行、自行车概率均较高，可能是因为上班漫步以及外卖送餐。

4. 贝叶斯模型的概率分布视角

抉择基于贝叶斯分类器进行改良的起因如下：

贝叶斯分类器属于生成模型，依赖于条件概率密度函数，具备明确的统计学意义。此外，如后面提到的条件概率图示，通过观察不同轨迹、标签的概率密度函数，可能一一剖析、阐明特色的有效性。
贝叶斯分类器能够示意为:

通过削减、删减、改变特色的概率密度函数，能够疾速实现贝叶斯分类器的迭代改良。并且相较于决策树，贝叶斯分类器不会对某一个特色的变动过于敏感。
贝叶斯分类器最终输入为概率值，能够作为置信度。

4.1 标签 - 概率混合贝叶斯模型

以后轨迹分类问题为样本不均衡（Data Unbalanced）标签不精确（Noisy Label）问题。

Tanaka 等人基于卷积神经网络提出了伪标签损失函数，通过穿插熵损失函数与伪标签损失函数的迭代优化实现了谬误标签的修改 [2]。受此启发，贝叶斯模型同样可能建设伪标签损失函数实现样本荡涤。

咱们基于贝叶斯分类器的分类后果，提出基于伪标签极大似然预计的伪标签损失函数，实现谬误样本荡涤，再迭代实现贝叶斯分类。该模型的迭代流程如下图所示。

标签 - 概率混合优化贝叶斯模型迭代流程。

4.2 联结概率密度函数计算

因为贝叶斯分类器假如各变量互相独立，因而不可避免的会对一些场景下的样本产生谬误预测。例如，外卖骑手以及快递员该当被断定为非机动车。这种类型轨迹长度可能较长（超过 10 公里），最大速度适中（小于 50 公里每小时）。在假如行驶间隔与最大速两个特色互相独立的状况下，容易谬误地把外卖骑手以及快递员的行驶轨迹断定为汽车。

自行车轨迹行驶间隔以及最大速度联结概率密度函数

汽车轨迹行驶间隔以及最大速度联结概率密度函数

然而，行驶间隔与最大速两个维度的特色并不互相独立。上图构建了针对汽车轨迹这两个维度的联结概率密度函数，能够发现，对汽车轨迹而言，行驶间隔越长，最大速可能越高，当汽车行驶间隔超过 10 公里时，其最大速度小于 50 公里每小时的可能性很低。因而，通过构建行驶间隔与最大速度两个维度的联结概率密度函数，替换两个独立概率的相乘，能够帮忙解决长距离非机动车轨迹被误判为汽车的问题。

4.3 基于贝叶斯的轨迹分类试验后果

评测团队抽样约 100 条数据并人工标记真值。最终模型分类成果如表所示。

5. 深度学习模型的图像编码视角

因为轨迹数据短少原始真值，咱们将用户导航模式作为轨迹分类的伪标签。例如过后用户采纳汽车导航，其轨迹对应的标签即为汽车。本次基于深度学习的摸索不思考标签噪声的问题。

5.1 轨迹信息的两种察看形式

深度学习的劣势在于可能从原始数据中学习到无效信息，无需人工开掘特色。针对轨迹数据的特点，存在两种察看轨迹的形式，别离是工夫序列与空间散布。

工夫序列：轨迹当中的 GPS 点数据随时间推移顺次上传至数据库中。轨迹数据人造具备工夫序列属性。因而，能够采纳 TCN 或 RNN 构建模型，学习轨迹中的工夫序列信息，实现轨迹分类。

空间散布：将轨迹数据绘制在地图中，则轨迹形成图片中的一条线。如果可能将速度、方向、等待时间编码到线的色彩当中，则可能采纳 CNN 从轨迹图像中学习到无效信息 [3]。

图左侧大概率为快递员轨迹，图右侧大概率为汽车轨迹。GPS 点的空间散布可能为轨迹分类提供无效信息。因而，咱们采纳空间分布模式构建模型，摸索基于深度学习的轨迹分类。

轨迹色彩编码：从 GPS 点中获取的次要信息为速度、方向、期待时长。将这 3 个维度的信息进行轨迹色彩编码有 2 种形式，别离是 RGB 编码与 HSV 编码。其中 HSV 即色相（Hue）、饱和度（Saturation）、亮度（Value）。

因为方向信息为 0~360 度的角度值，与 HSV 色调空间种的色相 H 完全一致。因而，本文采纳 HSV 色调空间对速度、方向、期待时长进行编码，编码方式为速度：V，方向：H，时长：S。编码后将轨迹缩放为 256×256 的图片。对地图轨迹的编码后果如下图所示。

5.2 双流神经网络模型

基于编码生成的轨迹图片仍然缺失一些重要信息，包含将轨迹缩放至 256×256 图片的缩放因子，以及 GPS 点所在的地位。能够将轨迹匹配后果中通过国道、省道、城市快速路等不同类型路线的比例结构出特色集表征 GPS 点所在的地位信息，退出缩放因子结构一个一维动态特征向量。

将卷积神经网络学习到的特征向量以及该一维特征向量合并，最终通过全连贯层实现轨迹分类。最终卷积神经网络抉择 ResNet50 构造。

5.3 基于深度学习的轨迹分类试验后果

评测团队抽样约 100 个样本，人工标记真值。

如上表所示，以人工标记标签为真值验证深度学习模型，深度学习模型可能获得无效的轨迹分类精度，然而最终分类成果弱于提出的贝叶斯模型。可能的起因有如下几点：

ResNet50 并不是学习轨迹图像的最优模型。
仅采纳 8 月 17 日的样本训练模型，样本多样性有余。
所抉择的非凡场景样本分布与深度学习中的训练集样本分布差别微小。

6. 小结

轨迹分类对于精确及时地开掘路线关闭事件具备重要意义。本文从给予概率密度散布的贝叶斯模型视角与基于轨迹点图像编码的深度学习视角别离摸索了轨迹分类可能的技术计划。将来轨迹分类模型还能够从聚焦利用场景，优化利用以及拓展上游数据，优化特色两个方面进行改良。

参考文献

[1].Frénay B, Verleysen M. Classification in the presence of label noise: a survey[J]. IEEE transactions on neural networks and learning systems, 2013, 25(5): 845-869.

[2].Tanaka D, Ikami D, Yamasaki T, et al. Joint optimization framework for learning with noisy labels[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2018: 5552-5560.

[3].Liu Y, Wang X, You W. Non-intrusive Load Monitoring by Voltage-Current Trajectory Enabled Transfer Learning[J]. IEEE Transactions on Smart Grid, 2018.

招聘

阿里巴巴高德地图在线引擎和平安运维核心团队长期招聘机器学习算法、C++、Java 资深工程师 / 技术专家 / 高级专家，职位地点：北京。欢送投递简历到 gdtech@alibaba-inc.com，邮件主题为：姓名 - 应聘团队 - 应聘方向。