摘要:本文是由华为云数据库翻新 Lab 联结电子科技大学数据与智能实验室发表在顶会 CIKM’21 的文章,该文章提出首个克服人类挪动轨迹数据中普遍存在的多层次周期性、周期偏移景象以及数据稠密问题的轨迹复原模型。
本文分享自华为云社区《CIKM’21 PeriodicMove 论文解读》,作者:云数据库翻新 Lab。
导读
本文 (PeriodicMove: shift-aware human mobility recovery with graph neural network) 是由华为云数据库翻新 Lab 联结电子科技大学数据与智能实验室发表在顶会 CIKM’21 的文章,该文章提出首个克服人类挪动轨迹数据中普遍存在的多层次周期性、周期偏移景象以及数据稠密问题的轨迹复原模型。CIKM 是信息检索和数据挖掘畛域顶级学术会议之一。本届会议共收到投稿 1251 篇,其中录用论文 271 篇,录取率约为 21.7%。该论文是云数据库翻新 LAB 在轨迹剖析层面获得的关键技术成绩之一。
1 摘要
随着各种基于地位的服务的推出,将稠密的人类挪动轨迹数据进行复原补全以晋升这些上游工作的准确率显得尤为重要。然而人类挪动轨迹数据的复原面临着较大的挑战:
• 轨迹中轨迹点之间具备简单的转移模式
• 人类挪动轨迹数据中普遍存在多层次周期性以及周期偏移景象
• 现目前采集的轨迹数据是绝对稠密的
在本文中,咱们提出了一个名为 PeriodicMove 的基于图神经网络的人类行为轨迹复原模型,在该模型中,咱们首先对每条历史轨迹构建有向图,并应用图神经网络捕获地位之间的简单转移模式;之后,咱们设计了两个注意力机制别离捕获人类行为轨迹的多层次周期性与周期偏移性;最初,咱们设计了一个空间感知的损失函数来将地位的空间邻近信息引入到模型中,从而肯定水平上缓解了数据稠密问题。咱们在两个具备代表性的人类轨迹数据集上做了大量试验,试验结果表明,咱们的模型 PeriodicMove 绝对于目前 SOTA 模型取得了 2.9%-9% 的大幅性能晋升。
2 模型
2.1 模型架构
咱们的模型次要包含五个局部:图神经网络层、时序嵌入层、两个注意力机制层以及最初的交融复原层
2.2 图神经网络层
为了捕获轨迹中轨迹点之间简单的空间转移关系,咱们首先将每条轨迹依照如图所示形式进行建图,而后利用图神经网络来学习有向图中轨迹节点之间简单的空间转移模式
2.3 时序嵌入层
咱们采纳《Attention is all you need》中提到的利用三角函数中绝对相位来刻画轨迹序列中的绝对程序关系,而后咱们将图神经网络层以及时序嵌入层的后果拼接起来,造成蕴含简单时空依赖关系的嵌入向量示意
2.4 注意力机制层
Cross Attention Layer 次要用于解决人类挪动轨迹数据中的周期偏移景象,咱们将以后时刻 t 的挪动模式与每一条历史轨迹中所有时刻的挪动模式进行比拟,基于一个相似性权重将相干的历史信息聚合在历史轨迹的 t 时刻以解决周期偏移景象
在通过 Cross Attention Layer 后,每一条历史轨迹的每个时刻的轨迹点示意能够了解为依据以后待补全轨迹的每个时刻进行了偏移校准。接下来在 Soft Attention Layer 中,咱们将以后轨迹的第 t 时刻与每一条历史轨迹的第 t 时刻的轨迹示意进行一个 attention 操作,造成一个蕴含历史轨迹中的多层次周期性的历史轨迹示意
2.5 交融复原层
在最初的交融复原层,咱们利用蕴含简单时空依赖关系、蕴含多层次周期性且克服了周期偏移景象的历史轨迹加强序列辅助以后轨迹来进行最初的补全复原
2.6 设计 Distance Loss
在轨迹数据高度稠密的场景下,穿插熵损失不能很好地捕获空间邻近性,而空间邻近性是人类挪动复原的重要特色。因而,咱们设计了一个间隔损失函数,以纳入空间邻近信息的模型,并且采纳了 Noise Contrastive Estimation (NCE)来减速模型的训练,可视化结果显示,退出了 Distance Loss 可能无效帮忙模型捕获空间邻近信息
3 试验
3.1 试验后果
咱们的模型 PeriodicMove 绝对于目前 SOTA 模型(2021-AAAI)取得了 2.9%-9% 的大幅性能晋升
3.2 融化试验
咱们对模型五个局部别离进行了融化试验,从试验后果中能够看出每个模块对于咱们的工作都有肯定的奉献,其中 Soft Attention Layer 模块去掉后,模型成果降落最快,阐明人类挪动轨迹数据恢复工作中多层次周期性起着十分大的作用
3.3 鲁棒性试验
咱们将本模型与最新的 SOTA 模型(2021-AAAI)进行一个在不同缺失率下的鲁棒性试验,从试验后果中能够看出,两个模型都具备较好的鲁棒性,然而咱们的模型在各个缺失率下的成果都在 AttnMove 上有肯定的晋升
4 利用
在各种基于地位的服务中如:个性化地理位置举荐、城市智能交通调度以及轨迹异样检测等诸多场景,只有是收集到的轨迹数据是稠密的都会影响这些上游工作的准确率。咱们论文的目标是将稠密的轨迹数据恢复成浓密且精密的轨迹数据,以进步这些上游工作的准确率
华为云数据库翻新 lab 官网:https://www.huaweicloud.com/l…
点击关注,第一工夫理解华为云陈腐技术~