共计 3271 个字符,预计需要花费 9 分钟才能阅读完成。
PaddleSpatial 是基于百度飞桨深度学习框架开发的时空大数据计算工具和平台,交融了百度当先的区域分割、工夫序列、城市迁徙学习等时空数据处理能力。本次将由百度研究院资深研究员、PaddleSpatial 技术负责人周景博,为大家分享 PaddleSpatial 如何实现深度学习与时空大数据的联合,以助力智慧城市倒退。
本文次要笼罩四局部内容:
- 百度大数据和人工智能技术助力智慧城市建设
- PaddleSpatial 开源算法介绍 \
- 城市认知计算在智慧城市的利用
- 在智能交通方面的摸索
一、百度大数据和人工智能技术助力智慧城市建设
首先讲一下咱们我的项目研发的方法论。咱们能够用一个三角形来示意大数据、人工智能和智慧城市之间的关系。百度的大数据的劣势体现在多个方面。百度是国内惟一一个同时领有海量的搜寻数据和地图数据的人工智能公司。百度是国内最大的搜索引擎公司,同时百度地图也是国内利用最宽泛的电子地图挪动 app。正是这些海量的动静时空大数据和互联网大数据,实现了城市的数字化,让咱们更快更间接地感触城市的变化规律。这为更好地建设智慧城市提供了必要的数据根底。同时,大数据也为人工智能提供了燃料,对训练机器模型是必不可少的。这样大数据和人工智能独特为智慧城市的建设,提供了必要的数据和技术撑持。
二、PaddleSpatial 开源算法介绍
PaddleSpatial 的研发目标正是为了充分利用百度的时空大数据能力和人工智能技术,构建根底算法的开源工具,来撑持下层城市的利用。
目前 PaddleSpatial 开源的次要算法模块包含区域切分,社区属性预测,空间图神经网络,城市迁徙学习和城市工夫序列数据预测等等。同时咱们在下层研发了一些相干的城市计算的利用,包含区域画像,出行画像,城市量化剖析,智能交通等等。上面我将一一做简要的分享。
首先咱们先介绍一下 PaddleSpatial 里有亮点的几个算法模块。
第一,是反对空间点的关系预测的空间图神经网络模型。图神经网络近两年获得了十分大的停顿,然而存在一个问题是,它通常将图当成一个拓扑图来解决,建模的是结点和结点之间的关系。实际上在天文数据中,点和点的绝对地位和角度是十分重要的。如何建模两点之间的间隔及角度,是目前图神经网络不能很好解决的问题。因而咱们提出一个空间自适应的图神经网络算法。它把天文空间中两点之间的绝对间隔和角度信息,很好整合到图神经网络框架中。
第二个性能是城市区域切分。它次要是基于路网数据,将城市切分成细分单元,进而将这个根底单元作为钻研对象。城市区域切分和自然语言解决中的利用绝对比,实际上是定义了城市空间域上的“切词”能力。和已有的算法做比照能够看出,PaddleSpatial 开源的城市区域切分办法的准确率远高于已有的办法。PaddleSpatial 能够将全国划分成 150 万个区块,为进一步的城市钻研提供了松软的根底。
实现城市区域切分之后,下一步就是钻研城市区域的各类属性,比方人口数量,房价,以及人群散布等。这里咱们也研发了一个城市区域稠密标签预测算法。城市区域稠密标签的一个典型的利用是城中村检测。城中村在很多城市都存在,然而数量是十分稠密的。通过咱们钻研的算法,能够实现对整个城市城中村的检测。初步的试验后果也证实咱们的办法显著优于现有的最好办法。
在建模区块之后,还会钻研区块间的人流关系,比如说不同的区块之间流量是多少。咱们也专门提出了面向城市区域之间的流量预测模型。该模型的翻新点包含变分的有向图自编码器,城市多模态信息交融的先验散布对齐以及基于泊松散布的解码器等。在已有的区域流量数据上,获得了十分好的成果。
三、城市认知计算在智慧城市的利用
后面我着重分享了 PaddleSpatial 的特色算法工具,前面我会再偏重介绍一下咱们实验室正在进行的城市认知计算相干的我的项目。咱们的指标是构建城市空间的认知计算能力,进而能更好地了解城市,造福城市居民。
咱们首先介绍的是区域画像。区域画像包含人群画像、生存地图、常访区域、区域指数、用地散布、性能散布等特色性能。区域画像具备更细粒度的剖析力和辨识能力,能够动静感知区域间人流散布和人流特色,并进行城市功能区的实时剖析。区域画像的覆盖范围十分精密,能够反对省到街道的 5 级空间维度的缩放,相干数据能够反对覆盖全国的用户特色和性能设施剖析。
同时,和区域画像相关联,咱们还建设了城市的出行画像。与区域画像不通,出行画像以每个出发地和目的地形成 OD 对为根本钻研单位,细粒度刻画人群的挪动属性。通过海量历史人群数据,进行量化的指标剖析和预测能力建模,晋升城市的感知能力。
这里是咱们构建的区域画像和出行画像的零碎。首先来看出行画像,对于每一个出发地和目的地形成的 OD 对,咱们能够是实现细粒度的人群剖析,展现在同一门路上的不同的人群的流量、交通形式等维度。区域画像则能够实现对一个区域的人群和属性的剖析。咱们能够建设每个区域的生存地图,剖析该区域衣食出行的需要和供应状况。咱们还能够剖析该区域的常访地点,察看不同层级的出发地和目的地等。而后,咱们还构建了细粒度的区域指数,包含便民指数、生活品质指数等。咱们还能够对区域进行用地和性能散布的剖析。用地散布体现了区域的布局定位,比方居民用地和教育用地等;而性能散布则体现了该区域自发造成的服务性能,比方休闲娱乐和餐饮美食等性能。
咱们还会进一步钻研城市之间的关系,并学习城市的已知法则,将它利用到其余的城市上。在 2020 年疫情期间,咱们实验室和地图单干实现了一个新冠肺炎感化高风险小区的辨认我的项目。该我的项目联合多模态学习和城市区域迁徙学习技术,设计了城市新冠肺炎感化高风险小区的辨认算法。去年新冠疫情刚暴发的时候,只有武汉开始大规模风行。通过看武汉产生大规模疫情暴发的小区特点是什么样的,来抽取出法则,进而领导其余城市。咱们研发的模型能够定位新冠疫情高风险小区的成因,提醒政府对不同区域采取针对性优化措施,助力政府进步疫情管控能力。
PaddleSpatial 构建的平台能力在与雄安新区管委会,联合国开发署和北京市交研院的单干中都获得了示范性利用。其中咱们实现雄安大数据报告被人民网、磅礴新闻、中新网、河北卫视等 50 多家权威报道;同时咱们还与新华社眺望共建“中国幸福城市实验室”, 从 2018 年起继续为新华社主导的中国幸福城市排名提供技术支持,产生了宽泛的技术影响力。近期咱们还将城立方的能力扩大到反对智能交通上,致力于让城市交通运营商模式行健致远,也获得了很好的成果。
咱们设计了全国首个基于大数据和人工智能的城市幸福感指数框架。整个框架设计为 9 + X 构造。其中“9”指九大一级指数,共包含 100 多个细分指标,力求笼罩居民衣食住行的每一个维度和细分群体。比方,以“生活品质”指数为例,它就笼罩了“文体休闲程度、人均绿地占有度”等 8 个二级指标,每个二级指标进一步细分为更多三级指标。
去年,咱们的指数框架还新增了一个 X 指数,用于笼罩每年的时事热点,2020 年的 X 指数是基于“新冠疫情”事件研发的“大数据抗疫指数”。绝对于传统的问卷调查和统计办法,百度城市幸福感指数具备科学性、创新性和全面性等劣势。
PaddleSpatial 的能力还能够帮助咱们进行城市发展趋势的研判和剖析,为城市管理者制订决策,提供数据和技术上的反对。近期咱们反对了雄安、温州等城市的城市大数据报告。特地是雄安的大数据报告,从 2018 年开始做,曾经间断做了第 4 期,产生了宽泛的媒体影响力。
四、在智能交通方面的摸索
最初,我再简略总结一下咱们在智能交通上做的一些摸索。咱们往年上半年研发了业界当先的轨迹还原模块。依据不同的十字路口拍摄的数据,来复现车辆在城市上的残缺轨迹。它作为百度交通大脑的亮点性能,上线到了保定和亦庄城市的交通大脑上。另外,联合已有的城市交通网络和流量的预测,咱们也和交管部门单干摸索路线布局和交通枢纽建设优化的相干工作。
总之,咱们心愿继续的建设和优化 PaddleSpatial,实现用百度人工智能让城市更智慧的近景指标。谢谢大家的关注!