关于数据挖掘:基于出租车GPS轨迹数据的研究出租车行程的数据分析附代码数据

2次阅读

共计 1100 个字符,预计需要花费 3 分钟才能阅读完成。

原文链接:http://tecdat.cn/?p=7553

最近咱们被客户要求撰写对于出租车 GPS 轨迹数据的钻研报告,包含一些图形和统计输入。

通过解析原始数据,失去模式如下所示

数据

 每次骑行都有十分具体的上 / 下车地位以及开始 / 完结工夫的详细信息。上面显示了一个示例:

 咱们留下了 158,320,608 个出租车行程的数据集,分为 32,654 个不同的终点 / 起点。


点击题目查阅往期内容

杭州出租车行驶轨迹数据空间工夫可视化剖析

左右滑动查看更多

01

02

03

04

自 1987 年以来,位于东 79 街和约克大巷的出租车站始终将上东区的居民带到华尔街。

我在数据中发现了沿着这条路线的 252,210 次记录。出租车均匀须要 20.35 分钟能力以 22.11 mph 的速度行驶。当然,凌晨 4 点出租车的行驶速度更快,然而大多数人直到凌晨 6 点或凌晨 7 点才开始上下班:

 一年中,最忙的出租车沿该路线行驶 234 次(只有 7 辆出租车沿该路线行驶 100 次):

只管前十名最常见的出租车司机的平均速度能够预测,但他们的速度并没有比大多数人快(这可能是因为他们常常每天长时间开车)。

 

 

SELECT
  pickup_street1, pickup_street2, dropoff_street1, dropoff_street2,
  trips_medallion, trips_pickup_datetime, trips_dropoff_datetime,
  ROUND(trips_avg_mph,4) AS avg_mpg,
  ROUND(trips_trip_duration_hours,4) AS num_hours
FROM
  [taxi_strava.joined_geohash_geonames]
WHERE
  trips_geohashed_dropoff = 'dr5ru2'
  AND trips_geohashed_pickup = 'dr5rvj'

点击文末 “浏览原文”

获取全文残缺代码数据资料。

本文选自《基于出租车 GPS 轨迹数据的钻研:出租车行程的数据分析》。

点击题目查阅往期内容

基于出租车 GPS 轨迹数据的钻研:出租车行程的数据分析
用数据通知你出租车资源配置是否正当
把握出租车行驶的数据脉搏:出租车轨迹数据给你答案!
基于出租车 GPS 轨迹数据的钻研:出租车行程的数据分析
用数据通知你出租车资源配置是否正当
共享单车大数据报告
R 语言用泊松 Poisson 回归、GAM 样条曲线模型预测骑自行车者的数量
消费者共享汽车应用状况考察
新能源车主数据图鉴
python 钻研汽车传感器数据统计可视化剖析
R 语言 ggmap 空间可视化机动车交通事故地图
R 语言 ggmap 空间可视化机动车碰撞–街道地图热力求

正文完
 0