原始数据

METR_LA

地点: Los Angeles County, USA

时期: Mar. 1, 2012 ~ Jun. 27, 2012

链接: https://github.com/liyaguang/DCRNN

描述: 由环路探测器在高速公路上收集,包含来自 207 个传感器的交通速度数据。

LOS_LOOP

地点: Los Angeles County, USA

时期: Mar. 1, 2012 ~ Jun. 27, 2012

链接: https://github.com/lehaifeng/T-GCN/tree/master/data

描述: 与METR LA略有不同,缺失值通过线性插值得到补充。

SZ_TAXI

地点: Shenzhen, China

时期: Jan. 1, 2015 ~ Jan. 31, 2015

链接: https://github.com/lehaifeng/T-GCN/tree/master/data

描述: SZ-Taxi 数据集包含深圳市的出租车轨迹,包括道路邻接矩阵和道路交通速度信息。

LOOP_SEATTLE

地点: Greater Seattle Area, USA

时期: 2015 全年

链接: https://github.com/zhiyongc/Seattle-Loop-Data

描述: Loop Seattle 数据集由部署在西雅图地区高速公路(I-5、I-405、I-90和SR-520)上的感应环路探测器收集,包含来自323个传感器站的交通状态数据。

Q_TRAFFIC

地点: Beijing, China

时期: Apr. 1, 2017 ~ May 31, 2017

链接: https://github.com/JingqingZ/BaiduTraffic

描述: Q-Traffic 数据集包含三个子数据集:查询子数据集、交通速度子数据集和路网子数据集。

PEMS

地点: California, USA

时期: 2001 ~ present

链接: http://pems.dot.ca.gov

描述: PEMS 记录加利福尼亚高速公路的速度数据,包括时间小时,平均时间,车道点。

PEMSD3

地点: District 3 of California, USA

时期: Sept. 1, 2018 ~ Nov. 30, 2018

链接: https://github.com/Davidham3/STSGCN

描述: PeMSD3 数据集包括 358 个传感器和流量信息。

PEMSD4

地点: San Francisco Bay Area, USA

时期: Jan. 1, 2018 ~ Feb. 28, 2018

链接: https://github.com/Davidham3/ASTGCN/tree/master/data/PEMS04

描述: PeMSD4 数据集描述了加州高速公路的速度流量占用信息,包含29条道路上的3848个传感器。

PEMSD7

地点: District 7 of California, USA

时期: Jul. 1, 2016 ~ Aug. 31, 2016

链接: https://github.com/Davidham3/STSGCN

描述: PeMSD7 数据集包含883个传感器站的交通流量信息。

PEMSD8

地点: San Bernardino Area, USA

时期: Jul. 1, 2016 ~ Aug. 31, 2016

链接: https://github.com/Davidham3/ASTGCN/tree/master/data/PEMS08

描述: PeMSD8 数据集描述了加州高速公路的速度占用率,数据来自8条公路上的1979个传感器。

PEMSD7(M)

地点: District 7 of California, USA

时期: the weekdays of May and June of 2012

链接: https://github.com/Davidham3/STGCN/tree/master/datasets

描述: PeMSD7(M) 数据集描述了加州第7区228个站点的高速公路速度信息。

PEMS_BAY

地点: San Francisco Bay Area, USA

时期: Jan. 1, 2017 ~ Jun. 30, 2017

链接: https://github.com/liyaguang/DCRNN

描述: PEMS-BAY 数据集包含6个月的交通速度统计数据,包括325个传感器。

BEIJING_SUBWAY

地点: Beijing, China

时期: Feb. 29, 2016 - Apr. 3, 2016

链接: https://github.com/JinleiZhangBJTU/ResNet-LSTM-GCN

描述: 该数据集是从2016年2月29日至4月3日连续五周的05:00-23:00从北京地铁采集的数据。截至2016年3月北京共有17条线路和276个地铁站(不包括机场快线及其上的车站)。

M_DENSE

地点: Madrid, Spain

时期: Jan. 1, 2018 - Dec. 21, 2019

链接: https://github.com/rdemedrano/crann_traffic

描述: 该数据集包含马德里市交通测量的历史数据。在每个点每 15 分钟进行一次测量,包括每小时汽车数量的交通强度。

ROTTERDAM

地点: Rotterdam, Holland

时期: 135 days of 2018

链接: https://github.com/RomainLITUD/DGCN_traffic_forecasting

描述: ROTTERDAM 数据集包含 208 条链路的交通状态信息。

SHMETRO

地点: Shanghai, China

时期: Jul. 1, 2016 - Sept. 30, 2016

链接: https://github.com/ivechan/PVCGN

描述: 该数据集是基于中国上海的地铁系统构建的。 2016年7月1日至2016年9月30日,共收集8.118亿笔交易记录,日客流量882万人次。

HZMETRO

地点: Hangzhou, China

时期: Jan. 1, 2019 - Jan. 25, 2019

链接: https://github.com/ivechan/PVCGN

描述: 该数据集是根据 2019 年 1 月收集的杭州地铁系统交易记录创建的。该系统拥有 80 个运营站点和 248 个边,每天有 235 万乘客。

TAXIBJ

地点: Beijing, China

时期: Jul. 1, 2013 ~ Oct. 30, 2013, Mar. 1, 2014 ~ Jun. 30, 2014, Mar. 1, 2015 ~ Jun. 30, 2015 and Nov. 1, 2015 ~ Apr. 10, 2016

链接: https://github.com/TolicWang/DeepST/issues/3

描述: TaxiBJ 数据集包含出租车 GPS 数据,包括人流、气象和节假日信息。

T_DRIVE

地点: Beijing, China

时期: Feb. 2, 2008 ~ Feb. 8, 2008

链接: https://www.microsoft.com/en-us/research/publication/t-drive-trajectory-data-sample/

描述: T-Drive轨迹数据集样本包含10357辆北京出租车的每周轨迹约1500万个点,轨迹总距离达到900万公里。

PORTO

地点: Porto, Portugal

时期: Jul. 1, 2013 ~ Jun. 30, 2014

链接: https://archive.ics.uci.edu/ml/datasets/Taxi+Service+Trajectory+-+Prediction+Challenge%2C+ECML+PKDD+2015

描述: 数据集描述了在葡萄牙波尔图市运行的所有 442 辆出租车所执行的轨迹。

NYCTAXI

地点: New York, USA

时期: 2009 ~ present

链接: https://www1.nyc.gov/site/tlc/about/tlc-trip-record-data.page

描述: NYC-Taxi 数据集包含 GPS 为纽约市从 2009 年到 2020 年收集的不同类型出租车的轨迹。

NYCTAXI_DYNA

  • NYCTAXI_DYNA 是一个用不规则区域划分方法统计区域流入流出的数据集。

NYCTAXI_OD

  • NYCTAXI_OD 是一个数据集,它使用不规则区域划分方法计算区域之间的起点-终点流量。

NYCTAXI_GRID

  • NYCTAXI_GRID 是一个数据集,它使用基于网格的划分方法计算区域的流入和流出。

NYC_TOD

地点: New York, USA

时期: 2014

链接: https://github.com/liulingbo918/CSTN#:~:text=download%20NYC-TOD.tar.gz%20with%20following%20links%20and%20put%20it%20into%20folder%20NYC-TOD/.

描述: NYC_TOD 使用基于网格的划分方法计算区域的流入和流出。由 CSTN 的论文作者通过轨迹数据集处理得到。

NYCBIKE

地点: New York, USA

时期: Jun. 2013 ~ present

链接: https://www.citibikenyc.com/system-data

描述: NYC-Bike 数据集包含从 NYC CitiBike 系统收集的自行车轨迹。

AUSTINRIDE

地点: Austin, USA

时期: Jun. 4, 2016 ~ Apr. 13, 2017

链接: https://data.world/ride-austin/ride-austin-june-6-april-13

描述: AustinRide 数据集包含从 2016 年 8 月 1 日到 2017 年 4 月 13 日的奥斯汀骑行轨迹,包括超过 140 万次旅行。

BIKEDC

地点: Washington, USA

时期: Sept. 20, 2010 ~ Oct. 2020

链接: https://www.capitalbikeshare.com/system-data

描述: BikeDC 数据集描述了华盛顿自行车系统的自行车道,其中包括 472 个停靠点。

BIKECHI

地点: Chicago, USA

时期: Jun. 27, 2013 ~ 2018

链接: https://www.divvybikes.com/system-data

描述: BikeCHI 数据集展示了 2013 年至 2018 年芝加哥共享单车的发展情况。

Foursquare

时期: Apr. 12, 2012 ~ Feb. 16, 2013

链接: https://sites.google.com/site/yangdingqi/home/foursquare-dataset#h.p_ID_46

描述: Foursquare 是一个基于位置的社交网站,用户可以在其中通过签到来分享他们的位置。我们使用链接中的第二个数据集,即 NYC and Tokyo Check-in Dataset 。我们对链接提供的原始数据进行了预处理,并将其拆分为 Foursquare-TKY 和 Foursquare-NYC。

Gowalla

地点:

时期: Feb. 2009 ~ Oct. 2010

链接: https://snap.stanford.edu/data/loc-gowalla.html

描述: Gowalla 是一个基于位置的社交网站,用户通过签到分享他们的位置,包含用户信息、用户签到时间、用户纬度、经度、用户位置ID。

Brightkite

地点: Global

时期: Apr. 2008 ~ Oct. 2010

链接: http://snap.stanford.edu/data/loc-brightkite.html

描述: Brightkite 是一个基于位置的社交网站,用户通过签到分享他们的位置,包含用户信息、用户签到时间、用户纬度、经度、用户位置ID。

Instagram

地点: New York, USA

时期: Jun. 15, 2011 - Nov. 8, 2016

链接: https://dmis.korea.ac.kr/cape

描述: 该数据集最大的特点是每条签到记录不仅包含POI信息,还包含用户创建签到记录时写入的文本信息。因此,该数据集对于将轨迹语义特征纳入轨迹预测的相关研究尤为重要。

Seattle

地点: Seattle,WA,USA

时期: Jan. 17,2009 20:27:37~22:34:28

链接: https://www.microsoft.com/en-us/research/publication/hidden-markov-map-matching-noise-sparseness/

描述: 这个用于地图匹配的数据集显示了在美国华盛顿州西雅图及其东部郊区开车时拍摄的GPS数据。轨迹从Marymoor公园附近开始。数据是用RoyalTek RBT-2300 GPS记录器以1HZ的频率采样的。这次驾驶发生在2009年1月17日星期六,从20:27:37 UTC(当地时间12:27:37)开始,到22:34:28 UTC(当地时间14:34:28)结束,经过的时间为02:06:51。

Global

地点: 全世界100个地区

时期:

链接: https://zenodo.org/record/57731#.YVwZ7WJBxnK

描述: 这个用于地图匹配的数据集可以在世界范围内验证地图匹配的假设。由于这个数据集覆盖全球,可以提高泛化能力。

BJ_ROADMAP

地点: Beijing, China

时期: -

链接:

描述: 原始数据集包含 OpenStreetMap 格式的节点和边的属性。建图有两种实现方式,分别是节点为交叉点,关系为路段,以及节点为路段,关系为交叉点。分别命名为 “bj_roadmap_node” 和 “bj_roadmap_edge”。

Chengdu_Taxi_Sample1

地点: Chengdu, China

时期: Aug. 03, 2014 - Aug. 30, 2014

链接: https://github.com/UrbComp/DeepTTE/tree/master/data

描述: Chengdu_Taxi_Sample1 数据集是Chengdu_Taxi 数据集的部分样例数据集。包含1800条成都市出租车轨迹数据。

Beijing_Taxi_Sample

地点:Beijing, China

时期:Oct. 01, 2013 - Oct. 31, 2013

链接:https://github.com/YibinShen/TTPNet/tree/master/data

描述:Beijing_Taxi_Sample 数据集是Beijing_Taxi 数据集的部分样例数据集,这里每一天只提供了1000条北京市出租车轨迹数据。

NYC_RISK

地点: New York, USA

时期: Jan.01,2013 ~ Dec.31,2013

链接: https://github.com/Echohhhhhh/GSNet

描述: NYC_RISK 数据集包含了2013年纽约道路、风险和POI数据。

CHICAGO_RISK

地点: New York, USA

时期: Feb.01,2016 ~ Sep.30,2016

链接: https://github.com/Echohhhhhh/GSNet

描述: CHICAGO_RISK 数据集包含了2016年1月到9月芝加哥道路和风险数据。