libcity.utils.dataset

数据预处理阶段相关的工具函数

libcity.utils.dataset.caculate_time_sim(data)[源代码]
libcity.utils.dataset.cal_basetime(start_time, base_zero)[源代码]

用于切分轨迹成一个 session, 思路为:给定一个 start_time 找到一个基准时间 base_time, 在该 base_time 到 base_time + time_length 区间的点划分到一个 session 内, 选取 base_time 来做的理由是:这样可以保证同一个小时段总是被 encode 成同一个数

libcity.utils.dataset.cal_timeoff(now_time, base_time)[源代码]

计算两个时间之间的差值,返回值以小时为单位

libcity.utils.dataset.parse_coordinate(coordinate)[源代码]
libcity.utils.dataset.parse_time(time_in, timezone_offset_in_minute=0)[源代码]

将 json 中 time_format 格式的 time 转化为 local datatime

libcity.utils.dataset.string2timestamp(strings, offset_frame)[源代码]
libcity.utils.dataset.timestamp2array(timestamps, t)[源代码]

把时间戳的序列中的每一个时间戳转成特征数组,考虑了星期和小时, 时间戳: numpy.datetime64(‘2013-07-01T00:00:00.000000000’)

参数
  • timestamps – 时间戳序列

  • t – 一天有多少个时间步

返回

特征数组,shape: (len(timestamps), ext_dim)

返回类型

np.ndarray

libcity.utils.dataset.timestamp2vec_origin(timestamps)[源代码]

把时间戳的序列中的每一个时间戳转成特征数组,只考虑星期, 时间戳: numpy.datetime64(‘2013-07-01T00:00:00.000000000’)

参数

timestamps – 时间戳序列

返回

特征数组,shape: (len(timestamps), 8)

返回类型

np.ndarray