libcity.utils.dataset

数据预处理阶段相关的工具函数

libcity.utils.dataset.caculate_time_sim(data)[source]
libcity.utils.dataset.cal_basetime(start_time, base_zero)[source]

用于切分轨迹成一个 session, 思路为:给定一个 start_time 找到一个基准时间 base_time, 在该 base_time 到 base_time + time_length 区间的点划分到一个 session 内, 选取 base_time 来做的理由是:这样可以保证同一个小时段总是被 encode 成同一个数

libcity.utils.dataset.cal_timeoff(now_time, base_time)[source]

计算两个时间之间的差值,返回值以小时为单位

libcity.utils.dataset.parse_coordinate(coordinate)[source]
libcity.utils.dataset.parse_time(time_in, timezone_offset_in_minute=0)[source]

将 json 中 time_format 格式的 time 转化为 local datatime

libcity.utils.dataset.string2timestamp(strings, offset_frame)[source]
libcity.utils.dataset.timestamp2array(timestamps, t)[source]

把时间戳的序列中的每一个时间戳转成特征数组,考虑了星期和小时, 时间戳: numpy.datetime64(‘2013-07-01T00:00:00.000000000’)

Parameters
  • timestamps – 时间戳序列

  • t – 一天有多少个时间步

Returns

特征数组,shape: (len(timestamps), ext_dim)

Return type

np.ndarray

libcity.utils.dataset.timestamp2vec_origin(timestamps)[source]

把时间戳的序列中的每一个时间戳转成特征数组,只考虑星期, 时间戳: numpy.datetime64(‘2013-07-01T00:00:00.000000000’)

Parameters

timestamps – 时间戳序列

Returns

特征数组,shape: (len(timestamps), 8)

Return type

np.ndarray