libcity.data.utils

libcity.data.utils.generate_dataloader(train_data, eval_data, test_data, feature_name, batch_size, num_workers, shuffle=True, pad_with_last_sample=False)[source]

create dataloader(train/test/eval)

Parameters
  • train_data (list of input) – 训练数据,data 中每个元素是模型单次的输入,input 是一个 list,里面存放单次输入和 target

  • eval_data (list of input) – 验证数据,data 中每个元素是模型单次的输入,input 是一个 list,里面存放单次输入和 target

  • test_data (list of input) – 测试数据,data 中每个元素是模型单次的输入,input 是一个 list,里面存放单次输入和 target

  • feature_name (dict) – 描述上面 input 每个元素对应的特征名, 应保证len(feature_name) = len(input)

  • batch_size (int) – batch_size

  • num_workers (int) – num_workers

  • shuffle (bool) – shuffle

  • pad_with_last_sample (bool) – 对于若最后一个 batch 不满足 batch_size的情况,是否进行补齐(使用最后一个元素反复填充补齐)。

Returns

tuple contains:

train_dataloader: Dataloader composed of Batch (class)

eval_dataloader: Dataloader composed of Batch (class)

test_dataloader: Dataloader composed of Batch (class)

Return type

tuple

libcity.data.utils.generate_dataloader_pad(train_data, eval_data, test_data, feature_name, batch_size, num_workers, pad_item=None, pad_max_len=None, shuffle=True)[source]

create dataloader(train/test/eval)

Parameters
  • train_data (list of input) – 训练数据,data 中每个元素是模型单次的输入,input 是一个 list,里面存放单次输入和 target

  • eval_data (list of input) – 验证数据,data 中每个元素是模型单次的输入,input 是一个 list,里面存放单次输入和 target

  • test_data (list of input) – 测试数据,data 中每个元素是模型单次的输入,input 是一个 list,里面存放单次输入和 target

  • feature_name (dict) – 描述上面 input 每个元素对应的特征名, 应保证len(feature_name) = len(input)

  • batch_size (int) – batch_size

  • num_workers (int) – num_workers

  • pad_item (dict) – 用于将不定长的特征补齐到一样的长度,每个特征名作为 key,若某特征名不在该 dict 内则不进行补齐。

  • pad_max_len (dict) – 用于截取不定长的特征,对于过长的特征进行剪切

  • shuffle (bool) – shuffle

Returns

tuple contains:

train_dataloader: Dataloader composed of Batch (class)

eval_dataloader: Dataloader composed of Batch (class)

test_dataloader: Dataloader composed of Batch (class)

Return type

tuple

libcity.data.utils.get_dataset(config)[source]

according the config[‘dataset_class’] to create the dataset

Parameters

config (ConfigParser) – config

Returns

the loaded dataset

Return type

AbstractDataset