如何在传递到Torch模块之前批量处理输入?

在Torch中,应该使用哪个维度进行批处理?

我有1000个训练示例,每个训练示例的维度为10*5。现在,我想将这些数据作为100个示例的批次馈送到Sequencer中。

我应该如何构建我的输入?每个输入批次的维度是100105(第一维用于批处理)还是101005(第二维用于批处理)?

感谢提供相关文档链接以解释所遵循的约定。

对于容器和模块,约定是否会改变?

点赞
用户6076729
用户6076729

通常情况下,输入数据的大小是100*10*5的张量。如果它是一张图片,你可能需要考虑通道数,那么它就是batchSize*channels*width*height。这样可以让数据更容易地被访问,只需要使用inputs[{i}]来获取你的数据。如果你使用标记的数据,请考虑创建另一个张量来存储标签。你可以在这里找到示例代码:https://github.com/torch/tutorials/blob/master/2_supervised/4_train.lua#L131

我建议你看一下 Torch 的教程,那里会教你如何在将数据送入网络之前进行“准备”:https://github.com/torch/tutorials

2016-07-13 11:21:36