torch7:微调CNN时出现错误。

我正试图在图像多类面孔数据集上微调一个预训练的**OverFeat**卷积网络(CNN)。我的训练-测试lua脚本基于此处给出的教程。

我首先创建了一个脚本,并尝试在_ImageNet_数据集的子集上培训和测试我的脚本。解决了一些问题后,它正常工作且没有错误。但是,然后我对脚本进行了轻微的更改,例如在神经网络中添加了几个图层,更改了输入文件和标签以适应新数据集。我要微调的更新模型如下:

   net:add(SpatialConvolution(3, 96, 7, 7, 2, 2))
   net:add(nn.ReLU(true))
   net:add(SpatialMaxPooling(3, 3, 3, 3))
   net:add(SpatialConvolutionMM(96, 256, 7, 7, 1, 1))
   net:add(nn.ReLU(true))
   net:add(SpatialMaxPooling(2, 2, 2, 2))
   net:add(SpatialConvolutionMM(256, 512, 3, 3, 1, 1, 1, 1))
   net:add(nn.ReLU(true))
   net:add(SpatialConvolutionMM(512, 512, 3, 3, 1, 1, 1, 1))
   net:add(nn.ReLU(true))
   net:add(SpatialConvolutionMM(512, 1024, 3, 3, 1, 1, 1, 1))
   net:add(nn.ReLU(true))
   net:add(SpatialConvolutionMM(1024, 1024, 3, 3, 1, 1, 1, 1))
   net:add(nn.ReLU(true))
   net:add(SpatialMaxPooling(3, 3, 3, 3))
   net:add(SpatialConvolutionMM(1024, 4096, 5, 5, 1, 1))
   net:add(nn.ReLU(true))
   net:add(SpatialConvolutionMM(4096, 4096, 1, 1, 1, 1))
   net:add(nn.ReLU(true))
   net:add(SpatialConvolutionMM(4096, 1000, 1, 1, 1, 1))
   -- net:add(nn.View(1000))
   net:add(nn.ReLU(true))
   net:add(SpatialConvolutionMM(1000, 530, 1, 1, 1, 1))
   net:add(nn.View(530))
   net:add(nn.SoftMax())

我正在使用**nn.ClassNLLCriterion()**训练我的网络。但是,当训练时,我遇到了以下错误:

==> online epoch # 1 [batchSize = 8]
/home/adarshc/torch/install/bin/luajit: ...shc/torch/install/share/lua/5.1/nn/ClassNLLCriterion.lua:38: attempt to call method 'type' (a nil value)
stack traceback:
    ...shc/torch/install/share/lua/5.1/nn/ClassNLLCriterion.lua:38: in function 'forward'
    final_2.lua:486: in function 'opfunc'
    /home/adarshc/torch/install/share/lua/5.1/optim/sgd.lua:43: in function 'optimMethod'
    final_2.lua:509: in function 'train'
    final_2.lua:613: in main chunk
    [C]: in function 'dofile'
    ...rshc/torch/install/lib/luarocks/rocks/trepl/scm-1/bin/th:131: in main chunk
    [C]: at 0x00406670

我无法解决它,因为我发现这个错误不具有信息性,因此很难跟踪和调试。有人可以帮我解决这个问题吗?

提前致谢。

点赞
用户1688185
用户1688185

当你在 你的 criterion 进行前向传播 时,第二个参数(= 目标)类型不正确,因此会出现此错误。

由于你显然是在使用小批量数据,所以应该传递一个大小为 N = 小批量大小的 1D torch 长整型张量(在非批处理模式下,它可以是一个 number 或一个单元素 1D 长整型张量)。

注意:在训练时,在 nn.ClassNLLCriterion 之前,应该使用 nn.LogSoftMax() 而不是 nn.SoftMax() 层。作为替代方案,有一个内置的图层结合了它们两个:nn.CrossEntropyCriterion.

2016-01-29 22:21:27