尝试训练SeGAN模型时出现了"尝试调用本地'回调'(为空值)"错误

我正在尝试在Ubuntu 18.04上使用Geforce RTX 2060实现"SeGAN:分割和生成不可见"论文。我已经安装了驱动程序,CUDA,cuDNN,Torch7和依赖项,并下载并提取了数据集和权重文件夹,并建立了一个链接。 我尝试使用以下代码行训练模型:

th main.lua -baseLR 1e-3 -end2end -istrain "train"

但是我收到了这个错误消息:

定义模型网络G...
/home/darya/distro/install/bin/luajit: /home/darya/distro/install/share/lua/5.1/nn/Module.lua:352: 尝试调用本地'回调'(为空值)
栈回溯:
    /home/darya/distro/install/share/lua/5.1/nn/Module.lua:352: 在函数'apply'中
    /home/darya/SeGAN/networks/End2EndNetwork.lua:81: 在函数'defineG'中
    /home/darya/SeGAN/networks/End2EndNetwork.lua:130: 在函数'init_networks'中
    /home/darya/SeGAN/networks/End2EndNetwork.lua:343: 在主块中
    [C]:在函数'dofile'中
    main.lua:265: 在主块中
    [C]:在函数'dofile'中
    ...rya/distro/install/lib/luarocks/rocks/trepl/scm-1/bin/th:150: 在主块中
    [C]:在0x55e8fde0f570

我不知道我错在哪里,因为我没有太多经验,我很困惑。 可以有人帮我解决这个问题吗?非常感谢。

SeGAN分割和生成不可见的github存储库

点赞
用户2858170
用户2858170

从链接的 GitHub 仓库中:

End2EndNetwork.lua 第 81 行

netG:apply(weights_init)

weights_init 应该是一个函数值,但是却是空值。

这将导致 Module:apply 中 Torch nn 的 Module.lua 第 352 行 中的 callback(self) 失败。

看起来有人必须要实现这个函数。

就像这个 https://github.com/phillipi/pix2pix/blob/89ff2a81ce441fbe1f1b13eca463b87f1e539df8/train.lua,在 https://github.com/ehsanik/SeGAN/blob/d29e0a5ac08f093b87dc82af3707d50107900d04/networks/End2EndNetwork.lua#L73 中引用。

其中

local function weights_init(m)
   local name = torch.type(m)
   if name:find('Convolution') then
      m.weight:normal(0.0, 0.02)
      m.bias:fill(0)
   elseif name:find('BatchNormalization') then
      if m.weight then m.weight:normal(1.0, 0.02) end
      if m.bias then m.bias:fill(0) end
   end
end
2021-01-06 11:11:34