在GPU上运行torch预测模型时出错

我一直在尝试使用一个特定的预训练机器学习模型来为图片加上标题。我一直在使用https://github.com/unnonouno/densecap 。它附带了一个Dockerfile设置整个cuda/torch/cudnn环境。通过运行 'run_model.lua' 脚本可以对新图片进行预测。当通过传递'-gpu -1'在CPU上运行它时,它确实可以工作,但是当在GPU上去掉参数并运行它时,我会得到以下错误:

THCudaCheck FAIL file=/tmp/luarocks_cutorch-scm-1-8398/cutorch/lib/THC/THCGeneral.c line=70 error=35 : CUDA driver version is insufficient for CUDA runtime version
/root/torch/install/bin/luajit:
/root/torch/install/share/lua/5.1/trepl/init.lua:389: loop or previous error loading module 'cutorch'
stack traceback:
    [C]: in function 'error'
    /root/torch/install/share/lua/5.1/trepl/init.lua:389: in function 'require'
    ./densecap/utils.lua:26: in function 'setup_gpus'
    run_model.lua:145: in main chunk
    [C]: in function 'dofile'
    /root/torch/install/lib/luarocks/rocks/trepl/scm-1/bin/th:150: in main chunk
    [C]: at 0x00406670

我尝试了不同的方法,如通过运行'luarocks install cudnn'重新安装'cudnn',或从'cudnn5'降级到'cudnn4',但都没有成功。

点赞
用户4403144
用户4403144

问题似乎出在你的CUDA驱动程序上:

CUDA驱动程序版本不足以支持CUDA运行时版本

可以参考这里找到类似的讨论。

无需更改你的cuDNN版本。你只需要纠正你的CUDA驱动程序/工具包兼容性即可。

2018-06-28 23:47:41