无法通过 GTX 1060 安装 Torch,尽管已安装 Cuda 8.0 和 nvidia-driver 375

我目前正在尝试在我的 Ubuntu 16.04 机器上安装 Torch。我已经安装了 Cuda 8.0,nvidia-smi 告诉我我正在使用的版本是 375.66。

然而,在尝试运行./install.sh~/torch 文件夹中运行时,我收到以下错误消息:

-- 正在安装:/home/yenicelik/torch/install/lib/luarocks/rocks/optim/1.0.5-0/lua/optim/lbfgs.lua
-- 正在安装:/home/yenicelik/torch/install/lib/luarocks/rocks/optim/1.0.5-0/lua/optim/checkgrad.lua
-- 正在安装:/home/yenicelik/torch/install/lib/luarocks/rocks/optim/1.0.5-0/lua/optim/adamax.lua
-- 正在安装:/home/yenicelik/torch/install/lib/luarocks/rocks/optim/1.0.5-0/lua/optim/ConfusionMatrix.lua
-- 正在安装:/home/yenicelik/torch/install/lib/luarocks/rocks/optim/1.0.5-0/lua/optim/adadelta.lua
-- 正在安装:/home/yenicelik/torch/install/lib/luarocks/rocks/optim/1.0.5-0/lua/optim/rmsprop.lua
-- 正在安装:/home/yenicelik/torch/install/lib/luarocks/rocks/optim/1.0.5-0/lua/optim/doc
-- 正在安装:/home/yenicelik/torch/install/lib/luarocks/rocks/optim/1.0.5-0/lua/optim/doc/logger.md
-- 正在安装:/home/yenicelik/torch/install/lib/luarocks/rocks/optim/1.0.5-0/lua/optim/doc/intro.md
-- 正在安装:/home/yenicelik/torch/install/lib/luarocks/rocks/optim/1.0.5-0/lua/optim/doc/image
-- 正在安装:/home/yenicelik/torch/install/lib/luarocks/rocks/optim/1.0.5-0/lua/optim/doc/image/parameterflattening.svg.png
-- 正在安装:/home/yenicelik/torch/install/lib/luarocks/rocks/optim/1.0.5-0/lua/optim/doc/image/parameterflattening.svg
-- 正在安装:/home/yenicelik/torch/install/lib/luarocks/rocks/optim/1.0.5-0/lua/optim/doc/image/parameterflattening.png
-- 正在安装:/home/yenicelik/torch/install/lib/luarocks/rocks/optim/1.0.5-0/lua/optim/doc/algos.md
-- 正在安装:/home/yenicelik/torch/install/lib/luarocks/rocks/optim/1.0.5-0/lua/optim/doc/logger_plot.png
-- 正在安装:/home/yenicelik/torch/install/lib/luarocks/rocks/optim/1.0.5-0/lua/optim/README.md
正在更新 /home/yenicelik/torch/install/lib/luarocks/rocks 的清单
optim 1.0.5-0 现在已在 /home/yenicelik/torch/install/(许可证:BSD)中构建和安装

在您的机器上找到了 CUDA。 正在安装 CUDA 包
警告:不匹配的变量 LUALIB

jopts=$(getconf _NPROCESSORS_CONF)

echo "正在 $jopts 核心上构建"
cmake -E make_directory build && cd build && cmake .. -DLUALIB= -DLUA_INCDIR=/home/yenicelik/torch/install/include -DCMAKE_CXX_FLAGS=${CMAKE_CXX_FLAGS} -DCMAKE_BUILD_TYPE=Release -DCMAKE_PREFIX_PATH="/home/yenicelik/torch/install/bin/.." -DCMAKE_INSTALL_PREFIX="/home/yenicelik/torch/install/lib/luarocks/rocks/cutorch/scm-1" && make -j$jopts install

在 4 个核心上构建
-- 在 /home/yenicelik/torch/install 中发现了 Torch7
在 /usr/share/cmake-3.5/Modules/FindPackageHandleStandardArgs.cmake: 148 (message) 处出现 CMake 错误:
  找不到 CUDA(缺少:CUDA_CUDART_LIBRARY)(找到适当版本“7.5”,要求的最小版本为“6.5”)
堆栈调用(最近的调用在最前面):
  /usr/share/cmake-3.5/Modules/FindPackageHandleStandardArgs.cmake: 388 (_FPHSA_FAILURE_MESSAGE)
  /home/yenicelik/torch/install/share/cmake/torch/FindCUDA.cmake: 1009(find_package_handle_standard_args)
  CMakeLists.txt: 7(FIND_PACKAGE)

-- 配置不完整,发生错误!
请参见“/home/yenicelik/torch/extra/cutorch/build/CMakeFiles/CMakeOutput.log”。
请参见“/home/yenicelik/torch/extra/cutorch/build/CMakeFiles/CMakeError.log”。

我认为这是一个相当简单的错误,但我不确定为什么会失败。

点赞
用户5957020
用户5957020

答案可能对其他人有帮助。因此,

  • 可能在系统中安装了 libcudart7.5。搜索此类引用。
  • 如果从 /usr/local/cuda-8-0 到 /usr/local/cuda 未进行链接,则建立链接(sudo ln -s from _to_)。
  • 使用 ./clean.sh 文件或者更暴力的方法,销毁 torch 目录并克隆一个新的。引用在错误后不会重新构建。
  • 安装并享受。
2017-10-31 21:31:38
用户7860217
用户7860217

我遇到了完全一样的错误。只要执行以下命令:

sudo rm /usr/bin/nvcc

在/usr/local/cuda-***中手动安装你的CUDA。

2018-12-06 12:24:57