我想使用 HPC 的 GPU 并尝试添加 CUDA 模块... 但是出现错误。错误消息是:

Lmod 检测到以下错误:无法加载模块,因为在评估模块文件时出错:
/trinity/shared/easybuild/modules/all/CUDA/11.1.1-GCC-10.2.0.lua:文件为空或不存在
请检查模块文件,尤其是是否有上面消息中指定的行号
处理以下模块时发生错误:
    模块全名            模块文件名
    ---------------         ---------------
    CUDA/11.1.1-GCC-10.2.0  /trinity/shared/easybuild/modules/all/CUDA/11.1.1-GCC-10.2.0.lua

这个错误很困扰人。我输入了 rm –rf ~/.lmod.d/.cache 但是它不起作用。该如何解决呢?

点赞
用户15199730
用户15199730

你可以执行 cat /trinity/shared/easybuild/modules/all/CUDA/11.1.1-GCC-10.2.0.lua 命令吗? 也许你的 modulefile 不存在。

如果 modulefile 不存在: 通常可以使用 luatcl 文件编写 modulefile。尝试编写如下的文件!

#%Module

set s /usr/local/cuda-11.1

prepend-path PATH $s/bin
prepend-path LIBRARY_PATH $s/lib
prepend-path LD_LIBRARY_PATH $s/lib
prepend-path LIBRARY_PATH $s/lib64
prepend-path LD_LIBRARY_PATH $s/lib64
prepend-path CPATH $s/include
prepend-path INCLUDE $s/include
2021-05-13 18:18:08