Lua 和 Torch 在 GPU 上的问题

我正在尝试从 OpenNMT 运行基于 Lua 的程序。我已经按照这里的步骤进行了操作:http://forum.opennmt.net/t/text-summarization-on-gigaword-and-rouge-scoring/85

我使用了以下命令:

 th train.lua -data textsum-train.t7 -save_model textsum1 -gpuid 0 1 2 3 4 5 6 7

我使用了 8 个 GPU,但是进程速度极慢,好像是在使用 CPU 运行。请问有什么方法可以优化 GPU 的使用吗?

这是 GPU 使用情况的统计数据:

GPUSTATS

请问该如何让进程完全利用 GPU 运行,以使进程运行更快。我有 11GB 的空闲内存,但进程只使用了 2 GB 或更少,所以进程速度极慢。

点赞
用户3832970
用户3832970

根据OpenNMT文档,你需要从gpuid选项中去除0,因为0代表CPU,这样实际上会将训练速度降低到与CPU相同的速度。

要使用数据并行性,请将GPU标识符列表分配给-gpuid选项。例如:

th train.lua -data data/demo-train.t7 -save_model demo -gpuid 1 2 4

将使用由CUDA API返回的机器的第一个、第二个和第四个GPU。

2018-07-06 10:43:16