基于docker镜像nvcr.io/nvidia/torch的训练过程比bare metal慢41%

2017-11-9 8:43:42

收藏：0

阅读：91

评论：0

我使用NVidia docker镜像nvcr.io/nvidia/torch来训练DNN。一切正常，除了训练时间比在我的机器上执行时要慢得多（+41%）。批量执行需要大约410ms，而在bare metal上只需要290ms。

我的nvidia-docker运行命令：

nvidia-docker run -it --network=host --ipc=host -v /mnt/data1:/mnt/data1 my-custom-image bash

my-custom-image基于nvcr.io/nvidia/torch，在此仅添加了我的训练脚本（.lua）并安装了luajit。所有结果都写入/mnt/data1，而不是容器本身。

这是正常的还是我做错了什么？我该如何调查浪费时间的原因？

更新：我仔细检查了，发现在训练过程中容器内部没有任何数据被写入。所有数据都写在/mnt/data1下。

更新2：我在容器内尝试推断过程，发现与bare metal设置一样不需要更多时间。

点赞

评论区的留言会收到邮件通知哦~

作者:

用户2254364

用户2254364

社区规范

了解社区行为准则，共建良好氛围

发文指南

如何撰写高质量的技术文章

社区文章

开源项目 & 应用

🎮 游戏开发

World of Warcraft

UI 插件和宏的脚本语言

Roblox

在线创作平台 (Luau)

Defold

轻量级 2D 游戏引擎

LÖVE 2D

2D 游戏开发框架

🌐 高性能网络与 Web 服务

OpenResty

高性能 Web 应用平台

Kong

云原生 API 网关

Redis

高性能键值数据库

Nmap

网络安全扫描扩展 (NSE)

LuaJIT

高性能 JIT 编译器

Wapiti

Web 应用漏洞扫描

Wireshark

网络协议分析

⚙️ 嵌入式系统与应用工具

LuatOS

运行在嵌入式设备的 Lua

TeX Live

强大的排版系统脚本

Awesome WM

窗口管理器

Vim/Neovim

文本编辑器

FFmpeg

多媒体处理

🧠 人工智能与科学计算

Torch

机器学习框架

SciLua

科学计算库

关于 Lua 社区

Lua 社区为开发者提供学习交流的平台，内容板块为 Lua 开发，Openresty 开发，逆向分析开发，游戏逆向等

社区共建

欢迎提 PR 增加社区能力

任何意见和反馈都是我们前进的基石 WeChat QR

WeChat QR

社区使用指南

文档撰写指南

社区赞助商

空位以待
有意向可以联系站长

统计信息

会员 0
文章数: 0
话题数: ...

Designed by Horan and Amazing

陕ICP备16002741号