Torch - 使用多线程将张量加载到队列以进行训练
2018-5-8 3:30:42
收藏:0
阅读:64
评论:2
我想使用线程库(或者可能是Parallel库)来将数据加载/预处理到队列中,但我不太确定它是如何工作的。总之;
- 加载数据(张量),预处理张量(这需要时间,因此我在这里),并将它们放入队列中。我希望尽可能多的线程执行此操作,以便模型不会等待或等待时间过长。
- 对于队列顶部的张量,提取它并将其传递到模型中,然后从队列中删除它。
我真的不太理解https://github.com/torch/threads中的示例。如果能给我一个示例或提示,让我知道应该在哪里加载数据到队列并进行训练,那就太好了。
编辑于 14/03/2016
在此示例中" https://github.com/torch/threads/blob/master/test/test-low-level.lua"中,使用低级线程,有谁知道如何将数据从这些线程中提取到主线程中?
点赞
用户2104596
如果Soumith在之前的回答中的示例不太容易使用,我建议您从头开始构建自己的流水线。我在这里提供了两个同步线程的示例:一个用于写入数据,一个用于读取数据:
local t = require 'threads'
t.Threads.serialization('threads.sharedserialize')
local tds = require 'tds'
local dict = tds.Hash() -- 只有本地变量可以在此处工作,只有表或tds.Hash()
dict[1] = torch.zeros(4)
local m1 = t.Mutex()
local m2 = t.Mutex()
local m1id = m1:id()
local m2id = m2:id()
m1:lock()
local pool = t.Threads(
1,
function(threadIdx)
end
)
pool:addjob(
function()
local t = require 'threads'
local m1 = t.Mutex(m1id)
local m2 = t.Mutex(m2id)
while true do
m2:lock()
dict[1] = torch.randn(4)
m1:unlock()
print ('W ===> ')
print(dict[1])
collectgarbage()
collectgarbage()
end
return __threadid
end,
function(id)
end
)
-- 主程序执行的代码:
local a = 1
while true do
m1:lock()
a = dict[1]
m2:unlock()
print('R --> ')
print(a)
end
2016-07-07 12:46:56
评论区的留言会收到邮件通知哦~
推荐文章
- 如何将两个不同的lua文件合成一个 东西有点长 大佬请耐心看完 我是小白研究几天了都没搞定
- 如何在roblox studio中1:1导入真实世界的地形?
- 求解,lua_resume的第二次调用继续执行协程问题。
- 【上海普陀区】内向猫网络招募【Skynet游戏框架Lua后端程序员】
- SF爱好求教:如何用lua实现游戏内调用数据库函数实现账号密码注册?
- Lua实现网站后台开发
- LUA错误显式返回,社区常见的规约是怎么样的
- lua5.3下载库失败
- 请问如何实现文本框内容和某个网页搜索框内容连接,并把网页输出来的结果反馈到另外一个文本框上
- lua lanes多线程使用
- 一个kv数据库
- openresty 有没有比较轻量的 docker 镜像
- 想问一下,有大佬用过luacurl吗
- 在Lua执行过程中使用Load函数出现问题
- 为什么 neovim 里没有显示一些特殊字符?
- Lua比较两个表的值(不考虑键的顺序)
- 有个lua简单的项目,外包,有意者加微信 liuheng600456详谈,最好在成都
- 如何在 Visual Studio 2022 中运行 Lua 代码?
- addEventListener 返回 nil Lua
- Lua中获取用户配置主目录的跨平台方法
看看这个多线程的数据提供程序:
https://github.com/soumith/dcgan.torch/blob/master/data/data.lua
它在线程中运行这个文件:
https://github.com/soumith/dcgan.torch/blob/master/data/data.lua#L18
在这里调用它:
https://github.com/soumith/dcgan.torch/blob/master/data/data.lua#L30-L43
然后,如果你想将任务排入线程队列中,你需要提供两个函数:
https://github.com/soumith/dcgan.torch/blob/master/data/data.lua#L84
第一个函数在线程内部运行,第二个函数在第一个函数完成后在主线程中运行。希望这让你更清楚了解它。