Python 中由 Lua 访问 sharedmem

我必须反复地将一个大数组从 Lua 移动到 Python 中。目前,我将 Lua 代码作为 Python 的子进程运行,并从其 stdout 中读取数组。这比我想象的要慢得多,瓶颈似乎几乎完全是 Python 的 p.stdout.read([byte size of array]) 调用,因为单独运行 Lua 代码要快得多。

据我所知,改进管道的唯一方法是使用共享内存,但这几乎总是讨论在不同的 Python 进程之间进行多进程处理,而不是在 Python 和子进程之间进行处理。

有没有一种合理的方法在 Python 和 Lua 之间共享内存?相关的答案已经建议使用直接调用shm_open,但如果存在预构建的模块/包,我宁愿使用它们。

点赞
用户8379597
用户8379597

在考虑使用共享内存之前,我建议进行一些剖析实验,以确定时间消耗在哪里。

如果您的实验证明,您在进程之间序列化/反序列化数据的时间太长,则可以使用共享内存,以及像[Cap'n Proto](https://capnproto.org/)这样设计用于避免这种成本的格式可能是一个很好的解决方案。

快速搜索可以找到这两个库:

  • lua-capnproto
    • Lua-capnp是一个基于luajit的capnproto的纯lua实现。
  • pycapnp
    • 这是Cap啤酒的C++实现的Python包装。

但绝对要先进行分析。

还有没有[lupa](https://pypi.python.org/pypi/lupa/)适合您的原因?

2017-10-21 03:30:19
用户8809171
用户8809171

以下是使用 Lua 中的 Torch 和 Python 中的 NumPy 找到的解决方案。使用 lupa 将 Lua 代码从 Python 中运行。

main.lua 中:

require 'torch'

data_array = torch.FloatTensor(256, 256)

function write_data()
    return tonumber(torch.data(data_array:contiguous(), true))
}

从 Python 中调用:

import ctypes
import lupa
import numpy as np

data_shape = (256, 256)

lua = lupa.LuaRuntime()
with open('main.lua') as f: lua.execute(f.read())
data_array = np.ctypeslib.as_array(ctypes.cast(ctypes.c_void_p(lua.globals().write_data()), ctypes.POINTER(ctypes.c_float)), shape=data_shape)

data_array 被构建成指向 Torch 张量存储的指针。

2017-10-22 18:56:07