如何将Lua与Mecab绑定?

我想在 Lua 中使用 Mecab,但我真的无法弄清绑定的过程,我正在使用 Windows 7,那么绑定是指创建共享库吗?如果是的话,如何操作?我看到一些关于 Java 的绑定文件,org.chasen.mecab 包中的文件表明它是通过 swig 创建的,这让我很困惑,那么它是从哪来的?还是自己编写的?在进行绑定后,如果我想在 Lua 中使用,还需要做什么?顺便说一下,我使用的是 mingw。有人可以给我一些简单的步骤,让我可以继续尝试解决问题。

对于 greatwolf: 我用以下命令来操作:

swig -lua  -c++ MeCab.i
g++ -c MeCab_wrap.cxx -I C:\Lua\5.1\include -I ..\src
g++ -LC:\Lua\5.1\lib -shared MeCab_wrap.o -llua51  -o MeCab.dll

但是我收到以下错误:

 MeCab_wrap.o:MeCab_wrap.cxx:(.text+0x2960): undefined reference to `_imp___ZN5MeCab12createTaggerEPKc'
 MeCab_wrap.o:MeCab_wrap.cxx:(.text+0x2981): undefined reference to `_imp___ZN5MeCab12getLastErrorEv'
 MeCab_wrap.o:MeCab_wrap.cxx:(.text+0x29c9): undefined reference to `_imp___ZN5MeCab12createTaggerEPKc'
 MeCab_wrap.o:MeCab_wrap.cxx:(.text+0x29d9): undefined reference to `_imp___ZN5MeCab12getLastErrorEv'
 MeCab_wrap.o:MeCab_wrap.cxx:(.text+0x2a8d): undefined reference to `_imp___ZN5MeCab11createModelEPKc'
 MeCab_wrap.o:MeCab_wrap.cxx:(.text+0x2aae): undefined reference to `_imp___ZN5MeCab12getLastErrorEv'
 MeCab_wrap.o:MeCab_wrap.cxx:(.text+0x2af6): undefined reference to `_imp___ZN5MeCab11createModelEPKc'
 MeCab_wrap.o:MeCab_wrap.cxx:(.text+0x2b06): undefined reference to `_imp___ZN5MeCab12getLastErrorEv'
 MeCab_wrap.o:MeCab_wrap.cxx:(.text+0x2b6d): undefined reference to `_imp___ZN5MeCab13createLatticeEv'
 MeCab_wrap.o:MeCab_wrap.cxx:(.text+0x11050): undefined reference to `MeCab::Model::version()'
 MeCab_wrap.o:MeCab_wrap.cxx:(.text+0x11457): undefined reference to `MeCab::Model::create(int, char**)'
 MeCab_wrap.o:MeCab_wrap.cxx:(.text+0x11732): undefined reference to `MeCab::Model::create(char const*)'
 MeCab_wrap.o:MeCab_wrap.cxx:(.text+0x122bf): undefined reference to `MeCab::Tagger::parse(MeCab::Model const&, MeCab::Lattice*)'
 MeCab_wrap.o:MeCab_wrap.cxx:(.text+0x17737): undefined reference to `MeCab::Tagger::create(int, char**)'
 MeCab_wrap.o:MeCab_wrap.cxx:(.text+0x17a12): undefined reference to `MeCab::Tagger::create(char const*)'
 MeCab_wrap.o:MeCab_wrap.cxx:(.text+0x17d83): undefined reference to `MeCab::Tagger::version()'
 collect2: ld returned 1 exit status

似乎这些函数在 mecab.h 中声明,但我不知道如何处理它。

点赞
用户2633423
用户2633423

我不知道是否有适用于 mecab 的 Lua 绑定。首先尝试谷歌一下。

要自己创建绑定,您必须精通 Lua C API 和 C(或C ++)。建议对 Lua 本身(我是指语言)有深入的了解。

Lua WIKI 上搜索一些更多的指针。特别是 BindingCodeToLua 页面。

2013-08-25 14:26:12
用户234175
用户234175

看起来 mecab 提供了一个 swig 文件,用于自动生成绑定。碰巧,Lua 是 swig 支持的目标之一。

一个合理的起点是查看相应的 makefile,了解其他语言的绑定是如何创建的。从 mecab 的 swig makefile 中:

SWIG = swig
PREFIX = MeCab

all: perl ruby python java csharp

# ...

perl:
    $(SWIG) -perl -shadow -c++ $(PREFIX).i
    mv -f $(PREFIX)_wrap.cxx ../perl
    mv -f $(PREFIX).pm ../perl

ruby:
    $(SWIG) -ruby -c++ $(PREFIX).i
    mv -f $(PREFIX)_wrap.cxx ../ruby/$(PREFIX)_wrap.cpp

python:
    $(SWIG) -python -shadow -c++ $(PREFIX).i
    mv -f $(PREFIX)_wrap.cxx ../python
    mv -f $(PREFIX).py ../python

# ...

从上面推导出来,你可以尝试生成类似以下这样的 swig 绑定:

swig -lua -shadow -c++ MeCab.i

这将极大地减少您手动创建绑定的工作量。

2013-08-25 21:55:10
用户355715
用户355715

我最近需要这个功能,但是由于没有找到任何可以使用 Mecab 的 Lua 所写的模块,因此我自己写了一个 module

使用方法如下:

mecab = require "mecab"
parser = mecab:new("") -- 在这里可以传递 mecab 配置选项,如 "-Owakati"

print(parser:parse("我是猫"))

你也可以通过 LuaRocks 安装它,名称为 mecab

它只是提供了 Tagger 类的 parse 方法,但在使用 Mecab 时这就已经足够了。如果您需要其他 Mecab 功能的支持,请随时在 Github 上提出问题。

2017-03-05 13:52:11