在 Lua/Torch 中迭代中文字符串

我有一个在 Lua 中的中文字符串,例如

str = '这是一个中文字符串'-- 英文:'this is a Chinese string'

现在我想要迭代上面的字符串,得到以下结果:

str [1] ='这'
str [2] ='是'
str [3] ='一'
str [4] ='个'
str [5] ='中'
str [6] ='文'
str [7] ='字'
str [8] ='符'
str [9] ='串'

并且输出9作为字符串的长度。

有什么想法吗?

点赞
用户1442917
用户1442917

假如你在使用 Lua 5.3 的 utf8 模块或是 luautf8,使用下面的代码应该可以解决问题:

local str = '这是一个中文字符串'
local tbl = {}
for p, c in utf8.codes(str) do
  table.insert(tbl, utf8.char(c))
end
print(#tbl) -- 输出 9
2016-06-16 04:33:13
用户6336645
用户6336645

我以前没有在lua中使用过非英语字符,我的模拟器会将它们输入为'?',但类似这样的东西可能会起作用:

convert = function ( str )
    local temp = {}
    for c in str:gmatch('.') do
        table.insert(temp, c)
    end
    return temp
end

这是一个简单的函数,利用string.gmatch()将字符串分解为单个字符并将它们保存到表中。它可以像这样使用:

t = convert('abcd'

这将使“t”成为包含a、b、c和d的表。

t [1] = a
t [2] = b
...

我不确定这是否适用于中文字符,但值得一试。

2016-06-16 07:02:05