如何在 Lua 文件路径中处理特殊字符(如umlauts)

我有一个小的 Lua 函数来检查一个文件是否存在

function file_exists( filePath )
    local handler = io.open( filePath )
    if handler then
        io.close( handler )
        return true
    end
    return false
end

然而,当文件路径包含像德语 umlauts(äöü)这样的特殊字符时,这将始终返回“false”。有没有什么办法克服这个问题?

谢谢!

点赞
用户936986
用户936986

Lua 和它微小的标准库是平台中立的,不知道读取完整 Unicode 名称的正确 Windows 函数。您可以使用 winapi 模块来获取一些特定于 Windows 的函数处理此任务。请注意,它需要在目标磁盘上启用短名称生成。

local handler = io.open( winapi.short_path(filePath) )
if handler then
    -- etc
end

它也可以通过 LuaRocks 轻松安装: luarocks install winapi

2016-04-19 13:21:19
用户1847592
用户1847592
   function(cp1252_description)
      local unicode_to_1252 = {}
      for code, unicode in cp1252_description:gmatch'\n0x(%x%x)%s+0x(%x+)' do
         unicode_to_1252[tonumber(unicode, 16)] = tonumber(code, 16)
      end
      local undefined = ('?'):byte()
      return
         function (utf8str)
            local pos, result = 1, {}
            while pos <= #utf8str do
               local code, size = utf8str:byte(pos, pos), 1
               if code >= 0xC0 and code < 0xFE then
                  local mask = 64
                  code = code - 128
                  repeat
                     local next_byte = utf8str:byte(pos+size, pos+size) or 0
                     if next_byte >= 0x80 and next_byte < 0xC0 then
                        code, size = (code - mask - 2) * 64 + next_byte, size+1
                     else
                        code, size = utf8str:byte(pos, pos), 1
                     end
                     mask = mask * 32
                  until code < mask
               end
               pos = pos + size
               table.insert(result,
                  string.char(unicode_to_1252[code] or undefined))
            end
            return table.concat(result)
         end
   end
)[[
download
http://www.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/CP1252.TXT
and insert the whole text here:

#
#    Name:     cp1252 to Unicode table
#    Unicode version: 2.0
#    Table version: 2.01
..................................
0xFD    0x00FD  #LATIN SMALL LETTER Y WITH ACUTE
0xFE    0x00FE  #LATIN SMALL LETTER THORN
0xFF    0x00FF  #LATIN SMALL LETTER Y WITH DIAERESIS
]]```

**用法:**

cp1252_filename = utf8_to_cp1252(your_utf8_filename)

```

现在您可以使用cp1252_filename调用标准 Lua 库中的io.open()os.rename()os.execute()和其他函数。

2016-04-20 15:49:41