如何在Lua中将Windows-1256转换为UTF-8?
2013-5-18 12:28:30
收藏:0
阅读:197
评论:3
我需要将 Windows-1256 编码的阿拉伯文本转换成 UTF-8,有什么方法可以做到吗?谢谢。
点赞
用户1847592
local win2utf_list = [[
0x00 0x0000 #NULL
0x01 0x0001 #START OF HEADING
0x02 0x0002 #START OF TEXT
-- 从http://www.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/CP1256.TXT下载完整的文本
0xFD 0x200E #从左到右标记
0xFE 0x200F #从右到左标记
0xFF 0x06D2 #阿拉伯文字母 YEH BARREE
]]
local win2utf = {}
-- 将 win2utf_list 中的字符转为 utf8 编码
for w, u in win2utf_list:gmatch'0x(%x%x)%s+0x(%x+)' do
local c, t, h = tonumber(u,16), {}, 128
while c >= h do
t[#t+1] = 128 + c%64
c = math.floor(c/64)
h = h > 32 and 32 or h/2
end
t[#t+1] = 256 - 2*h + c
win2utf[w.char(tonumber(w,16))] =
w.char((table.unpack or unpack)(t)):reverse()
end
-- 将 win_string 转为 utf8 编码
local function convert_to_utf8(win_string)
return win_string:gsub('.', win2utf)
end
2013-05-18 18:47:23
用户8301479
通常需要使用映射表,将一种代码页(字符集)转换为另一种。
例如:http://www.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/CP1256.TXT,将 CP1256 转换为 Unicode。
然后从 Unicode 转换为 Utf8(使用编码/解码方法在 Unicode 和 UTF-8 之间工作,无需一个大的映射表)。
注:保留原本的 markdown 格式。
2020-11-17 17:22:58
评论区的留言会收到邮件通知哦~
推荐文章
- 如何将两个不同的lua文件合成一个 东西有点长 大佬请耐心看完 我是小白研究几天了都没搞定
- 如何在roblox studio中1:1导入真实世界的地形?
- 求解,lua_resume的第二次调用继续执行协程问题。
- 【上海普陀区】内向猫网络招募【Skynet游戏框架Lua后端程序员】
- SF爱好求教:如何用lua实现游戏内调用数据库函数实现账号密码注册?
- Lua实现网站后台开发
- LUA错误显式返回,社区常见的规约是怎么样的
- lua5.3下载库失败
- 请问如何实现文本框内容和某个网页搜索框内容连接,并把网页输出来的结果反馈到另外一个文本框上
- lua lanes多线程使用
- 一个kv数据库
- openresty 有没有比较轻量的 docker 镜像
- 想问一下,有大佬用过luacurl吗
- 在Lua执行过程中使用Load函数出现问题
- 为什么 neovim 里没有显示一些特殊字符?
- Lua比较两个表的值(不考虑键的顺序)
- 有个lua简单的项目,外包,有意者加微信 liuheng600456详谈,最好在成都
- 如何在 Visual Studio 2022 中运行 Lua 代码?
- addEventListener 返回 nil Lua
- Lua中获取用户配置主目录的跨平台方法
尝试使用 lua-iconv,它将 iconv 绑定到 Lua 中。