Lua中处理TSV文件
2019-12-7 9:7:26
收藏:0
阅读:200
评论:2
我有一个非常非常大的TSV文件。第一行是标题。下面的行包含数据,后面跟着制表符或双制表符,如果字段为空,则字段可以包含字母数字或字母数字加标点符号。例如:
Field1 Field2 FieldN
字段可能包含空格、标点符号或字母数字。唯一不变的事情是:
- 每个字段后面都跟着一个制表符,除了最后一个
- 最后一个字段后面跟着一个换行符
- 空白字段用制表符填充。像所有其他字段一样,它们后面跟着一个制表符。这使它们成为双制表符。
我在lua中尝试了许多组合的模式匹配,但从未完全正确。通常是那些带有标点符号(时间和日期字段)的字段让我无法匹配。
我需要保留空白字段(双制表符字段),以使其余字段始终具有相同的索引值。
提前致谢!
点赞
用户12968803
行和列被分开:
local filename = "big_tables.tsv" -- 用制表符分隔的值
-- local filename = "big_tables.csv" -- 用逗号分隔的值
local lines = io.lines(filename) -- 将文件作为行打开
local tables = {} -- 新表,行和列作为tables[n_column][n_row]=value
for line in lines do -- 行迭代器
local i = 1 -- 第一列
for value in (string.gmatch(line, "[^%s]+")) do -- 用制表符分隔的值
-- for value in (string.gmatch(line, '%d[%d.]*')) do -- 用逗号分隔的值
tables[i]=tables[i]or{} -- 如果没有该列则创建新的
tables[i][#tables[i]+1]=tonumber(value) -- 添加行数值
i=i+1 -- 列迭代器
end
end
2021-01-08 11:13:07
评论区的留言会收到邮件通知哦~
推荐文章
- Lua 虚拟机加密load(string.dump(function)) 后执行失败问题如何解决
- 我想创建一个 Nginx 规则,禁止访问
- 如何将两个不同的lua文件合成一个 东西有点长 大佬请耐心看完 我是小白研究几天了都没搞定
- 如何在roblox studio中1:1导入真实世界的地形?
- 求解,lua_resume的第二次调用继续执行协程问题。
- 【上海普陀区】内向猫网络招募【Skynet游戏框架Lua后端程序员】
- SF爱好求教:如何用lua实现游戏内调用数据库函数实现账号密码注册?
- Lua实现网站后台开发
- LUA错误显式返回,社区常见的规约是怎么样的
- lua5.3下载库失败
- 请问如何实现文本框内容和某个网页搜索框内容连接,并把网页输出来的结果反馈到另外一个文本框上
- lua lanes多线程使用
- 一个kv数据库
- openresty 有没有比较轻量的 docker 镜像
- 想问一下,有大佬用过luacurl吗
- 在Lua执行过程中使用Load函数出现问题
- 为什么 neovim 里没有显示一些特殊字符?
- Lua比较两个表的值(不考虑键的顺序)
- 有个lua简单的项目,外包,有意者加微信 liuheng600456详谈,最好在成都
- 如何在 Visual Studio 2022 中运行 Lua 代码?

尝试以下代码:
function test(s) local n=0 s=s..'\t' for w in s:gmatch("(.-)\t") do n=n+1 print(n,"["..w.."]") end end test("10\t20\t30\t\t50") test("100\t200\t300\t\t500\t")它在字符串末尾添加一个制表符,以便所有字段都跟随一个制表符,甚至是最后一个字段。