Lua 如何匹配位于 <head> 标签下的一级标签

我正在尝试获得任何 HTML 响应中位于 head 标签下的所有一级标签。我正在运行 nginx+lua,因此使用 lua 模板匹配的解决方案将非常棒......

目前,我使用 string.sub() 方法提取 head 标签内部的内容,然后迭代嵌套标签将它们逐个添加到表中:

local headOnly = string.sub(wholeHtmlResponse, startHead, endHead)
local tags = {}
for tag in string.gmatch(headOnly, '(<[^<>]*>)') do
    tags[#tags+1]=tag
end

然后我遍历“tags”表,移除所有非一级标签。我只对标签本身感兴趣,不关心其内容或参数。 我们谈论实时请求,我担心如果请求头足够大,这可能会变得非常缓慢。

因此,我有一些相关问题:

  • string.gmatch 是否足够高效?
  • 是否有一种更有效的方法/模块可以完成这个任务?
  • 我应该考虑编写自己的模块吗?

欢迎提供任何意见!

点赞
用户1442917
用户1442917

Is string.gmatch efficient enough?

你可以通过运行符合你使用情况的测试来回答这个问题。普通的答案可能不会帮助你。

有没有更高效的方法/模块来做这个?

也许有,但这还取决于你正在尝试做什么。如果你正在寻找特定的标记,那么搜索该特定标记可能会更快,而不是解析和存储所有标记,然后再进行检查。如果你的条件被早期匹配满足,你也可以更早地中止。

2016-04-27 16:44:03