匹配Lua中的“长字符串”语法

我正在为 Lua 编写 jFlex 词法分析器,但我在设计一个正则表达式来匹配语言规范中的一个特定部分时遇到了问题:

可以使用由长括号括起来的长格式来定义字面字符串。我们将级别为 n 的开头长括号定义为一个开方括号后面跟着 n 个等号,然后再跟一个开方括号。因此,级别为 0 的开头长括号写成 [[, 级别为 1 的开头长括号写成 [=[,以此类推。类似地,关闭长括号也是这样定义的;例如,级别为 4 的关闭长括号写成 ]====]。长字符串以任何级别的开头长括号开头,并在同一级别的第一个关闭长括号处结束。在这种括号形式中的字面值可以跨越多行,不解析任何转义序列,并忽略任何其他级别的长括号。它们可以包含除正确级别的关闭括号外的任何内容。

简而言之,我正在尝试设计一个正则表达式,以匹配一个开头长括号、中间的字符串内容和关闭长括号。只有当开头长括号和关闭长括号有相同数量的等号时,才会发生匹配,等号的数量可以是零或更多。

原文链接 https://stackoverflow.com/questions/1023722

点赞
stackoverflow用户108741
stackoverflow用户108741
\[(=*)\[.*?\]\1\]

\\1 捕获第一个 ()

2009-06-21 12:07:34
stackoverflow用户98687
stackoverflow用户98687
\[ (=*) \[ .*? \] \1 \]

这是一个正则表达式的代码块,意思是匹配以相同数量的等号开头和结尾的中括号中的任何字符,即表示标题的 markdown 语法。

2009-06-21 12:07:59
stackoverflow用户122460
stackoverflow用户122460

嗯,我很抱歉,用正则表达式进行分词这项任务并不够好。正则表达式实际上不够强大。

在 jFlex 中,使用普通的正则表达式来比较“=”符号的数量是不可行的。虽然 Perl 可以通过 #1 来实现这一点,但我们不是在讨论编写 Perl 程序,而是 jFlex 词法分析器。

解决方案是使用 [=*\[ 作为左括号标记,\]=*\] 作为右括号标记,然后在上层(解析器)中比较它们的长度是否相等。

不管怎样,您可以看一下 lua 源代码中的 read_long_string() 函数,在 llex.c 文件中,看看他们是如何不使用正则表达式实现这一点的。**

2009-06-22 05:27:10