创建一个递归的 LPeg 模式。

2014-10-1 20:15:51

收藏：0

阅读：94

评论：2

在普通的 PEG（解析表达式语法）中，这是一个有效的语法：

values <- number (comma values)*
number <- [0-9]+
comma  <- ','

然而，如果我尝试使用 LPeg 编写此规则，则该规则的递归性质会失败：

local lpeg   = require'lpeg'

local comma  = lpeg.P(',')
local number = lpeg.R('09')^1
local values = number * (comma * values)^-1
--> bad argument #2 to '?' (lpeg-pattern expected, got nil)

尽管在这个简单的例子中，我可以重写规则以不使用递归，但我有一些现有的语法，我宁愿不重写。

如何在 LPeg 中编写一个自引用规则？

用户258523

使用语法。

使用 Lua 变量，可以逐步定义模式，每个新模式都使用先前定义的模式。然而，这种技术不允许定义递归模式。对于递归模式，我们需要真正的语法。

LPeg 用表表示语法，其中每个条目都是一个规则。

调用 lpeg.V(v) 创建表示语法中带有索引 v 的非终端（或变量）的模式。因为当此函数被评估时，语法尚不存在，所以结果是对相应规则的开放引用。

当一个表被转换为模式（通过调用 lpeg.P 或其中一个模式被期望的标准方法），那么每个由 lpeg.V(v) 创建的开放式引用被更正为引用表中索引为 v 的规则。

当一个表被固定时，结果是匹配其初始规则的模式。在表中，索引 1 的条目定义其初始规则。如果该条目是字符串，则假定它是初始规则的名称。否则，LPeg 假定条目 1 本身是初始规则。

例如，以下语法匹配具有相同数量的 a 和 b 的 a 和 b 字符串：

equalcount = lpeg.P{
  "S";   -- 初始规则名称
  S = "a" * lpeg.V"B" + "b" * lpeg.V"A" + "",
  A = "a" * lpeg.V"S" + "b" * lpeg.V"A" * lpeg.V"A",
  B = "b" * lpeg.V"S" + "a" * lpeg.V"B" * lpeg.V"B",
} * -1

它等同于以下标准 PEG 符号的语法：

   S <- 'a' B / 'b' A / ''
   A <- 'a' S / 'b' A A
   B <- 'b' S / 'a' B B

2014-10-01 20:24:17

用户40691

我知道这是一个晚回答，但是这里有一个如何回溯规则的想法。

local comma  = lpeg.P(',')
local number = lpeg.R('09')^1
local values = lpeg.P{ lpeg.C(number) * (comma * lpeg.V(1))^-1 }

local t = { values:match('1,10,20,301') }

基本上，一个原始语法被传递给 lpeg.P（语法只是一个经过美化的表格），该语法通过数字而不是名称引用第一个规则，即 lpeg.V(1)。

该示例只是在number终端上添加了一个简单的 lpeg.C 捕获，并将所有这些结果收集在本地表t中以供进一步使用。（请注意，没有使用lpeg.Ct，这不是一个大问题，但...这是样例的一部分。）

2016-01-03 20:03:27

评论区的留言会收到邮件通知哦~

作者:

用户405017

技术支撑

Nana 框架
Kong API 网关
Nuxt 服务端渲染

统计信息

会员 0
文章数: 0
话题数: ...