使用LPEG打开和关闭Pandoc Reader中的元素

我正在开发一个简单的Pandoc阅读器,可以处理论坛中使用的一些基本的类似html的语法(例如“[b]粗体[/b]”和“[h1]标题[/h1]”)。

我成功地使用LPEG(如Pandoc文档中所述)创建了一个基本的阅读器,但我选择的解决方案感觉笨拙。是否有更好的方法来定义开始和结束标记的语法(使用优先级或负先行预测或LPEG分组)?

这是我能够使用的内容:

local P,S,R,Cf,Cc,Ct,V,Cs,Cg,Cb,B,C,Cmt =
  lpeg.P,lpeg.S,lpeg.R,lpeg.Cf,lpeg.Cc,lpeg.Ct,lpeg.V,
  lpeg.Cs,lpeg.Cg,lpeg.Cb,lpeg.B,lpeg.C,lpeg.Cmt

local whitespacechar = S(" \t\r\n")
local wordchar = (1 - whitespacechar)
local spacechar = S(" \t")
local newline = P”\r“^-1 * P”\n“
local blanklines = newline * (spacechar^0 * newline)^1
local endline = newline - blanklines
local emph_start = P”[i]“
local emph_end = P”[/i]“
local strong_start = P”[b]“
local strong_end = P”[/b]“
local header_start = P”[h” * (R”17” / tonumber) * “]“
local header_end = P”[/h” * R”17” * “]“
local tag_start = emph_start + strong_start + header_start
local tag_end = emph_end + strong_end + header_end

-- 语法
G = P{ “Pandoc”,
  Pandoc = Ct(V”Block”^0) / pandoc.Pandoc;
  Block = blanklines^0 * (V”Header” + V”Para”) ;
  Para = Ct(V”Inline”^1) / pandoc.Para;
  Inline = V”Emph” + V”Strong” + V”Str” + V”Space” + V”SoftBreak” ;
  Str = (1 - (whitespacechar + tag_end + tag_start))^1 / pandoc.Str;
  Space = spacechar^1 / pandoc.Space;
  SoftBreak = endline / pandoc.SoftBreak;
  Emph = emph_start * Ct(V”Inline”^1) * emph_end / pandoc.Emph;
  Strong = strong_start * Ct(V”Inline”^1) * strong_end / pandoc.Strong;
  Header = header_start * Ct(V”Inline”^1) * header_end / pandoc.Header;
}

function Reader(input)
  return lpeg.match(G, input)
end

这是我想要转换的文本的样本:

[h1]一个测试[/h1]
[i]快速[/i]的狗跳过了懒洋洋的小溪!
标记应该能够在单词[b]中间[/b]应用。

原文链接 https://stackoverflow.com/questions/70661539

点赞