Pandoc Lua 过滤器:如何为 Span 元素指定属性

我有一个包含原始 LaTeX 命令的 Markdown 文档。我正在尝试使用 Lua 过滤器 和 Pandoc (2.0.1.1) 将 LaTeX 命令转换为更加便携的形式。特别是,指定文本语言的命令应该被转换为具有 lang 属性的 Span 元素。问题在于我不知道如何将属性传递给 pandoc.Span 构造函数。这是我的过滤器尝试 (filter.lua):

function RawInline(elem)
  if elem.format == "tex" then
    text = string.match(elem.text, "\\textspanish{(.+)}")
    if text then
      contents = {pandoc.Str(text)}
      attrs = pandoc.Attr("",{},{lang = "es-SP"})
      return pandoc.Span(contents, attrs)
    end
  else
    return elem
  end
end

示例用法:

echo '\textspanish{hola}' | pandoc -f markdown -t native --lua-filter=filter.lua

输出结果是 [Para [Span ("",[],[]) [Str "hola"]]],Span 中没有属性。

如果我给 pandoc.Attr 传递名称和/或类,这些都可以通过,例如,attrs = pandoc.Attr("name",{"class"},{lang = "es-SP"}) 会产生 [Para [Span ("name",["class"],[]) [Str "hola"]]]。但是我传递给构造函数的属性从未出现在输出中。将属性传递给 pandoc.Attr 的正确方法是什么?

点赞
用户2425163
用户2425163

背景

在内部,Pandoc 使用两个元素的表来保存键值对。它大致是这样的:

attrs = pandoc.Attr("", {}, {{"lang", "es-SP"}})

当然,这不是一个很好的表示键值对的方式。当前实现的原因有两个:

  1. 它反映了Pandoc的 JSON 输出中键值对(和属性)的编码方式。
  2. 这些键值对有一个固定的顺序。

当我们想要保证属性的顺序在经过过滤器的传递时不会改变时,最后一个部分很重要。Lua 没有规则来确定表中键的顺序:Lua 表 {one = 1, two = 2} 可以被反序列化回 Pandoc 中的属性列表 {one="1" two="2}"{two="2" one="1"}。对于大多数应用程序来说,属性的顺序都不太重要,但我们不能确定。因此,这种不太直观的表示方法。

目前的状态(Pandoc 2.16 及更高版本)

内部表示没有改变,但我们已经改进了 Lua 中 Attr 对象的表示方式,扩展了码化代码,并添加了一个 Lua 元表。因此,属性表现如预期一样。此外,许多用户可能会发现使用类似 HTML 的属性列表比 "identifier,class,attributes" 三元组更直观。现在也支持这种方式:

attr = pandoc.Attr{id='some-id', class="one two", lang='es-SP'}

事实上,完全不需要使用 pandoc.Attr 构造函数,只需传递一个表即可:

  return pandoc.Span(contents, {lang='es-SP'})
2017-11-14 19:35:33