返回 pandoc 过滤器中 el.content 的文本字符串

使用 pandoc 过滤器时,我只想要得到 el.content 的文本,但它返回一个表格!

以下是.md文件(仅用于调试):

[It's so easy!]{color="red"}. 今天是星期一。

我想要输出字符串 It's so easy!。所以,我编写了如下代码:

function Span(el)
  color = el.attributes['color']
  strTxt = el.content
  print(strTxt)
end

但是,这不是正确的答案!使用 el.text 同样不行!

点赞
用户2858170
用户2858170

所以我之前从未使用过 Pandoc,如果有什么不对之处请见谅。

我安装了 Pandoc,我创建了一个与你一样的 filter.lua

function Span(el)
  print(el.content)
end

我创建了一个包含你的内容的 test.md

[It's so easy!]{color="red"}. Today is Monday.

然后我运行了 pandoc --lua-filter=filter.lua -f markdown test.md

它输出了

table: 00000000078ba480
<p><span color="red">It’s so easy!</span>. Today is Monday.</p>

那个 ' 怎么了...

于是我查看了那个表格

function Span(el)
  for k,v in pairs(el.content) do print(k,v) end
end

它输出了

1       table: 0000000007874e90
2       table: 0000000007875010
3       table: 0000000007875050
4       table: 0000000007875090
5       table: 0000000007876190
<p><span color="red">It’s so easy!</span>. Today is Monday.</p>

那一定是手册中提到的 Inline 对象的列表。

让我们来看看内部内容!

function Span(el)
  for i, tbl in ipairs(el.content) do
    print(string.format("Table #%d contains: ", i))
    for k, v in pairs(tbl) do
      print(k,v)
    end
  end
end

它输出了

Table #1 contains:
text    It’s
Table #2 contains:
Table #3 contains:
text    so
Table #4 contains:
Table #5 contains:
text    easy!
<p><span color="red">It’s so easy!</span>. Today is Monday.</p>

所以那个表格中的表格很可能是一些 Inline 对象,并且它们有一个文本属性,其中含有你要查找的文字。

你看,使用一些循环和打印来检查神秘的表格非常简单。

2021-01-28 16:35:18
用户2425163
用户2425163

模块pandoc.utils包含一个函数stringify,它将一个元素转换为一个列表:

function Span(el)
  print(pandoc.utils.stringify(el))
end

这将打印It’s so easy!(请注意pandoc智能处理撇号的效果:一个关闭的花括号替换了直撇号')。

有关如何使用它们的更多信息,请参阅Lua过滤器文档

2021-01-28 18:58:10
用户10215301
用户10215301

下面的lua过滤器将以md样式标记为[It's so **easy**!]{color="red"}的文本着色以及普通文本。最初的想法是通过名称和RGB十六进制来指定字体颜色(例如[It's so **easy**!]{color="#5588FF"}),并且该想法的实现并不是我的,而是在此处进行了修改以便我们还可以将过滤器应用于创建revealjsbeamer幻灯片。

Span = function(span)
  color = span.attributes['color']
  -- 如果没有 color 属性,返回未更改的结果
  if color == nil then return span end

  -- 转换为 <span style="color: red;"></span>
  if FORMAT:match 'html' or FORMAT:match 'revealjs' then
    -- 清除 color 属性
    span.attributes['color'] = nil
    -- 改用 style 属性
    span.attributes['style'] = 'color: ' .. color .. ';'
    -- 返回完整的 span 元素
    return span
  elseif FORMAT:match 'latex' or FORMAT:match 'beamer' then
    -- 清除 color 属性
    span.attributes['color'] = nil
    -- 将其封装在LaTeX代码中
    if string.sub(color, 1, 1) == "#" and #color == 7 then
      -- TODO:需要xcolor
      local R = tostring(tonumber(string.sub(color, 2, 3), 16))
      local G = tostring(tonumber(string.sub(color, 4, 5), 16))
      local B = tostring(tonumber(string.sub(color, 6, 7), 16))
      table.insert(
        span.content, 1,
        pandoc.RawInline('latex', '\\textcolor[RGB]{'..R..','..G..','..B..'}{')
      )
    elseif string.sub(color, 1, 1) == "#" and #color == 4 then
      -- TODO:需要xcolor
      local R = tostring(tonumber(string.sub(color, 2, 2), 16) * 0x11)
      local G = tostring(tonumber(string.sub(color, 3, 3), 16) * 0x11)
      local B = tostring(tonumber(string.sub(color, 4, 4), 16) * 0x11)
      table.insert(
        span.content, 1,
        pandoc.RawInline('latex', '\\textcolor[RGB]{'..R..','..G..','..B..'}{')
      )
    else
      table.insert(
        span.content, 1,
        pandoc.RawInline('latex', '\\textcolor{'..color..'}{')
      )
    end
    table.insert(
      span.content,
      pandoc.RawInline('latex', '}')
    )
    -- 仅返回 span 内容
    return span.content
  else
    -- 对于其他格式返回未更改的内容
    return span
  end
end
2022-07-02 09:29:07