检测 Pandoc 中的 docx 分页

2020-10-27 10:21:15

收藏：0

阅读：173

评论：0

有很多关于如何将分页输出到 .docx 文件的 Pandoc 答案，但是当从 .docx 读取时，是否有任何方法可以检测页面分页？

我知道 Pandoc 的 AST 不支持分页的概念，但我一直希望能够使用例如 RawBlock 的 Lua 过滤器：

function RawBlock (el)
  return pandoc.Str "PAGE BREAK"
end

return {
  {RawBlock = RawBlock}
}

但是，这行不通（可能是因为分页被简单地忽略了，而不是被转换成 RawBlock？）

我唯一能想到的解决方案是使用 XML 解析器预处理 .docx 文件，并将所有 \u003cw:br w:type ="page"/\u003e 实例替换为一个魔术字符串，然后我们可以检测到它，但是使用单独的 XML 解析器有点不符合使用 Pandoc 的初衷。

点赞

评论区的留言会收到邮件通知哦~

作者:

用户4003671

用户4003671

社区规范

了解社区行为准则，共建良好氛围

发文指南

如何撰写高质量的技术文章

社区文章

开源项目 & 应用

🎮 游戏开发

World of Warcraft

UI 插件和宏的脚本语言

Roblox

在线创作平台 (Luau)

Defold

轻量级 2D 游戏引擎

LÖVE 2D

2D 游戏开发框架

🌐 高性能网络与 Web 服务

OpenResty

高性能 Web 应用平台

Kong

云原生 API 网关

Redis

高性能键值数据库

Nmap

网络安全扫描扩展 (NSE)

LuaJIT

高性能 JIT 编译器

Wapiti

Web 应用漏洞扫描

Wireshark

网络协议分析

⚙️ 嵌入式系统与应用工具

LuatOS

运行在嵌入式设备的 Lua

TeX Live

强大的排版系统脚本

Awesome WM

窗口管理器

Vim/Neovim

文本编辑器

FFmpeg

多媒体处理

🧠 人工智能与科学计算

Torch

机器学习框架

SciLua

科学计算库

关于 Lua 社区

Lua 社区为开发者提供学习交流的平台，内容板块为 Lua 开发，Openresty 开发，逆向分析开发，游戏逆向等

社区共建

欢迎提 PR 增加社区能力

任何意见和反馈都是我们前进的基石 WeChat QR

WeChat QR

社区使用指南

文档撰写指南

社区赞助商

空位以待
有意向可以联系站长

统计信息

会员 0
文章数: 0
话题数: ...

Designed by Horan and Amazing

陕ICP备16002741号