修复Lua中的糟糕的XML

我有一个 Lua 程序,正在从外部设备获取数据。该设备返回格式不正确的 XML,如下所示:

<element attribute1="value1" attribute2="value2" attribute3=" m "value3" " attribute4="value4" />

特别是有些字段是用户可编辑的,理论上可能包含应该转义但没有转义的项目。希望我可以解决生成这些消息的代码,但在此之前,我需要一个解决方法来尝试“做正确的事™”。这些消息似乎以固定的格式出现,属性始终按相同的顺序出现,而且始终存在(据我所知),因此我可以使用非常严格的模式匹配,例如:

string.match(str, 'attribute1="(.*)" attribute2="(.*)" attribute3="(.*)" attribute4="(.*)")

但这似乎非常丑陋,并且如果他们决定更改格式(而不修复问题),它当然会出错。

还有其他替代解决方案的建议吗?我主要关心需要将“转换为 "”的“的。其他 XML 实体我并不太担心。

原文链接 https://stackoverflow.com/questions/1046563

点赞
stackoverflow用户51717
stackoverflow用户51717

不幸的是,如果 XML 格式错误,您无法找到在绝对每种情况下都可行的方法。

我会先尝试解析它作为普通的 XML,如果失败了,再回到您的正则表达式方法。这样,当 XML 的生产者被修正时,您的代码将自动开始执行正确操作。

2009-06-25 22:51:57