优雅的正则表达式多匹配，在单行有限的空间中

2013-11-14 10:26:14

收藏：0

阅读：90

评论：2

我使用mudlet玩一个泥巴游戏，希望使用Perl regex从我的提示中捕获一些输入。问题是如果不过度重复我的搜索，似乎很难做到。我希望能提出一个优雅的解决方案。

这是我的示例提示行：[NESWDNeSeSwNw] [The Palace Square-Bastion] [|Excl] >)|61|(<

我想捕获的是方向列表，每个方向以大写字母开头，可能包含或不包含小写字母（对角线情况下）。有效的大写字母是N E S W U D（基准指标），有效的小写字母仅为e w（对角线指标）。

我试着使用如下内容：^.([NESWUD]{1}[ew]?)+.（点匹配括号，因为括号在mudlet用于触发器的pcre中似乎无法转义）

这个解决方案的问题是它没有捕获所有的方向，贪婪匹配只匹配了最后一个方向"Nw"。如果我将其分解以去除捕获组和贪婪性，只是[NESWUD]{1}[ew]?，它会给我每个大写字母的所有出现，而不仅仅是在我的提示中。

任何帮助将不胜感激。

用户2550045

``` ([NUESWUD][ew]?)(?=[NSEWUDew\]])

这个正则表达式会从[NESWDNeSeSwNw] [The Palace Square-Bastion] [|Excl] >)|61|(< 中匹配到 NESWDNeSeSwNw。

最后面的零宽度正向先行断言 (?=[NSEWUDew\]]) 确保只在指定字符之前匹配，因此不会捕获 Square 中的 S 或 Excl 中的 E。

在http://gskinner.com/RegExr/ 上尝试测试。

2013-11-14 10:41:38

用户1166898

我认为像We和Dw这样的方向没有意义，并且e和w只能在N或S之后。您想要的是像^\[((?:[EWUD]|[NS][ew]?)+)\]这样的东西。这将捕获$1中的所有方向，而不仅仅是最后一个。

为了解释它，我将使用一个更简单的正则表达式:((?:[a-z])+)。([a-z]) +将匹配任何小写拉丁字母的字符串，但每次捕获都会覆盖上一个，只保留最后一个字母（例如，Hello将返回o）。((?:[a-z])+)将匹配并捕获相同的字符串（例如，Hello将在$1中返回ello）。(?:[a-z])防止匹配被捕获，+将匹配尽可能多的内容，然后外部的(和)将该字符串捕获到$1中。

您不需要在正则表达式中使用{1}，因为它总是被隐含地包含在内。

2013-11-28 06:16:55

评论区的留言会收到邮件通知哦~

作者:

用户2605120

技术支撑

Nana 框架
Kong API 网关
Nuxt 服务端渲染

统计信息

会员 0
文章数: 0
话题数: ...