优雅的正则表达式多匹配,在单行有限的空间中

我使用mudlet玩一个泥巴游戏,希望使用Perl regex从我的提示中捕获一些输入。问题是如果不过度重复我的搜索,似乎很难做到。我希望能提出一个优雅的解决方案。

这是我的示例提示行:[NESWDNeSeSwNw] [The Palace Square-Bastion] [|Excl] >)|61|(<

我想捕获的是方向列表,每个方向以大写字母开头,可能包含或不包含小写字母(对角线情况下)。有效的大写字母是N E S W U D(基准指标),有效的小写字母仅为e w(对角线指标)。

我试着使用如下内容:^.([NESWUD]{1}[ew]?)+.(点匹配括号,因为括号在mudlet用于触发器的pcre中似乎无法转义)

这个解决方案的问题是它没有捕获所有的方向,贪婪匹配只匹配了最后一个方向"Nw"。如果我将其分解以去除捕获组和贪婪性,只是[NESWUD]{1}[ew]?,它会给我每个大写字母的所有出现,而不仅仅是在我的提示中。

任何帮助将不胜感激。

点赞
用户2550045
用户2550045

``` ([NUESWUD][ew]?)(?=[NSEWUDew\]])

这个正则表达式会从[NESWDNeSeSwNw] [The Palace Square-Bastion] [|Excl] >)|61|(< 中匹配到 NESWDNeSeSwNw

最后面的零宽度正向先行断言 (?=[NSEWUDew\]]) 确保只在指定字符之前匹配,因此不会捕获 Square 中的 SExcl 中的 E

http://gskinner.com/RegExr/ 上尝试测试。

2013-11-14 10:41:38
用户1166898
用户1166898

我认为像WeDw这样的方向没有意义,并且ew只能在NS之后。您想要的是像^\[((?:[EWUD]|[NS][ew]?)+)\]这样的东西。这将捕获$1中的所有方向,而不仅仅是最后一个。

为了解释它,我将使用一个更简单的正则表达式:((?:[a-z])+)([a-z]) +将匹配任何小写拉丁字母的字符串,但每次捕获都会覆盖上一个,只保留最后一个字母(例如,Hello将返回o)。((?:[a-z])+)将匹配并捕获相同的字符串(例如,Hello将在$1中返回ello)。(?:[a-z])防止匹配被捕获,+将匹配尽可能多的内容,然后外部的()将该字符串捕获到$1中。

您不需要在正则表达式中使用{1},因为它总是被隐含地包含在内。

2013-11-28 06:16:55