有什么更好的方法编写这个正则表达式,以确保目标字符串至少包含一个点号?

我需要使用正则表达式过滤一个字符串,这个字符串至少包含一个点,并被一个有限字符集包围。

所以我使用了(忽略所有空格):

^[a-z0-9:_-]+ \. [a-z0-9:_-]+$

问题是我需要使用完全相同的正则表达式 [a-z0-9:_-]+ 两次。有没有更好的办法写呢?

点赞
用户114986
用户114986

不,你必须在固定点之前和之后显式重复字符集正则表达式。

2013-09-16 02:40:53
用户633183
用户633183

如果大小写不敏感,取决于使用的语言,您可能可以这么做。

^[\w:-]+ \. [\w:-]+$

\w 匹配 [A-Za-z0-9_]


另一种方法是从字符串构建正则表达式。这是一个 JavaScript 示例:

var chars = '[\\w:-]';
var re    = new RegExp('^' + chars + ' \\. ' + chars + '$');

re;
// => /^[\w:-] \. [\w:-]$/

这个假想的示例并没有节省太多,但是根据您的正则表达式的复杂程度,这样做可以避免重复字符类。此外,在使用字符串构建正则表达式时,请不要忘记\\转义您的斜杠。


如果我正在编写解析器之类的东西,我可能会进一步采取上述示例一步,像这样:

RegExp.build = function(regexen, flags) {
  return new RegExp(regexen.map(function(re) { return re.source }).join(''), flags);
};

var chars = /[\w:-]+/;

RegExp.build([/^/, chars, / \. /, chars, /$/], 'gi');

//=> /^[\w:-]+ \. [\w:-]+$/gi
2013-09-16 02:42:23
用户390913
用户390913

一些编程语言允许将正则表达式存储在变量中,或者从字符串中构建。例如,在 Perl 中可以这样做:

my $re_l = qr/[a-z0-9:_-]+/;
my $re   = qr/^$re_l\.$re_l$/;
2013-09-16 02:45:42
用户787195
用户787195

正向先行断言

/^(?=.*[^.]\.[^.])[a-z0-9:_.-]+$/ - 至少包含一个点,且该点被非点字符所包围

/^(?=^([^.]+\.)+[^.]+$)[a-z0-9:_.-]+$/ - 至少包含一个点,且每个点都被非点字符所包围

2013-09-16 02:59:16
用户372239
用户372239

我不确定 Lua 是否支持这种语法(它在 Perl 中可以使用 PCRE 实现):

^([a-z0-9:_-]+)\.(?1)$

(?1) 模式与用于捕获第一个组(即 \ [a-z0-9:_ -] +)的模式相同。

2013-09-16 09:28:38