小开

最佳答案

例子

给定字符串foobarbarfoo:

bar(?=bar)     finds the 1st bar ("bar" which has "bar" after it)
bar(?!bar)     finds the 2nd bar ("bar" which does not have "bar" after it)
(?<=foo)bar    finds the 1st bar ("bar" which has "foo" before it)
(?<!foo)bar    finds the 2nd bar ("bar" which does not have "foo" before it)

你也可以将它们组合起来:

(?<=foo)bar(?=bar)    finds the 1st bar ("bar" with "foo" before it and "bar" after it)

定义

向前看积极`(?=)`

在表达式B后面找到表达式A:

A(?=B)

向前看- `(?!)`

找到表达式A，其中表达式B不跟在后面:

A(?!B)

看看后面积极的`(?<=)`

在表达式B之前找到表达式A:

(?<=B)A

看看负`(?<!)`后面

找到表达式A，其中表达式B不在前面:

(?<!B)A

原子群`(?>)`

原子组退出一个组，并在组内的第一个匹配模式之后丢弃替代模式(回溯被禁用)。

应用于foots的(?>foo|foot)s将匹配它的第一个替代foo，然后失败，因为s没有立即跟随，并在回溯被禁用时停止

非原子组将允许回溯;如果后续的匹配失败，它将返回并使用替代模式，直到找到整个表达式的匹配或用尽所有可能性。

(foo|foot)s应用于foots将:
1. 匹配它的第一个替代foo，然后失败，因为s没有立即跟随在foots中，并返回到它的第二个替代;
2. 匹配它的第二个替代foot，然后成功，因为s紧跟在foots之后，并停止。

一些资源

在线测试人员

https://regex101.com

小开

查找是零宽度断言。它们检查正则表达式(朝着当前位置的右边或左边——基于前面或后面)，当找到匹配时成功或失败(基于它是正的还是负的)，并丢弃匹配的部分。它们不消耗任何字符-对它们后面的正则表达式的匹配(如果有的话)将从相同的光标位置开始。

更多细节请阅读regular-expression.info。

积极的超前:

语法:

(?=REGEX_1)REGEX_2

仅当REGEX_1匹配时才匹配;匹配REGEX_1后，丢弃匹配，从同一位置开始查找REGEX_2。

例子:

(?=[a-z0-9]{4}$)[a-z]{1,2}[0-9]{2,3}

REGEX_1是[a-z0-9]{4}$，它匹配四个字母数字字符，后跟行尾 REGEX_2是[a-z]{1,2}[0-9]{2,3}，它匹配一个或两个字母后面跟着两个或三个数字

REGEX_1确保字符串的长度确实为4，但不消耗任何字符，以便从同一位置开始搜索REGEX_2。现在REGEX_2确保字符串匹配其他一些规则。如果没有前瞻，它将匹配长度为3或5的字符串。

消极的超前

语法:

(?!REGEX_1)REGEX_2

仅当REGEX_1不匹配时匹配;在检查了REGEX_1之后，从同一位置开始搜索REGEX_2。

例子:

(?!.*\bFWORD\b)\w{10,30}$

前瞻部分检查字符串中的FWORD，如果找到它则失败。如果没有找到FWORD，则向前查找成功，下面的部分验证字符串的长度在10到30之间，并且只包含单词字符a-zA-Z0-9_

向后查找与向前查找类似:它只查看当前光标位置的后面。一些正则表达式风格(如javascript)不支持向后查找断言。而且大多数支持它的版本(PHP, Python等)都要求后面的查看部分有固定的长度。

一旦一个令牌匹配，原子组基本上会丢弃/忘记组中的后续令牌。检查本页原子组的例子

小开

Grokking迅速环顾四周如何区分前瞻和后瞻? 和我一起游览2分钟:

(?=) - positive lookahead
(?<=) - positive lookbehind

假设

    A  B  C #in a line

现在，我们问B，你在哪里?< br > B有两个解来声明它的位置:

第一，B有A在前面，C被绑定
二，B在C的前面和a的后面。

我们可以看到，前面和后面的两个解是相反的正则表达式是解决方案二。< / p >

小开

为什么?假设你在玩字谜游戏，你输入了“蚂蚁”。(是的，三个字母的单词，这只是一个例子-冷静)

答案返回为空白，黄色，绿色，并且您有一个三字母单词的列表，您希望使用正则表达式来搜索?你会怎么做?

首先，你可以从第三个位置的t开始:

[a-z]{2}t

我们可以通过注意没有a来改进

[b-z]{2}t

我们可以进一步改进，说搜索中必须有n。

(?=.*n)[b-z]{2}t

或者把它分解;

(?=.*n) -向前看，并检查匹配中有n，它可能有0个或多个字符在n之前

[b-z]{2} -前两个位置除“a”外的两个字母;

T，字面上的T在第三个位置

小开

我曾经回头寻找模式，并向前看，以寻找表丢失与(nolock)

expression="(?<=DB\.dbo\.)\w+\s+\w+\s+(?!with\(nolock\))"


matches=re.findall(expression,sql)
for match in matches:
print(match)

正则表达式前视、后视和原子组

例子

定义

向前看积极(?=)

向前看- (?!)

看看后面积极的(?<=)

看看负(?<!)后面

原子群(?>)