正则表达式(.*?)(.+?)惰性匹配

看了挺多博客,终于弄懂了,现在整理一下:

.         匹配任意除换行符“\n”外的字符
*         匹配前面的字符0次或多次
+        匹配前面的字符1次或多次
?        匹配前面的子表达式零次或一次,或指明一个非贪婪限定符
.*        匹配任意除换行符“\n”外的字符0次或多次
.+       匹配任意除换行符“\n”外的字符1次或多次
.*?    匹配任意除换行符“\n”外的字符0次或多次,但尽可能少重复
.+?   匹配任意除换行符“\n”外的字符0次或多次,但尽可能少重复
此处?的作用就是指明一个非贪婪限定符,什么叫尽可能少重复?简单点说就是匹配最短的符合要求的表达式,下面举出例子:

 re.match(ra.*b, aababa) # 1 

 re.match(ra.*?b, aababa) # 2 

1式没有非贪婪限定符,匹配最长表达式,结果为aabab
2式有非贪婪限定符,尽可能少重复,结果为aab和ab

  re.match(ra.+?b, aababa) # 3  

同理.+?也一样,只是不包括匹配0次的情况,所以3式结果为aab,再比如:

 re.match(rhello.*?world, xxxhelloworldxxhelloxxworld # 4 
4式的结果显而易见:helloworld和helloxxworld

相关推荐