re正则表达式
二:多个字符匹配规则:返回以列表的形式,同时定义多个规则可使用”|“
1. “abc"匹配abc这个字符串
re1 = r"abc"
re.findall(re1, "字符串")
2. {m}:表示匹配一个字符m次,"\d{7}"
3. {m,}:表示匹配一个字符至少m次,"\d{7,}"
4. {m,n},表示一个字符出现m到n次。默认开启贪婪模式。可使用”?"关闭
5.* 表示前一个字符出现0次以上,包括0次。
6. +表示1次以上,包括一次
三:边界。
1.^:匹配字符串开头。^python
2. $:匹配字符串结尾
3.\b, 单词边界(字母,数字,下划线)
4. \B, 匹配非单词边界。
四:匹配分组:(),在匹配的数据中提取数据
1. re = r"aa(\d{3})bb"
res = re.findall(re,"gg123aa123bbhshfaa567bb")
re函数。
findall:查找所有符合规则的字符串。返回列表的形式
search: 查找第一个符合规则的字符串,返回的是匹配对象(span(),字符串所在的位置。)使用group()将找到的数据提取出来,不会往后面继续找。如找不到,返回None
group():,若不传参数,则全部匹配,若传参数,则获取该参数分组里面的内容 (1).(2).....
match(): 从字符串的开头位置进行匹配,找到符合规则的,返回出来的匹配对象
如果开头的位置不符合规范,则不会往后面去找,直接返回None.
替换,sub(par1,par2,par3,(par4)),par1, 需要替换的字符串,par2:替换新字符串,par3:原始字符串, par4:非必填参数(默认替换所有符合规则的字符串),指定最多替换的次数。