通用正则表达式学习的总结
正则表达式学习总结在网上已经不少了,不过这种笔记多多益善,多看看总是能增进些记忆。下面这个正则表达式学习笔记,希望对大家有所帮助。
\d = [0-9] 表示0-9的任意一个数字
\D = [^0-9] 表示除数字之外的任意字符
\w = [0-9a-zA-Z] 表示数字或字母
\W = [^0-9a-zA-Z] 表示除数字或字母外的任意字符
\s 匹配空白字符(回车、换行、制表、空格)
\S 非空白字符
.能匹配所有字符,除换行符\n(但在如下的模式匹配中将可以匹配\n)
\.和[.]匹配点号本身
* 0-无穷
+ 1-无穷
? 0-1次
之前的字符可用括号来表示字符数组的多次,如:(ac)+表示出现一个及以上的ac字符串
{min,max} min-max次 \d{1,3} 匹配1-3个数字
{min,} min-无穷次 \d{1,} 匹配一个及以上的数字
{number} 只能是number次 \d{3} 匹配3个数字
多选:
(...|...)在竖线两端添加各个字符串表示多选 (ac|ab) 匹配ac或ab
捕获分组:
1、只要使用了括号就存在捕获分组
2、编号按从左至右
3、获取到的值是匹配的最后一个字符串
(?:..)不捕获文本,不是所有语言都支持,不推荐使用
反向引用:
\1 引用括号内出现的内容,数字为括号编号 (ac)\1 匹配acac
锚点:
\b 单词分解符锚点、一侧是单词字符,另一侧是非单子字符
单词字符通常是指英文字符、数字字符,对中文不适用
非单词字符通常是指各种标点复和空白字符
^匹配一行的的开头(有可能变化)
$匹配一行的末尾(有可能变化)
\A匹配整个字符串的开头
\Z匹配整个字符串的末尾
环视:
(?=...) 肯定顺序环视 右侧文本能由此表达式匹配
(?!...) 否定顺序环视 右侧文本不能由此表达式匹配
(?<=...) 肯定逆序环视 左侧文本能由此表达式匹配
注意:
1、环视结构仅用于布尔判断,结构内的子表达式所匹配的文本,不会保存在整个表达式的匹配结果之中
2、逆序环视结构对子表达式存在限制:
Perl、Python:子表达式必须为固定长度
PHP、Java:子表达式
可以不定长度,但必须有上限
.NET:没有任何限制
匹配模式:
I:不区分大小写 Pattern.CASE_INSENSITIVE
S:.可以匹配任何字符 Pattern.DOTALL
M:^$可以匹配字符串中任意起始位置和结束位置 Pattern.MULTILINE
X:可以添加注释(注释以#开头以换行符结束或到表示末尾,此模式会忽略表达式中的所有空白字符) Pattern.COMMENTS
使用多个模式时用|来分隔