JS正则表达式入门
什么是正则表达式?
正则表达式其实就是,在一个字符串序列中,按照你自己想要的匹配模式,将字符串搜索或替换的过程
正则表达式结构
/正则表达式主体/修饰符(可选) //实例如下: const patr = /china/i
解析: /china/i 是一个正则表达式,其中china是一个正则表达式主体,i 是一个修饰符(搜索不区分大小写)
使用正则表达式方法
search方法
检索字符串中指定的字符串,并且返回子串的起始位置
const str = "hello world!"; const n = str.search(/hello/); console.log(n); //输出结果为0
replace方法
在字符串中用一些字符替换另一些字符,或替换一个与正则表达式匹配的子串
const str = "hello world!"; const newstr = str.replace(/hello/, 'hi'); console.log(newstr); //输出结果为hi world!
match方法
可在字符串内检索指定的值,或找到一个或多个正则表达式的匹配,但是它返回指定的值,而不是字符串的位置
const str = 'hello world!'; const arr = str.match(/o/g); console.log(arr); //输出结果['o', 'o']
test方法
用于检测一个字符串是否匹配某个模式,如果字符串中含有匹配的文本,则返回 true,否则返回 false
const str = 'hello word!'; const regx = /o/; const flag = regx.test(str); console.log(flag); //输出结果true
exec方法
返回一个数组,其中存放匹配的结果。如果未找到匹配,则返回值为 null
const str = 'abc123abc321'; const pattern = /^abc/g; const flag = pattern.exec(str); console.log(flag); //["abc", index: 0, input: "abc123abc321", groups: undefined]
常见的正则表达式修饰符
i 不区分(ignore)大小写
/abc/i 可以匹配 abc、aBC、Abc
g 全局(global)匹配
如果不带g,从左往右搜索,找到第一个符合条件就返回;如果带g,则从左往右,找到每个符合条件的都记录下来,如下:
const str = 'hello world!'; const n1 = str.match(/o/g); console.log(n1); //输出结果["o", "o"] const n2 = str.match(/o/); console.log(n2); //输出结果["o", index: 4, input: "hello world!"]
m 多(more)行匹配
如果字符串中存在n并且有开始^或结束$符的情况下,会默认作为一个换行符,g只匹配第一行,加上m则可以匹配多行,如下:
const str = 'hello\nworld\nhello world\ngood hello'; const n1 = str.match(/^hello/gm); console.log(n1); //输出结果:["hello", "hello"] const n2 = str.match(/world$/g); console.log(n2); //输出结果:null
n2输出为null,是因为没有m则只匹配第一行,第一行中没有与之匹配的字符串,所有输出null
正则表达式语法
定位符
^ 符:匹配字符串开始的位置
const str = 'hello world!'; const pattr1 = /^hello/; const flag1 = pattr1.test(str); console.log(flag1); //输出结果:true const pattr2 = /^world/; const flag2 = pattr2.test(str); console.log(flag2); //输出结果:false
$ 符:匹配字符串结束的位置
const str = 'hello world'; const pattr1 = /hello$/; const flag1 = pattr1.test(str); console.log(flag1); //输出结果:false const pattr2 = /world$/; const flag2 = pattr2.test(str); console.log(flag2); //true
b 符:单词边界匹配,匹配单词的开头或结尾的位置,匹配的是一个位置
const str = 'word'; const pattern1 = /word\b/; const flag1 = pattern1.test(str); console.log(flag1); //true const pattern2 = /\bword/; const flag2 = pattern2.test(str); console.log(flag2); //true const str1 = 'hello,world' const pattern3 = /hello\b/; const flag3 = pattern3.test(str1); console.log(flag3); //true const pattern4 = /hello\bworld/; const flag4 = pattern4.test(str1); console.log(flag4); //false
如果b在模式的开头和结尾那没有问题,但是如果b在两个单词之间,则得都符合b左右匹配的模式
B 符:非单词边界匹配,其实就是b的相反,b匹配的是单词,而B匹配的是非单词
const str = 'hello, 你好!我是小明!'; const pattern1 = /\B/; const arr1 = str.split(pattern1); console.log(arr1); // 输出结果:["h", "e", "l", "l", "o,", " ", "你", "好", "!", "我", "是", "小", "明", "!"] const pattern2 = /\b/; const arr2 = str.split(pattern2); console.log(arr2); // 输出结果:["hello", ", 你好!我是小明!"]
从上面例子中可以看出,b是可以把单词匹配出来,而B不管是什么都分隔,如果在一个字符串中,有中英文,符合等等组成,如果要把里面的单词单独提取出来,则可以使用b来提取单词
特殊字符
. 符:匹配除换行符以外的任意单字符
const str = '\n'; const pattern = /./gm; const flag1 = pattern.test(str); console.log(flag1); //false
w 符:匹配字母或数字或下划线(等价于'[A-Za-z0-9_]')
const str = '^^##hello, 123'; const pattern = /^\w/; const flag1 = pattern.test(str); console.log(flag1); //false
const str = '你好hello!'; const pattern = /^\w/; const flag = pattern.test(str); console.log(flag); // false
如果头部是汉字或者符号(除下划线),则返回false
W:用于匹配所有与w不匹配的字符
s 符:匹配任意的空白符(等价于 [ fnrtv])
const str = 'abc'; const pattern = /\s/; const flag1 = pattern.test(str);; console.log(flag1); // false const str1 = 'abc cde'; const flag2 = pattern.test(str1); console.log(flag2); // true
S 符:匹配除单个空格符之外的所有字符(非s)
d 符:匹配数字
const str = '123'; const pattern = /\d/; const flag1 = pattern.test(str); console.log(flag1); // true const str1 = 'abc'; const flag2 = pattern.test(str1); console.log(flag2); // false
限定符
* 符:匹配前面的子表达式重复出现0次或多次(可有可无)
const str = '123abc###'; const pattern = /(\d)*/; const flag1 = pattern.test(str); console.log(flag1); // true
+ 符:匹配前面的子表达式重复出现一次或更多次(至少一次)
const str = 'abc###'; const pattern = /(\d)+/; const flag1 = pattern.test(str); console.log(flag1); // false const str2 = '123'; const flag2 = pattern.test(str2); console.log(flag2); // true
? 符:匹配前面的子表达式重复出现零次或一次
const str = 'eee123'; const pattern = /h+?/; const flag = pattern.test(str); console.log(flag); //false
当?跟在+后面的时,则此时必须出现一次,?一般都是跟在限定符后面的
{n} 符:匹配确定的 n 次(n为非负数整数)
const str = 'type'; const pattern = /t{2}/; const flag = pattern.test(str); console.log(flag); // false
t得要有两个才能匹配,这里不满足2个,所有返回false
{n,} 符:至少匹配n 次(n为非负整数)
const str = 'ttypet'; const pattern = /t{2,}/; const flag = pattern.test(str); console.log(flag); // true
这里t至少得重复出现2次才可以被匹配
{n,m} 符:最少匹配 n 次且最多匹配 m 次(n<m)
const str = 'food'; const pattern = /o{1,4}/; const flag = pattern.test(str); console.log(flag); // true //o出现2次,1<2<4
const str = 'food'; const pattern = /o{3,4}/; const flag = pattern.test(str); console.log(flag); // false //o出现2次,不属于3到4的范围
方括号
[abc]:查找方括号之间的任何字符
const str = 'my name is lucy!'; const pattern = /^[lpo]/; const flag = pattern.test(str); console.log(flag); // false
const str = 'my name is lucy!'; const pattern = /^[mpo]/; const flag = pattern.test(str); console.log(flag); // true
1:查找任何不在方括号之间的字符
const str = 'my name is lucy!'; const pattern = /^[^mpo]/; const flag = pattern.test(str); console.log(flag); // false
const str = 'my name is lucy!'; const pattern = /^[^lpo]/; const flag = pattern.test(str); console.log(flag); // true
[0-9]:查找任何从 0 至 9 的数字
const str = 'hello,123'; const pattern = /[0-9]$/; const flag = pattern.test(str); console.log(flag); // true
[a-z]:查找任何从小写 a 到小写 z 的字符
const str = 'hello,123'; const pattern = /^[a-z]/; const flag = pattern.test(str); console.log(flag); // true
[A-Z]:查找任何从大写 A 到大写 Z 的字符
const str = 'hello,123'; const pattern = /^[A-Z]/; const flag = pattern.test(str); console.log(flag); // false
简单正式表达式实例
1.只能是数字或英文
const str1 = '123456'; const str2 = '你好,123'; const str3 = ""; const pattern = /^[a-zA-Z0-9]+$/; const flag1 = pattern.test(str1); const flag2 = pattern.test(str2); const flag3 = pattern.test(str3); console.log(flag1); // true console.log(flag2); // false console.log(flag3); // false
2.中英文开头
const str1 = '中文+++123'; const str2 = 'word123你好'; const str3 = '321wrod'; const pattern = /^[\u4e00-\u9fa5A-Za-z]+/; const flag1 = pattern.test(str1); const flag2 = pattern.test(str2); const flag3 = pattern.test(str3); console.log(flag1); // true console.log(flag2); // true console.log(flag3); // false
这里开头以中英文开头,则
^[\u4e00-\u9fa5A-Za-z]+
除了开头要中英文,后面部分随意都可以,没有限制
3.校验数值
最多保留两位小数
const str1 = 45; const str2 = 45.5; const str3 = 45.55; const str4 = 0.111; const pattern = /^[0-9]+(.[0-9]{0,2})?$/; const flag1 = pattern.test(str1); const flag2 = pattern.test(str2); const flag3 = pattern.test(str3); const flag4 = pattern.test(str4); console.log(flag1); // true console.log(flag2); // true console.log(flag3); // true console.log(flag4); // false
这里可以分成两部分,一部分是整数部分,如下:
^[0-9]+
再一部分是小数部分,如下:
(.[0-9]{0,2})?
小数可以保留一位或者两位或者不保, ? 表示0次或者一次
4.网址URL验证
const str1 = 'www.baidu.com?id=123'; const str2 = 'cnds.tang-123/china'; const str3 = 'www.baidu.com\311'; const pattern = /^([\w-]+.)+[\w-]+([\w-./?%&=]*)$/; const flag1 = pattern.test(str1); const flag2 = pattern.test(str2); const flag3 = pattern.test(str3); console.log(flag1); // true console.log(flag2); // true console.log(flag3); // false
开头只能是数字或字母或下划线或-至少得一个,则:
^([\w-]+.)+
中间部分也至少得有一次
[\w-]+
到后面的那部分随意,可有可无
([\w-./?%&=]*)
本章节主要就是简单介绍了正则表达式的一些常用的东西,有不对的地方大家可以指出哈
- abc ↩