JS应用之正则表达式

定义

正则表达式是用于匹配字符串中字符组合的模式。

创建正则表达式

两种方式:

1.new RegExp()

let pattern1 = new RegExp('cat'); //第一个参数字符串
let pattern2 = new RegEXP('cat', 'ig'); //第二个参数可选模式修饰符
  • i:忽略大小写
  • g:全局匹配,即模式被应用于所有字符串,而非匹配到第一项时立即停止
  • m:多行匹配
  • y:执行“粘性”搜索,匹配从目标字符串的当前位置开始,可以使用y标志

2.字面量(以下栗子均使用字面量的方式创建正则表达式)

let pattern3 = /cat/;
let pattern4 = /cat/ig;

匹配正则表达式

1.test
在字符串中测试是否匹配的RegExp方法,它返回true或false。

let str = 'This is a cat!';
console.log(pattern4.test(str)); //true

2.exec
在字符串中执行查找匹配的RegExp方法,它返回一个数组(未匹配到则返回null)。

console.log(pattern4.exec(str)); //[cat]

3.match
在字符串中执行查找匹配的String方法,它返回一个数组或者在未匹配到时返回null。

console.log(str.match(pattern4)); //[cat]

4.replace
在字符串中执行查找匹配的String方法,并且使用替换字符串替换掉匹配到的子字符串。

console.log(str.replace(pattern4, 'dog')); //This is a dog!

5.search
在字符串中测试匹配的String方法,它返回匹配到的位置索引,或者在失败时返回-1。

console.log(str.search(pattern4)); //10

6.split
使用正则表达式或者一个固定字符串分隔一个字符串,并将分隔后的子字符串存储到数组中的String方法。

console.log(str.split(pattern4)); //["This is a ", "!"]

正则表达式语法

重复匹配(?、*、+、.、{m,n})

  • .匹配除换行符外的任意字符,单个匹配
  • x?匹配0个或1个x
  • x*匹配0个或任意多个x
  • x+匹配至少1个x
  • x{m,n}匹配最少m,最多n个的x,闭区间
  • (xyz){m,n}把xyz看成一个整体,匹配xyz最少m次最多n次
  • chrome|firefox|ie匹配chrome或者firefox或者ie中的任意一个
let str = 'google',
    str1 = 'gooooogle',
    str2 = 'ggle',
    pattern = /g..gle/,
    pattern1 = /go*gle/,
    pattern2 = /go+gle/,
    pattern3 = /g.*gle/,//0个或多个的任意字符
    pattern4 = /go?gle/,
    pattern5 = /go{2,4}gle/,
    pattern6 = /go{3}gle/,//匹配3个o->gooogle
    pattern7 = /go{3,}gle/;//匹配3个或3个以上o
    
console.log(pattern.test(str));//true
console.log(pattern1.test(str));//true
console.log(pattern1.test(str1));//true
console.log(pattern2.test(str1));//true
console.log(pattern2.test(str2));//false
console.log(pattern3.test(str));//true
console.log(pattern3.test(str2));//true
console.log(pattern4.test(str));//false
console.log(pattern7.test(str1));//true

字符类匹配

  • [a-z]*表示任意个a-z中的字符
  • [A-Z]*表示任意个A-Z中的字符
  • [0-9]*表示任意个0-9中的字符
  • [a-zA-Z0-9]表示匹配一个以上三种情况下的任意一个字符
  • [^0-9]表示非0-9的任意字符
  • ^[0-9]表示以0-9为起始字符,^表示从起始位置开始匹配
  • [0-9]$表示以0-9为结束字符,$表示匹配结束位置
  • /d匹配数字,同[0-9]
  • /D匹配非数字,同[ ^0-9]
  • /w匹配字母数字及下划线_,同[a-zA-Z0-9_]
  • /W匹配非字母数字及下划线_,同[^a-zA-Z0-9_]
  • \b匹配单词边界
  • \B匹配非单词边界

空白字符

  • \0匹配null字符
  • \f匹配换页字符
  • \n匹配换行符
  • \r匹配回车字符
  • \t匹配制表符
  • \s匹配空白字符、空格、制表符和换行符
  • \S匹配非空白字符

贪婪模式和非贪婪模式
?紧跟在任何量词 *、 +、? 或 {} 的后面,将会使量词变为非贪婪的(匹配尽量少的字符),和缺省使用的贪婪模式(匹配尽可能多的字符)正好相反。

console.log('123abc'.match(/\d+/)); //[123]
console.log('123abc'.match(/\d+?/)); //[1]

捕获和非捕获
(x)匹配 'x' 并且记住匹配项。括号被称为 捕获括号。

console.log(/(\d+)([a-z]+)/.exec('123abc')); //[12abc, 123, abc]
console.log(/(\d+)(?:[a-z]+)/.exec('123abc')); //[123abc, 123]

正向肯定查找和正向否定查找
x(?=y)匹配'x'仅仅当'x'后面跟着'y'.这种叫做正向肯定查找。
x(?!y)匹配'x'仅仅当'x'后面不跟着'y',这个叫做正向否定查找。

console.log(/goo(?=gle)/.exec('google')); //[goo]
console.log(/goo(?=gle)/.exec('goodu')); //null

console.log(/goo(?!gle)/.exec('google')); //null
console.log(/goo(?!gle)/.exec('goodu')); //[goo]

常用的正则表达式

1.手机号(1xxxxxxxxxx):/^1[0-9]{10}$/
2.邮政编码校验:/[1-9][0-9]{5}/
3.匹配汉字:[u4e00-u9fa5]
4.简易邮箱校验:/^([a-zA-Z0-9_\.\-]+)@([a-zA-Z0-9_\.\-]+)\.([a-zA-Z]{2,4})$/

相关推荐