JS正则表达式精简教程(JavaScript RegExp 对象)

什么是 RegExp?

RegExp 是正则表达式的缩写。

当您检索某个文本时,可以使用一种模式来描述要检索的内容。RegExp 就是这种模式。

简单的模式可以是一个单独的字符。

更复杂的模式包括了更多的字符,并可用于解析、格式检查、替换等等。

您可以规定字符串中的检索位置,以及要检索的字符类型,等等。

定义 RegExp

const pattern = new RegExp('str');

RegExp 对象的方法

  • test()
  • exec()
  • compile()

test() 方法检索字符串中的指定值。返回值是 true 或 false。

const pattern = new RegExp('str');
console.log(pattern.test('input string')); // true

exec() 方法检索字符串中的指定值。返回值是被找到的值。如果没有发现匹配,则返回 null。

const pattern = new RegExp('str');
console.log(pattern.test('input string')); // [ 'str', index: 6, input: 'input string', groups: undefined ]

compile() 方法用于改变 RegExp(既可以改变检索模式,也可以添加或删除第二个参数)。

const pattern = new RegExp('e');
console.log(pattern.test('The best things in life are free'));
pattern.compile('d');
console.log(pattern.test('The best things in life are free'));

支持正则表达式的 String 对象的方法

  • search()
  • match()
  • replace()
  • split()

search()方法检索与正则表达式相匹配的子字符串。search() 方法不执行全局匹配,它将忽略标志 g。它同时忽略 regexp 的 lastIndex 属性,并且总是从字符串的开始进行检索,这意味着它总是返回 stringObject 的第一个匹配的位置。

// stringObject.search(regexp) 语法 (匹配不上时返回 -1)

const stringObj = 'Hello world';
const result = stringObj.search(/l{3}/);
console.log(result); // -1

match() 方法可在字符串内检索指定的值,或找到一个或多个正则表达式的匹配。该方法类似 indexOf() 和 lastIndexOf(),但是它返回指定的值,而不是字符串的位置。

// stringObject.match(regexp) 语法 (匹配不上时返回 null)

const stringObj = 'Hello world';
const result = stringObj.match(/l{2}/);
console.log(result); // [ 'll', index: 2, input: 'Hello world', groups: undefined ]

replace() 方法用于在字符串中用一些字符替换另一些字符,或替换一个与正则表达式匹配的子串。
字符串 stringObject 的 replace() 方法执行的是查找并替换的操作。它将在 stringObject 中查找与 regexp 相匹配的子字符串,然后用 replacement 来替换这些子串。如果 regexp 具有全局标志 g,那么 replace() 方法将替换所有匹配的子串。否则,它只替换第一个匹配子串。

// stringObject.replace(regexp/substr,replacement) 语法 (匹配不上时返回原字符串)

const stringObj = 'Hello world';
const result = stringObj.replace(/l{2}/,'ii');
console.log(result); // Heiio world

split() 方法用于把一个字符串分割成字符串数组。
返回一个字符串数组。该数组是通过在 separator 指定的边界处将字符串 stringObject 分割成子串创建的。返回的数组中的字串不包括 separator 自身。
但是,如果 separator 是包含子表达式的正则表达式,那么返回的数组中包括与这些子表达式匹配的字串(但不包括与整个正则表达式匹配的文本)。

// stringObject.split(separator,howmany) 语法 (匹配不上时返回 [stringObject])

const stringObj = 'Hello world';
const result = stringObj.split(/l{2}/);
console.log(result) // [ 'He', 'o world' ]

RegExp 参数

  • 直接量语法
/pattern/attributes
  • 创建 RegExp 对象的语法
new RegExp(pattern, attributes);

参数 pattern 是一个字符串,指定了正则表达式的模式或其他正则表达式。

参数 attributes 是一个可选的字符串,包含属性 "g"、"i" 和 "m",分别用于指定全局匹配、区分大小写的匹配和多行匹配。ECMAScript 标准化之前,不支持 m 属性。如果 pattern 是正则表达式,而不是字符串,则必须省略该参数。

注意

const reg = /str/;
const newReg = reg.compile(reg, 'i'); // 报错
console.log(newReg.test('string'))

// 正确示例
const reg = /str/;
const newReg = new RegExp(reg, 'i');
console.log(newReg.test('string'));

附表

  • 修饰符
修饰符描述
i执行对大小写不敏感的匹配。
g执行全局匹配
m执行多行匹配
  • 方括号
表达式描述
[abc]查找方括号之间的任何字符
1查找任何不在方括号之间的任何字符
[0-9]查找任何从0至9的数字
[a-z]查找任何从小写a至小写z的字符
[A-Z]查找任何从大写A至大写Z的字符
[A-z]查找任何从大写A至小写z的字符
[adgk]查找给定集合内的任何字符
[^adgk]查找给定集合外的任何字符
(red ¦ blue ¦green)查找任何指定的选项
  • 元字符
元字符描述
.查找单个字符,除了换行和行结束符。
w查找单词字符。
W查找非单词字符。
d查找数字字符。
D查找非数字字符。
s查找空白字符。
S查找非空白字符。
b匹配单词边界。
B匹配非单词边界。
0查找 NUL 字符。
n查找换行符。
f查找换页符。
r查找回车符。
t查找制表符。
v查找垂直制表符。
xxx查找以八进制数 xxx 规定的字符。
xdd查找以十六进制数 dd 规定的字符。
uxxxx查找以十六进制数 xxxx 规定的 Unicode 字符。
  • 量词
元字符描述
n+匹配任何包含至少一个 n 的字符串。
n*匹配任何包含零个或多个 n 的字符串。
n?匹配任何包含零个或一个 n 的字符串。
n{X}匹配包含 X 个 n 的序列的字符串。
n{X,Y}匹配包含 X 至 Y 个 n 的序列的字符串。
n{X,}匹配包含至少 X 个 n 的序列的字符串。
n$匹配任何结尾为 n 的字符串。
^n匹配任何开头为 n 的字符串。
?=n匹配任何其后紧接指定字符串 n 的字符串。
?!n匹配任何其后没有紧接指定字符串 n 的字符串。

  1. abc ↩

相关推荐