JS正则表达式入门

SometimesYmc

2019-06-29

什么是正则表达式？

正则表达式其实就是，在一个字符串序列中，按照你自己想要的匹配模式，将字符串搜索或替换的过程

正则表达式结构

/正则表达式主体/修饰符(可选)

//实例如下：
const patr = /china/i

解析： /china/i 是一个正则表达式，其中china是一个正则表达式主体，i 是一个修饰符(搜索不区分大小写)

使用正则表达式方法

search方法

检索字符串中指定的字符串，并且返回子串的起始位置

const str = "hello world!";
const n = str.search(/hello/);
console.log(n); //输出结果为0

replace方法

在字符串中用一些字符替换另一些字符，或替换一个与正则表达式匹配的子串

const str = "hello world!";
const newstr = str.replace(/hello/, 'hi');
console.log(newstr); //输出结果为hi world!

match方法

可在字符串内检索指定的值，或找到一个或多个正则表达式的匹配，但是它返回指定的值，而不是字符串的位置

const str = 'hello world!';
 const arr = str.match(/o/g);
 console.log(arr); //输出结果['o', 'o']

test方法

用于检测一个字符串是否匹配某个模式，如果字符串中含有匹配的文本，则返回 true，否则返回 false

const str = 'hello word!';
 const regx = /o/;
 const flag = regx.test(str);
 console.log(flag); //输出结果true

exec方法

返回一个数组，其中存放匹配的结果。如果未找到匹配，则返回值为 null

const str = 'abc123abc321';
      const pattern = /^abc/g;
      const flag = pattern.exec(str);
      console.log(flag); //["abc", index: 0, input: "abc123abc321", groups: undefined]

常见的正则表达式修饰符

i 不区分(ignore)大小写

/abc/i 可以匹配 abc、aBC、Abc

g 全局(global)匹配

如果不带g,从左往右搜索，找到第一个符合条件就返回；如果带g，则从左往右，找到每个符合条件的都记录下来，如下：

const str = 'hello world!';
 const n1 = str.match(/o/g);
 console.log(n1); //输出结果["o", "o"]
 const n2 = str.match(/o/);
 console.log(n2); //输出结果["o", index: 4, input: "hello world!"]

m 多(more)行匹配

如果字符串中存在n并且有开始^或结束$符的情况下，会默认作为一个换行符，g只匹配第一行，加上m则可以匹配多行，如下：

const str = 'hello\nworld\nhello world\ngood hello';
  const n1 = str.match(/^hello/gm);
  console.log(n1); //输出结果：["hello", "hello"]
  const n2 = str.match(/world$/g);
  console.log(n2); //输出结果：null

n2输出为null，是因为没有m则只匹配第一行，第一行中没有与之匹配的字符串，所有输出null

正则表达式语法

定位符

^ 符：匹配字符串开始的位置

const str = 'hello world!';
      const pattr1 = /^hello/;
      const flag1 = pattr1.test(str);
      console.log(flag1); //输出结果：true

      const pattr2 = /^world/;
      const flag2 = pattr2.test(str);
      console.log(flag2); //输出结果：false

$ 符：匹配字符串结束的位置

const str = 'hello world';
      const pattr1 = /hello$/;
      const flag1 = pattr1.test(str);
      console.log(flag1); //输出结果：false

      const pattr2 = /world$/;
      const flag2 = pattr2.test(str);
      console.log(flag2); //true

b 符：单词边界匹配，匹配单词的开头或结尾的位置，匹配的是一个位置

const str = 'word';
      const pattern1 = /word\b/;
      const flag1 = pattern1.test(str);
      console.log(flag1); //true

      const pattern2 = /\bword/;
      const flag2 = pattern2.test(str);
      console.log(flag2); //true

      const str1 = 'hello,world'
      const pattern3 = /hello\b/;
      const flag3 = pattern3.test(str1);
      console.log(flag3); //true

      const pattern4 = /hello\bworld/;
      const flag4 = pattern4.test(str1);
      console.log(flag4); //false

如果b在模式的开头和结尾那没有问题，但是如果b在两个单词之间，则得都符合b左右匹配的模式

B 符：非单词边界匹配，其实就是b的相反，b匹配的是单词，而B匹配的是非单词

const str = 'hello, 你好！我是小明！';
      const pattern1 = /\B/;
      const arr1 = str.split(pattern1);
      console.log(arr1);
      // 输出结果：["h", "e", "l", "l", "o,", " ", "你", "好", "！", "我", "是", "小", "明", "！"]

      const pattern2 = /\b/;
      const arr2 = str.split(pattern2);
      console.log(arr2);
      // 输出结果：["hello", ", 你好！我是小明！"]

从上面例子中可以看出，b是可以把单词匹配出来，而B不管是什么都分隔，如果在一个字符串中，有中英文，符合等等组成，如果要把里面的单词单独提取出来，则可以使用b来提取单词

特殊字符

. 符：匹配除换行符以外的任意单字符

const str = '\n';
       const pattern = /./gm;
       const flag1 = pattern.test(str);
       console.log(flag1); //false

w 符：匹配字母或数字或下划线（等价于'[A-Za-z0-9_]'）

const str = '^^##hello, 123';
       const pattern = /^\w/;
       const flag1 = pattern.test(str);
       console.log(flag1); //false

const str = '你好hello!';
         const pattern = /^\w/;
         const flag = pattern.test(str);
         console.log(flag); // false

如果头部是汉字或者符号(除下划线)，则返回false

W：用于匹配所有与w不匹配的字符

s 符：匹配任意的空白符（等价于 [ fnrtv]）

const str = 'abc';
       const pattern = /\s/;
       const flag1 = pattern.test(str);;
       console.log(flag1); // false

       const str1 = 'abc cde';
       const flag2 = pattern.test(str1);
       console.log(flag2); // true

S 符：匹配除单个空格符之外的所有字符（非s）

d 符：匹配数字

const str = '123';
        const pattern = /\d/;
        const flag1 = pattern.test(str);
        console.log(flag1); // true

        const str1 = 'abc';
        const flag2 = pattern.test(str1);
        console.log(flag2); // false

限定符

* 符：匹配前面的子表达式重复出现0次或多次(可有可无)

const str = '123abc###';
  const pattern = /(\d)*/;
  const flag1 = pattern.test(str);
  console.log(flag1); // true

+ 符：匹配前面的子表达式重复出现一次或更多次(至少一次)

const str = 'abc###';
        const pattern = /(\d)+/;
        const flag1 = pattern.test(str);
        console.log(flag1); // false

        const str2 = '123';
        const flag2 = pattern.test(str2);
        console.log(flag2); // true

? 符：匹配前面的子表达式重复出现零次或一次

const str = 'eee123';
    const pattern = /h+?/;
    const flag = pattern.test(str);
    console.log(flag); //false

当?跟在+后面的时，则此时必须出现一次，?一般都是跟在限定符后面的

{n} 符：匹配确定的 n 次（n为非负数整数）

const str = 'type';
  const pattern = /t{2}/;
  const flag = pattern.test(str);
  console.log(flag); // false

t得要有两个才能匹配，这里不满足2个，所有返回false

{n,} 符：至少匹配n 次（n为非负整数）

const str = 'ttypet';
 const pattern = /t{2,}/;
 const flag = pattern.test(str);
 console.log(flag); // true

这里t至少得重复出现2次才可以被匹配

{n,m} 符：最少匹配 n 次且最多匹配 m 次（n<m）

const str = 'food';
 const pattern = /o{1,4}/;
 const flag = pattern.test(str);
 console.log(flag); // true
 //o出现2次，1<2<4

const str = 'food';
  const pattern = /o{3,4}/;
  const flag = pattern.test(str);
  console.log(flag); // false
  //o出现2次，不属于3到4的范围

方括号

[abc]：查找方括号之间的任何字符

const str = 'my name is lucy!';
 const pattern = /^[lpo]/;
 const flag = pattern.test(str);
 console.log(flag); // false

const str = 'my name is lucy!';
const pattern = /^[mpo]/;
const flag = pattern.test(str);
console.log(flag); // true

¹：查找任何不在方括号之间的字符

const str = 'my name is lucy!';
  const pattern = /^[^mpo]/;
  const flag = pattern.test(str);
  console.log(flag); // false

const str = 'my name is lucy!';
  const pattern = /^[^lpo]/;
  const flag = pattern.test(str);
  console.log(flag); // true

[0-9]：查找任何从 0 至 9 的数字

const str = 'hello,123';
 const pattern = /[0-9]$/;
 const flag = pattern.test(str);
 console.log(flag); // true

[a-z]：查找任何从小写 a 到小写 z 的字符

const str = 'hello,123';
   const pattern = /^[a-z]/;
   const flag = pattern.test(str);
   console.log(flag); // true

[A-Z]：查找任何从大写 A 到大写 Z 的字符

const str = 'hello,123';
  const pattern = /^[A-Z]/;
  const flag = pattern.test(str);
  console.log(flag); // false

简单正式表达式实例

1.只能是数字或英文

const str1 = '123456';
      const str2 = '你好，123';
      const str3 = "";
      const pattern = /^[a-zA-Z0-9]+$/;
      const flag1 = pattern.test(str1);
      const flag2 = pattern.test(str2);
      const flag3 = pattern.test(str3);

      console.log(flag1); // true
      console.log(flag2); // false
      console.log(flag3); // false

2.中英文开头

const str1 = '中文+++123';
      const str2 = 'word123你好';
      const str3 = '321wrod';
      const pattern = /^[\u4e00-\u9fa5A-Za-z]+/;

      const flag1 = pattern.test(str1);
      const flag2 = pattern.test(str2);
      const flag3 = pattern.test(str3);

      console.log(flag1); // true
      console.log(flag2); // true
      console.log(flag3); // false

这里开头以中英文开头，则

^[\u4e00-\u9fa5A-Za-z]+

除了开头要中英文，后面部分随意都可以，没有限制

3.校验数值

最多保留两位小数

const str1 = 45;
      const str2 = 45.5;
      const str3 = 45.55;
      const str4 = 0.111;
      const pattern = /^[0-9]+(.[0-9]{0,2})?$/;
      const flag1 = pattern.test(str1);
      const flag2 = pattern.test(str2);
      const flag3 = pattern.test(str3);
      const flag4 = pattern.test(str4);

      console.log(flag1); // true
      console.log(flag2); // true
      console.log(flag3); // true
      console.log(flag4); // false

这里可以分成两部分，一部分是整数部分，如下：

^[0-9]+

再一部分是小数部分，如下：

(.[0-9]{0,2})?

小数可以保留一位或者两位或者不保, ? 表示0次或者一次

4.网址URL验证

const str1 = 'www.baidu.com?id=123';
      const str2 = 'cnds.tang-123/china';
      const str3 = 'www.baidu.com\311';
      const pattern = /^([\w-]+.)+[\w-]+([\w-./?%&=]*)$/;

      const flag1 = pattern.test(str1);
      const flag2 = pattern.test(str2);
      const flag3 = pattern.test(str3);

      console.log(flag1); // true
      console.log(flag2); // true
      console.log(flag3); // false

开头只能是数字或字母或下划线或-至少得一个，则：