javascript正则表达式RegExp再次研究-replace

chenqiangdage

2019-06-29

昨天说了几个RegExp的几个实例属性

global 标示正则表达式是否指定了全局模式g（只读）
ignoreCase 标示正则表达式是否指定了不区分大小写模式i（只读）
mutiline 标示正则表达式是否指定了多行模式m（只读）
lastIndex 如果使用了全局模式，这个变量保存的是在字符串中尝试下次的匹配的偏移值，在test()和exec()中会用到这个值（可写）
source 返回创建RegExp对象实例时指定的表达式文本字符串。（只读）

虽然有那么多属性，但是基本用不到，为什么呢?因为这些信息都包含在模式声明中了：
字面量创建的正则

var reg = /\[abc\]de/i
console.log(reg.global);//=>false
console.log(reg.ignoreCase);//=>true
console.log(reg.multiline);//=>false
console.log(reg.lastIndex);//=>0
console.log(reg.source);//=>\[abc\]de

通过RegExp构造函数创建的也是一样的结果

var reg2 = new RegExp("\\[bc\\]at","i")
  console.log(reg2.global);//=>false
  console.log(reg2.ignoreCase);//=>true
  console.log(reg2.multiline);//=>false
  console.log(reg2.lastIndex);//=>0
  console.log(reg2.source);//=>\[abc\]de

replace

说到正则表达式，不得不提replace
stringObject.replace(regexp/substr,replacement)

参数1：可以是字符串，也可以是正则表达式
参数2：可以是字符串，也可以是函数。如果它是字符串，那么每个匹配都将由字符串替换。但是 replacement 中的 $ 字符具有特定的含义。如下表所示，它说明从模式匹配得到的字符串将用于替换。

返回一个新的字符串，是用参数2 替换了参数1 的第一次匹配或所有匹配之后得到的。

$1、$2、...、$99 与 regexp 中的第 1 到第 99 个子表达式相匹配的文本。
$& 与 regexp 相匹配的子串。
$` 位于匹配子串左侧的文本。
$' 位于匹配子串右侧的文本。
$$ 直接量符号。

replace例一：匹配一次，区分大小写

var aStr = "Hello 陌上寒!"
    var bStr = aStr.replace("陌上寒", "正则表达式")
    console.log( bStr)//=>Hello 正则表达式!

replace例二：全局匹配

var cStr =`你好 陌上寒! 我是陌上寒，我们一起来交流讨论前端，每天更新，欢迎关注`
    var dStr = cStr.replace(/陌上寒/g, "moshanghan")
    console.log(dStr)//=>你好 moshanghan! 
     //=>我是moshanghan，我们一起来交流讨论前端，每天更新，欢迎关注

replace例三：忽略大小写，匹配一次

var cStr ="我是 Moshanghan! moshanghan是我"
var dStr = cStr.replace(/moshanghan/i, "陌上寒")
console.log(dStr)//=>我是 陌上寒! moshanghan是我

replace例四：忽略大小写，全局匹配

var cStr ="我是 Moshanghan! moshanghan是我"
var dStr = cStr.replace(/moshanghan/ig, "陌上寒")
console.log(dStr)//=>我是 陌上寒! 陌上寒是我

加点难度
replace例五：hello, moshanghan转换为moshanghan hello
以下的输出是相同的

var name = "hello, moshanghan";
var a = name.replace(/(\w+)\s*,\s*(\w+)/, "$2 $1");
console.log(a);//=>moshanghan hello
var b = name.replace(/(\w+)\s*, (\w+)\s*/, "$2 $1");
console.log(b);//=>moshanghan hello
var c = name.replace(/(\w+), (\w+)/, "$2 $1");
console.log(c);//=>moshanghan hello
var d = name.replace(/(\w*), (\w*)/, "$2 $1");
console.log(d);//=>moshanghan hello

replace例六:

var name = `"a", "b"," dd"`;
var aa = name.replace(/"([^"]*)"/, "'$1'");
console.log(aa); //=>'a', "b"," dd"
console.log(/"([^"]*)"/g.test(name));

replace例七:

var name = 'aaa bbb ccc';
var uw = name.replace(/\b\w+\b/g, function (word) {
    return word.substring(0, 1).toUpperCase() + word.substring(1);
});
console.log(uw); //Aaa Bbb Ccc

要理解上面的，有几个关于正则的概念需要知道

分组

下面的正则表达式可以匹配kidkidkid：

var b =/kidkidkid/
console.log(b.test('kidkidkid')); //=>true

而另一种更优雅的写法是：

var b =/(kid){3}/
console.log(b.test('kidkidkid')); //=>true

这里由圆括号包裹的一个小整体称为分组。

候选

一个分组中，可以有多个候选表达式，用|分隔：

var reg = /I love (him|her|it)/;
console.log(reg.test('I love him'));//=>true
console.log(reg.test('I love her'));//=>true
console.log(reg.test('I love it'));//=>true
console.log(reg.test('I love them'));//=>false

捕获与引用

被正则表达式匹配（捕获）到的字符串会被暂存起来。其中，由分组捕获的串会从1开始编号，于是我们可以引用这些串

var reg = /(\d{4})-(\d{2})-(\d{2})/
var date = '2010-04-12'
reg.test(date)
console.log(RegExp.$1);//=>2010
console.log(RegExp.$2);//=>04
console.log(RegExp.$3);//=>12

$1引用了第一个被捕获的串，$2是第二个，依次类推。

嵌套分组的捕获

如果碰到类似/((我) 就 (是 (陌上寒)))/的嵌套分组，捕获的顺序是什么？来试试：

var reg = /((我) 就 (是 (陌上寒)))/
var str = "我 就 是 陌上寒"
reg.test( str ) // true
console.log(RegExp.$1);//=>我 就 是 陌上寒
console.log(RegExp.$2);//=>我
console.log(RegExp.$3);//=>是 陌上寒
console.log(RegExp.$4);//=>陌上寒

规则是以左括号“（”出现的顺序进行捕获。
javascript正则表达式RegExp再次研究-replace