常见问题的正则表达式解决方案(持续更新)
在构造一个正则表达式模式的时候,我们不仅要考虑到匹配结果的准确性,还必须考虑到它的执行效率。
常见场景
场景1:北美电话号码,由一个三位数的区号和一个7位数的号码构成(这7位数字又分成一个3位数的局号和一个4位数的线路号,局号和线路号之间用连字符分隔)。每位号码可以是任意数字,但区号和局号的第一位数字不能是0或1
文本:Le : 248-555-1234
Ben : (313) 555-1234
Dee :(810)555-1234
正则表达式:\(?[2-9]\d\d\)?[ -]?[2-9]\d\d-\d{4}
解析:首先\(? ,对(进行转义,可以匹配(的括号,?表示可以有括号 也可以没有
因为第一个是非1或0,所有取[2-9],\d是其他的表示任意数字
后面\)?表示结尾的括号,也是可有可无
[ -]?表示三种情况,可以是空格,可以是-,也可以是直接什么都没有,后面的就是基本的数字匹配,{4}表示重复四次
但是其实上面的还是不够全面,比如当出现 888)222-1234即只有一边)的情况,也会被匹配成功。
所以改成(\()?[2-9]\d\d(?(1)\)|-)[ -]?[2-9]\d\d-\d{4}不知道为什么有问题,思路是要进行条件查询(原来也有人遇到这个问题 这个不能通过,原因就不知道了)
中国固定电话号码类似:
规则:一开始固定0,表示长途,接着是2,3,4位数字组成的区号,然后是7位或者8位的电话号码。
正则表达式:\(?0[1-9]\d{1,3}\)?[ -]?[2-9]\d{2,3}[ -]?\d{4}