解析Perl正则表达式用法

本文和大家重点讨论一下Perl正则表达式的概念,Perl正则表达式有很多值得学习的地方,很多语言如Java设计正则式支持的时候都参考Perl正则表达式。本文介绍Perl正则表达式中最基本、最常用的部分。

Perl正则表达式初步

Perl语言的Perl正则表达式功能十分强大,基本上是常用语言中最强大的,很多语言如Java设计正则式支持的时候都参考Perl正则表达式。本文介绍Perl正则表达式中最基本、最常用的部分。

一、Perl正则表达式运算符

=~Perl正则表达式匹配运算符,左边是待匹配字符串,右边是Perl正则表达式,匹配结果设置在$1,$2等变量中,在scaler上下文中,成功匹配返回匹配个数,否则返回false。例如$var=~/foo/;
!~Perl正则表达式匹配运算符,和=~不同的是它忽略匹配结果,且返回值相反。例如$var!~/foo/;

Perl正则表达式运算符右边是Perl正则表达式,有如下三种形式:

1.匹配模式m/pattern/igmsoxc

m表示match,pattern是正则式内容,分隔符/可以用任意其他字符如#替换,igmsoxc是可选的参数,意义如下:
i忽略大小写
g匹配所有符合的(默认是匹配第一个符合的)
m多行模式,^和$分别匹配行的开始和结尾(默认匹配字符串的开始和结尾)
s单行模式,“.”匹配“\n”(默认不匹配)
ocompilepatternOnce
xeXtendedlegibility-freewhitespaceandcomments
cdon'tresetposonfailedmatcheswhenusing/g

2.存储模式qr/pattern/imsox

qr将Perl正则表达式存储到一个变量中,这样可以反复使用,可选项意义与m相同

3.替换模式s/pattern/replacement/igmsoxe

s代表substitutes,将匹配的模式pattern替换为replacement,多了一个可选项:
e将replacement作为一个表达式执行

4.一次性匹配模式?pattern?

和m/pattern/相同,但是只进行一次匹配,?不能用其他分隔符替换


二、Perl正则表达式中基本语法元素

\字符转义
.匹配除\n外的任意字符
^匹配行或字符串开头
$匹配行或字符串结尾
*0个或多个
+1个或多个
?0个或1个
{...}指定个数
[...]字符类,匹配括号中的任意一字符
(...)匹配组,匹配后可以用$1,$2等获取相应的匹配组
(?:...)聚集,匹配后不能$1,$2等获取相应的匹配组,速度会快些
|前者或后者,一般和括弧配合使用
\1,\2...正则式中反引用匹配组


三、Perl正则表达式中常见转义字符

\aAlarm(beep)

详细出处参考:http://www.itqun.net/content-detail/93504.html

\eEscape  


\fFormfeed  


\nNewline  


\rCarriagereturn  


\tTab  


\037AnyoctalASCIIvalue  


\x7fAnyhexadecimalASCIIvalue  


\x{263a}Awidehexadecimalvalue  


\cxControl-x  


\N{name}Anamedcharacter  


 


\lLowercasenextcharacter  


\uTitlecasenextcharacter  


\LLowercaseuntil\E  


\UUppercaseuntil\E  


\QDisablepatternmetacharactersuntil\E  


\EEndcasemodification  


\bwordboudariy  


 

四、Perl正则表达式中字符类

[...]匹配括号中的任意一个字符,但是当第一个字符是^时是相反的,匹配除了括号中的字符外的任意字符。另外还有a-z这样的简写方式代替a到z的所有字符。例如:

[amy]Match'a','m'or'y'  


[f-j]Dashspecifies"range"  


[f-j-]Dashescapedoratstartorendmeans'dash'  


[^f-j]Caretindicates"matchanycharacter_except_these"  

相关推荐