Perl学习笔记---Perl模式匹配

本文和大家重点讨论一下Perl模式匹配的概念,主要包括Perl模式匹配的语法和特殊字符等内容,希望通过本文的介绍你对Perl模式匹配的概念有明确的认识。

Perl模式匹配

模式指在字符串中寻找的特定序列的字符,由反斜线包含:/def/即模式def。

一、Perl模式匹配的语法

m/def/
例如if(m/def/){}这是在$_中寻找def匹配.如果将模式括起来的字符(称为界限符)是斜杠,那么编写Perl模式匹配代码时也可以不带m。
/def/
Perl模式匹配的操作符=~,!~若在该字符串中找到了该模式,则返回非零值,即true,不匹配则返回0,即false。!~则相反。这两者适合条件控制.
例如

if($question=~/please/)    


{    


print("Thankyouforbeingpolite!\n");    


}    


 

二、Perl模式匹配中的特殊字符

2.1+

+用于使前面的字符与后面的字符至少匹配一次,也可以任意次地进行匹配.类似于windows中*例如/d+g/能匹配的dog,dogg,dooooog/ab+/在字符串abbc中匹配的将是abb,而不是ab。

2.2[]和[^]

[]意味着匹配一组字符中的一个
^表示除其之外的所有字符
例如/w[abcd]s/能匹配的was,wbs,wcs,wds
/w[^ab]s/不能匹配的was,wbs
也可以写成如下形式
/w[a-z0-9A-Z]s/

2.3字符*和?

它们与+类似,区别在于*匹配0个、1个或多个相同字符,?匹配0个或1个该字符。
例如/de*f/匹配df、def、deeeef等;/de?f/匹配df或def。

2.4位置通配符(锚模式)

^或\A仅匹配串首
$或\Z仅匹配串尾
\b匹配单词边界
\B单词内部匹配
例如:/^def/只匹配以def打头的字符串,/$def/只匹配以def结尾的字符串,结合起来的/^def$/只匹配字符串def(?)。\A和\Z在多行匹配时与^和$不同。

\b在单词边界匹配:/\bdef/匹配def和defghi等以def打头的单词,但不匹配abcdef。/def\b/匹配def和abcdef等以def结尾的单词,但不匹配defghi,/\bdef\b/只匹配字符串def。注意:/\bdef/可匹配$defghi,因为$并不被看作是单词的部分。

\B在单词内部匹配:/\Bdef/匹配abcdef等,但不匹配def;/def\B/匹配defghi等;/\Bdef\B/匹配cdefg、abcdefghi等,但不匹配def,defghi,abcdef。

2.5字符转义类

\d任意数字[0-9]
\D除数字外的任意字符[^0-9]
\w任意单词字符[_0-9a-zA-Z]
\W任意非单词字符[^_0-9a-zA-Z]
\s空白[\r\t\n\f]
\S非空白[^\r\t\n\f]

2.6.

字符"."匹配除换行外的所有字符,通常与*合用。

2.7匹配指定数目的字符

字符对{}指定所匹配字符的出现次数。
如:/de{1,3}f/匹配def,deef和deeef;
/de{3}f/匹配deeef;
/de{3,}f/匹配不少于3个e在d和f之间;
/de{0,3}f/匹配不多于3个e在d和f之间。

2.8指定选项

字符"|"指定两个或多个选择来匹配模式。如:/def|ghi/匹配def或ghi。
这些转义符有一定的操作顺序:
()模式内存
+*?{}出现次数
^$\b\B锚
|选项

2.9模式次序变量

在Perl模式匹配后调用重用部分的结果可用变量$n,全部的结果用变量$&。
$string="Thisstringcontainsthenumber25.11.";
$string=~/-?(\d+)\.?(\d+)/;#匹配结果为25.11
$integerpart=$1;#now$integerpart=25
$decimalpart=$2;#now$decimalpart=11
$totalpart=$&;#nowtotalpart=25.11

三、Perl模式匹配选项

g匹配所有可能的模式
i忽略大小写
m将串视为多行
o只赋值一次
s将串视为单行
x忽略模式中的空白

3.1、匹配所有可能的模式(g选项)

@matches="balata"=~/.a/g;#now@matches=("ba","la","ta")
匹配的循环:

while("balata"=~/.a/g){  



$match=$&;  



print("$match\n");  


}  

结果为:
ba
la
ta
当使用了选项g时,可用函数pos来控制下次匹配的偏移:
$offset=pos($string);
pos($string)=$newoffset;

3.2、忽略大小写(i选项)例

/de/i匹配de,dE,De和DE。

3.3、将字符串看作多行(m选项)

在此情况下,^符号匹配字符串的起始或新的一行的起始;$符号匹配任意行的末尾。

3.4、只执行一次变量替换例

$var=1;  



$line=<STDIN>;  




while($var<10){  




$result=$line=~/$var/o;  




$line=<STDIN>;  



$var++;  


}  

每次均匹配/1/。

3.5、将字符串看作单行例

/a.*bc/s匹配字符串axxxxx\nxxxxbc,但/a.*bc/则不匹配该字符串。

3.6、在模式中忽略空格

/\d{2}([\W])\d{2}\1\d{2}/x等价于/\d{2}([\W])\d{2}\1\d{2}/。

四、Perl模式匹配的附加操作

4.1替换操作符

语法为s/pattern/replacement/,其效果为将字符串中与pattern匹配的部分换成replacement。如:
$string="abc123def";
$string=~s/123/456/;#now$string="abc456def";
在替换部分可使用模式次序变量$n,如s/(\d+)/[$1]/,但在替换部分不支持模式的特殊字符,如{},*,+等,如s/abc/[def]/将把abc替换为[def]。

替换操作符的选项如下表:

g改变模式中的所有匹配
i忽略模式中的大小写
e替换字符串作为表达式
m将待匹配串视为多行
o仅赋值一次
s将待匹配串视为单行
x忽略模式中的空白

注:e选项把替换部分的字符串看作表达式,在替换之前先计算其值,如:
$string="0abc1";
$string=~s/[a-zA-Z]+/$&x2/e;#now$string="0abcabc1"

4.2翻译操作符

这是另一种替换方式,语法如:tr/string1/string2/。同样,string2为替换部分,但其效果是把string1中的第一个字符替换为string2中的第一个字符,把string1中的第二个字符替换为string2中的第二个字符,依此类推。如:
$string="abcdefghicba";
$string=~tr/abc/def/;#nowstring="defdefghifed"
当string1比string2长时,其多余字符替换为string2的最后一个字符;当string1中同一个字符出现多次时,将使用第一个替换字符。

翻译操作符的选项如下:

c翻译所有未指定字符
d删除所有指定字符
s把多个相同的输出字符缩成一个

相关推荐