Flex正则表达式规则
1.Flex正则表达式规则
1.1普通字符
字母、数字、汉字、下划线、以及后边章节中没有特殊定义的标点符号,都是"普通字符"。表达式中的普通字符,在匹配一个字符串的时候,匹配与之相同的一个字符。
举例1:表达式"c",在匹配字符串"abcde"时,匹配结果是:成功;匹配到的内容是:"c";匹配到的位置是:开始于2,结束于3。(注:下标从0开始还是从1开始,因当前编程语言的不同而可能不同)
举例2:表达式"bcd",在匹配字符串"abcde"时,匹配结果是:成功;匹配到的内容是:"bcd";匹配到的位置是:开始于1,结束于4。
1.2简单的转义字符
Flex正则表达式中一些不便书写的字符,采用在前面加""的方法。这些字符其实我们都已经熟知了。
表达式可匹配
\r,\n
代表回车和换行符
\t
制表符
\\
代表""本身
◆还有其他一些在后边章节中有特殊用处的标点符号,在前面加""后,就代表该符号本身。比如:^,$都有特殊意义,如果要想匹配字符串中"^"和"$"字符,则表达式就需要写成"\^"和"\$"。
表达式可匹配
\^
匹配^符号本身
\$
匹配$符号本身
\.
匹配小数点(.)本身
这些转义字符的匹配方法与"普通字符"是类似的。也是匹配与之相同的一个字符。
举例1:表达式"\$d",在匹配字符串"abc$de"时,匹配结果是:成功;匹配到的内容是:"$d";匹配到的位置是:开始于3,结束于5。
1.3能够与'多种字符'匹配的表达式
Flex正则表达式中的一些表示方法,可以匹配'多种字符'其中的任意一个字符。比如,表达式"\d"可以匹配任意一个数字。虽然可以匹配其中任意字符,但是只能是一个,不是多个。这就好比玩扑克牌时候,大小王可以代替任意一张牌,但是只能代替一张牌。
表达式可匹配
\d
任意一个数字,0~9中的任意一个
\w
任意一个字母或数字或下划线,也就是A~Z,a~z,0~9,_中任意一个
\s
包括空格、制表符、换页符等空白字符的其中任意一个
.
小数点可以匹配除了换行符(\n)以外的任意一个字符
举例1:表达式"\d\d",在匹配"abc123"时,匹配的结果是:成功;匹配到的内容是:"12";匹配到的位置是:开始于3,结束于5。
举例2:表达式"a.\d",在匹配"aaa100"时,匹配的结果是:成功;匹配到的内容是:"aa1";匹配到的位置是:开始于1,结束于4。
1.4自定义能够匹配'多种字符'的表达式
Flex正则表达式中使用方括号[]包含一系列字符,能够匹配其中任意一个字符。用[^]包含一系列字符,则能够匹配其中字符之外的任意一个字符。同样的道理,虽然可以匹配其中任意一个,但是只能是一个,不是多个。
表达式可匹配
[ab5@]
匹配"a"或"b"或"5"或"@"
[^abc]
匹配"a","b","c"之外的任意一个字符
[f-k]
匹配"f"~"k"之间的任意一个字母
[^A-F0-3]
匹配"A"~"F","0"~"3"之外的任意一个字符
举例1:表达式"[bcd][bcd]"匹配"abc123"时,匹配的结果是:成功;匹配到的内容是:"bc";匹配到的位置是:开始于1,结束于3。
举例2:表达式"[^abc]"匹配"abc123"时,匹配的结果是:成功;匹配到的内容是:"1";匹配到的位置是:开始于3,结束于4。
http://hi.baidu.com/fengpingfan123/blog/item/9a0ffdef3be51b2fadafd5cc.html
谈谈正则表达式,AS3.0中引进了正则表达式。正则表达式是用于验证文本值是否符合特定模式。
正则表达式有四个部分。1元子符。2元序列。3标志。4数量表达符。
可以这样看patternRegExp=/匹配字符串元字符元序列/标志当然顺序可能不完全是这样.别把他想的太复杂其实他就是个组合。
现在我们来看看元字符:^$\.*+?()[]{}|
前面说的是转义字符串的使用
元子符
1.^的用法:匹配字符串的开头
varpattern:RegExp=/^小虫/;
varstr:String="小虫是好人";
trace(str,"isvalid:",pattern.test(str));小虫是好人isvalid:true
2.$的用法:匹配字符串的结尾
varpattern:RegExp=/lizhen$/;
varstr:String="Mynameislizhen";
trace(str,"isvalid:",pattern.test(str));小虫是好人isvalid:true
仔细看一下两个符号在匹配字符串中的位置,注意:如果同时使用^符号和$符号,将进行精确匹配。
3.\的用法:匹配字符串的结尾
如果匹配字符串中包含有"/"比如1/2的时候,使用如下定义
varpattern:RegExp=/1\/2/;
varstr:String="1/2是多少?";
trace(str,"isvalid:",pattern.test(str));1/2是多少?isvalid:true
如果匹配字符串中包含有""比如"lizhen"的时候,使用如下定义
varpattern:RegExp=/"lizhen"/;
varstr:String="Mynameis"lizhen"";
trace(str,"isvalid:",pattern.test(str));Mynameis"lizhen"isvalid:true
4.*的用法:匹配0个或多个前面的字符.
varpattern:RegExp=/我的*/;
varstr:String="我的我的我的";或者varstr:String="我的"
trace(str,"isvalid:",pattern.test(str));我的我的...isvalid:true
5.+的用法:匹配至少一个前面的字符
varpattern:RegExp=/我的+/;
varstr:String="我的ID是...";或者varstr:String="我的"
trace(str,"isvalid:",pattern.test(str));我的ID是...isvalid:true
注意+和*的区别。如果varstr:String="我的"那就会显示false
6.?的用法:匹配0个或1个前面的字符
varpattern:RegExp=/天?/;
varstr:String="一天快乐";或者varstr:String="天天快乐";
trace(str,"isvalid:",pattern.test(str));一天快乐isvalid:true
7..的用法:匹配任意单个字符
varpattern:RegExp=/天./;
varstr:String="一天快乐";或者varstr:String="天天快乐";
trace(str,"isvalid:",pattern.test(str));一天快乐isvalid:true
8.[]的用法:匹配某一个范围而不局限于具体的单个字符
varpattern:RegExp=/[a-z]/
varstr:String="a"
trace(str,"isvalid:",pattern.test(str));aisvalid:true
9.()的用法:这个就相当于是个集合。
varpattern:RegExp=/([a-z][A-Z][0-9])+/比如说这个就是定义了一个四个字符的字符串第一个字符是a到z之间的字符第二个是A到Z之间的字符第三个是0-9之间的字符,第四个重复前面的数字。
varstr:String="aD77aaaaaaaaaaaaaaaa"
trace(str,"isvalid:",pattern.test(str));aD77aaaaaaaaaaaaaaaaisvalid:true
10.|的用法:匹配左边或者右边的字符。
varpattern:RegExp=/小虫|lizhen/
varstr:String="小虫是好人"
trace(str,"isvalid:",pattern.test(str));小虫是好人isvalid:true
元序列
元序列是在正则表达式模式中具有特殊含义的字符序列
{n}{n,}{n,m}\b\B\d\D\f\n\r\s\S\t\unnnn\v\w\w\W\xnn
1.{n}的用法:匹配恰好n个(n为非负整数)前面的字符。
varpattern:RegExp=/(小虫){2}/对象中连续出现2次小虫.注意下(),如果用varpattern:RegExp=/小虫{2}/那么就是varstr:String="小虫虫"
varstr:String="小虫小虫"
trace(str,"isvalid:",pattern.test(str));小虫小虫isvalid:true.
2.{n,}的用法:匹配恰好n个(n为非负整数)或更多个前面的字符。
3.{n,m}的用法:匹配至少n个,至多m个前面的字符。
4.\b的用法:匹配单词字符和非单词字符之间的位置只能放在开头和结尾。
NN的,他不支持中文.用中文还是用^.
varpattern:RegExp=/\b小虫/
varpattern:RegExp=/.mp3\b/
varstr:String="小虫.mp3"可以判断是否是mp3格式。
trace(str,"isvalid:",pattern.test(str));小虫.mp3isvalid:true
5.\B的用法:匹配对象必须位于目标字符串的开头和结尾两个边界之内,
即匹配对象既不能作为目标字符串的开头,也不能作为目标字符串的结尾和\b相反。
varpattern:RegExp=/\B是/
varstr:String="我是虫子"
trace(str,"isvalid:",pattern.test(str));我是虫子isvalid:true
6.\d的用法:用于匹配从0到9的数字;
varpattern:RegExp=/\b\d/开头的第一字符必须为数字
varstr:String="900/元"
trace(str,"isvalid:",pattern.test(str));900/元isvalid:true
7.\D的用法:匹配除数字以外的任何字符
varpattern:RegExp=/\b\D/开头的第一字符必须不为数字
varstr:String="a900/元"
trace(str,"isvalid:",pattern.test(str));a900/元isvalid:true
8.\f的用法:匹配换页符DOS操作时代的概念
9.\n的用法:匹配换行符
varpattern:RegExp=/\n/
varstr:String="欢迎来到虫子的空间!\n"
trace(str,"isvalid:",pattern.test(str));
10.\r的用法:匹配回车符
varpattern:RegExp=/\r/
varstr:String="欢迎来到虫子的空间!\r"
trace(str,"isvalid:",pattern.test(str));
11.\s的用法:匹配任何空白字符(空格、制表符、换行符或回车符)
varpattern:RegExp=/\s/
varstr:String="欢迎来到虫子的空间!"
trace(str,"isvalid:",pattern.test(str));欢迎来到虫子的空间!isvalid:true
12.\S的用法:匹配除空白字符以外的任何字符
varpattern:RegExp=/\S/
varstr:String="欢迎来到虫子的空间!"
trace(str,"isvalid:",pattern.test(str));欢迎来到虫子的空间!isvalid:true
13.\t的用法:匹配制表符DOS操作时代的概念
14.\unnnn用法:匹配字符代码由十六进制数字nnnn指定的Unicode字符。
例如,\u263a是一个笑脸字符
varpattern:RegExp=/\u263a/
varstr:String="欢迎来到虫子的空间!\u263a"
trace(str,"isvalid:",pattern.test(str));欢迎来到虫子的空间!☺isvalid:true
15.\v用法:匹配垂直换页符DOS操作时代的概念
16.\w用法:匹配单词字符(A-Z、a-z、0-9或_)。
请注意,\w不匹配非英文字符,如é、ñ或ç。他和[]是有区别的。
varpattern:RegExp=/^\w/
varstr:String="a虫子"
varstr:String="0虫子"
varstr:String="A虫子"
varstr:String="_虫子"
trace(str,"isvalid:",pattern.test(str));_虫子isvalid:true
17.\W用法:匹配除单词字符以外的任何字符。
varpattern:RegExp=/^\W/
varstr:String="虫子"
trace(str,"isvalid:",pattern.test(str));虫子isvalid:true
18.\xnn用法:匹配具有指定ASCII值(由十六进制数字nn定义)的字符。
varpattern:RegExp=/^\x41/;"A"
varstr:String="ABCD";
trace(str,"isvalid:",pattern.test(str));ABCDisvalid:true
标志:
标志可以作为正则表达式对象属性进行访问。
正则表达式有五个标志:gimsx
1.g的用法:如果不指定g,那么在查找的时候只会返回一个。
如:
varstr:String="shesellsseashellsbytheseashore.";
varpattern:RegExp=/sh\w*/;
trace(str.match(pattern))输出:she
指定g后:
varstr:String="shesellsseashellsbytheseashore.";
varpattern:RegExp=/sh\w*/g;
trace(str.match(pattern))输出:she,shells,shore
2.i的用法:默认情况下,正则表达式匹配区分大小写。如果设置i(ignoreCase)标志,将忽略区分大小写。
varstr:String="ShesellsseaShellsbytheseaShore.";
varpattern:RegExp=/sh\w*/gi;
trace(str.match(pattern))输出:She,Shells,Shore
3.m的用法:匹配"行"的开头和结尾.注意这里的行只有\n字符表示行的结束,其余的都不行。包括\r。比如:
varstr:String="ShesellsseaShellsbytheseaShore.\n";
str+="She'syourmother"
varpattern:RegExp=/^sh\w*/gim;
trace(str.match(pattern))输出:She,She
也可以在结尾使用.比如:
varstr:String="ShesellsseaShellsbytheseaShore.\n";
str+="She'syourmother.\n"
varpattern:RegExp=/\n\$\w*/gim;
trace("====="+str.match(pattern))输出:=====
4.s的用法:用点来匹配换行符
varstr:String="<p>Test\n";
str+="Multiline</p>";
varre:RegExp=/<p>.*?<\/p>/s;
trace(str.match(re));
5.x的用法:在正则表达式中使用x(extended)标志时,则会忽略在模式中键入的所有空格。
varstr:String="lizhen";
varre:RegExp=/lizhen/x
trace(str.match(re));输出:lizhen
数量表示符
使用数量表示符指定字符或序列在模式中的重复次数,如下所示:
数量表示符元字符
描述
*(星号)
匹配前面重复零次或多次的项目。
+(加号)
匹配前面重复一次或多次的项目。
?(问号)
匹配前面重复零次或一次的项目。
{n}
{n,}
和
{n,n}
指定前一项目的数值数量或数量范围:
/A{27}/匹配重复27次的字符A。
/A{3,}/匹配重复3次或更多次的字符A。
/A{3,5}/匹配重复3到5次的字符A。
您可以将数量表示符应用到单个字符、字符类或组:
/a+/匹配重复一次或多次的字符a。
/\d+/匹配一个或多个数字。
/[abc]+/匹配重复的一个或多个字符,这些字符可能是a、b或c中的某个。
/(very,)*/匹配重复零次或多次的后跟逗号和空格的单词very。
您可以在应用数量表示符的括号组内使用数量表示符。例如,下面的数量表示符匹配诸如word和word-word-word的字符串:
/\w+(-\w+)*/
默认情况下,正则表达式执行所谓的“无限匹配”。正则表达式中的任何子模式(如.*)都会尝试在字符串中匹配尽可能多的字符,然后再执行正则表达式的下一部分。例如,使用以下正则表达式和字符串:
varpattern:RegExp=/<p>.*<\/p>/;
str:String="<p>Paragraph1</p><p>Paragraph2</p>";
正则表达式匹配整个字符串:
<p>Paragraph1</p><p>Paragraph2</p>
但是,假如您只想匹配一个<p>...</p>组。则可以通过以下操作实现:
<p>Paragraph1</p>
在所有数量表示符后添加问号(?)以将其更改为所谓的“惰性数量表示符”。例如,下面的正则表达式使用惰性数量表示符*?匹配<p>后跟数量最少(惰性)的字符,再跟</p>的模式:
/<p>.*?<\/p>/
有关数量表示符,请牢记以下几点:
数量表示符{0}和{0,0}不会从匹配中排除项目。
不要结合使用多个数量表示符,例如/abc+*/中。
在除非设置s(dotall)标志,否则不会跨越多行,即使后跟*数量表示符。例如,请考虑使用以下代码:
varstr:String="<p>Test\n";
str+="Multiline</p>";
varre:RegExp=/<p>.*<\/p>/;
trace(str.match(re));//null;
re=/<p>.*<\/p>/s;
trace(str.match(re));
//output:<p>Test
//Multiline</p>
有
常用的正则表达式语句
^\d+$ //匹配非负整数(正整数+0)
^[0-9]*[1-9][0-9]*$ //匹配正整数
^((-\d+)|(0+))$ //匹配非正整数(负整数+0)
^-[0-9]*[1-9][0-9]*$ //匹配负整数
^-?\d+$ //匹配整数
^\d+(\.\d+)?$ //匹配非负浮点数(正浮点数+0)
^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$ //匹配正浮点数
^((-\d+(\.\d+)?)|(0+(\.0+)?))$ //匹配非正浮点数(负浮点数+0)
^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$//匹配负浮点数
^(-?\d+)(\.\d+)?$ //匹配浮点数
^[A-Za-z]+$ //匹配由26个英文字母组成的字符串
^[A-Z]+$ //匹配由26个英文字母的大写组成的字符串
^[a-z]+$ //匹配由26个英文字母的小写组成的字符串
^[A-Za-z0-9]+$ //匹配由数字和26个英文字母组成的字符串
^\w+$ //匹配由数字、26个英文字母或者下划线组成的字符串
^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$ //匹配email地址
^[a-zA-z]+://匹配(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$ //匹配url
匹配中文字符的正则表达式:[\u4e00-\u9fa5]
匹配双字节字符(包括汉字在内):[^\x00-\xff]
匹配空行的正则表达式:\n[\s|]*\r
匹配HTML标记的正则表达式:/<(.*)>.*<\/>|<(.*)\/>/
匹配首尾空格的正则表达式:(^\s*)|(\s*$)
匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
匹配网址URL的正则表达式:^[a-zA-z]+://(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$
匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
匹配国内电话号码:(\d{3}-|\d{4}-)?(\d{8}|\d{7})?
匹配腾讯QQ号:^[1-9]*[1-9][0-9]*$
下表是元字符及其在正则表达式上下文中的行为的一个完整列表:
\将下一个字符标记为一个特殊字符、或一个原义字符、或一个后向引用、或一个八进制转义符。
^匹配输入字符串的开始位置。如果设置了RegExp对象的Multiline属性,^也匹配’\n’或’\r’之后的位置。
$匹配输入字符串的结束位置。如果设置了RegExp对象的Multiline属性,$也匹配’\n’或’\r’之前的位置。
*匹配前面的子表达式零次或多次。
+匹配前面的子表达式一次或多次。+等价于{1,}。
?匹配前面的子表达式零次或一次。?等价于{0,1}。
{n}n是一个非负整数,匹配确定的n次。
{n,}n是一个非负整数,至少匹配n次。
{n,m}m和n均为非负整数,其中n<=m。最少匹配n次且最多匹配m次。在逗号和两个数之间不能有空格。
?当该字符紧跟在任何一个其他限制符(*,+,?,{n},{n,},{n,m})后面时,匹配模式是非贪婪的。非贪婪模式尽可能少的匹配所搜索的字符串,而默认的贪婪模式则尽可能多的匹配所搜索的字符串。
.匹配除"\n"之外的任何单个字符。要匹配包括’\n’在内的任何字符,请使用象’[.\n]’的模式。
(pattern)匹配pattern并获取这一匹配。
(?:pattern)匹配pattern但不获取匹配结果,也就是说这是一个非获取匹配,不进行存储供以后使用。
(?=pattern)正向预查,在任何匹配pattern的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。
(?!pattern)负向预查,与(?=pattern)作用相反
x|y匹配x或y。
[xyz]字符集合。
[^xyz]负值字符集合。
[a-z]字符范围,匹配指定范围内的任意字符。
[^a-z]负值字符范围,匹配任何不在指定范围内的任意字符。
\b匹配一个单词边界,也就是指单词和空格间的位置。
\B匹配非单词边界。
\cx匹配由x指明的控制字符。
\d匹配一个数字字符。等价于[0-9]。
\D匹配一个非数字字符。等价于[^0-9]。
\f匹配一个换页符。等价于\x0c和\cL。
\n匹配一个换行符。等价于\x0a和\cJ。
\r匹配一个回车符。等价于\x0d和\cM。
\s匹配任何空白字符,包括空格、制表符、换页符等等。等价于[\f\n\r\t\v]。
\S匹配任何非空白字符。等价于[^\f\n\r\t\v]。
\t匹配一个制表符。等价于\x09和\cI。
\v匹配一个垂直制表符。等价于\x0b和\cK。
\w匹配包括下划线的任何单词字符。等价于’[A-Za-z0-9_]’。
\W匹配任何非单词字符。等价于’[^A-Za-z0-9_]’。
\xn匹配n,其中n为十六进制转义值。十六进制转义值必须为确定的两个数字长。
\num匹配num,其中num是一个正整数。对所获取的匹配的引用。
\n标识一个八进制转义值或一个后向引用。如果\n之前至少n个获取的子表达式,则n为后向引用。否则,如果n为八进制数字(0-7),则n为一个八进制转义值。
\nm标识一个八进制转义值或一个后向引用。如果\nm之前至少有isprecededbyatleastnm个获取得子表达式,则nm为后向引用。如果\nm之前至少有n个获取,则n为一个后跟文字m的后向引用。如果前面的条件都不满足,若n和m均为八进制数字(0-7),则\nm将匹配八进制转义值nm。
\nml如果n为八进制数字(0-3),且m和l均为八进制数字(0-7),则匹配八