为你解疑:VB.NET开发正则表达式bug原因
很多朋友都喜欢找语言编程的bug,感觉有成就感,在用VB.NET开发正则表达式时我发现了一个bug!最近在使用正则表达式的时候发现:在忽略大小写的时候,匹配值从 0xff 到 0xffff 之间的所有字符,正则表达式竟然也能匹配两个 ASCII 字符:i(code: 0x69) 和 I(code: 0x49);但是仍然不能匹配其他的 ASCII 字母和数字。
比如以下的代码就是用来测试用VB.NET开发正则表达式匹配从 0xff 到 0xffff 的字符。而值范围在 0 到 0xfe 的所有字符是不能被匹配的。
1234567891011121314151617Regex regex = new Regex(@"[/u00FF-/uFFFF]+"); // The characters, whoes value are smaller than 0xff, are not expected to be matched. for (int i = 0; i < 0xff; i++) { string s = new string(new char[] { (char)i }); Debug.Assert( !regex.IsMatch(s), string.Format("The character was not expected to be matched: 0x{0:X}!", i)); } // However, the characters whoes value are greater than 0xfe are expected to be matched. for (int i = 0xff; i <= 0xffff; i++) { string s = new string(new char[] { (char)i }); Debug.Assert( regex.IsMatch(s), string.Format("The character was expected to be matched: 0x{0:X}!", i)); }
这时的运行结果是正常的,没有任何的断言错误出现。然而当使用忽略大小写的匹配模式时,结果就不一样了。将上面代码中的第一行改成:
1Regex regex = new Regex(@"[/u00FF-/uFFFF]+", RegexOptions.IgnoreCase);
程序运行的时候就会有两处断言错误。它们分别是字符值为 73 和 105,也就是小写字母 i 和大写字母 I。 这个 bug 非常奇怪,别的字符都很正常!而且用 javascript 脚本在 IE (版本是6.0)里面运行也同样有这么 bug 存在(比如下面这段代码)。然而在 Firefox 中运行就是没有问题的。还是 Firefox 好啊,呵呵!
相关推荐
wangzhaotongalex 2020-10-20
rechanel 2020-11-16
cshanzhizi 2020-10-16
luofuIT成长记录 2020-09-22
taomengxing 2020-09-07
MaggieRose 2020-08-19
jyj00 2020-08-15
MaggieRose 2020-07-04
modaiairen 2020-06-28
ziggurat 2020-06-28
JnX 2020-06-27
jyj00 2020-06-26
山水沐光 2020-06-25
shqhope 2020-06-23
eroshn 2020-06-21
码墨 2020-06-16
wyq 2020-11-11
TLROJE 2020-10-26
风雨断肠人 2020-10-13