深入浅析正则表达式中的B和
对于正则表达式的中\B和\b 有些地方会出现弄不懂的情况
或许你看了下面这篇博客 你就能够对\B和\b认识加深了
根据查看API可以知道 \B和\b都是边界匹配符
先说说\b这个单词边界吧!竟然想了解 首先必须清楚什么叫单词边界!我们可以以\b为分割来探究一下
单词边界
import java.util.regex.Matcher; import java.util.regex.Pattern; public class matcher1 { public static void main(String[] args) { String str="(中文问号?123???英文)问号?我是华丽[的制表符\t]我是华丽{的空格符 我是华丽}的换行符\n"; String rex="\\b"; Pattern pattern=Pattern.compile(rex); Matcher matcher=pattern.matcher(str); String [] result=pattern.split(str); for(String string:result){ System.out.println("分割的字符串:"+"["+string+"]"); } } }
运行结果
分割的字符串:[(]
分割的字符串:[中文问号]
分割的字符串:[?]
分割的字符串:[123]
分割的字符串:[???]
分割的字符串:[英文]
分割的字符串:[)]
分割的字符串:[问号]
分割的字符串:[?]
分割的字符串:[我是华丽]
分割的字符串:[[]
分割的字符串:[的制表符]
分割的字符串:[ ]]
分割的字符串:[我是华丽]
分割的字符串:[{]
分割的字符串:[的空格符]
分割的字符串:[ ]
分割的字符串:[我是华丽]
分割的字符串:[}]
分割的字符串:[的换行符]
分割的字符串:[
]
从这些分割的字符串中我们可以知道单词边界就是单词和符号之间的边界
这里的单词可以是中文字符,英文字符,数字;符号可以是中文符号,英文符号,空格,制表符,换行
下面我们看一个例子
import java.util.regex.Matcher; import java.util.regex.Pattern; public class matcher1 { public static void main(String[] args) { String str=" 2 "; String rex="\\b2\\b"; Pattern pattern=Pattern.compile(rex); Matcher matcher=pattern.matcher(str); if(matcher.matches()){ System.out.println("匹配成功"); }else{ System.out.println("匹配不成功"); } } }
在没有看上面分割的例子前估计很多人包括我都会认为这运行的结果是匹配成功
经过分割的例子后就知道了 空格并不是边界 空格与数字2之间的那个才叫边界 所以运行结果不言而喻 肯定是匹配不成功
当如果你这样写就运行出来就是匹配成功
import java.util.regex.Matcher; import java.util.regex.Pattern; public class matcher1 { public static void main(String[] args) { String str="2"; String rex="\\b2\\b"; Pattern pattern=Pattern.compile(rex); Matcher matcher=pattern.matcher(str); if(matcher.matches()){ System.out.println("匹配成功"); }else{ System.out.println("匹配不成功"); } } }
\b的用法
一般来说\b不用来判断当前字符串是否符合某种规则
一般我们都用\b来进行获取
import java.util.regex.Matcher; import java.util.regex.Pattern; public class matcher1 { public static void main(String[] args) { String str=",,,,呵呵,,,,"; String rex="\\b呵呵\\b"; Pattern pattern=Pattern.compile(rex); Matcher matcher=pattern.matcher(str); if(matcher.find()){ System.out.println(matcher.group()); } } }
运行结果
呵呵1
\B的用法
了解了\b的用法 我们再来说说\B \B是非单词边界
也就说\B=[^\b]//符号^是非的意思1
\b是单词与符号的边界 那非单词与符号的边界的其它都是\B
所以我们的猜想\B是符号与符号,单词与单词的边界
当然猜想需要认证!下面我们写一个例子来证明一个!
import java.util.regex.Matcher; import java.util.regex.Pattern; public class matcher1 { public static void main(String[] args) { String str="123456我是JAVA{,、;‘asd"; String rex="\\B"; Pattern pattern=Pattern.compile(rex); Matcher matcher=pattern.matcher(str); String [] result=pattern.split(str); for(String string:result){ System.out.println("分割的字符串:"+string); } } }
运行结果
分割的字符串:1
分割的字符串:2
分割的字符串:3
分割的字符串:4
分割的字符串:5
分割的字符串:6
分割的字符串:我
分割的字符串:是
分割的字符串:J
分割的字符串:A
分割的字符串:V
分割的字符串:A{ //单词与符号之间的边界不算\B的边界
分割的字符串:,
分割的字符串:、
分割的字符串:;
分割的字符串:‘a
分割的字符串:s
分割的字符串:d
事实证明\B作为非单词边界 确实是单词与单词,符号与符号之间的边界
\B一般也是用来获取字符串的
import java.util.regex.Matcher; import java.util.regex.Pattern; public class matcher1 { public static void main(String[] args) { String str=",,,,,和呵呵,,,,,"; String rex="\\B呵\\B"; Pattern pattern=Pattern.compile(rex); Matcher matcher=pattern.matcher(str); if(matcher.find()){ System.out.println(matcher.group()); } } }
因为字符与字符之间的边界
所以运行的结果是
呵
补充:
正则表达式中\b和\s有什么区别
字符串:abcsdsadas abc asdsadasdabcasdsa
使用\sabc\s和\babc\b都能匹配中间的abc,这种方法不是重复了么,/s是匹配空格回车等得,/b网上教程说得不清楚什么字符边界什么意思。
不一样
\babc\b匹配的是"abc"
\sabc\s匹配的不是"abc", 前后还带空格" abc "
\b只是匹配字符串开头结尾及空格回车等的位置, 不会匹配空格符本身
例如"abc sdsadasabcasdsadasdabcasdsa",
\sabc\s不能匹配,\babc\b可以匹配到"abc"
\b代表字与字中间那个看不见的东西,如
here is a word
那么,这句中有好几个\b, 每个单词的前后都有一个\b.
所以你用 \bhere\b 可以匹配上面这个here,但如果here 不是一个单词,而是一个单词的一部分,如 adheread, 这样的话,用here 可以匹配,用\bhere\b就不能区配了,因为ad后面没有\b. 所以 adhere 中的here 不会被匹配。
总结: \b 就是用在你匹配整个单词的时候。 如果不是整个单词就不匹配。 你想匹配 I 的话,你知道,很多单词里都有I的,但我只想匹配I,就是“我”,这个时候用 \bI\b
\B就是反过来,代表非字间。 类似\d代表数字, \D代表非数字。