sed与awk菜鸟的笔记--第三章 了解正则表达式
第三章 了解正则表达式
第三章是最重要的,很多正则表达式都有一起同工之妙,所以一定要好好学习!
P45:特殊字符汇总.
P54:POSIX字符类([:space:]等)
grep -c '^$' file :计算file文件的空行数
\{n,m\}:匹配他前面某个范围内单个字符出现的次数 (\{n\}:n次 \{n,\}:至少n次 \{n,m\}:n和m之间的次数)
+:1次或多次 等价于\{1,\}
?:0次或1次 等价于\{0,1\}
*:0次到多次 等价于\{0,\}
^: a.正则表达式的第一个字符,则表示行开始.
b.在"[]"里,表示行中不包含[]中的所有字符(即使要匹配的行中有一个[^...]以为的都会打印出来)
echo "abc" abc.txt ;awk '/[^ab]/' abc.txt #会显示
echo "abc" abc.txt ;awk '/[^abc]/' abc.txt #不会显示
c.出现在其他位置则作为自身不是特殊字符匹配.
$:和^原理相同. 正则表达式若想匹配他自身,最好都加斜杠转义.
():用于对正则表达式分组设置优先级.
egrep "compan(y|ies)" file :匹配单词company的单复数
egrep "Tom( and Jerry)?" file :匹配"Tom"和"Tom and Jerry"
egrep "Tom( and Jerry)" file :匹配"Tom and Jerry",与没有括号结果一样
A*Z:零次或多次出现A,后面跟Z.产生的结果与只写一个Z相同.
A.*Z:A与Z之间有任意多的字符(包括0个字符).
[0-9][0-9]*\.\.*[0-9][0-9]*:n个数字后跟n个句点再跟n个数字(n>=1) //匹配 1.5 , 44..9等。不匹配1d.3等
[0-9][0-9]*\.\{5,\}[0-9][0-9].*:一个数字后至少跟5个句点,然后又跟有一个数字.
$ sed 's#\([0-9][0-9]*\)\.\{5,\}\([0-9][0-9]*\)#\1-\2#' filename :此表达式用于匹配"一个数字后面至少跟5个句点,然后又至少跟一个数字"的情况,并将之间的所有"."替换成"-" 。 \(和\)用于保存正则表达式的一部分,而\1和\2用于回调保存部分.
//分析:由于用"/"做为替换的分隔符看着不清楚,这里用的"#".
//运行示例
$ cat filename
1...........38
4...............9
3...6
$ sed 's#\([0-9][0-9]*\)\.\{5,\}\([0-9][0-9]*\)#\1-\2#' filename
1-38
4-9
3...6
正则表达式示例:
匹配空行:^$
匹配整个行:^.*$
匹配一个或多个空格:空空*