sed与awk菜鸟的笔记--第三章 了解正则表达式

第三章 了解正则表达式

第三章是最重要的,很多正则表达式都有一起同工之妙,所以一定要好好学习!

P45:特殊字符汇总.

P54:POSIX字符类([:space:]等)

grep -c '^$' file :计算file文件的空行数

\{n,m\}:匹配他前面某个范围内单个字符出现的次数 (\{n\}:n次 \{n,\}:至少n次 \{n,m\}:n和m之间的次数)

+:1次或多次 等价于\{1,\}

?:0次或1次 等价于\{0,1\}

*:0次到多次 等价于\{0,\}

^: a.正则表达式的第一个字符,则表示行开始. 

   b.在"[]"里,表示行中不包含[]中的所有字符(即使要匹配的行中有一个[^...]以为的都会打印出来)

echo "abc" abc.txt ;awk '/[^ab]/' abc.txt   #会显示

echo "abc" abc.txt ;awk '/[^abc]/' abc.txt   #不会显示 

   c.出现在其他位置则作为自身不是特殊字符匹配.

$:和^原理相同. 正则表达式若想匹配他自身,最好都加斜杠转义.

():用于对正则表达式分组设置优先级.

   egrep "compan(y|ies)" file :匹配单词company的单复数

   egrep "Tom( and Jerry)?" file :匹配"Tom"和"Tom and Jerry"

   egrep "Tom( and Jerry)" file :匹配"Tom and Jerry",与没有括号结果一样

A*Z:零次或多次出现A,后面跟Z.产生的结果与只写一个Z相同.

A.*Z:A与Z之间有任意多的字符(包括0个字符).

[0-9][0-9]*\.\.*[0-9][0-9]*:n个数字后跟n个句点再跟n个数字(n>=1)  //匹配 1.5 , 44..9等。不匹配1d.3等

[0-9][0-9]*\.\{5,\}[0-9][0-9].*:一个数字后至少跟5个句点,然后又跟有一个数字.

$ sed 's#\([0-9][0-9]*\)\.\{5,\}\([0-9][0-9]*\)#\1-\2#' filename :此表达式用于匹配"一个数字后面至少跟5个句点,然后又至少跟一个数字"的情况,并将之间的所有"."替换成"-" 。  \(和\)用于保存正则表达式的一部分,而\1和\2用于回调保存部分.

//分析:由于用"/"做为替换的分隔符看着不清楚,这里用的"#".

//运行示例

$ cat filename 

1...........38

4...............9

3...6

$ sed 's#\([0-9][0-9]*\)\.\{5,\}\([0-9][0-9]*\)#\1-\2#' filename

1-38

4-9

3...6

正则表达式示例:

匹配空行:^$

匹配整个行:^.*$

匹配一个或多个空格:空空*

相关推荐