Linux正则表达式与文件格式化处理学习总结

1、正则表达式就是处理字符串的方法,它是以行为单位来进行字符串的处理行为

2、正则表达式通过一些特殊符号的辅助,可以让用户轻易达到查找、删除、替换某特定字符串的处理程序

3、只要工具程序支持正则表达式,那么该工具程序就可以用来作为正则表达式的字符串处理之用

4、正则表达式与通配符是完全不一样的,通配符代表的是bash操作接口的一个功能,但正则表达式则是一种字符串处理的表示方式

5、使用grep或其他工具进行正则表达式的字符串比较时,因为编码的问题会有不同的状态,因此最好将lANG等变量设置为C或者是en等英文语系

6、grep与egrep在正则表达式里面是很常见的两个程序,其中,egrep支持更严谨的正则表达式的语法

7、由于编码系统的不同,不同的语系会造成正则表达式选取数据的区别,因此可利用特殊符号如[:upper]来来替代编码范围较佳

8、由于严谨度不同正则表达式之上还有更严谨的扩展正则表达式

9、基础正则表达式的特殊字符有   *   ?   []    [-]   [^]    ^    $   等

10、常见的正则表达式工具有grep   sed    vim  等

11、printf可以通过一些特殊符号来将数据进行格式化输出

12、awk可以使用“字段”为依据,进行数据的重新整理与输出

13、文件的比较中,可以利用diff及cmp进行比较,其中diff主要用在纯文本文件方面的新旧版比较

14、patch命令可以将旧版数据更新到新版

相关推荐