Linux Shell脚本系列-正则表达式介绍

mrshelly

2011-05-04

随着对UNIX和LINUX熟悉程度的不断加深，需要经常接触到正则表达式这个领域。使用shell时，从一个文件中抽取多于一个字符串将会很麻烦。例如，在一个文本中抽取一个词，它的头两个字符是大写的，后面紧跟四个数字。如果不使用某种正则表达式，在s h e l l中将不能实现这个操作。
本章内容包括：
? 匹配行首与行尾。
? 匹配数据集。
? 只匹配字母和数字。
? 匹配一定范围内的字符串集。
当从一个文件或命令输出中抽取或过滤文本时，可以使用正则表达式（RE），正则表达式是一些特殊或不很特殊的字符串模式的集合。

本章设计的基本元字符使用在g r e p和s e d命令中，同时结合{ \ \ }（以字符出现情况进行匹配的元字符）使用在awk语言中。
基本元字符集及其含义

^                            匹配行首
$                            匹配行尾
*                            一个单字符后紧跟*，匹配0个或多个此单字符
[ ]                          匹配[ ]内字符。可以是一个单字符，也可以是字符序列。可以使用-
                                 表示[ ]内字符序列范围，如用[ 1 - 5 ]代替[ 1 2 3 4 5 ]
\                                用来屏蔽一个元字符的特殊含义。因为有时在s h e l l中一些元字符有
                                 特殊含义。\可以使其失去应有意义
.                            匹配任意单字符
pattern\{n\}                   用来匹配前面pattern出现次数。n为次数
pattern\{n\}m                  含义同上，但次数最少为n
pattern\{n，m\}                含义同上，但pattern出现次数在n与m之间

1.使用\屏蔽一个特殊字符的含义
有时需要查找一些字符或字符串，而它们包含了系统指定为特殊字符的一个字符。什么。是特殊字符？一般意义上讲，下列字符可以认为是特殊字符：

$ . ' " * [ ] ^ | 0 | + ?

假定要匹配包含字符“ .”的各行而“，”代表匹配任意单字符的特殊字符，因此需要屏蔽其含义。操作如下：
\.
上述模式不认为反斜杠后面的字符是特殊字符，而是一个普通字符，即句点。假定要匹配包含^的各行，将反斜杠放在它前面就可以屏蔽其特殊含义。如下：
\^
如果要在正则表达式中匹配以*.pas结尾的所有文件，可做如下操作：
\*\.pas
即可屏蔽字符*的特定含义。

2.使用[]匹配一个范围或集合

使用“ -”表示一个字符串范围，表明字符串范围从“ -”左边字符开始，到“ -”右边字符结束。如果熟知一个字符串匹配操作，应经常使用[ ]模式。假定要匹配任意一个数字，可以使用：
[ 0 1 2 3 4 5 6 7 8 9 ]
然而，通过使用“-”符号可以简化操作：
[ 0 - 9 ]
或任意小写字母
[ a - z ]
要匹配任意字母，则使用：
[ A - Z a - z ]
表明从A - Z、a - z的字母范围。如要匹配任意字母或数字，模式如下：
[ A - Z a - z 0 - 9 ]
在字符序列结合使用中，可以用[ ]指出字符范围。假定要匹配一单词，以s开头，中间有
一任意字母，以t结尾，那么操作如下：
s[a-z A-Z]t
上述过程返回大写或小写字母混合的单词，如仅匹配小写字母，可使用：
s [ a - z ] t
如要匹配C o m p u t e r或c o m p u t e r两个单词，可做如下操作：
[ C c ] o m p u t e r
为抽取诸如S c o u t、s h o u t、b o u g h t等单词，使用下列表达式：
[ou] .*t
匹配以字母o或u开头，后跟任意一个字符任意次，并以t结尾的任意字母。
也许要匹配所有包含s y s t e m后跟句点的所有单词，这里S可大写或小写。使用如下操作：
[ S,s ] y s t e m \ .
[ ]在指定模式匹配的范围或限制方面很有用。结合使用*与[ ]更是有益，例如[ A - Z a - Z ] *将匹配所有单词。
[ A - Z a - z ] *
注意^符号的使用，当直接用在第一个括号里，意指否定或不匹配括号里内容。
[^a-zA-Z]
匹配任一非字母型字符，而
[ ^ 0 - 9 ]
匹配任一非数字型字符。

正则表达式 shell linux系统特殊字符字符 shell脚本

安科网

Linux Shell脚本系列-正则表达式介绍

mrshelly

mrshelly

相关推荐

shell模糊匹配与正则详解

Shell—正则表达式（grep命令、sed工具）

正则表达式解决input框固定输入值得格式(金额,特殊字符)

【教程】图文解读正则表达式的使用技巧

如何掌握正则表达式这一开发利器，看这篇就够了

如何使用Grep命令查找多个字符串

C# 正则表达式

正则表达式常用的字符类

正则表达式

正则表达式基础

小智最近在学习正则，学习过程中发现这 6 个方便的正则表达式

【python----发轫之始】【正则表达式总结】

第一章—正则表达式

python——RE模块的基础应用及正则表达式的使用

在 JavaScript 中替换所有指定字符 3 种方法

10. 正则表达式匹配

leetcode之正则表达式匹配Golang

正则表达式中两个反斜杠的匹配规则详解

浅析golang 正则表达式

Oracle数据库正则表达式使用场景代码实例

mrshelly