Linux文本处理工具grep和正则表达式及egrep与grep区别

luofuIT成长记录

2016-08-09

关注关注

文本处理工具grep，正则表达式在Linux学习过程中很容易出现困惑与障碍的地方，这里分享下学习这方面内容的一些感受。

grep Global search REgular expression and Print out the line

作用：文本搜索工具，根据用户指定的‘模式（过滤条件）’对目标文本逐行进行匹配检查；打印匹配到的行；

‘模式’：由正则表达式的元字符及文本字符所编写出的过滤条件。

grep [OPTIONS] PATTERN [FILE...]

grep [OPTIONS] [-e PATTERN | -f FILE] [FILE...]

常用选项：

-i:忽略字符大小写

-o:仅显示匹配到的字符串本身

-v:显示不能被模式匹配到的行

-E:支持扩展正则表达式元字符

-q:静默模式，匹配不显示

-A#:after,显示匹配条件所在行的后#行

-B#:before,显示匹配条件所在行的前#行

-C#:context,显示匹配条件所在行的前后#行

-n：显示匹配的行号（用的较少）

-c: 统计匹配的行数（用的较少）

下面以几个小实验对grep的用法及选项做下具体的演示

实验目录/test 文本/test/head

[root@localhost test]# cat head  
12345 Sdabc saber  
Berar bserac 
12cds 
67890 
12 
345 
123 
6

Linux文本处理工具grep和正则表达式及egrep与grep区别

正则表达式：Regual Expression，REGEXP

它由一类特殊字符及文本字符所编写的模式，其中有些字符不表示其字面意义，而是用于表示控制或通配的功能。

它分两类：基本正则表达式BRE、扩展正则表达式ERE

基本正则表达式元字符：

包括：字符匹配、匹配次数、位置锚定、分组

字符匹配：

. ：匹配任意单个字符； [] ：匹配指定范围内的任意单个字符

[^] ：匹配指定范围外的任意单个字符

常用集合：[:digit:]、[:lower:]、[:upper:]、[:alpha:]、[:alnum:]、[:punct:]、[:space:]

Linux文本处理工具grep和正则表达式及egrep与grep区别

匹配次数：用在要指定次数的字符后面，用于指定前面的字符要出现的次数

*：匹配前面的字符任意次，包括0次；贪婪模式：尽可能长的匹配

.*：任意长度的任意字符

\?：匹配其前面的字符0或1次

\+：匹配其前面的字符至少1次

\{m\}：匹配前面的字符m次

\{m,n\}：匹配前面的字符至少m次，至多n次

\{,n\}：匹配前面的字符至多n次

\{m,\}：匹配前面的字符至少m次

Linux文本处理工具grep和正则表达式及egrep与grep区别

位置锚定：定位出现的位置

^：行首锚定，用于模式的最左侧

$：行尾锚定，用于模式的最右侧

^PATTERN$: 用于模式匹配整行

^$: 空行

^[[:space:]]*$ ：空白行

单词：非特殊字符组成的连续字符在Linux看来都称单词

\< 或\b：词首锚定，用于单词模式的左侧

\> 或\b：词尾锚定；用于单词模式的右侧

\<PATTERN\>：匹配完整的单词

Linux文本处理工具grep和正则表达式及egrep与grep区别

1、查找以for开头的行

Linux文本处理工具grep和正则表达式及egrep与grep区别

2、检索只含有for的字符串；检索含有for的内容

Linux文本处理工具grep和正则表达式及egrep与grep区别

3、检索以for结尾的行；检索以for结尾的字符串

Linux文本处理工具grep和正则表达式及egrep与grep区别

分组：：将一个或多个字符捆绑在一起，当作一个整体进行处理，如：$root$\+

分组括号中的模式匹配到的内容会被正则表达式引擎记录于内部的变量中，这些变量的命名方式为: \1, \2, \3, ...

\1: 从左侧起，第一个左括号以及与之匹配右括号之间的模式所匹配到的字符；

实例：$string1\+\(string2$*\)

\1: string1\+$string2$*

\2: string2

后向引用：引用前面的分组括号中的模式所匹配字符(而非模式本身)

Linux文本处理工具grep和正则表达式及egrep与grep区别

上述命令意思是检索包含有for字符串后跟任意字符且出现一次，连续出现上述情况两次截取结果。后面的\1是重复第一个括号内的检索对象。

egrep= grep -E

egrep[OPTIONS] PATTERN [FILE...]

扩展正则表达式的元字符：

字符匹配：同基本正则表达式

次数匹配：

*：匹配前面字符任意次

?: 0或1次

+：1次或多次

{m}：匹配m次

{m,n}：至少m，至多n次

位置锚定：同基本正则表达式

分组：

()

后向引用：\1, \2, ...

或者：

a|b

C|cat: C或cat

(C|c)at:Cat或cat

最后我们通过9个例子来感受grep与正则表达式结合所能实现的功能

1、显示/proc/meminfo文件中以大小s开头的行

Linux文本处理工具grep和正则表达式及egrep与grep区别

这个只需要知道grep的选项i就能轻松解决。

2、显示/etc/passwd文件中不以/bin/bash结尾的行

Linux文本处理工具grep和正则表达式及egrep与grep区别

先使用grep检索出包含有以“/bin/bash”结尾的行，再使用grep的-v取不以上面结果的行。类似数学中的补集效果。

3、找出ifconfig命令结果中本机的所有IPv4地址

Linux文本处理工具grep和正则表达式及egrep与grep区别

这个分为三步：

1）通过grep锁定包含有IPV4的行，这个通过分析ifconfig列出的信息可以看出规律，只要包含有IPv4的开头都有inet这个字母，所以我们只需要检索它就行了

2）接下来使用tr将所有空替换为“:”并压缩

3）使用cut实现结果。

4、查出分区空间使用率的最大百分比值

Linux文本处理工具grep和正则表达式及egrep与grep区别

这个大致分6步：

1）过滤汉字

2）使用tr替换所有空为":"并压缩

3）使用cut剪切出含有使用率百分比的数值

4）再次使用tr剔除%

5）使用sort按数值大小写排序

6）使用tail取出最大值

5、显示用户rpc默认的shell程序

Linux文本处理工具grep和正则表达式及egrep与grep区别

上面的检索条件是以rpc为行首且以它为字符结尾的行

6、找出/etc/passwd中的两位或三位数

Linux文本处理工具grep和正则表达式及egrep与grep区别

这里使用的是扩展正则表达式因为可以是表达式更简洁

这里需要注意的是要以两位或三位数为字符串，这需要对其进行开头与结尾的字符锚定

7、找出/etc/rc.d/init.d/functions文件中行首为某单词(包括下划线)后面跟一个小括号的行

Linux文本处理工具grep和正则表达式及egrep与grep区别

当我们想好要过滤的条件后，要对其进行行首及字符的锚定，否则会导致条件范围不严谨

这里要注意的是.*\>，如果这里改写为.*\>则会失败，具体可以自己想想。其实.*已经包括了"()"，所以后面的是重复的，这样就容易出错。

8、使用egrep取出/etc/rc.d/init.d/functions中其基名

Linux文本处理工具grep和正则表达式及egrep与grep区别

上面是两种方法，一种利用grep直接检索出来，另一种的思想是分割。各有特点

9、利用扩展正则表达式分别表示0-9、10-99、100-199、200-249、250-255

\<[0-9]\>:0-9

\<[1-9][0-9]|>:10-99

\<1[0-9][0-9]\> | \<1[0-9]{2}\>:100-199

\<2[0-4][0-9]\> :200-249

\<25[0-5]\>:250-255

上面只是对grep及正则表达式的简要总结，不过只要掌握好这基本的内容自己也就可以进行更深入的学习了。

font-family grep gb2312 正则表达式 font-size font

luofuIT成长记录

0 关注 0 粉丝 0 动态

关注关注

Linux解压文件

1、*.tar 用 tar –xvf 解压2、*.gz 用 gzip -d或者gunzip 解压3、*.tar.gz和*.tgz 用 tar –xzf 解压4、*.bz2 用 bzip2 -d或者用bunzip2 解压5、*.tar.bz2用tar –xj

graseed 2020-10-28

让数据处理更简单？百度EasyData推出首个高级智能数据清洗功能

在进行AI模型开发时，数据的数量与质量直接影响模型效果。在实地数据采集之后，企业往往需要从大量数据中筛选出符合训练要求的相关数据，剔除质量差或不相关的数据，这个步骤被称为数据清洗。针对数据清洗这一具体功能，EasyData目前上线了去相似、去模糊、旋转、裁

jinhao 2020-09-07

数据科学家、开发者的新神器 Amazon SageMaker正式上线中国区

机器学习自诞生至今，已经被应用在很多领域，但目前来看对于从业人员来说仍然存在着一些阻力。首先是机器学习方向的学习门槛高，人工智能、机器学习这些知识，相对来说比较苦涩难懂，对学习人员的综合素养要求高；想要真正成为一名机器学习工程师。而近期登陆中国区的Amaz

yoohsummer 2020-06-01

jackson gson

private static final ObjectMapper objectMapper = new ObjectMapper();

SXIAOYI 2020-09-16

css之font

　　font属性可用于font-style,font-family,font-weigth,font-variant,font-size,line-height这六个属性的简写，下面来分别说明。　　　　参数：20px/关键字可以使用关键字，像素或em数字

impress 2020-02-20

rails常用命令

数据库迁移部分：。rake db:create 依照目前的 RAILS_ENV 環境建立資料庫。rake db:rollback STEP=n 回復上N個 Migration 動作。rake db:migrate:up VERSION=2008090612

chenshuixian 2013-06-01

浏览器缓存机制

Cache-Control 是最重要的规则。这个字段用于指定所有缓存机制在整个请求/响应链中必须服从的指令。这些指令指定用于阻止缓存对请求或响应造成不利干扰的行为。这些指令通常覆盖默认缓存算法。缓存指令是单向的，即请求中存在一个指令并不意味着响应中将存在同

羽化大刀Chrome 2013-05-31

6月19日 --- mac终端命令大全介绍(转)

OSX 的文件系统 OSX 采用的Unix文件系统，所有文件都挂在跟目录 / 下面，所以不在要有Windows 下的盘符概念。你在桌面上看到的硬盘都挂在 /Volumes 下。比如接上个叫做 USBHD的移动硬盘，桌面上会显示出一个硬盘图标，它实际在哪里呢

kanpiaoxue 2013-06-19

如何为 Mac 安装 Java？

要在 Mac OS X 上运行 Java 7，需要 64 位浏览器。在 Mac 平台上，32 位浏览器不支持 Java 7。下面的屏幕截图和说明适用于 Java 7 Update 6 。如果正在安装其他版本，请务必相应地更改版本号。示例：对于 Java 版

quanhaoH 2013-06-17

Ubuntu 安装Docker

Unbutu系统上安装Docker服务，为保证docker服务的运行未定，需要使用与之相匹配的docker版本，使用命令。若看到上述信息，表明docker安装成功！默认情况下，docker从hub上下载需要安装的进行，囿于这些hub位于国外，下载速度缓慢，

pigsmall 2020-11-19

如何根据云服务中提取的数据来推断出用户的位置？

地理位置数据可以为各种政府机构提供需要的信息，执法机构使用位置数据来锁定嫌疑人位置。但是，地理位置数据可不限于刑事或民事调查，比如日常的紧急响应服务也要使用位置数据来服务需要帮助的人员，出租车和送货服务也要使用位置来改善服务。还有更多的例子表明位置数据是至

大数据杂谈 2020-09-26

几维安全用代码虚拟化技术解决IOT安全核心痛点，让万物互联更安全

几维安全定位专注于底层安全技术的企业，主要方向为物联网安全产品和服务。其虚拟化编译器可以通过固件代码虚拟化隐藏协议逻辑，白盒加虚拟化以及加密芯片则能充分保护密钥安全。物联网攻击事件亦是频发。在此背景下，物联网安全市场正井喷式发展，据相关数据显示，2018年

ChinaWin 2020-08-13

性能测试综述

性能测试旨在检查应用程序或软件在特定负载下工作时的响应性和稳定性，从而检测应用程序/软件在响应速度、可扩展性和稳定性方面是否达到预期的要求。简而言之，性能测试目标就是为了识别并消除应用程序中的性能瓶颈。性能测试主要有[负载测试]，[压力测试]，[容量测试]

mohanzb 2020-08-01

小白也可以玩转的炫酷大屏！

从2015年开始，数据可视化大屏备受很多企业青睐，也是展现公司业务数据的不二之选。可视化大屏怎么这么火？领导天天要，业务人员、开发人员、UI设计师就得一起熬夜加班。那么，有没有一种简单高效、还能快速上手的可视化工具，小白也可以快速上手的工具呢？此外，还包含

王国平 2020-06-20

安卓移动应用代码安全加固系统设计及实现

安卓平台已经逐渐成为最受欢迎的移动终端操作系统，基于安卓系统的软件应用数量众多，同时安全威胁也在不断增加。介绍了Android系统的安全风险及加固的核心技术，据此提出了一种安卓应用程序的安全加固系统，设计和实现了基于代码混淆的加固技术，从而达到了移动应用安

kangtingting0 2020-05-20

批量服务器管理软件批量管理服务器

iis7VPS服务器批量管理是一款可以完美支持 3389 vnc 一键登录。方便随时保持服务器信息。支持打印列表到处Excel列表。可查看在线服务器列表和离线服务器列表，一键联系客服，自动复制服务器地址和故障现象，直接弹出管理的QQ对话框。检测服务器状态

MichelinMessi 2020-02-19

css备份

.syntaxhighlighter a, .syntaxhighlighter div, .syntaxhighlighter code, .syntaxhighlighter table, .syntaxhighlighter table td, .s

nicepainkiller 2020-01-25

关于ie6不支持png的解决方法（记录）

介绍：滤镜从IE4.0被微软正式引入，所以我们可以使用滤镜解决IE6的PNG透明问题，滤镜不仅可以实现目前CSS3的一些旋转效果而且还可以引入图片。注意：此方法在部分版本的IETest中无效，建议使用标准的IE6来进行测试！

hfszy0 2013-05-15

myeclipse 无法复制粘贴代码解决方法

比如有A、B两个编辑窗口在A编辑完了，换B窗口但是在B窗口里无法粘贴剪切，但是可以敲代码在B窗口执行粘贴的话，粘贴的代码会调到A窗口除非关了A窗口，否则B窗口基本无法使用了是不是我无意中按了什么快捷键锁定了A窗口？？？window-->prefere

lizhenmxcz 2013-05-12

Chrome 浏览器中很酷的实验性功能

Chrome 浏览器作为一款版本号跑的超快，功能特性也都超好的超棒浏览器，总是会在Candy、Dev版本中加入些超前的实验性设置。之前就介绍过那些，隐藏在chrome:// 里的页面，今天就介绍些在chrome://flags 里的优秀实验性功能。启用触摸

gxyblue 2013-05-11

安科网

Linux文本处理工具grep和正则表达式及egrep与grep区别

luofuIT成长记录

luofuIT成长记录

相关推荐

Linux解压文件

让数据处理更简单？百度EasyData推出首个高级智能数据清洗功能

数据科学家、开发者的新神器 Amazon SageMaker正式上线中国区

jackson gson

css之font

rails常用命令

浏览器缓存机制

6月19日 --- mac终端命令大全介绍(转)

如何为 Mac 安装 Java？

Ubuntu 安装Docker

如何根据云服务中提取的数据来推断出用户的位置？

几维安全用代码虚拟化技术解决IOT安全核心痛点，让万物互联更安全

性能测试综述

小白也可以玩转的炫酷大屏！

安卓移动应用代码安全加固系统设计及实现

批量服务器管理软件批量管理服务器

css备份

关于ie6不支持png的解决方法（记录）

myeclipse 无法复制粘贴代码解决方法

Chrome 浏览器中很酷的实验性功能

luofuIT成长记录