Linux18_数据操作

grep命令 筛选数据
Globally search a Regular Expression and Print的缩写
全局搜索一个正则表达式,并打印
在文件中,查找关键字,并显示关键字所在的行;

基本用法:
grep text file
text 搜索的文本
file 要搜索的文件名

查看etc/profile文件中查找path关键字,返回含有path关键字的行;

Linux18_数据操作

默认情况下grep是区分大小写
如果加上-i (ignore)表示忽略大小写

-n参数显示搜索的行号

Linux18_数据操作

grep高级用法
配合正则表达式

-E extended regular expression的第一个字母
使用正则表达式
类似命令egrep 等同于 grep -E

Linux18_数据操作

正则表达式的使用这里就不多说了;

有些发行版,正则表达式式默认激活的,不需要-E

=====================================================

sort命令,为文件排序

Linux18_数据操作

Linux18_数据操作

sort 文件名
这并不会改变文件内容,只是将排序后的内容显示在屏幕上;

如果需要保存排序后的结果,可以使用-o参数;
-o 将排序后的结果,写入新文件;output缩写;

Linux18_数据操作

-r参数    倒序排列

-R参数   随机排序

-n参数   对数字排序,从小到大排序  //使用sort默认排序时,会把数字看成字符串来处理,按照1-9顺序来排;

=================================================

wc命令   文件的统计

word count

统计行数、字符数、字节数

Linux18_数据操作

这个结果看着有点迷惑

第一列:表示行数,10

第二列:表示单词数,9

第三列:表示字节数,51

第四列:表示文件名

-l参数   只统计行数

-w参数 统计单词数

-c参数  统计字节数

-n参数  统计字符数

==================================================

uniq 命令   删除文件中的重复内容

uniq 命令要注意的是:只能将连续的重复行变成一行;

Linux18_数据操作

类似于sort,如果要将结果保存下来的话,就要保存到新的文件中;

Linux18_数据操作

-c 参数 显示重复的行数

Linux18_数据操作

-d  参数  显示重复的行

Linux18_数据操作

================================================

cut命令   剪切文件的一部分内容

cut命令用于对文件的每一行进行剪切处理

-c 参数  根据字符数来剪切

cut -c 2-4 name.txt     //每一行只保留第二到第四个字符

Linux18_数据操作

===================================================================

总结:

grep   查找指定内容

sort     排序

wc      统计字符、字节数、行数

uniq   去重

cut     剪切

相关推荐