Linux awk命令详解

lonesomer

2012-02-15

关注关注

AWK介绍

0.awk有3个不同版本:awk、nawk和gawk，未作特别说明，一般指gawk。

1.awk语言的最基本功能是在文件或字符串中基于指定规则来分解抽取信息，也可以基于指定的规则来输出数据。完整的awk脚本通常用来格式化文本文件中的信息。

2.三种方式调用awk

1)awk[opion]'awk_script'input_file1[input_file2...]

awk的常用选项option有；

①-Ffs:使用fs作为输入记录的字段分隔符，如果省略该选项，awk使用环境变量IFS的值

②-ffilename:从文件filename中读取awk_script

③-vvar=value:为awk_script设置变量

2)将awk_script放入脚本文件并以#!/bin/awk-f作为首行，给予该脚本可执行权限，然后在shell下通过键入该脚本的脚本名调用之。

3)将所有的awk_script插入一个单独脚本文件，然后调用:awk-fawk脚本文件input_file(s)

3.awk的运行过程

1)awk_script的组成:

①awk_script可以由一条或多条awk_cmd组成，两条awk_cmd之间一般以NEWLINE分隔

②awk_cmd由两部分组成:awk_pattern{actions}

③awk_script可以被分成多行书写，必须确保整个awk_script被单引号括起来。

2)awk命令的一般形式:

awk'BEGIN{actions}

awk_pattern1{actions}

............

awk_patternN{actions}

END{actions}

'inputfile

其中BEGIN{actions}和END{actions}是可选的。

3)awk的运行过程:

①如果BEGIN区块存在，awk执行它指定的actions。

②awk从输入文件中读取一行，称为一条输入记录。(如果输入文件省略，将从标准输入读取)

③awk将读入的记录分割成字段，将第1个字段放入变量$1中，第2个字段放入$2，以此类推。$0表示整条记录。字段分隔符使用shell环境变量IFS或由参数指定。

④把当前输入记录依次与每一个awk_cmd中awk_pattern比较，看是否匹配，如果相匹配，就执行对应的actions。如果不匹配，就跳过对应的actions，直到比较完所有的awk_cmd。

⑤当一条输入记录比较了所有的awk_cmd后，awk读取输入的下一行，继续重复步骤③和④，这个过程一直持续，直到awk读取到文件尾。

⑥当awk读完所有的输入行后，如果存在END，就执行相应的actions。

4)iput_file可以是多于一个文件的文件列表，awk将按顺序处理列表中的每个文件。

5)一条awk_cmd的awk_pattern可以省略，省略时不对输入记录进行匹配比较就执行相应的actions。一条awk_cmd的actions也可以省略，省略时默认的动作为打印当前输入记录(print$0)。一条awk_cmd中的awk_pattern和actions不能同时省略。

6)BEGIN区块和END区块别位于awk_script的开头和结尾。awk_script中只有END区块或者只有BEGIN区块是被允许的。如果awk_script中只有BEGIN{actions}，awk不会读取input_file。

7)awk把输入文件的数据读入内存，然后操作内存中的输入数据副本，awk不会修改输入文件的内容。

8)awk的总是输出到标准输出，如果想让awk输出到文件，可以使用重定向。

4.awk_pattern

awk_pattern模式部分决定actions动作部分何时触发及触发actions。awk_pattern可以是以下几种类型:

1)正则表达式用作awk_pattern:/regexp/

①awk中正则表达式匹配操作中经常用到的字符:

\^$.[]|()*//通用的regexp元字符

+:匹配其前的单个字符一次以上，是awk自有的元字符，不适用于grep或sed等

?:匹配其前的单个字符1次或0次，是awk自有的元字符，不适用于grep或sed等

②举例:

awk'/*\$0\.[0-9][0-9].*/'input_file

2)布尔表达式用作awk_pattern，表达式成立时，触发相应的actions执行。

①表达式中可以使用变量(如字段变量$1,$2等)和/regexp/

②布尔表达式中的操作符:

关系操作符:<><=>===!=

匹配操作符:value~/regexp/如果value匹配/regexp/，则返回真

value!~/regexp/如果value不匹配/regexp/，则返回真

举例:awk'$2>10{print"ok"}'input_file

awk'$3~/^d/{print"ok"}'input_file

③&&(与)和||(或)可以连接两个/regexp/或者布尔表达式，构成混合表达式。!(非)可以用于布尔表达式或者/regexp/之前。

举例:awk'($1<10)&&($2>10){print"ok"}'input_file

awk'/^d/||/x$/{print"ok"}'input_file

④其它表达式用作awk_script，如赋值表达式等

eg:awk'(tot+=$6);END{print"totalpoints:"tot}'input_file//分号不能省略

awk'tot+=$6{print$0}END{print"totalpoints:"tot}'input_file//与上面等效

awk用法例举：

变量名含义

ARGC命令行变元个数

ARGV命令行变元数组

FILENAME当前输入文件名

FNR当前文件中的记录号

FS输入域分隔符，默认为一个空格

RS输入记录分隔符

NF当前记录里域个数

NR到目前为止记录数

OFS输出域分隔符

ORS输出记录分隔符

1、awk'/101/'file显示文件file中包含101的匹配行。

awk'/101/,/105/'file

awk'$1==5'file

awk'$1=="CT"'file注意必须带双引号

awk'$1*$2>100'file

awk'$2>5&&$2<=15'file

2、awk'{printNR,NF,$1,$NF,}'file显示文件file的当前记录号、域数和每一行的第一个和最后一个域。

awk'/101/{print$1,$2+10}'file显示文件file的匹配行的第二个域加10。

awk'/101/{print$1$2}'file

awk'/101/{print$1$2}'file显示文件file的匹配行的第一、二个域，但显示时域中间没有分隔符。

3、df|awk'$4>1000000'通过管道符获得输入，如：显示第4个域满足条件的行。

4、awk-F"|"'{print$1}'file按照新的分隔符“|”进行操作。

awk'BEGIN{FS="[:\t|]"}

{print$1,$2,$3}'file通过设置输入分隔符（FS="[:\t|]"）修改输入分隔符。

Sep="|"

awk-F$Sep'{print$1}'file按照环境变量Sep的值做为分隔符。

awk-F'[:\t|]''{print$1}'file按照正则表达式的值做为分隔符，这里代表空格、:、TAB、|同时做为分隔符。

awk-F'[][]''{print$1}'file按照正则表达式的值做为分隔符，这里代表[、]

5、awk-fawkfilefile通过文件awkfile的内容依次进行控制。

catawkfile

/101/{print"\047Hello!\047"}--遇到匹配行以后打印'Hello!'.\047代表单引号。

{print$1,$2}--因为没有模式控制，打印每一行的前两个域。

6、awk'$1~/101/{print$1}'file显示文件中第一个域匹配101的行（记录）。

7、awk'BEGIN{OFS="%"}

{print$1,$2}'file通过设置输出分隔符（OFS="%"）修改输出格式。

8、awk'BEGIN{max=100;print"max="max}BEGIN表示在处理任意行之前进行的操作。

{max=($1>max?$1:max);print$1,"Nowmaxis"max}'file取得文件第一个域的最大值。

（表达式1?表达式2:表达式3相当于：

if(表达式1)

表达式2

else

表达式3

awk'{print($1>4?"high"$1:"low"$1)}'file

9、awk'$1*$2>100{print$1}'file显示文件中第一个域匹配101的行（记录）。

10、awk'{$1=='Chi'{$3='China';print}'file找到匹配行后先将第3个域替换后再显示该行（记录）。

awk'{$7%=3;print$7}'file将第7域被3除，并将余数赋给第7域再打印。

11、awk'/tom/{wage=$2+$3;printfwage}'file找到匹配行后为变量wage赋值并打印该变量。

12、awk'/tom/{count++;}

END{print"tomwasfound"count"times"}'fileEND表示在所有输入行处理完后进行处理。

13、awk'gsub(/\$/,"");gsub(/,/,"");cost+=$4;

END{print"Thetotalis$"cost>"filename"}'filegsub函数用空串替换$和,再将结果输出到filename中。

123$1,200.00

123$2,300.00

123$4,000.00

awk'{gsub(/\$/,"");gsub(/,/,"");

if($4>1000&&$4<2000)c1+=$4;

elseif($4>2000&&$4<3000)c2+=$4;

elseif($4>3000&&$4<4000)c3+=$4;

elsec4+=$4;}

END{printf"c1=[%d];c2=[%d];c3=[%d];c4=[%d]\n",c1,c2,c3,c4}"'file

通过if和elseif完成条件语句

awk'{gsub(/\$/,"");gsub(/,/,"");

if($4>3000&&$4<4000)exit;

elsec4+=$4;}

END{printf"c1=[%d];c2=[%d];c3=[%d];c4=[%d]\n",c1,c2,c3,c4}"'file

通过exit在某条件时退出，但是仍执行END操作。

awk'{gsub(/\$/,"");gsub(/,/,"");

if($4>3000)next;

elsec4+=$4;}

END{printf"c4=[%d]\n",c4}"'file

通过next在某条件时跳过该行，对下一行执行操作。

14、awk'{printFILENAME,$0}'file1file2file3>fileall把file1、file2、file3的文件内容全部写到fileall中，格式为

打印文件并前置文件名。

15、awk'$1!=previous{close(previous);previous=$1}

{printsubstr($0,index($0,"")+1)>$1}'fileall把合并后的文件重新分拆为3个文件。并与原文件一致。

16、awk'BEGIN{"date"|getlined;printd}'通过管道把date的执行结果送给getline，并赋给变量d，然后打印。

17、awk'BEGIN{system("echo"Inputyourname:\\c"");getlined;print"\nYournameis",d,"\b!\n"}'

通过getline命令交互输入name，并显示出来。

awk'BEGIN{FS=":";while(getline<"/etc/passwd">0){if($1~"050[0-9]_")print$1}}'

打印/etc/passwd文件中用户名包含050x_的用户名。

18、awk'{i=1;while(i<NF){printNF,$i;i++}}'file通过while语句实现循环。

awk'{for(i=1;i<NF;i++){printNF,$i}}'file通过for语句实现循环。

typefile|awk-F"/"'

{for(i=1;i<NF;i++)

{if(i==NF-1){printf"%s",$i}

else{printf"%s/",$i}}}'显示一个文件的全路径。

用for和if显示日期

awk'BEGIN{

for(j=1;j<=12;j++)

{flag=0;

printf"\n%d月份\n",j;

for(i=1;i<=31;i++)

{

if(j==2&&i>28)flag=1;

if((j==4||j==6||j==9||j==11)&&i>30)flag=1;

if(flag==0){printf"%02d%02d",j,i}

}

19、在awk中调用系统变量必须用单引号，如果是双引号，则表示字符串

Flag=abcd

awk'{print'$Flag'}'结果为abcd

awk'{print"$Flag"}'结果为$Flag

awk linux系统编程语言字符

lonesomer

0 关注 0 粉丝 0 动态

关注关注

awk命令详解

awk ‘BEGIN{print "姓","名","QQ号","捐款记录"}{print $0}‘ awk_test.txt |column -t. awk ‘BEGIN{FS

chenpro 2020-07-04

[Linux Shell学习系列十四]sed和awk-6.awk与Shell

我们可以将awk和Shell脚本结合使用来执行各种任务。一般会将信息传入awk脚本，再将信息以对Shell有用的格式传回。如使用shell变量来保存awk程序搜索用的模式是很常见的。1）最常见的方法：使用Shell引用来替换变量的值到Shell脚本内部的a

fendou00sd 2020-06-16

Linux下科学计数法(e)转化为数字的方法

科学计数法使用e标识数值，将科学计算学转化为数字的思路：按e右边的数字移动小数点位数。那么在shell中，如何转化科学计数法为数字呢，方法如下：这里以"1.7615562e+06" 为示例：。2）e后面的数字若是负数，则小数点后面要保留

RealJianyuan 2020-06-14

shell脚本-awk

awk [option] ‘script‘ file1 file2 ...awk将符合PATTERN的文本逐行取出，并按照指定的分割符(默认为空白,awk ‘BEGIN{print "line one\nline two\nline three&

cwgxiaoguizi 2020-06-05

shell awk 常见命令

比如 ls -alh |awk /TD/ | awk ‘{print $5}‘。ls -alh 返回文件详情列表。awk /TD/ 返回有 TD 字符的那一行。命令 | awk ‘/location/{getline a;print a}‘。返回的就是 l

chenpro 2020-06-02

zabbix监控nginx状态信息

} #开启nginx的stub_staus模块，这个模块主要作用是提供对基本信息状态的访问。/usr/bin/curl "http://$HOST/status" 2>/dev/nul

Neptune 2020-05-31

Linux awk统计日志中出现过的IP(或出现次数最多的N个IP)

awk是一个强大的文本分析工具，相对于grep的查找，sed的编辑，awk在其对数据分析并生成报告时，显得尤为强大。简单来说awk就是把文件逐行的读入，以空格为默认分隔符将每行切片，切开的部分再进行各种分析处理。awk ‘BEGIN{ commands }

老谢的自留地 2020-05-09

awk教程

AWK是一种解释性编程语言。它是非常强大的，专为文本处理。AWK 提供了极其强大的功能：可以进行样式装入、流控制、数学运算符、进程控制语句甚至于内置的变量和函数。它具备了一个完整的语言所应具有的几乎所有精美特性。AWK名字是从它的作者的姓氏衍生的，它的作者

YukiRain 2020-05-08

shell脚本之awk(一)

　　1.awk是一种编程语言，用于linux/unix下对文本和数据进行扫描。　　2.linux中常用的awk编译器版本有mawk,gawk。Redhat使用的是gawk，Ubuntu使用的是mawk.　　2. awk 基本结构包括模式匹配和处理过程。如果

baobaozai 2020-04-29

Linux 基础 - AWK 用法

awk ‘{a[$1]++}{!b[$0]++}END{for print i,"-",a[i]}‘ 源文件。斜杠内容一般为字符、空格、引号、冒号等等。根据需要删除对应的字符即可。$0 第三个参数为你需要修改的变量。例如awk

Proudoffaith 2020-04-08

Linux 文本处理利器--Awk常用命令

在 Linux/UNIX 系统中，awk 是一个功能强大的编辑工具，逐行读取输入文本，并根据指定的匹配模式进行查找，对符合条件的内容进行格式化输出或者过滤处理，可以在无交互的情况下实现相当复杂的文本操作，被广泛应用于 Shell 脚本，完成各种自动化配置任

fenxinzi 2020-03-01

awk命令

　　program由{ pattern + action statements}组成，动作语句之间用分号“;”分隔。[ ~]# awk -v FS=: -v OFS=" | " ‘{print $1,$3}‘ /etc/passwd.

zhiliang 2020-01-31

Linux 中awk 提取包含某个关键字的段落

AWK是一种处理文本文件的语言，是一个强大的文本分析工具。本文将使用命令awk将具有某个关键字的段落提取出来。"Finalizer" #3 daemon prio=8 os_prio=0 tid=0x00007fb2dc1aa800 n

wannagonna 2020-01-13

shell监控系统资源并通过短信报警的脚本

Critical="当前系统登录用户人数超过1人，具体人数为：$LoginUser 个,请确认操作者人数。MemTotal=`free -m | grep Mem | awk -F: '{print $2}' | awk '{print $1}'

wandererdl 2019-12-25

网站维护：Linux服务器查看外网访问IP指令汇总

Shellnetstat -ntu | awk ‘{print $5}‘ | cut -d: -f1 | sort | uniq -c | sort -n1netstat -ntu | awk ‘{print $5}‘ | cut -d: -f1 | so

chenchuang 5评论 2020-01-25

正则表达式awk学习（三）

语句之间用分号分隔。变量名必须以字母或_开头。输出的个item可以是字符串,也可以是数字；当前记录的字段、变量或awk的表达式。如省略item,相当于print $0. 案例1：打印用户名和对应的shell. [ ~]# awk -F":&quo

jyj00 2020-01-09

shell-分析服务器日志

awk ‘{++S[$1]} END {for print a,S[a]}‘ log_file > log.txtsort -n -t ‘ ‘ -k 2 log.txt 配合sort进一步排序。grep ^111.111.111.111 log_f

fendou00sd 2020-01-07

SHELL用法九（awk练习）

Awk主要是用于对文本文件进行处理，通常是逐行处理，其语法参数格式为，单引号‘‘是为了和shell命令区分开;大括号{ }表示一个命令分组;pattern是一个过滤器，表示匹配pattern条件的行才进行Action处理;action是处理动作，常见动作为

fendou00sd 2020-01-06

三剑客

awk是一种编程语言，主要用于在linux/unix下对文本和数据进行处理，是linux/unix下的一个工具。数据可以来自标准输入、一个或多个文件，或其它命令的输出。awk的处理文本和数据的方式：逐行扫描文件，默认从第一行到最后一行，寻找匹配的特定模式的

PHP学习笔记 2020-01-06

杀进程批量和单个演示

批量根据服务名称查询进程id然后批量杀sudops-ef|grepjava|awk‘{print$2}‘|sudoxargskill-9sudops-ef|greppython|awk‘{print$2}‘|sudoxargskill-9sudops-ef

AndesStay 2020-01-03

安科网

Linux awk命令详解

lonesomer

lonesomer

相关推荐

awk命令详解

[Linux Shell学习系列十四]sed和awk-6.awk与Shell

Linux下科学计数法(e)转化为数字的方法

shell脚本-awk

shell awk 常见命令

zabbix监控nginx状态信息

Linux awk统计日志中出现过的IP(或出现次数最多的N个IP)

awk教程

shell脚本之awk(一)

Linux 基础 - AWK 用法

Linux 文本处理利器--Awk常用命令

awk命令

Linux 中awk 提取包含某个关键字的段落

shell监控系统资源并通过短信报警的脚本

网站维护：Linux服务器查看外网访问IP指令汇总

正则表达式awk学习（三）

shell-分析服务器日志

SHELL用法九（awk练习）

三剑客

杀进程批量和单个演示

lonesomer