查看Linux上文件内容的5个方法

即将开播:6月19日,互联网银行架构师魏生谈互联网开放银行实施路径的探索与思考

查看Linux上文件内容的5个方法

Linux提供了查看文件内容的许多命令,包括cat、more、head和tail,而这只是个开端。

举例说,连最明显的命令也有大量选项,比许多Linux用户平常用的多得多。还有一些不太明显的命令提供了一些独特的功能。本文介绍了查看文件内容的命令和定制那些视图以更好地满足实际需要的选项。

cat

cat命令将文本文件的全部内容发送到终端窗口以供查看。实际上,如果您键入“cat”,后面跟以有数千行的文件的名称,那些行会在窗口一闪而过,您只能看到最后一屏幕的文本。不过,尽管cat命令对Linux用户来说很熟悉,连这个基本命令也提供了许多有用的选项,比如对输出的行进行编号,我们许多人可能从未使用过该选项。补充一下,您不仅可以对行进行编号,进行编号时还有一些选择。

对每行编号如下所示:

$ cat -n msg 
     1  Hello -- 
     2 
     3  I hope you are having a wonderful day! 
     4 
     5 
     6  That's it for ...       now 
     7 
     8  bye! 
     9 
    10  s. 

还可以只对有内容的行进行编号。注意:内容为空的行对该命令而言并不被认为是“空行”,也会加以编号。

$ cat -b msg 
     1  Hello -- 
     2  I hope you are having a wonderful day! 
     3  That's it for ...       now 
     4  bye! 
     5  s. 

cat命令让您可以用-s选项忽略重复的空行,但您得添加另一个命令才能完全排除空行。

$ cat -s msg 
Hello -- 
I hope you are having a wonderful day! 
That's it for ...       now 
bye! 
s. 

想忽略所有空行,只要将输出从cat命令pipe到grep命令,如下所示。点(.)匹配包括空字符的文本,所以它会显示内容空白的行。

$ cat msg | grep . 
Hello -- 
I hope you are having a wonderful day! 
That's it for ...       now 
bye! 
s. 

-E选项提供了视觉线索,显示行末尾有没有多余的空白,只需在每行末尾添加$。

$ cat -E msg 
Hello --$ 
$ 
I hope you are having a wonderful day!  $ 
$ 
$ 
That's it for ...       now$ 
$ 
bye!$ 
$ 
s.$ 

若使用-A,您既得到每行末尾处的$字符,还得到显示为^I而不是空白区的标签。

$ cat -A msg 
Hello --$ 
$ 
I hope you are having a wonderful day!$ 
$ 
$ 
That’s it for …^Inow$ 
$ 
bye!$ 
$ 
s.$ 

用head和tail显示文件的部分内容

head和tail命令显示文件的顶部或底部,默认显示10行。您可以指定不同的行数来查看,只要使用-3(显示3行)或-11(显示11行)之类的字符串。tail命令的工作原理与head一样,但显示文件的底部,而不是顶部。

$ head -3 msg 
Hello -- 
I hope you are having a wonderful day! 
$ tail -3 msg 
bye! 
s. 

您还可以结合head和tail命令来查看文件顶部和底部之间的文本。您只要选择起点以及想查看的行数。在该例子中,该命令将显示文件中的第200行;借助cat命令,可对那些行进行编号。

$ cat -b mybigfile | head -200 | tail -100 
   101  Invoice #2020-06-07a sent to vendor 
   ... 

用more或less每次浏览一屏幕的文本

more命令显然用于每次浏览一屏幕的文件内容,而less增添了使用向上和向下键盘箭头在文件中上下移动的功能,以便您可以开始扫描、然后返回到文件前面的内容。

用od一次双向查看文本文件

od(八进制输出)命令让您可以将文件输出为普通文本和一系列ASCII值(即该文本在文件中如何实际编码)。您可以从下面示例中看到,编号的行显示了数字ASCII值,隔行显示了文本和非输出字符。

$ od -bc msg 
0000000 110 145 154 154 157 040 055 055 012 012 111 040 150 157 160 145 
          H   e   l   l   o       -   -  \n  \n   I       h   o   p   e 
0000020 040 171 157 165 040 141 162 145 040 150 141 166 151 156 147 040 
              y   o   u       a   r   e       h   a   v   i   n   g 
0000040 141 040 167 157 156 144 145 162 146 165 154 040 144 141 171 041 
          a       w   o   n   d   e   r   f   u   l       d   a   y   ! 
0000060 012 012 012 124 150 141 164 047 163 040 151 164 040 146 157 162 
         \n  \n  \n   T   h   a   t   '   s       i   t       f   o   r 
0000100 040 056 056 056 011 156 157 167 012 012 142 171 145 041 012 012 
              .   .   .  \t   n   o   w  \n  \n   b   y   e   !  \n  \n 
0000120 163 056 012 
          s   .  \n 

注意:换行字符显示成\n(八进制012),标签显示成\t(八进制011)。

od命令特别有帮助的用途之一是查看非文本文件,以获取识别文件类型的信息。在这里,我们看到JFIF(JPEG文件交互格式)标签向报告文件类型的命令(比如file)表明这是jpg文件。还有其他许多有用的信息,如果你很想知道这些文件的格式更是如此。

在这下一个命令中,我们查看jpg文件的起始部分。

$ od -bc arrow.jpg | head -12 
0000000 377 330 377 340 000 020 112 106 111 106 000 001 001 000 000 001 
        377 330 377 340  \0 020   J   F   I   F  \0 001 001  \0  \0 001 
0000020 000 001 000 000 377 333 000 103 000 003 002 002 002 002 002 003 
         \0 001  \0  \0 377 333  \0   C  \0 003 002 002 002 002 002 003 
0000040 002 002 002 003 003 003 003 004 006 004 004 004 004 004 010 006 
        002 002 002 003 003 003 003 004 006 004 004 004 004 004  \b 006 
0000060 006 005 006 011 010 012 012 011 010 011 011 012 014 017 014 012 
        006 005 006  \t  \b  \n  \n  \t  \b  \t  \t  \n  \f 017  \f  \n 
0000100 013 016 013 011 011 015 021 015 016 017 020 020 021 020 012 014 
         \v 016  \v  \t  \t  \r 021  \r 016 017 020 020 021 020  \n  \f 
0000120 022 023 022 020 023 017 020 020 020 377 333 000 103 001 003 003 
        022 023 022 020 023 017 020 020 020 377 333  \0   C 001 003 003 

如果我们向file命令索取该图像文件方面的信息,可以看到这样的内容。file命令从文件开始处的数据获取所有这些描述性信息。

$ file arrow.jpg 
arrow.png: JPEG image data, JFIF standard 1.01, aspect ratio, density 1x1, segment length 16, baseline, precision 8, 500x375, components 3 

用jp2a查看文件,显示成基于文本的图像

如果你只能使用命令行,想了解某个图像文件含有什么内容,可以使用jp2a(jpeg to ascii)之类的工具来提供字符版本。该格式中图像多易于识别将取决于文件。别抱太大的希望,因为你会看到的图像版本“分辨率很低”!该图像是分辨率很低的帝企鹅。