常用Perl命令行参数应用分析
本文和大家重点讨论一下Perl命令行应用介绍,Perl有很多Perl命令行参数.通过它,我们有机会写出更简单的程序.在这篇文章里我们来了解一些常用的参数.
Perl命令行应用介绍
Perl有很多Perl命令行参数.通过它,我们有机会写出更简单的程序.在这篇文章里我们来了解一些常用的参数.
SafetyNetOptions
在使用Perl尝试一些聪明(或stupid)的想法时,错误难免会发生.有经验的Perl程序员常常使用三个参数来提前找到错误所在,
-C是第一个.这个参数编译Perl程序但不会真正运行它.由此检查所有语法错误.每次修改perl程序之后我都会立刻使用它来找到任何语法错误.
CODE:
$perl-cprogram.pl
-W是第二个参数.它会提示你任何潜在的问题.Perl5.6.0之后的版本已经用usewarnings;替换了-w.你应该使用usewarnings因为它要比-w更灵活.
-T是第三个参数.它把perl放到了tain模式.在这个模式里,Perl会质疑任何程序外传来的数据.例如,从Perl命令行读取,外部文件里读取或是CGI程序里传来的数据.这些数据在-T模式里都会被Tainted掉.
Tainted数据不可以被用来和外部交互.例如使用在system调用和用作open的文件名.perlsec文档里有更多什么数据会被Tainted掉的例子.
要想使用Tainted的数据就需要untaint这个数据.untaint是通过正则表达式来实现.这里我不会太多的讲述taint模式.如果你要编写的程序(例如CGI程序)需要从从用户那里接受不可知的输入,我推荐使有taint模式
-d,PerlDebugger,在这里值得一提但我们无法顾及,我推荐阅读文档'perldocperldebug'或RichardFoley的PerlDebuggerPocketReference一书.
Command-LinePrograms
下面的几个Perl参数可以让短小的Perl程序运行在Perl命令行.-e可以让Perl程序在Perl命令行上运行.例如,我们可以在Perl命令行上运行"HelloWorld"程序而不用把它写入文件再运行.
CODE:
$perl-e'print"HelloWorld\n"'
多个-e也可以同时使用,运行顺序根据它出现的位置.
CODE:
$perl-e'print"Hello";'-e'print"World\n"'
象所有的Perl程序一样,只有程序的最后一行不需要以;结尾.
虽然你也可以象通常一样引用模块,但-M让它变得更容易.
CODE:
$perl-MLWP::Simple-e'printhead"http://www.example.com"'
-M模块名和use模块名一样.如果不想引入模块的缺省值,你可以使用-m.-m模块名和use模块名()一样.例如下面这个例子,因为head函数是缺省引入,而使用-m时就不会,结果是没有输出.
CODE:
$perl-mLWP::Simple-e'printhead"http://www.example.com"'
-m和-M通过=来引入某个模块的特别函数.
CODE:
$perl-MCGI=:standard-e'printheader'
这里,CGI.pm的":standard"被引入,header函数因此可以使用.要引入多个参数可以通过使用引号和逗号.
CODE:
$perl-MCGI='header,start_html'-e'printheader,start_html'
这里我们引入了header和start_html函数.
ImplicitLoops
-n和-p增加了循环的功能,使你可以一行一行来处理文件.
CODE:
$perl-n-e'somecode'file1
这与下面的程序一样.
CODE:
LINE:
while(<>){
#yourcodegoeshere
}
<>;打开Perl命令行里的文件,一行行的读取.每一行缺省保存在$_
CODE:
$perl-n-e'print"$.-$_"'file
上面的这一行可以写成
CODE:
LINE:
while(<>){
print"$.-$_"
}
输出当前行数$.和当前行$_.
-p可以让上面的程序变得更容易.-p会输出$_就像这样
CODE:
LINE:
while(<>){ #yourcodegoeshere }continue{ printordie"-pdestination:$!\n"; }
continue在这里保证print在每次循环都会被调用.
使用-p,我们的打印行数程序可以改为
CODE:
$perl-p-e'$_="$.-$_"'
注意到那个LINE:标签?我们可以利用它来跳到下一个循环.使用nextLINE
CODE:
$perl-n-e'nextLINEunless/pattern/;print$_'
如果想在循环的前后做些处理,可以使用BEGIN或ENDblock.下面的这一行计算文件里的字数.
CODE:
$perl-ne'END{print$t}@w=/(\w+)/g;$t+=@w'file.txt
每一行所有匹配的字放入数组@w,然后把@w的元素数目递加到$t.ENDblock里的print最后输出文件总字数.
还有两个参数可以让这个程序变得更简单.-a打开自动分离(split)模式.空格是缺省的分离号.输入根据分离号被分离然后放入缺省数组@F.由此,我们可以把上面的程序改写为
CODE:
$perl-ane'END{print$x}$x+=@F'file.txt
你也可以通过-F把缺省的分离号改为你想要的.例如把分离号定为非字符:
CODE:
$perl-F'\W'-ane'END{print$x}$x+=@F'file.txt
下面通过Unixpassword文件来介绍一个复杂的例子.Unixpassword是文本文件,每一行是一个用户记录,由冒号:分离.第7行是用户的登录shell路径.我们可以得出每一个不同shell路径被多少个用户使用:
CODE:
$perl-F':'-ane'$s{$F[6]}++;'\
>;-e'END{print"$_:$s{$_}"forkeys%s}'/etc/passwd
虽然现在不是一行,但是你可以看出使用参数可以解决什么问题.
RecordSeparators
以前我提到过$/和$\--输入,输出分隔号.$/用来分隔从文件句柄里读出的数据,缺省$/分隔号是\n,这样每次从文件句柄里就会一行行的读取.$\缺省是空字符,用来自动加到要print的数据尾端.这就是为什么很多时候print都要在末尾加上\n.
$/和$\可与-n-p一起使用.在Perl命令行上相对应为-0(零)和-l(这是L).-0后面可以跟一个16进制或8进制数值,若是16进制数,需要使用前缀x.这个值用来付给$/.-0表示以null字符串作为分格符,-00打开段落模式,-0777打开slurp模式(即可以一次把整个文件读入),这与把$/设为空字符和undef一样效果.
单独使用-l有两个效果,第一自动chomp输入分隔号,第二把$/值付给$\(这样print的时候就会自动在末尾加\n)
我个人常常使用-l参数,用来给每一个输出加\n.例如
CODE:
$perl-le'print"HelloWorld"'
In-PlaceEditing
使用已有的参数我们可以写出很有效的Perl命令行程序.常见的UnixI/O重定向:
CODE:
$perl-pe'somecode'<input.txt>output.txt
这个程序从input.txt读取数据,然后做一些处理再输出到output.txt.你当然也可以把输出重定向到同一个文件里.
上面的程序可以通过-i参数做的更简单些.
-i把源文件更名然后从这个更名的源文件里读取.最后把处理后的数据写入源文件.如果-i后跟有其他字符串,这个字符串与源文件名合成后来生成一个新的文件名.此文件会被用来储存原始文件以免被-i参数覆盖.
注意:使用-i参数后,文件将作为程序的标准输出,所以必须使用-p参数,或者程序里要包含print等输出语法,不然文件将为空.
这个例子把所有php字符替换为perl:
CODE:
$perl-i-pe's/\bPHP\b/Perl/g'file.txt
程序读取文件的每一行,然后替换字符,处理后的数据重新写入(即覆盖)源文件.如果不想覆盖源文件,可以使用