Perl性能优化的三大技巧
本文和大家重点讨论一下Perl性能优化技巧,利用Perl开发一些服务应用时,有时会遇到Perl性能或资源占用的问题,可以巧用require装载模块,使用系统函数及XS化模块,自写低开销模块等来优化Perl性能。
Perl性能优化
Perl是强大的语言,是强大的工具,也是一道非常有味道的菜:-)利用很多perl的特性,可以实现一些非常有趣而实用的功能。
利用Perl开发一些服务应用时,有时会遇到Perl性能或资源占用的问题,如何解决呢?以下是自己过去开发实践的一些经验,几个主要的技巧分别是:
◆巧用require装载模块
◆使用系统函数及XS化模块
◆自写低开销模块
◆优化正则表达式
◆善用BSDsocket
巧用require装载模块
为避免程序一启动就加载大量模块,降低启动速度,可以在必要的时候再装载模块,这时候就是require大派用场的时候了。
如:
#!/usr/bin/perl-w usepre_load_module; #Initializesomething init_args(); #if$use_this_moduleistrue,loadtheModule if($use_this_module){ requireModule; }
上述代码中,如果变量$use_this_module设置了,那么才加载Module,如果没设置则不需要加载,实现了:useondemand的功能。在CGI应用程序中,这相当有用,如果每次请求(fork)都加载大量无用模块的话,响应速度会有所降低,而在特定场合才加载一些模块将加块启动、解析的速度,提高Perl性能。
再看一个例子:
#!/usr/bin/perl my$pid=forkordie"can'tfork:$!\n"; if($pid){ print"i'mfather\n"; sleep; }else{ print"i'mchild\n": requireIO::Socket; sleep; }
上述代码中,如果在程序一开始就用use来载入IO::Socket模块,那么子/父进程都加载了该模块,通过top命令发现子父进程大小都是3.07MB;如果只在子进程里加载,则只在子进程里有效,内存的消耗将降低,top命令发现子进程3.04MB,父进程变为1.4MB。
使用系统函数及XS化模块
Perl内建的系统函数及用c编写的perlXS扩展模块的速度和效率都比纯perl的实现要好得多。在Perl性能要求较高的场合(如开发ApplicationServer,NetworkServer等),可以考虑使用这些内建函数或XS化模块。
如Socket就比IO::Socket的内存消耗要低,XS编写的Data::Dumper就比纯Perl的Data::Dumper要快4-5倍。
此外,一些简单的任务并没必要使用Perl模块,如获得主机IP地址就大可不必载入庞大的Net::DNS而只是使用gethostbyname()系统函数即可。
以下是一些常用的替代方案以获得更快的速度,更好的效率:
◆用sys*系列函数等替代open/seek/tell/等标准IO操作
◆用Socket代替IO::Socket以获得更低开销和内存占用
◆用get*by*系列函数代替Net::DNS
◆用index/substr等代替部分低效正则表达式
◆用select(3参数版本)代替IO::Handle部分功能.......
自写低开销模块
通常我们使用一些Perl模块时,只使用了其中很小一部分的功能,可是却不得不载入整个模块,甚至要载入其他不相关的模块。因此往往使整个程序非常臃肿庞大。
著名的web管理软件webmin的miniserv(一个简化的http服务端)功能强大,还支持SSL,但资源占用却出奇的少,只有大约5.6MB的大小!这是为什么呢?因为miniserver只使用了2个Perl系统模块(Socket及POSIX),没有载入其他的模块。一些本需要其他perl模块的功能,均由web-lib.pl等用系统函数编写代替。
例如以下是一个获得A记录的高速函数get_mx(),它不依赖任何模块,速度非常快,可以提高Perl性能。
subget_mx{ my@info=gethostbynameshift; my@addr=splice(@info,4); my@rt; foreach(@addr){ push@rt,join('.',unpack('C4',$_)); } \@rt; }
另一个例子,对于标准的IO::Handle对象,可以使用$obj->autoflush(1);来设置缓冲的特性,我们通过使用系统函数select()来获得同样的能力,而无需要载入IO::Handle,代码如下:
subautoflush{ my$io=$_[0]; select((select($io),$|=1)[0]); }