Perl多进程概念解析

MysunshineSy

2010-07-15

你对Perl多进程的概念是否熟悉，它和多线程有什么区别呢，本文介绍了Perl多进程的用法和适用场景，以及Perl多进程和多线程的关系。

在IT产品系统测试的自动化项目中，经常有并行处理多个子任务的需求，为了提高测试效率，就需要用到多进程或者多线程编程。本文介绍了Perl多进程的用法和适用场景，以及Perl多进程和多线程的关系。同时结合企业级IT产品系统测试的自动化特点，介绍了Perl多进程在这方面的应用。

Perl多进程

Perl语言是一种非常强大的脚本语言，其广泛应用于系统维护，CGI（CommonGatewayInterface）编程，数据库编程和自动化测试中。

多任务和并发处理一度被看作是判定优异操作系统的一个特性；同样任何优秀从而流行的编程语言都会有并发的应用，而且都有各自的实现方法。Perl最开始在并发方面的应用就是多进程。

Perl多进程的用户接口是fork()函数以及对系统fork函数封装的一些module。我们在使用Perl语言编程时，如果一个任务的某一个段可以或者需要并发很多执行，那么我们就会使用Perl的多进程编程，例如同时向数据库递交多个记录的查询，同时完成多个系统信息的收集等等。

Perl的多进程是这样实现的：主进程每fork一个子进程，会把当前（主进程的）内存空间的所有变量都复制一份传到新的进程里面，达到数据共享的目的。此外，主进程和子进程可以通过信号、管道等来通信。

在处理并发的方案中，多进程依靠内存空间独享提供了优秀的容错性和健壮性。一个多进程的系统不会由于其中一个进程的状态不良而崩溃，每个进程都相对独立地运作，很少会相互影响。

内存空间独享也造就了多进程不可避免的劣势：资源负荷以及通信复杂，对于Perl来说，每个子进程都可以看作主进程的拷贝，这多少有些内存浪费，而且主进程的关键变量如果是“浅复制”到子进程的话，将会带来一些意想不到的错误。另外，进程的创建和回收会带来许多额外的负载，因此应当尽量避免频繁地创建进程。

多进程之间的通信方式有socket，管道，信号量等。在Linux平台上，对于进程间大量信息的交互情况，最常用的是文件；这在用户空间进程和系统内核空间进程之间的通信中的最为常用。

在谈起Perl多进程的时候，不可避免的要说说它与Perl多线程的关系。

Perl多进程和多线程的关系

如果我们需要执行一些各异的小任务，他们可能数量较多，但生存周期都比较短，或者他们可能共享大量数据，只有小部分的变量是自身的。这个时候，很自然就想到了多线程。

从Perl5.005开始，多线程的概念被引入Perl语言了；不过仅仅是概念而已。在Perl5.005中，线程模型默认共享所有的数据，而且数据的共享访问需要明确的同步操作。这个模型被称为“5005threads”，其实就是多进程，只不过换了个“多线程”的概念。

到了Perl5.6，一个新的线程模型引入了，各个线程的数据默认是私有的，而且共享数据的访问需要显式地调用相关的函数来保证同步。这个模型称为“ithreads”。在Perl5.6中，ithreads模型并没有提供一些API供用户调用，仅作为一个内部的API供扩展使用。

到了Perl5.8，ithreads模型通过Perl的threads模块供用户使用，但是Perl5.8同时也保留了5005threads模型。这里，用户可以通过配置来选择使用哪一种模型。