Python多线程的事件监控

设想这样一个场景:

你创建了10个子线程,每个子线程分别爬一个网站,一开始所有子线程都是阻塞等待。一旦某个事件发生:例如有人在网页上点了一个按钮,或者某人在命令行输入了一个命令,10个爬虫同时开始工作。

肯定有人会想到用Redis来实现这个开关:所有子线程全部监控Redis中名为start_crawl的字符串,如果这个字符串不存在,或者为0,那么就等待1秒钟,再继续检查。如果这个字符串为1,那么就开始运行。

代码片段可以简写为:

import time

import redis

 

client = redis.Redis()

while client.get(‘start_crawl‘) != 1:

print(‘继续等待‘)

time.sleep(1)

这样做确实可以达到目的,不过每一个子线程都会频繁检查Redis。

实际上,在Python的多线程中,有一个 <span>Event</span>模块,天然就是用来实现这个目的的。

Event是一个能在多线程中共用的对象,一开始它包含一个为 <span>False</span>的信号标志,一旦在任一一个线程里面把这个标记改为 <span>True</span>,那么所有的线程都会看到这个标记变成了 <span>True</span>

我们通过一段代码来说明它的使用方法:

import threading

import time

 

class spider(threading.Thread):

def __init__(self, n, event):

super().__init__()

self.n = n

self.event = event

 

def run(self):

print(f‘第{self.n}号爬虫已就位!‘)

self.event.wait()

print(f‘信号标记变为True!!第{self.n}号爬虫开始运行‘)

 

eve = threading.Event()

for num in range(10):

crawler = spider(num, eve)

crawler.start()

 

input(‘按下回车键,启动所有爬虫!‘)

eve.set()

time.sleep(10)

运行效果如下图所示:

Python多线程的事件监控

在这段代码中,线程 <span>spider</span>在运行以后,会运行到 <span>self<span>.<span>event<span>.<span>wait<span>()</span></span></span></span></span></span>这一行,然后10个子线程会全部阻塞在这里。而这里的 <span>self<span>.<span>event</span></span></span>,就是主线程中 <span>eve<span>=<span>threading<span>.<span>Event<span>()</span></span></span></span></span></span>生成的对象传入进去的。

在主线程里面,当执行了 <span>eve<span>.<span>set<span>()</span></span></span></span>后,所有子线程的阻塞会被同时解除,于是子线程就可以继续运行了。

相关推荐