网络异步请求之gevent

liuxiaohua

2019-06-20

关注关注

我们知道对于网络请求这种IO bound的场景来说，最怕的就是某个请求阻塞了其余的操作，让并发性大大降低。今天就来介绍一款python下的并发库-gevent。

首先看一下他自己的介绍：

gevent是一个基于libev的并发库。它为各种并发和网络相关的任务提供了整洁的API。

嗯，确实很简洁，很易使用。待会我们就见识到了。

同步IO

首先我们来看看传统的IO请求。
比如我们请求：http://httpbin.org/ip 发个http get请求会得到我们的ip地址，如：

{
  "origin": "183.240.202.14"
}

我们来写个脚本连续发50个get请求到这个地址，以模拟多个请求。(脚本命名为get.py)

import requests

url = 'http://httpbin.org/ip'

for i in range(50):
    print("{}: {}".format(i, requests.get(url).text))

统计一下运行时间：

$ time python3 get.py

(输出略...)
python3 get.py  0.56s user 0.06s system 1% cpu 35.606 total

大概花费35s钟，当然不同网络环境可能结果不同。而且打印出来的结果是按照1, 2, 3...50这样的顺序来的，说明整个请求是同步的，一个请求结束再发下一个请求。

使用gevent

我们再来写一个gevent版的get.py，命名为gevent_get.py

import requests
import gevent
import gevent.monkey
# 这里将socket变成异步
gevent.monkey.patch_socket()

url = 'http://httpbin.org/ip'


def hello(i):
    print("{}: {}".format(i, requests.get(url).text))


tasks = [gevent.spawn(hello, i) for i in range(50)]
gevent.joinall(tasks)

再来看看运行时间：

$ time python3 gevent_get.py

(输出略...)
python3 gevent_get.py  0.49s user 0.06s system 39% cpu 1.403 total

我的天！才1.4秒左右，而且打印出来的结果没有按照1, 2, 3...50这样排列，而是按照随机顺序排列的，说明整个请求是异步非阻塞的。

结论

我又多试了几次，gevent的效率确实牛，远远高于同步io请求。最近在我的一个爬虫小项目里面用进程池 + gevent，爬取80个页面，大概花费40s左右，每个页面只要0.5s，而且还包括DOM解析的时间，而用同步请求则花费大概300s左右。

gevent的更多用法请参考其官方文档。这么简单又好用的库赶紧试试吧。^_^

gevent python3

liuxiaohua

0 关注 0 粉丝 0 动态

关注关注

Python gevent协程切换实现详解

大家都知道gevent的机制是单线程+协程机制，当遇到可能会阻塞的操作时，就切换到可运行的协程中继续运行，以此来实现提交系统运行效率的目标，但是具体是怎么实现的呢？让我们直接从代码中看一下吧。这里会开启一个死循环，在循环中调用self._sock.recv

efeve 2020-09-14

如何用一行代码让gevent爬虫提速100%

用python做网络开发的人估计都听说过gevent这个库，gevent是一个第三方的python协程库，其是在微线程库greenlet的基础上构建而成，并且使用了epoll事件监听机制，这让gevent具有很好的性能并且比greenlet更好用。基于li

dashoumeixi 2020-07-20

2020最新nginx+gunicorn+supervisor部署基于flask开发的项目的生产环境的详细攻略

本攻略基于ubuntu1804的版本，服务器用的华为云的服务器，python3欢迎加我的QQ6398903，或QQ群讨论相关技术。pip intall -r requirements.txt # 一次安装全部的python模块。gunicorn是基于w

SDUTACM 2020-05-03

Python线程和协程CPU资源利用率测试

　　协程，又称为微线程，它是实现多任务的另一种方式，只不过是比线程更小的执行单元。因为它自带CPU的上下文，这样只要在合适的时机，我们可以把一个协程切换到另一个协程。　　协程与线程的差异：　　在实现多任务时, 线程切换从系统层面远不止保存和恢复CPU上下

jacktangj 2020-04-17

1.7 协程

协程的本质是个单线程,它不能同时将单个CPU 的多个核用上,协程需要和进程配合才能运行在多CPU上线程阻塞操作会阻塞掉整个程序

87246237 2020-04-09

python语法基础-并发编程-协程-长期维护

# 协程和进程和线程一样都是实现并发的手段，# 开启一个线程，创建一个线程，还是需要开销，# 什么是协程：能够在多个任务之间切换来节省一些IO时间，# 不需要再浪费线程之间的切换了，只需要做程序之间的切换，# 我们在工作中会使用进程，线程，协程来提高代码的

wyqwilliam 2020-02-10

tcp_server_协程gevent版本

#使用此方法，会将代码中检查一遍，如有time.sleep()等延时方法，会自动转换为gevent.sleep(). #把标准库中的thread/socket等给替换掉.这样我们在后面使用socket的时候能够跟寻常一样使用,无需改动。# 调用此函数就不需

zuiaiqun 2020-01-23

odoo 使用协程,异步,gevent,打补丁

打补丁得时候需要在方法中实现,如果直接在外部调用猴子补丁,在odoo服务启动时,就会出现锁异常,会出现死锁,monkey.patch_all() # 这是一个错误的示例

talkincode 2020-01-11

python已协程方式处理任务

#从genent中导入monky模块①。#把程序变成协程的方式运行②。#记录程序开始时间。#把8个网站封装成列表。# 用requests.get()函数爬取网站。# 用gevent里面的spawn函数创建任务 get_data是方法名，url是参数③。#

shengge0 2019-12-26

简述 gevent模块的作用和应用场景。

当一个greenlet遇到IO操作时，比如访问网络，就自动切换到其他的greenlet，等到IO操作完成，再在适当的时候切换回来继续执行。由于IO操作非常耗时，经常使程序处于等待状态，由于切换是在IO操作时自动完成，所以gevent需要修改Python自带

dashoumeixi 2019-12-22

gevent实现并发

#_author:来童星#date:2019/12/12import geventimport timedef func1(): print(‘\033[31;1mfun1 starting...\033[0m‘,time.ctime()) g

zuiaiqun 2019-12-12

python gevent异步

monkey.patch_all()#捕捉所有阻塞，不止接收gevent.sleep. 执行协程并阻塞等待执行完毕

winmeanyoung 2019-12-07

并发编程之协程

g1.switch # 传了一次参数过后,下一次在switch的时候便不需要在传递参数了。但是greenlet模块只是进行了对任务的单纯的切换,在遇到了io阻塞时,还是会原地的阻塞住,并没有在io阻塞时对cpu进行调度。from gevent import

hamutailang 2019-11-03

python-协程gevent的使用

import geventfrom gevent import monkeyimport timeimport random# 有耗时操作时需要monkey.patch_all() # 将程序中用到的耗时操作代码，换为 gevent 中自己实现的模块de

wklken的笔记 2019-11-01

Python之路(第四十七篇) 协程

一句话说明什么是线程：协程是一种用户态的轻量级线程，即协程是由用户程序自己控制调度的。无需原子操作锁定及同步的开销 "原子操作是不需要synchronized"，所谓原子操作是指不会被线程调度机制打断的操作；这种操作一旦开始，就一直运行

georgeandgeorge 2019-10-31

python gevent网络库

例子：

CandyGL 2016-03-02

多任务-----协程gevent的使用总结。

如何判断某一类型是否可以迭代。如果一个对象是迭代器，那么一定可以迭代，如果一个对象可以迭代，但不一定是迭代器。迭代器对象必须要有__iter__和__next__方法。如果数据量很大的情况下，最好使用创建迭代器的方式来节省内存空间。print二，生成器g

chunjiekid 2019-07-01

gevent gevent.queue gevent读取文件

官方手册说的太不清楚 .自己写了个入门教程.g1 = gevent.spawn #产生一个GreenLet 协程 .# 与上面一种完全一样的方式 . gevent.spawn 相当于创建一个GreenLet ,然后start(). g2.join()下

talkincode 2019-06-30

python大佬养成计划----协程

协程，又称微线程，纤程。英文名Coroutine协程看上去也是子程序，但执行过程中，在子程序内部可中断，然后转而执行别的子程序，在适当的时候再返回来接着执行。最大的优势就是协程极高的执行效率。因为子程序切换不是线程切换，而是由程序自身控制，因此，没有线程切

solarLan 2019-06-28

关于gevent的一点总结

0x00 基本概念gevent是基于libev和greenlet的一个python异步框架。libev是一个高性能的事件循环实现。简单点说，就是event loop会捕获、处理io事件的变化：遇到阻塞，就跳出；阻塞结束，就继续。这依赖于系统底层的selec

mayflowers 2019-06-28

安科网

网络异步请求之gevent

liuxiaohua

同步IO

使用gevent

结论

liuxiaohua

相关推荐

Python gevent协程切换实现详解

如何用一行代码让gevent爬虫提速100%

2020最新nginx+gunicorn+supervisor部署基于flask开发的项目的生产环境的详细攻略

Python线程和协程CPU资源利用率测试

1.7 协程

python语法基础-并发编程-协程-长期维护

tcp_server_协程gevent版本

odoo 使用协程,异步,gevent,打补丁

python已协程方式处理任务

简述 gevent模块的作用和应用场景。

gevent实现并发

python gevent异步

并发编程之协程

python-协程gevent的使用

Python之路(第四十七篇) 协程

python gevent网络库

多任务-----协程gevent的使用总结。

gevent gevent.queue gevent读取文件

python大佬养成计划----协程

关于gevent的一点总结

liuxiaohua