python

超轻量级php框架startmvc

Python协程操作之gevent(yield阻塞,greenlet),协程实现多任务(有规律的交替协作执行)用法详解

更新时间:2020-08-03 07:18:01 作者:startmvc
本文实例讲述了Python协程操作之gevent(yield阻塞,greenlet),协程实现多任务(有规律的交替协

本文实例讲述了Python 协程操作之gevent(yield阻塞,greenlet),协程实现多任务(有规律的交替协作执行)用法。分享给大家供大家参考,具体如下:

实现多任务:进程消耗的资源最大,线程消耗的资源次之,协程消耗的资源最少(单线程)。

gevent实现协程,gevent是通过阻塞代码(例如网络延迟等)来自动切换要执行的任务,所以在进行IO密集型程序时(例如爬虫),使用gevent可以提高效率(有效利用网络延迟的时间去执行其他任务)。

GIL(全局解释器锁)是C语言版本的Python解释器中专有的,GIL的存在让多线程的效率变低(哪个线程抢到锁,就执行哪个线程)。在IO密集型程序中,多线程依然比单线程效率高(GIL通过IO阻塞自动切换多线程)。

解决GIL(全局解释器锁)的问题的三种方法:1、不要用C语言版本的Python解释器。2、让子线程运行其他语言代码(例如:主线程运行Python代码,子线程运行C语言代码(C语言的动态库))。3、多进程代替多线程(多进程可以利用多核CPU)。

demo.py(协程底层原理,yield):


import time
# 带yield的函数并不是函数,而是一个生成器模板,返回一个生成器(可用于遍历迭代)
def task_1():
 while True:
 time.sleep(0.1)
 yield # 阻塞,等待next迭代解阻塞
def task_2():
 while True:
 time.sleep(0.1)
 yield
def main():
 t1 = task_1() # 返回的t1是一个生成器。 此时并未执行task_1中的代码
 t2 = task_2()
 # 先让t1运行一会,当t1中遇到yield的时候,再返回到24行,然后
 # 执行t2,当它遇到yield的时候,再次切换到t1中
 # 这样t1/t2/t1/t2的交替运行,最终实现了多任务....协程
 while True:
 next(t1) # 执行task_1中的代码,遇到yield阻塞task_1。 等待下一次next激活。
 next(t2) # 实现task_1与task_2交替执行,实现多任务...协程
if __name__ == "__main__":
 main()

demo.py(greenlet实现协程,封装了yield):


from greenlet import greenlet # 需要安装greenlet模块 sudo pip3 install greenlet (python2.x使用pip) 
import time
def test1():
 while True:
 print("---A--")
 gr2.switch() # 切换到gr2中的任务。
 time.sleep(0.5)
def test2():
 while True:
 print("---B--")
 gr1.switch() # 切换到gr1中的任务。
 time.sleep(0.5)
gr1 = greenlet(test1) # greenlet 底层封装了yield。
gr2 = greenlet(test2)
#切换到gr1中运行
gr1.switch()

demo.py(gevent实现协程,封装了greenlet,遇到阻塞代码自动切换协程任务):


import gevent # 需要安装gevent模块 sudo pip3 install gevent (python2.x使用pip) 
import time
def f1(n):
 for i in range(n):
 print(gevent.getcurrent(), i)
 gevent.sleep(0.5) # 为了提高协程效率,遇到阻塞类代码,会自动切换协程任务。
 # time.sleep(0.5) # 阻塞类代码必须使用gevent自己包装的代码,原生阻塞类代码不会切换协程任务。 
 # 可以使用monkey.patch_all()将所有原生阻塞类代码替换成gevent包装的阻塞类代码。 
def f2(n):
 for i in range(n):
 print(gevent.getcurrent(), i) # <Greenlet "Greenlet-0" at 0x7f4a09b34648: f1(5)> 0
 gevent.sleep(0.5)
 # time.sleep(0.5)
def f3(n):
 for i in range(n):
 print(gevent.getcurrent(), i)
 gevent.sleep(0.5)
 # time.sleep(0.5)
g1 = gevent.spawn(f1, 5) # gevent其实是对greenlet的封装。
g2 = gevent.spawn(f2, 5) # 第一个参数f2表示协程执行的具体任务(函数),第二个参数5表示要传给f2的参数
g3 = gevent.spawn(f3, 5)
g1.join() # 遇到阻塞类代码,自动切换协程任务。
g2.join()
g3.join()

运行结果:

<Greenlet at 0x1985030: f1(5)> 0 <Greenlet at 0x1b431c8: f2(5)> 0 <Greenlet at 0x1b43140: f3(5)> 0 <Greenlet at 0x1985030: f1(5)> 1 <Greenlet at 0x1b431c8: f2(5)> 1 <Greenlet at 0x1b43140: f3(5)> 1 <Greenlet at 0x1985030: f1(5)> 2 <Greenlet at 0x1b431c8: f2(5)> 2 <Greenlet at 0x1b43140: f3(5)> 2 <Greenlet at 0x1985030: f1(5)> 3 <Greenlet at 0x1b431c8: f2(5)> 3 <Greenlet at 0x1b43140: f3(5)> 3 <Greenlet at 0x1985030: f1(5)> 4 <Greenlet at 0x1b431c8: f2(5)> 4 <Greenlet at 0x1b43140: f3(5)> 4

demo.py(gevent打补丁,monkey自动替换原生阻塞类代码。重要,常用):


import gevent # 需要安装gevent模块 sudo pip3 install gevent (python2.x使用pip)
import time
from gevent import monkey
# gevent打补丁
monkey.patch_all() # 将所有原生阻塞类代码自动替换成gevent包装的阻塞类代码。 
def f1(n):
 for i in range(n):
 print(gevent.getcurrent(), i)
 time.sleep(0.5) # 会自动替换成 gevent.sleep(0.5)
def f2(n):
 for i in range(n):
 print(gevent.getcurrent(), i)
 time.sleep(0.5)
def f3(n):
 for i in range(n):
 print(gevent.getcurrent(), i)
 time.sleep(0.5)
# g1 = gevent.spawn(f1, 5)
# g2 = gevent.spawn(f2, 5)
# g3 = gevent.spawn(f3, 5)
# g1.join()
# g2.join()
# g3.join()
# 一种简便写法
gevent.joinall([
 gevent.spawn(f1, 5),
 gevent.spawn(f2, 5),
 gevent.spawn(f3, 5)
])

运行结果:

<Greenlet at 0x22e0938: f1(5)> 0 <Greenlet at 0x22e09c0: f2(5)> 0 <Greenlet at 0x22e0a48: f3(5)> 0 <Greenlet at 0x22e0938: f1(5)> 1 <Greenlet at 0x22e09c0: f2(5)> 1 <Greenlet at 0x22e0a48: f3(5)> 1 <Greenlet at 0x22e0938: f1(5)> 2 <Greenlet at 0x22e09c0: f2(5)> 2 <Greenlet at 0x22e0a48: f3(5)> 2 <Greenlet at 0x22e0938: f1(5)> 3 <Greenlet at 0x22e09c0: f2(5)> 3 <Greenlet at 0x22e0a48: f3(5)> 3 <Greenlet at 0x22e0938: f1(5)> 4 <Greenlet at 0x22e09c0: f2(5)> 4 <Greenlet at 0x22e0a48: f3(5)> 4

demo.py(gevent底层原理):


import socket
import time
tcp_server_tcp = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
tcp_server_tcp.bind(("", 7899))
tcp_server_tcp.listen(128)
tcp_server_tcp.setblocking(False) # 设置套接字为非堵塞的方式。 (接收数据时如果没有接到数据(阻塞)那么就抛异常,否则正常接收数据。)
client_socket_list = list() # 用于保存与客户端连接的套接字。
while True:
 # time.sleep(0.5)
 try:
 new_socket, new_addr = tcp_server_tcp.accept() # 用抛异常的方式代替阻塞。
 except Exception as ret:
 print("---没有新的客户端到来---")
 else:
 print("---只要没有产生异常,那么也就意味着 来了一个新的客户端----")
 new_socket.setblocking(False) # 设置套接字为非堵塞的方式。 (如果需要阻塞就直接抛异常代替阻塞)
 client_socket_list.append(new_socket)
 for client_socket in client_socket_list:
 try:
 recv_data = client_socket.recv(1024) # 用抛异常的方式代替阻塞。
 except Exception as ret:
 print("----这个客户端还没有发送过来数据----")
 else:
 if recv_data:
 # 对方发送过来数据
 print("----客户端发送过来了数据-----")
 else:
 # 对方调用close 导致了 recv返回
 client_socket.close()
 client_socket_list.remove(client_socket)
 print("---客户端已经关闭----")

Python 协程操作 gevent yield阻塞 greenlet 协程实现多任务 交替协作执行