本文实例讲述了Python协程操作之gevent(yield阻塞,greenlet),协程实现多任务(有规律的交替协
本文实例讲述了Python 协程操作之gevent(yield阻塞,greenlet),协程实现多任务(有规律的交替协作执行)用法。分享给大家供大家参考,具体如下:
实现多任务:进程消耗的资源最大,线程消耗的资源次之,协程消耗的资源最少(单线程)。
gevent实现协程,gevent是通过阻塞代码(例如网络延迟等)来自动切换要执行的任务,所以在进行IO密集型程序时(例如爬虫),使用gevent可以提高效率(有效利用网络延迟的时间去执行其他任务)。
GIL(全局解释器锁)是C语言版本的Python解释器中专有的,GIL的存在让多线程的效率变低(哪个线程抢到锁,就执行哪个线程)。在IO密集型程序中,多线程依然比单线程效率高(GIL通过IO阻塞自动切换多线程)。
解决GIL(全局解释器锁)的问题的三种方法:1、不要用C语言版本的Python解释器。2、让子线程运行其他语言代码(例如:主线程运行Python代码,子线程运行C语言代码(C语言的动态库))。3、多进程代替多线程(多进程可以利用多核CPU)。
demo.py(协程底层原理,yield):
import time
# 带yield的函数并不是函数,而是一个生成器模板,返回一个生成器(可用于遍历迭代)
def task_1():
while True:
time.sleep(0.1)
yield # 阻塞,等待next迭代解阻塞
def task_2():
while True:
time.sleep(0.1)
yield
def main():
t1 = task_1() # 返回的t1是一个生成器。 此时并未执行task_1中的代码
t2 = task_2()
# 先让t1运行一会,当t1中遇到yield的时候,再返回到24行,然后
# 执行t2,当它遇到yield的时候,再次切换到t1中
# 这样t1/t2/t1/t2的交替运行,最终实现了多任务....协程
while True:
next(t1) # 执行task_1中的代码,遇到yield阻塞task_1。 等待下一次next激活。
next(t2) # 实现task_1与task_2交替执行,实现多任务...协程
if __name__ == "__main__":
main()
demo.py(greenlet实现协程,封装了yield):
from greenlet import greenlet # 需要安装greenlet模块 sudo pip3 install greenlet (python2.x使用pip)
import time
def test1():
while True:
print("---A--")
gr2.switch() # 切换到gr2中的任务。
time.sleep(0.5)
def test2():
while True:
print("---B--")
gr1.switch() # 切换到gr1中的任务。
time.sleep(0.5)
gr1 = greenlet(test1) # greenlet 底层封装了yield。
gr2 = greenlet(test2)
#切换到gr1中运行
gr1.switch()
demo.py(gevent实现协程,封装了greenlet,遇到阻塞代码自动切换协程任务):
import gevent # 需要安装gevent模块 sudo pip3 install gevent (python2.x使用pip)
import time
def f1(n):
for i in range(n):
print(gevent.getcurrent(), i)
gevent.sleep(0.5) # 为了提高协程效率,遇到阻塞类代码,会自动切换协程任务。
# time.sleep(0.5) # 阻塞类代码必须使用gevent自己包装的代码,原生阻塞类代码不会切换协程任务。
# 可以使用monkey.patch_all()将所有原生阻塞类代码替换成gevent包装的阻塞类代码。
def f2(n):
for i in range(n):
print(gevent.getcurrent(), i) # <Greenlet "Greenlet-0" at 0x7f4a09b34648: f1(5)> 0
gevent.sleep(0.5)
# time.sleep(0.5)
def f3(n):
for i in range(n):
print(gevent.getcurrent(), i)
gevent.sleep(0.5)
# time.sleep(0.5)
g1 = gevent.spawn(f1, 5) # gevent其实是对greenlet的封装。
g2 = gevent.spawn(f2, 5) # 第一个参数f2表示协程执行的具体任务(函数),第二个参数5表示要传给f2的参数
g3 = gevent.spawn(f3, 5)
g1.join() # 遇到阻塞类代码,自动切换协程任务。
g2.join()
g3.join()
运行结果:
<Greenlet at 0x1985030: f1(5)> 0 <Greenlet at 0x1b431c8: f2(5)> 0 <Greenlet at 0x1b43140: f3(5)> 0 <Greenlet at 0x1985030: f1(5)> 1 <Greenlet at 0x1b431c8: f2(5)> 1 <Greenlet at 0x1b43140: f3(5)> 1 <Greenlet at 0x1985030: f1(5)> 2 <Greenlet at 0x1b431c8: f2(5)> 2 <Greenlet at 0x1b43140: f3(5)> 2 <Greenlet at 0x1985030: f1(5)> 3 <Greenlet at 0x1b431c8: f2(5)> 3 <Greenlet at 0x1b43140: f3(5)> 3 <Greenlet at 0x1985030: f1(5)> 4 <Greenlet at 0x1b431c8: f2(5)> 4 <Greenlet at 0x1b43140: f3(5)> 4
demo.py(gevent打补丁,monkey自动替换原生阻塞类代码。重要,常用):
import gevent # 需要安装gevent模块 sudo pip3 install gevent (python2.x使用pip)
import time
from gevent import monkey
# gevent打补丁
monkey.patch_all() # 将所有原生阻塞类代码自动替换成gevent包装的阻塞类代码。
def f1(n):
for i in range(n):
print(gevent.getcurrent(), i)
time.sleep(0.5) # 会自动替换成 gevent.sleep(0.5)
def f2(n):
for i in range(n):
print(gevent.getcurrent(), i)
time.sleep(0.5)
def f3(n):
for i in range(n):
print(gevent.getcurrent(), i)
time.sleep(0.5)
# g1 = gevent.spawn(f1, 5)
# g2 = gevent.spawn(f2, 5)
# g3 = gevent.spawn(f3, 5)
# g1.join()
# g2.join()
# g3.join()
# 一种简便写法
gevent.joinall([
gevent.spawn(f1, 5),
gevent.spawn(f2, 5),
gevent.spawn(f3, 5)
])
运行结果:
<Greenlet at 0x22e0938: f1(5)> 0 <Greenlet at 0x22e09c0: f2(5)> 0 <Greenlet at 0x22e0a48: f3(5)> 0 <Greenlet at 0x22e0938: f1(5)> 1 <Greenlet at 0x22e09c0: f2(5)> 1 <Greenlet at 0x22e0a48: f3(5)> 1 <Greenlet at 0x22e0938: f1(5)> 2 <Greenlet at 0x22e09c0: f2(5)> 2 <Greenlet at 0x22e0a48: f3(5)> 2 <Greenlet at 0x22e0938: f1(5)> 3 <Greenlet at 0x22e09c0: f2(5)> 3 <Greenlet at 0x22e0a48: f3(5)> 3 <Greenlet at 0x22e0938: f1(5)> 4 <Greenlet at 0x22e09c0: f2(5)> 4 <Greenlet at 0x22e0a48: f3(5)> 4
demo.py(gevent底层原理):
import socket
import time
tcp_server_tcp = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
tcp_server_tcp.bind(("", 7899))
tcp_server_tcp.listen(128)
tcp_server_tcp.setblocking(False) # 设置套接字为非堵塞的方式。 (接收数据时如果没有接到数据(阻塞)那么就抛异常,否则正常接收数据。)
client_socket_list = list() # 用于保存与客户端连接的套接字。
while True:
# time.sleep(0.5)
try:
new_socket, new_addr = tcp_server_tcp.accept() # 用抛异常的方式代替阻塞。
except Exception as ret:
print("---没有新的客户端到来---")
else:
print("---只要没有产生异常,那么也就意味着 来了一个新的客户端----")
new_socket.setblocking(False) # 设置套接字为非堵塞的方式。 (如果需要阻塞就直接抛异常代替阻塞)
client_socket_list.append(new_socket)
for client_socket in client_socket_list:
try:
recv_data = client_socket.recv(1024) # 用抛异常的方式代替阻塞。
except Exception as ret:
print("----这个客户端还没有发送过来数据----")
else:
if recv_data:
# 对方发送过来数据
print("----客户端发送过来了数据-----")
else:
# 对方调用close 导致了 recv返回
client_socket.close()
client_socket_list.remove(client_socket)
print("---客户端已经关闭----")
Python
协程操作
gevent
yield阻塞
greenlet
协程实现多任务
交替协作执行