【socket + select 实现构建异步非阻塞模块】

对于异步IO请求的本质则是【非阻塞Socket】+【IO多路复用】,那我们是否可以自定义异步IO模块,作为客户端,用于发送请求呢?答案那是肯定的!

补充说明:select可操作任何对象,但对象内必须是有fileno方法,可以看作是一个数值,给系统提供(文件句柄),其内部执行的是socket对象fileno方法的返回值!

自定义一个插件,模块如下:

import socket
import select

class Request(object):
    """
    select监听的是有变化的对象,当多个socket通信存在的话,当发生变化时,无法确定哪个是哪个。此时就需要唯一指定哪个通信处理的是什么数据!
    我们想到的办法是,再另创建一个类,用于接收当前的socket和信息,实例化唯一的对象!
    巧妙之处就在于唯一化的处理,生成的每个对象都是唯一的!!!
    """
    def __init__(self,sock,info):
    #初始化
        self.sock = sock   通信
        self.info = info   信息

    def fileno(self):  #转换成fileno对象
        return self.sock.fileno()


class NoBlockIO(object):
    def __init__(self):
        self.sock_list = []
        self.conns = []

    def add_request(self,req_info):
        """
        创建请求
         假设:req_info = {'host': 'www.baidu.com', 'port': 80, 'path': '/'},
        :return:
        """
        sock = socket.socket()  #创建socket对象
        sock.setblocking(False) #设置为非阻塞
        
        #建立连接,因为是非阻塞状态,连接可能会出异常所以需要做异常处理。
        #此处一定要注意,不管报不报错,连接的请求肯定会发出!
        try:
            sock.connect((req_info['host'],req_info['port']))
        except BlockingIOError as e:
            pass
        #实例化唯一的通信对象
        obj = Request(sock,req_info) #将生成的sock对象和信息列表传递到Request类,然后获取对应的文件句柄,信息保留到
        self.sock_list.append(obj) #将得到的对象添加到sock_list 通信列表中
        self.conns.append(obj)    #将得到的对象添加到conns 连接列表中

    def run(self):
        """
        开始事件循环,检测:连接成功?数据是否返回?
        注意此处操作的就全是Request类生成的对象!!!
        :return:
        """
        while True:
            # select.select([request对象,])
            r,w,e = select.select(self.sock_list,self.conns,[],0.05)
            
            # w,是否连接成功
            for obj in w:
                # 检查obj:request对象是谁,此时就需要唯一判断了!利用类可以封装对象的特性解决!
                # socket, {'host': 'www.baidu.com', 'port': 80, 'path': '/'},
                data = "GET %s http/1.1\r\nhost:%s\r\n\r\n" %(obj.info['path'],obj.info['host']) #发送GET请求的信息
                obj.sock.send(data.encode('utf-8')) #连接成功,发送字节数据
                self.conns.remove(obj) #然后在连接列表中删除这个对象,防止发送两次,排除循环通信的可能
            
            # 数据返回,接收到数据
            for obj in r:
                response = obj.sock.recv(8096)  #成功接收到数据,接收返回的信息
                #单个回调函数
                obj.info['callback'](response) #指定对应对象执行回调函数,参数为返回的信息
                
                #多个回调函数的情况!
                #for func in obj.info['callback'] #指定对应对象执行回调函数,参数为返回的信息
                #    func(response)
                
                self.sock_list.remove(obj)  #在监听列表中移除这个对象

            # 所有请求已经返回
            if not self.sock_list: #所有请求都处理完,就退出循环
                break

NBIO

调用这个插件,使用插件里的方法:

from .NBIO import NoBlockIO

#自定义定义回调函数,对返回的信息进行处理(执行完毕之后,对数据进行什么操作)
def done1(response):
    print(response)

def done2(response):
    print(response)

#准备执行的信息,域名,端口号,回调函数
url_list = [
    {'host': 'www.baidu.com', 'port': 80, 'path': '/','callback': done1},
    {'host': 'www.cnblogs.com', 'port': 80, 'path': '/index.html','callback': done2},
    {'host': 'www.bing.com', 'port': 80, 'path': '/','callback': done2},
]

#实例化一个对象
noblockObj = NoBlockIO()

#循环要处理的信息
for item in url_list:
    noblockObj.add_request(item)  #为条信息创建请求

noblockObj.run() #执行
#谁先执行完就返回谁,相对独立,互不干扰!

执行脚本

异步是相对而言,需要时间循环去检测!
以上是简单的模块定制,更多的操作,例如:分割响应头,响应体;or 保存文件这些操作后续需要,再进行补充! 

慎重说明:必须知道和理解整个执行的流程!!!