socket在创建的时候默认是阻塞的。我们可以通过socket系统调用的第二个参数传递SOCK_NONBLOCK标志,或者通过fcntl系统调用的F_SETFL命令,将其设置为非阻塞的。阻塞和非阻塞的概念能应用与所有文件描述符,不仅仅是socket,我们称阻塞的文件描述符为阻塞I/O,非阻塞的文件描述符为非阻塞I/O.
针对阻塞I/O执行的系统调用可能因为无法立即完成而被操作系统挂起,直到等待的事件发生为止。比如,客户端通过connect向服务器发起连接时,connect将首先发送同步报文段给服务器,然后等待服务器返回确认报文段,如果服务器的确认报文段没有立即到达客户端,则connect调用将被挂起,直到客户端收到确认报文段并唤醒connect调用,socket的基础API中,可能被阻塞的系统调用包括acept send rev connect.
针对非阻塞I/O执行的系统调用则总是立即返回,而不管事件是否已经发生,如果事件没有立即发生,这些系统调用就返回-1,和出错的情况一样,此时我们必须根据errno来分情况,对accept send recv而言,事件未发生时errno通常被设置成EAGAIN或者EWOULDBLOCK(意思为期望阻塞),对于connect,errno则被设置为EINPROGRESS(意思为正在处理中)。
很显然,我们只有在事件已经发生的情况下操作非阻塞i/o(读写等),才能提高程序的效率,因此,非阻塞I/O通常要和其他I/O通知机制一起使用,比如I/O复用和SIGIO信号。
I/O复用是最常用两个的I/O通知机制,他指的是,应用程序通过I/O复用函数想内核注册一组事件,内核通过I/O复用函数把其中就绪的事件通知给应用程序,Linux上常用的I/O复用函数是select、poll epoll_wait。需要明白的是,I/O复函数本身是阻塞的,他们能提高程序效率的原因在于他们具有同时监听多个I/O事件的能力。
SIGIO信号也可以用来报告I/O事件。当目标文件 描述符上有事件发生时,SIGIO信号的信号处理函数将被触发,我们也就可以在该信号处理函数中对目标文件描述II符执行非阻塞I/O操作了。
从理论上说,阻塞I/O I/O复用和信号驱动I/O都是同步I/O模型,因为在这三种I/O模型中,I/O读写操作,都是在I/O事件发生之后,由应用程序完成的,在POSIX规范所定义的异步I/O模型则不同。对于异步I/O而言,用户可以直接对I/O执行读写操作,这些操作告诉内核用户读写缓冲区的位置,以及I./O操作完成之 后内核通知应用程序的方式。异步I/O的读写总是立即返回,而不论I/O是否阻塞,因为真正的读写操作已经由内核接管,也就是说,同步I/O模型要求用户代码自行执行I/O操作(将数据从内核缓冲区读入用户缓冲区,或将数据从用户缓冲区写入内核缓冲区),而异步I/O机制则由内核来执行I/O操作(数据在内核缓冲区和用户缓冲区之间的移动是由内核在“后台”完成的)。你可以这么认为,同步I/O向应用程序通知的是I/O就绪事件,异步I/O想应用程序通知的是I/O完成事件。linux环境下,aio.h头文件中定义了函数提供了异步I/O支持。
总结
I/O模型 读写操作和阻塞阶段
阻塞I/O 程序阻塞与读写操作
I/O复用 程序阻塞于I/O复用系统调用,但可同时监听多个I/O事件,对I/O本身读写操作是非阻塞的
SIGIO信号 信号触发读写就绪事件,用户程序执行读写操作,程序没有阻塞阶段
异步I/O 内核执行读写并触发读写完成事件,程序没有阻塞阶段
同时,在并发模型中也有同步/异步的方式,但是和这里的概念不同。
在I/O模型中,同步和异步区分的是内核向应用程序通知的是何种I/O事件(是就绪事件还是完成事件),以及该由谁来完成I/O读写(是应用程序还是内核),在并发模型中,同步指的是程序完全按照代码序列的顺序执行,异步值得是程序执行需要由系统事件来驱动,常见的系统事件包括中断,信号等。