【面试八股总结】Linux系统下的I/O多路复用

select 将已连接的 Socket 都放到一个文件描述符集合，然后调用 select 函数将文件描述符集合拷贝到内核里，让内核来检查是否有事件产生，检查的方式就是通过遍历文件描述符集合的方式，当检查到有事件产生后，将此 Socket 标记为可读或可写，接着再把整个文件描述符集合拷贝回用户态里，然后用户态还需要再通过遍历的方法找到可读或可写的 Socket，然后再对其处理。

$【面试八股总结】Linux系统下的I/O多路复用,词库加载错误:未能找到文件“C:\Users\Administrator\Desktop\火车头9.8破解版\Configuration\Dict_Stopwords.txt”。,服务,服务器,操作,第1张$

缺点：

每次调用select，都需要把fd集合从用户态拷贝到内核态，这个开销在fd很多时会很大
同时每次调用select都需要在内核遍历传递进来的所有fd，这个开销在fd很多时也很大
select支持的文件描述符数量太小了，默认是1024
fds集合不能重用，每次都需要重置（因为内核会修改发生事件的fd）

二、POLL

poll是select的⼀种改进，使用轮询方式来检查多个文件描述符的状态，避免了select中文件描述符数量有限的问题。但对于大量的文件描述符，poll的性能也可能变得不够⾼效。

改进点：

基于结构体数组存储要监视的文件描述符，文件描述符数量不受限制，可以处理任意数量的文件描述符；
结构体中使用revents作为是否发生事件标志，每次遍历只需要将revernts恢复为0，因此文件描述符集合可以重用。

#include 
struct pollfd {
    int fd; /* 委托内核检测的文件描述符 */
    short events; /* 委托内核检测文件描述符的什么事件 */
    short revents; /* 文件描述符实际发生的事件 */
};
struct pollfd myfd;
myfd.fd = 5;
myfd.events = POLLIN | POLLOUT;

函数原型：

int poll(struct pollfd *fds, nfds_t nfds, int timeout);
- 参数：
        - fds : 是一个struct pollfd 结构体数组，这是一个需要检测的文件描述符的集合
        - nfds : 这个是第一个参数数组中最后一个有效元素的下标 + 1
        - timeout : 阻塞时长
            0 : 不阻塞
            -1 : 阻塞，当检测到需要检测的文件描述符有变化，解除阻塞
            >0 : 阻塞的时长
- 返回值：
        -1 : 失败
        >0（n） : 成功,n表示检测到集合中有n个文件描述符发生变化

缺点：

每次调用poll时，仍然需要将pollfd集合从用户态拷贝到内核态；
每次调用poll时，都需要在内核遍历传递进来的所有pollfd。

三、EPOLL

EPOLL是Linux特有的I/O复用函数。epoll 使用⼀个事件驱动（event-driven）的方式来处理I/O操作，它只会返回就绪的文件描述符，而不是遍历整个文件描述符集合。

epoll使用一组函数完成任务，而不是一个函数，并且epoll把用户关心的文件描述符上的事件放在内核里的一个事件表中，不需要像select和poll一样每次调用都需要重复传入文件描述符集合。但epoll需要一个额外的文件描述符，用于唯一标识内核中的事件表。

$【面试八股总结】Linux系统下的I/O多路复用,词库加载错误:未能找到文件“C:\Users\Administrator\Desktop\火车头9.8破解版\Configuration\Dict_Stopwords.txt”。,服务,服务器,操作,第2张$

LT和ET模式：

epoll 支持两种事件触发模式，分别是边缘触发（edge-triggered，ET）和水平触发（level-triggered，LT）。

使用边缘触发模式时，当被监控的 Socket 描述符上有可读事件发生时，服务器端只会从 epoll_wait 中苏醒一次，即使进程没有调用 read 函数从内核读取数据，也依然只苏醒一次，因此我们程序要保证一次性将内核缓冲区的数据读取完；

使用水平触发模式时，当被监控的 Socket 上有可读事件发生时，服务器端不断地从 epoll_wait 中苏醒，直到内核缓冲区数据被 read 函数读完才结束，目的是告诉我们有数据需要读取；
        ET（edge - triggered）是高速工作方式，只支持 no-block socket。在这种模式下，当描述符从未就绪变为就绪时，内核通过epoll告诉你。然后它会假设你知道文件描述符已经就绪，并且不会再为那个文件描述符发送更多的就绪通知，直到你做了某些操作导致那个文件描述符不再为就绪状态了。但是请注意，如果一直不对这个 fd 作 IO 操作（从而导致它再次变成未就绪），内核不会发送更多的通知（only once）。
        ET 模式在很大程度上减少了 epoll 事件被重复触发的次数，因此效率要比 LT 模式高。epoll工作在 ET 模式的时候，必须使用非阻塞套接口，以避免由于一个文件句柄的阻塞读/阻塞写操作把处理多个文件描述符的任务饿死。
EPOLLONESHOT事件：
        即使使用ET模式，一个socket上的某个事件还是可能被触发多次。这在并发程序中会引起一个问题，假设一个线程在读取完某个socket上的数据后开始处理该数据，而在数据处理过程中该socket又有新的数据可读（EPOLLIN再次被触发），此时另一个线程被唤醒来读取这些新的数据，于是就出现了两个线程同时操作一个socket的局面。
        我们期望一个socket连接在任何时候都只被一个线程处理，可以采用EPOLLONESHOT事件实现。对于注册了EPOLLONESHOT事件的文件描述符，操作系统最多触发其上注册的一个可读、可写或者异常事件，且只触发一次，除非使用epoll_cnt函数重置改文件描述符上注册的EPOLLONESHOT事件。
SELECT、POLL和EPOLL区别：
$【面试八股总结】Linux系统下的I/O多路复用,词库加载错误:未能找到文件“C:\Users\Administrator\Desktop\火车头9.8破解版\Configuration\Dict_Stopwords.txt”。,服务,服务器,操作,第3张$