关于linux:selectpoll和epoll

在浏览 UNIX 环境高级编程中，发现只写了 select 和 poll，对于 epoll 的回调机制还有所不了解。

首先要了解 LINUX 网络 IO 多路复用，IO 多路复用在 Linux 下包含了三种，select, poll, epoll，形象来看，他们性能是相似的，但具体细节各有不同：首先都会对一组文件描述符进行相干事件的注册，而后阻塞期待某些事件的产生或期待超时。更多细节详见上面的 “ 具体怎么用 ”。IO 多路复用都能够关注多个文件描述符，但对于这三种机制而言，不同数量级文件描述符对性能的影响是不同的，上面会具体介绍。

select 将监听的文件描述符分为三组，每一组监听不同的须要进行的 IO 操作。readfds 是须要进行读操作的文件描述符，writefds 是须要进行写操作的文件描述符，exceptfds 是须要进行异样事件处理的文件描述符。这三个参数能够用 NULL 来示意对应的事件不须要监听。

当 select 返回时，每组文件描述符会被 select 过滤，只留下能够进行对应 IO 操作的文件描述符。

linux 下 fd_set 是个 1024 位的位图，每个位代表一个 fd 的值，返回后须要扫描位图，这也是效率低的起因。性能问题且不提，正确性问题则更值得器重。因为这是一个 1024 位的位图，因而当过程内的 fd 值 >= 1024 时，就会越界，可能会造成解体。对于服务器程序，fd >= 1024 很容易达到，只有连接数 + 关上的文件数足够大即可产生。
再来看 fd_set 构造体是怎么记录一批文件描述符是否有事件触发的。认真看 fd_set 构造的定义能够发现，他其实是一个__int32_t 类型的数组，数组所有元素加起来共蕴含 1024bit（由 FD_SETSIZE 定义）。记录某个文件描述符是否触发事件时，一个 bit 代表一个文件描述符的状态，0 示意没有触发事件，1 示意触发，把文件形容的数值映射为下标，计算出哪一 bit 代表了这个文件描述符的状态。

因而能够看出，一旦文件描述符的数值超出 1024，计算出的下标就有可能超出__int32_t 数组的最大下标地位，所以有可能会呈现数组越界的问题。

和 select 用三组文件描述符不同的是，poll 只有一个 pollfd 数组，数组中的每个元素都示意一个须要监听 IO 操作事件的文件描述符。events 参数是咱们须要关怀的事件，revents 是所有内核监测到的事件。

Poll 机制冲破了 Select 机制中的文件描述符数量最大为 1024 的限度。

epoll_create 用于创立一个 epoll 实例，而 epoll_ctl 用于往 epoll 实例中增删改要监测的文件描述符，epoll_wait 则用于阻塞的期待能够执行 IO 操作的文件描述符直到超时。

增加到文件描述符上的理论都会与网卡建设回调机制，也就是理论产生时会自主调用一个回调办法，将事件所在的文件描述符插入到就绪队列中
援用程序调用 epoll_wait 就能够间接从就绪队列中将所有就绪的文件描述符拿到，能够说工夫复杂度 O(1)

对于上述的回调机制如何实现，还在查阅 epoll 相干源码中

状态继续告诉和状态变动告诉。

这两个概念来自电路，triggered 代表电路激活，也就是有事件告诉给程序，level-triggered 示意只有有 IO 操作能够进行比方某个文件描述符有数据可读，每次调用 epoll_wait 都会返回以告诉程序能够进行 IO 操作，edge-triggered 示意只有在文件描述符状态发生变化时，调用 epoll_wait 才会返回，如果第一次没有全副读完该文件描述符的数据而且没有新数据写入，再次调用 epoll_wait 都不会有告诉给到程序，因为文件描述符的状态没有变动。

select 和 poll 都是状态继续告诉的机制，且不可扭转，只有文件描述符中有 IO 操作能够进行，那么 select 和 poll 都会返回以告诉程序。而 epoll 两种告诉机制可选。

poll 和 select 基本上是一样的，poll 相比 select 好在如下几点：

poll 传参对用户更敌对。比方不须要和 select 一样计算很多奇怪的参数比方 nfds(值最大的文件描述符 +1)，再比方不须要离开三组传入参数。
poll 会比 select 性能稍好些，因为 select 是每个 bit 位都检测，假如有个值为 1000 的文件描述符，select 会从第一位开始检测始终到第 1000 个 bit 位。但 poll 检测的是一个数组。
select 的工夫参数在返回的时候各个系统的解决形式不对立，如果心愿程序可移植性更好，须要每次调用 select 都初始化工夫参数。

select 比 poll 好在上面几点

反对 select 的零碎更多，兼容更弱小，有一些 unix 零碎不反对 poll
select 提供精度更高 (到 microsecond) 的超时工夫，而 poll 只提供到毫秒的精度。

但总体而言 select 和 poll 基本一致。

epoll 优于 select&poll 在上面几点：

在须要同时监听的文件描述符数量减少时，select&poll 是 O(N)的复杂度，epoll 是 O(1)，在 N 很小的状况下，差距不会特地大，但如果 N 很大的前提下，一次 O(N)的循环可要比 O(1)慢很多，所以高性能的网络服务器都会抉择 epoll 进行 IO 多路复用。
epoll 外部用一个文件描述符挂载须要监听的文件描述符，这个 epoll 的文件描述符能够在多个线程 / 过程共享，所以 epoll 的应用场景要比 select&poll 要多。

https://zhuanlan.zhihu.com/p/…
https://www.jianshu.com/p/019…
https://www.cnblogs.com/Anker…
https://www.cnblogs.com/anker…

关于linux:selectpoll和epoll

IO 多路复用

select

poll

epoll

level-triggered and edge-triggered

不同 IO 多路复用计划优缺点

poll vs select

epoll vs poll&select

参考