关于linux:Netty框架IO模型Linux五大网络IO模型

一、IO 读写的根底原理：read、write

1、编程模型一致性以及底层零碎调用的了解(缓冲区与间接调用)：

1.1、无论是 Socket 的读写还是文件的读写，在 Java 层面的利用开发或者是 linux 零碎底层开发，都属于输出 input 和输入 output 的解决，简称为 IO 读写。在原理上和解决流程上，都是统一的。区别在于参数的不同。

1.2、用户程序进行 IO 的读写，基本上会用到 read&write 两大零碎调用。可能不同操作系统，名称不齐全一样，然而性能是一样的。

1.3、read 零碎调用，并不是把数据间接从物理设施，读数据到内存。write 零碎调用，也不是间接把数据，写入到物理设施。

1.4、read 零碎调用，是把数据从内核缓冲区复制到过程缓冲区；而 write 零碎调用，是把数据从过程缓冲区复制到内核缓冲区。这个两个零碎调用，都不负责数据在内核缓冲区和磁盘之间的替换。底层的读写替换，是由操作系统 kernel 内核实现.。

2. 了解内核缓冲区和过程缓冲区：（为什么要有缓冲区？缩小 IO 中断）

1. 为什么要有缓冲去？& 读写调用的实质(缩小中断，仅将数据在两个缓冲区进行复制, 和设施的交互则由内核决定)

缓冲区的目标，是为了缩小频繁的零碎 IO 调用。大家都晓得，零碎调用须要保留之前的过程数据和状态等信息，而完结调用之后回来还须要复原之前的信息，为了缩小这种损耗工夫、也损耗性能的零碎调用，于是呈现了缓冲区。

有了缓冲区，操作系统应用 read 函数把数据从内核缓冲区复制到过程缓冲区，write 把数据从过程缓冲区复制到内核缓冲区中。期待缓冲区达到肯定数量的时候，再进行 IO 的调用，晋升性能。至于什么时候读取和存储则由内核来决定，用户程序不须要关怀。

在 linux 零碎中，零碎内核也有个缓冲区叫做内核缓冲区。每个过程有本人独立的缓冲区，叫做过程缓冲区。所以，用户程序的 IO 读写程序，大多数状况下，并没有进行理论的 IO 操作，而是在读写本人的过程缓冲区。

2. 为什么要辨别内核空间以及用户空间？(用户过程无奈间接调用系统资源，只能通过操作系统来拜访)

1. 内核态和用户态（kernel mode 和 user mode），在内核态能够拜访系统资源，比方：

1. 处理器 cpu：cpu 管制着一个程序的执行。

2. 输入输出 IO：linux 有句话叫“一切都是流”，也就是所有输入输出设施的数据，包含硬盘，内存，终端都能够像流一样操作。

3. 过程治理：相似对过程的创立，休眠，唤醒，开释之类的调度。比方 linux 下的 fork 和 windows 下的 CreateProcess()函数。

4. 内存：包含内存的申请，开释等治理操作。

5. 设施：这个就是经常说的外设了，比方鼠标，键盘。

6. 计时器：计算机能计时是因为晶体振荡器产生的电磁脉冲。那么所有的定时工作都是以它为根底的。

7. 过程间通信 IPC：过程之间是不可能相互拜访内存的，所以过程与过程之间的交互须要通信，而通信也是一种资源。

8. 网络通信：网络通信能够看做是过程见通信的非凡模式。

而下面所说的这些系统资源，在用户过程中是无奈被间接拜访的，只能通过操作系统来拜访，所以也把操作系统提供的这些性能成为:“零碎调用”。

首先看看一个典型 Java 服务端解决网络申请的典型过程：

（1）客户端申请

Linux 通过网卡，读取客户断的申请数据，将数据读取到内核缓冲区。

（2）获取申请数据

服务器从内核缓冲区读取数据到 Java 过程缓冲区。

（1）服务器端业务解决

Java 服务端在本人的用户空间中，解决客户端的申请。

（2）服务器端返回数据

Java 服务端已构建好的响应，从用户缓冲区写入零碎缓冲区。

（3）发送给客户端

Linuxc/c++ 服务器开发高阶视频，电子书学习材料 +602878196（微 X 同号）获取

内容包含 C /C++，Linux，Nginx，ZeroMQ，MySQL，Redis，MongoDB，ZK，流媒体，P2P，K8S，Docker，TCP/IP，协程，DPDK 多个高级知识点。
残缺视频链接：https://ke.qq.com/course/4177…

二、Linux 五种 IO 模型

（1）阻塞 IO（Blocking IO）：用户空间始终期待。

首先，解释一下这里的阻塞与非阻塞：

阻塞 IO，指的是须要内核 IO 操作彻底实现后，才返回到用户空间，执行用户的操作。阻塞指的是用户空间程序的执行状态，用户空间程序需等到 IO 操作彻底实现。传统的 IO 模型都是同步阻塞 IO。在 java 中，默认创立的 socket 都是阻塞的。

其次，解释一下同步与异步：

同步 IO，是一种用户空间与内核空间的调用发动形式。同步 IO 是指用户空间线程是被动发动 IO 申请的一方，内核空间是被动接受方。异步 IO 则反过来，是指内核 kernel 是被动发动 IO 申请的一方，用户线程是被动接受方。

举个例子，发动一个 blocking socket 的 read 读操作系统调用，流程大略是这样：

1. 当用户线程调用了 read 零碎调用，内核（kernel）就开始了 IO 的第一个阶段：筹备数据。很多时候，数据在一开始还没有达到（比方，还没有收到一个残缺的 Socket 数据包），这个时候 kernel 就要期待足够的数据到来。

2. 当 kernel 始终等到数据筹备好了，它就会将数据从 kernel 内核缓冲区，拷贝到用户缓冲区（用户内存），而后 kernel 返回后果。

从开始 IO 读的 read 零碎调用开始，用户线程就进入阻塞状态。始终到 kernel 返回后果后，用户线程才解除 block 的状态，从新运行起来。

所以，blocking IO 的特点就是在内核进行 IO 执行的两个阶段，用户线程都被 block 了。

BIO 的长处：

1. 程序简略，在阻塞期待数据期间，用户线程挂起。用户线程根本不会占用 CPU 资源。

BIO 的毛病：

2. 个别状况下，会为每个连贯配套一条独立的线程，或者说一条线程保护一个连贯胜利的 IO 流的读写。在并发量小的状况下，这个没有什么问题。然而，当在高并发的场景下，须要大量的线程来保护大量的网络连接，内存、线程切换开销会十分微小。因而，基本上，BIO 模型在高并发场景下是不可用的。

（2）非阻塞 IO（Non-blocking IO）：用户空间轮训遍历内核空间，很少用。

非阻塞 IO，指的是用户程序不须要期待内核 IO 操作实现后，内核立刻返回给用户一个状态值，用户空间无需等到内核的 IO 操作彻底实现，能够立刻返回用户空间，执行用户的操作，处于非阻塞的状态。

简略的说：阻塞是指用户空间（调用线程）始终在期待，而且别的事件什么都不做；非阻塞是指用户空间（调用线程）拿到状态就返回，IO 操作能够干就干，不能够干，就去干的事件。

非阻塞 IO 要求 socket 被设置为 NONBLOCK。

NIO 的特点：

应用程序的线程须要一直的进行 I/O 零碎调用，轮询数据是否曾经筹备好，如果没有筹备好，持续轮询，直到实现零碎调用为止。

NIO 的长处：每次发动的 IO 零碎调用，在内核的期待数据过程中能够立刻返回。用户线程不会阻塞，实时性较好。

NIO 的毛病：须要一直的反复发动 IO 零碎调用，这种一直的轮询，将会一直地询问内核，这将占用大量的 CPU 工夫，系统资源利用率较低。

总之，NIO 模型在高并发场景下，也是不可用的。个别 Web 服务器不应用这种 IO 模型。个别很少间接应用这种模型，而是在其余 IO 模型中应用非阻塞 IO 这一个性。java 的理论开发中，也不会波及这种 IO 模型。

1. 与 java nio 的区别：

再次阐明，Java NIO（New IO）不是 IO 模型中的 NIO 模型，而是另外的一种模型，叫做 IO 多路复用模型（IO multiplexing）。

（3）IO 多路复用（IO Multiplexing）

即经典的 Reactor 设计模式，有时也称为异步阻塞 IO，Java 中的 Selector 和 Linux 中的 epoll 都是这种模型。linux 提供了 poll/select 零碎调用，过程通过将一个或多个 fd(文件描述符)传递给 poll/select 零碎调用，阻塞在 select 操作上，这样 poll/select 能够帮咱们监听多个 fd 是否处于就绪状态，poll/select 程序扫描 fd 是否就绪，而且反对的 fd 数量无限，因而它的应用受到了限度。linux 还提供了 epoll 零碎调用，epoll 应用了基于事件驱动的形式代替程序扫描，因而性能更高，当有 fd 就绪时，立刻回到哈数 rooback。

在这种模式中，首先不是进行 read 零碎调动，而是进行 select/epoll 零碎调用。当然，这里有一个前提，须要将指标网络连接，提前注册到 select/epoll 的可查问 socket 列表中。而后，才能够开启整个的 IO 多路复用模型的读流程。

1. 进行 select/epoll 零碎调用，查问能够读的连贯。kernel 会查问所有 select 的可查问 socket 列表，当任何一个 socket 中的数据筹备好了，select 就会返回。当用户过程调用了 select，那么整个线程会被 block（阻塞掉）。

2. 用户线程取得了指标连贯后，发动 read 零碎调用，用户线程阻塞。内核开始复制数据。它就会将数据从 kernel 内核缓冲区，拷贝到用户缓冲区（用户内存），而后 kernel 返回后果。

3. 用户线程才解除 block 的状态，用户线程终于真正读取到数据，继续执行。

多路复用 IO 的特点：

IO 多路复用模型，建设在操作系统 kernel 内核可能提供的多路拆散零碎调用 select/epoll 根底之上的。多路复用 IO 须要用到两个零碎调用（system call），一个 select/epoll 查问调用，一个是 IO 的读取调用。

和 NIO 模型类似，多路复用 IO 须要轮询。负责 select/epoll 查问调用的线程，须要一直的进行 select/epoll 轮询，查找出能够进行 IO 操作的连贯。

另外，多路复用 IO 模型与后面的 NIO 模型，是有关系的。对于每一个能够查问的 socket，个别都设置成为 non-blocking 模型。只是这一点，对于用户程序是通明的（不感知）。

多路复用 IO 的长处：

用 select/epoll 的劣势在于，它能够同时解决成千上万个连贯（connection）。与一条线程保护一个连贯相比，I/ O 多路复用技术的最大劣势是：零碎不用创立线程，也不用保护这些线程，从而大大减小了零碎的开销。

Java 的 NIO（new IO）技术，应用的就是 IO 多路复用模型。在 linux 零碎上，应用的是 epoll 零碎调用。

（4）信号驱动 IO 模型

利用过程应用 sigaction 零碎调用，内核立刻返回，利用过程能够继续执行，也就是说期待数据阶段利用过程是非阻塞的。内核在数据达到时向利用过程发送 SIGIO 信号，利用过程收到之后在信号处理程序中调用 recvfrom 将数据从内核复制到利用过程中。信号驱动 I/O 的 CPU 利用率很高.

（5）异步 IO（Asynchronous IO）

异步 IO，指的是用户空间与内核空间的调用形式反过来。用户空间线程是变成被动承受的，内核空间是被动调用者。

这一点，有点相似于 Java 中比拟典型的模式是回调模式，用户空间线程向内核空间注册各种 IO 事件的回调函数，由内核去被动调用。

1. 当用户线程调用了 read 零碎调用，立即就能够开始去做其它的事，用户线程不阻塞。

2. 内核（kernel）就开始了 IO 的第一个阶段：筹备数据。当 kernel 始终等到数据筹备好了，它就会将数据从 kernel 内核缓冲区，拷贝到用户缓冲区（用户内存）。

3.kernel 会给用户线程发送一个信号（signal），或者回调用户线程注册的回调接口，通知用户线程 read 操作实现了。

4. 用户线程读取用户缓冲区的数据，实现后续的业务操作。

异步 IO 模型的特点：

在内核 kernel 的期待数据和复制数据的两个阶段，用户线程都不是 block(阻塞)的。用户线程须要承受 kernel 的 IO 操作实现的事件，或者说注册 IO 操作实现的回调函数，到操作系统的内核。所以说，异步 IO 有的时候，也叫做信号驱动 IO。

异步 IO 模型毛病：

须要实现事件的注册与传递，这里边须要底层操作系统提供大量的反对，去做大量的工作。

三、JAVA 体系的 IO 模型

1、BIO 解说(对应 linux 中的阻塞 IO)

2、NIO 解说(对应 linux 中的 IO 多路复用)

3、AIO 解说(对应 linux 中的异步 IO)

四、IO 模型影响的参数：(ulimit 默认 1024)

1. 句柄限度：

文件句柄: 文件 (一般文件、目录文件、链接文件、设施文件(socket)) 描述符是内核为了高效治理已被关上文件所创立的索引，非负整数。指代被关上的文件，所有的 IO 零碎调用，包含 SOCKET 的读写调用，都是通过文件描述符。

ulimit：单个过程关上的最大文件句柄数。

报错：Cant open many files。