RabbitMQ消息中间件技术精讲

download
Socket 是什么以及创建过程
一个数据包经由应用程序产生，进入到协定栈中进行各种报文头的包装，而后操作系统调用网卡驱动程序指挥硬件，把数据发送到对端主机。整个过程的大抵的图示如下。

咱们大家知道，协定栈其实是位于操作系统中的一些协定的重叠，这些协定包含 TCP、UDP、ARP、ICMP、IP等。通常某个协定的设计都是为理解决某些问题，比如 TCP 的设计就负责安全可靠的传输数据，UDP 设计就是报文小，传输效率高，ARP 的设计是能够通过 IP 地址查问物理（Mac）地址，ICMP 的设计目标是返回谬误报文给主机，IP 设计的目标是为了实现大范畴主机的互联互通。

应用程序比如阅读器、电子邮件、文件传输服务器等产生的数据，会通过传输层协定进行传输，而应用程序是不会和传输层间接建立联系的，而是有一个能够连接应用层和传输层之间的套件，这个套件就是 Socket。

在下面这幅图中，应用程序蕴含 Socket 和解析器，解析器的作用就是向 DNS 服务器发动查问，查问目标 IP 地址。

应用程序的上面就是操作系统外部，操作系统外部包含协定栈，协定栈是一系列协定的重叠。操作系统上面就是网卡驱动程序，网卡驱动程序负责管制网卡硬件，驱动程序驱动网卡硬件实现收发工作。

在操作系统外部有一块用于存放管制信息的存储空间，这块存储空间记录了用于管制通信的管制信息。其实这些管制信息就是 Socket 的实体，或者说存放管制信息的内存空间就是套接字的实体。

这里大家有可能不太明显所以然，所以我用了一下 netstat 命令来给大伙看一下套接字是啥玩意。

咱们在 Windows 的命令提示符中输出

netstat -ano

netstat 用于浮现套接字内容 , -ano 是可选选项

a 不只浮现正在通信的套接字，还浮现包含尚未开始通信等状态的所有套接字

n 浮现 IP 地址和端口号

o 浮现套接字的程序 PID

我的计算机会出现上面后果。

download
图中的每一行都相当于一个套接字，每一列也被称为一个元组，所以一个套接字就是五元组（协定、本地地址、内部地址、状态、PID）。有的时候也被叫做四元组，四元组不包含协定。

比如图中的第一行，它的协定就是 TCP，本地地址和近程地址都是 0.0.0.0，这示意通信还没有开始，IP 地址临时还未必定，而本地端口已知是 135，然而近程端口还未知，此时的状态是 LISTENING，LISTENING 示意应用程序已经打开，正在等待与近程主机建立连接（对于各种状态之间的转换，大家可能浏览笔者的这篇文章 TCP ，丫的终于来了！！）最初一个元组是 PID，即过程标识符，PID 就像咱们的身份证号码，能够精确定位唯一的过程。

现在你可能对 Socket 有了一个基本的意识，现在喝口水，劳动一下，让咱们持续探究 Socket。

现在我有个问题，Socket 是如何创建的呢？
Socket 是和应用程序一起创建的。应用程序中有一个 socket 组件，在应用程序启动时，会调用 socket 申请创建套接字，协定栈会根据应用程序的申请创建套接字：首先调配一个套接字所需的内存空间，这一步相当于是为管制信息筹备一个容器，但只有容器并没有实际作用，所以你还需要向容器中放入管制信息；如果你不申请创建套接字所需要的内存空间，你创建的管制信息也没有地方存放，所以分配内存空间，放入管制信息缺一不可。至此套接字的创建就已经实现了。

套接字创建实现后，会返回一个套接字描述符给应用程序，这个描述符相当于是分别不同套接字的号码牌。根据这个描述符，应用程序在托付协定栈收发数据时就需要提供这个描述符。

套接字连接
套接字创建实现后，最终还是为数据收发服务的，在数据收发之前，还需要进行一步 connect，也就是建立连接的过程。这个连接并不是实在的连接：用一根水管插在两个电脑之间。

而是应用程序通过 TCP/IP 协定标准从一个主机通过网络介质传输到另一个主机的过程。

套接字刚刚创建实现后，还没有数据，也不知道通信对象。在这种状态下，即使你让客户端应用程序托付协定栈发送数据，它也不知道发送到哪里。所以阅读器需要根据网址来查问服务器的 IP 地址，做这项工作的协定是 DNS，查问到目标主机后，再把目标主机的 IP 告诉协定栈，至此，客户端这边就筹备好了。

在服务器上，与客户端一样也需要创建套接字，然而同样的它也不知道通信对象是谁，所以咱们需要让客户端向服务器告知客户端的必要信息：IP 地址和端口号。

现在通信单方建立连接的必要信息已经具备，只欠一股东南风了。通信单方收到数据之后，还需要一块地位来存放，这个地位就是缓冲区，它是内存的一部分，有了缓冲区，就能够进行数据的收发操作了。

OK，现在客户端想要给服务器发送一条数据，该进行哪些操作呢？

首先，客户端应用程序需要调用 Socket 库中的 connect 方法，提供 socket 描述符和服务器 IP 地址、端口号。

connect(<描述符>、<服务器IP地址和端口号>)
这些信息会传送给协定栈中的 TCP 模块，TCP 模块会对请求报文进行封装，再传送给 IP 模块，进行 IP 报文头的封装，而后传送给物理层，进行帧头封装，之后通过网络介质传送给服务器，服务器上会对帧头、IP 模块、TCP 模块的报文头进行解析，从而找到对应的套接字，套接字收到请求后，会写入相应的信息，并且把状态改为正在连接。请求过程实现后，服务器的 TCP 模块会返回响应，这个过程和客户端是一样的（如果大家不太明显报文头的封装过程，可能浏览笔者的这篇文章 TCP/IP 基础学识总结）

在一个完整的请求和响应过程中，管制信息起到非常要害的作用（具体的作用咱们前面会说）。

SYN 就是同步的缩写，客户端会首先发送 SYN 数据包，请求服务端建立连接。
ACK 就是相应的意义，它是对发送 SYN 数据包的响应。
FIN 是终止的意义，它示意客户端/服务器想要终止连接。
因为网络环境的复杂多变，常常会存在数据包丢失的情况，所以单方通信时需要相互确认对方的数据包是否已经到达，而判断的标准就是 ACK 的值。

（通信单方连接的建立会通过三次握手流程，对三次握手粗疏的介绍可能浏览笔者的这篇文章 TCP 基础学识）

当所有建立连接的报文都能够失常收发之后，此时套接字就已经进入可收发状态了，此时可能认为用一根治理把两个套接字连接了起来。当然，实际上并不存在这个管子。建立连接之后，协定栈的连接操作就结束了，也就是说 connect 已经执行完毕，管制流程被交回给应用程序。

收发数据
当管制流程从 connect 回到应用程序之后，接下来就会间接进入数据收发阶段，数据收发操作是从应用程序调用 write 将要发送的数据交给协定栈开始的，协定栈收到数据之后执行发送操作。

协定栈不会关心应用程序传输过去的是什么数据，因为这些数据最终都会转换为二进制序列，协定栈在收到数据之后并不会马上把数据发送进来，而是会将数据放在发送缓冲区，再等待应用程序发送下一条数据。

为什么收到数据包不会间接发送进来，而是放在缓冲区中呢？
因为只需一旦收到数据就会发送，就有可能发送大量的小数据包，导致网络效率起飞。所以协定栈需要将数据积攒到肯定数量才能将其发送进来。至于协定栈会向缓冲区放几数据，这个不同版本和种类的操作系统有不同的说法，不过，所有的操作系统和种类都会遵循上面这几个标准：

第一个判断因素是每个网络包能够容纳的数据长度，判断的标准是 MTU，它示意的是一个网络包的最大长度。最大长度蕴含头部，所以如果单论数据区的话，就会用 MTU – 包头长度，由此的进去的最大数据长度被称为 MSS。

另一个判断标准是工夫，当应用程序产生的数据比较少，协定栈向缓冲区搁置数据效率不高时，如果每次都等到 MSS 再发送的话，可能因为等待工夫太长造成提早，在这种情况下，即使数据长度没有到达 MSS，也应该把数据发送进来。
协定栈并没有告诉咱们怎么平衡这两个因素，如果数据长度优先，那么效率有可能比较低；如果工夫优先，那又会升高网络的效率。

通过了一段时间。。。。。。

img

假设咱们使用的是长度无限法则，此时缓冲区已满，协定栈要发送数据了，协定栈刚要把数据发送进来，却发现无奈一次性传输这么大数据量（绝对的）的数据，那怎么办呢？

在这种情况下，发送缓冲区中的数据就会超过 MSS 的长度，发送缓冲区中的数据会以 MSS 大小为一个数据包进行拆分，拆分进去的每块数据都会加上 TCP，IP，以太网头部，而后被放进独自的网络包中。

到现在，网络包已经筹备好发往服务器了，然而数据发送操作还没有结束，因为服务器还未确认是否已经收到网络包。因此在客户端发送数据包之后，还需要服务器进行确认。

TCP 模块在拆分数据时，会计算出网络包偏移量，这个偏移量就是相干于数据从头开始计算的第几个字节，并将算好的字节数写在 TCP 头部，TCP 模块还会生成一个网络包的序号（SYN），这个序号是唯一的，这个序号就是用来让服务器进行确认的。

服务器会对客户端发送过去的数据包进行确认，确认无误之后，服务器会生成一个序号和确认号（ACK）并一起发送给客户端，客户端确认之后再发送确认号给服务器。

咱们来看一下实际的工作过程。

首先，客户端在连接时需要计算出序号初始值，并将这个值发送给服务器。接下来，服务器通过这个初始值计算出确认号并返回给客户端。初始值在通信过程中有可能会抛弃，因此当服务器收到初始值后需要返回确认号用于确认。同时，服务器也需要计算出从服务器到客户端方向的序号初始值，并将这个值发送给客户端。而后，客户端也需要根据服务器发来的初始值计算出确认号发送给服务器，至此，连接建立实现，接下来就可能进入数据收发阶段了。

数据收发阶段中，通信单方可能同时发送请求和响应，单方也可能同时对请求进行确认。

请求 – 确认机制非常弱小，通过这一机制，咱们可能确认接收方有没有收到某个包，如果没有收到则从新发送，这样一来，但凡网络中出现的任何谬误，咱们都可能即使发现并补救。

网卡、集线器、路由器都没有谬误补救机制，一旦检测到谬误就会间接抛弃数据包，应用程序也没有这种机制，起作用的只是 TCP/IP 模块。

因为网络环境复杂多变，所以数据包会存在丢失情况，因此发送序号和确认号也存在肯定规定，TCP 会通过窗口治理确认号，咱们这篇文章不再赘述，大家可能浏览笔者的这篇文章 TCP 基础学识来寻找答案。

断开连接
当通信单方不再需要收发数据时，需要断开连接。不同的应用程序断开连接的时机不同。以 Web 为例，阅读器向 Web 服务器发送请求消息，Web 服务器再返回响应消息，这时收发数据就全副结束了，服务器可能会首先发动断开响应，当然客户端也有可能会首先发动（谁先断开连接是应用程序做出的判断），与协定栈无关。

download

无论哪一方发动断开连接的请求，都会调用 Socket 库的 close 程序。咱们以服务器断开连接为例，服务器发动断开连接请求，协定栈会生成断开连接的 TCP 头部，其实就是设置 FIN 位，而后托付 IP 模块向客户端发送数据，与此同时，服务器的套接字会记录下断开连接的相干信息。

收到服务器发来 FIN 请求后，客户端协定栈会将套接字标记为断开连接状态，而后，客户端会向服务器返回一个确认号，这是断开连接的第一步，在这一步之后，应用程序还会调用 read 来读取数据。等到服务器数据发送实现后，协定栈会告诉客户端应用程序数据已经接收完毕。

只需收到服务器返回的所有数据，客户端就会调用 close 程序来结束收发操作，这时客户端会生成一个 FIN 发送给服务器，一段时间后服务器返回 ACK 号，至此，客户端和服务器的通信就结束了。

删除套接字
通信实现后，用来通信的套接字就不再会使用了，此时咱们就可能删除这个套接字了。不过，这时分套接字不会马上删除，而是等过一段时间再删除。

等待这段时间是为了防止误操作，最常见的误操作就是客户端返回的确认号丢失，至于等待多长时间，和数据包重传的形式无关。

关于rabbitmq:RabbitMQ消息中间件技术精讲

RabbitMQ消息中间件技术精讲

netstat 用于浮现套接字内容 , -ano 是可选选项

a 不只浮现正在通信的套接字，还浮现包含尚未开始通信等状态的所有套接字

n 浮现 IP 地址和端口号

o 浮现套接字的程序 PID

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于rabbitmq:RabbitMQ消息中间件技术精讲

RabbitMQ消息中间件技术精讲

netstat 用于浮现套接字内容 , -ano 是可选选项

a 不只浮现正在通信的套接字，还浮现包含尚未开始通信等状态的所有套接字

n 浮现 IP 地址和端口号

o 浮现套接字的程序 PID

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复