关于网络编程:网络编程懒人入门十四到底什么是Socket一文即懂

本文由cxuan分享，原题“原来这才是 Socket”，有订正。

1、引言

本系列文章后面那些次要解说的是计算机网络的实践根底，但对于即时通讯IM这方面的应用层开发者来说，跟计算机网络打道的其实是各种API接口。

本篇文章就来聊一下网络应用程序员最相熟的Socket这个货色，抛开生涩的计算机网络实践，从应用层的角度来了解到底什么是Socket。

对于 Socket 的意识，本文将从以下几个方面着手介绍：

1）Socket 是什么；
2）Socket 是如何创立的；
3）Socket 是如何连贯的；
4）Socket 是如何收发数据的；
5）Socket 是如何断开连接的；
6）Socket 套接字的删除等。

特地阐明：本文中提到的“Socket”、“网络套接字”、“套接字”，如无非凡指明，指的都是同一个货色哦。

学习交换：

挪动端IM开发入门文章：《新手入门一篇就够：从零开发挪动端IM》
开源IM框架源码：https://github.com/JackJiang2…

（本文已同步公布于：http://www.52im.net/thread-38…）

2、Socket 是什么

一个数据包经由应用程序产生，进入到协定栈中进行各种报文头的包装，而后操作系统调用网卡驱动程序指挥硬件，把数据发送到对端主机。

整个过程的大体的图示如下：

咱们大家晓得，协定栈其实是位于操作系统中的一些协定的重叠，这些协定包含 TCP、UDP、ARP、ICMP、IP等。

通常某个协定的设计都是为了解决特定问题的，比方：

1）TCP 的设计就负责安全可靠的传输数据；
2）UDP 设计就是报文小，传输效率高；
3）ARP 的设计是可能通过 IP 地址查问物理（Mac）地址；
4）ICMP 的设计目标是返回谬误报文给主机；
5）IP 设计的目标是为了实现大规模主机的互联互通。

应用程序比方浏览器、电子邮件、文件传输服务器等产生的数据，会通过传输层协定进行传输。而应用程序是不会和传输层间接建立联系的，而是有一个可能连贯应用层和传输层之间的套件，这个套件就是 Socket。

在下面这幅图中，应用程序蕴含 Socket 和解析器，解析器的作用就是向 DNS 服务器发动查问，查问指标 IP 地址（对于DNS请见《实践联系实际，全方位深刻了解DNS》）。

应用程序的上面：就是操作系统外部，操作系统外部包含协定栈，协定栈是一系列协定的重叠。

操作系统上面：就是网卡驱动程序，网卡驱动程序负责管制网卡硬件，驱动程序驱动网卡硬件实现收发工作。

在操作系统外部有一块用于寄存管制信息的存储空间，这块存储空间记录了用于管制通信的管制信息。其实这些管制信息就是 Socket 的实体，或者说寄存管制信息的内存空间就是Socket的实体。

这里大家有可能不太分明所以然，所以我用了一下 netstat 命令来给大伙看一下Socket是啥玩意。

咱们在 Windows 的命令提示符中输出：

netstat-ano

netstat 用于显示Socket内容 , -ano 是可选选项
a 不仅显示正在通信的Socket，还显示包含尚未开始通信等状态的所有Socket
n 显示 IP 地址和端口号
o 显示Socket的程序 PID

我的计算机会呈现上面后果：

如上图所示：

1）每一行都相当于一个Socket；
2）每一列也被称为一个元组。

所以，一个Socket就是五元组：

1）协定；
2）本地地址；
3）内部地址；
4）状态；
5）PID。

PS：有的时候也被叫做四元组，四元组不包含协定。

咱们来解读一下上图中的数据，比方图中的第一行：

1）它的协定就是 TCP，本地地址和近程地址都是 0.0.0.0（这示意通信还没有开始，IP 地址临时还未确定）。

2）而本地端口已知是 135，然而近程端口还未知，此时的状态是 LISTENING（LISTENING 示意应用程序曾经关上，正在期待与近程主机建设连贯。对于各种状态之间的转换，大家能够浏览《通俗易懂-深刻了解TCP协定（上）：实践根底》）。

3）最初一个元组是 PID，即过程标识符，PID 就像咱们的身份证号码，可能精确定位惟一的过程。

3、Socket 是如何创立的

通过上节的解说，当初你可能对 Socket 有了一个根本的意识，先喝口水，劳动一下，让咱们持续探索 Socket。

当初我有个问题，Socket 是如何创立的呢？

Socket 是和应用程序一起创立的。

应用程序中有一个 socket 组件，在应用程序启动时，会调用 socket 申请创立Socket，协定栈会依据应用程序的申请创立Socket：首先调配一个Socket所需的内存空间，这一步相当于是为管制信息筹备一个容器，但只有容器并没有理论作用，所以你还须要向容器中放入管制信息；如果你不申请创立Socket所须要的内存空间，你创立的管制信息也没有中央寄存，所以分配内存空间，放入管制信息缺一不可。至此Socket的创立就曾经实现了。

Socket创立实现后，会返回一个Socket描述符给应用程序，这个描述符相当于是辨别不同Socket的号码牌。依据这个描述符，应用程序在委托协定栈收发数据时就须要提供这个描述符。

4、Socket 是如何连贯的

Socket创立实现后，最终还是为数据收发服务的。然而，在数据收发之前，还须要进行一步“连贯”（术语就是 connect），建设连贯有一整套过程。

这个“连贯”并不是实在的连贯（用一根水管插在两个电脑之间？不是你想的这样。。。）。

实际上这个“连贯”是应用程序通过 TCP/IP 协定规范从一个主机通过网络介质传输到另一个主机的过程。

Socket刚刚创立实现后，还没有数据，也不晓得通信对象。

在这种状态下：即便你让客户端应用程序委托协定栈发送数据，它也不晓得发送到哪里。所以浏览器须要依据网址来查问服务器的 IP 地址（做这项工作的协定是 DNS），查问到指标主机后，再把指标主机的 IP 通知协定栈。至此，客户端这边就筹备好了。

在服务器上：与客户端一样也须要创立Socket，然而同样的它也不晓得通信对象是谁，所以咱们须要让客户端向服务器告知客户端的必要信息：IP 地址和端口号。

当初通信单方建设连贯的必要信息曾经具备，能够开始“连贯”过程了。

首先：客户端应用程序须要调用 Socket 库中的 connect 办法，提供 socket 描述符和服务器 IP 地址、端口号。

以下是connect的伪码调用：

connect(<描述符>、<服务器IP地址和端口号>)

这些信息会传递给协定栈中的 TCP 模块，TCP 模块会对申请报文进行封装，再传递给 IP 模块，进行 IP 报文头的封装，而后传递给物理层，进行帧头封装。

之后通过网络介质传递给服务器，服务器上会对帧头、IP 模块、TCP 模块的报文头进行解析，从而找到对应的Socket。

Socket收到申请后，会写入相应的信息，并且把状态改为正在连接。

申请过程实现后：服务器的 TCP 模块会返回响应，这个过程和客户端是一样的（如果大家不太分明报文头的封装过程，能够浏览《疾速了解TCP协定一篇就够》）。

在一个残缺的申请和响应过程中，管制信息起到十分要害的作用：

1）SYN 就是同步的缩写，客户端会首先发送 SYN 数据包，申请服务端建设连贯；
2）ACK 就是相应的意思，它是对发送 SYN 数据包的响应；
3）FIN 是终止的意思，它示意客户端/服务器想要终止连贯。

因为网络环境的复杂多变，常常会存在数据包失落的状况，所以单方通信时须要互相确认对方的数据包是否曾经达到，而判断的规范就是 ACK 的值。

下面的文字不够活泼，动画能够更好的阐明这个过程：

▲ 上图援用自《跟着动画来学TCP三次握手和四次挥手》

（PS：这个“连贯”的具体理论知识，能够浏览《实践经典：TCP协定的3次握手与4次挥手过程详解》、《跟着动画来学TCP三次握手和四次挥手》，这里不再赘述。）

当所有建设连贯的报文都可能失常收发之后，此时套接字就曾经进入可收发状态了，此时能够认为用一根治理把两个套接字连贯了起来。当然，实际上并不存在这个管子。建设连贯之后，协定栈的连贯操作就完结了，也就是说 connect 曾经执行结束，管制流程被交回给应用程序。

另外：如果你对Socket代码更相熟的话，能够先读读这篇《手把手教你写基于TCP的Socket长连贯》。

5、Socket 是如何收发数据的

当管制流程上节中的连贯过程回到应用程序之后，接下来就会间接进入数据收发阶段。

数据收发操作是从应用程序调用 write 将要发送的数据交给协定栈开始的，协定栈收到数据之后执行发送操作。

协定栈不会关怀应用程序传输过去的是什么数据，因为这些数据最终都会转换为二进制序列，协定栈在收到数据之后并不会马上把数据发送进来，而是会将数据放在发送缓冲区，再期待应用程序发送下一条数据。

为什么收到数据包不会间接发送进来，而是放在缓冲区中呢？

因为只有一旦收到数据就会发送，就有可能发送大量的小数据包，导致网络效率降落（所以协定栈须要将数据积攒到肯定数量能力将其发送进来）。

至于协定栈会向缓冲区放多少数据，这个不同版本和品种的操作系统有不同的说法。

不过，所有的操作系统都会遵循上面这几个规范：

1）第一个判断因素：是每个网络包可能包容的数据长度，判断的规范是 MTU，它示意的是一个网络包的最大长度。最大长度蕴含头部，所以如果单论数据区的话，就会用 MTU – 包头长度，由此的进去的最大数据长度被称为 MSS。

2）另一个判断规范：是工夫，当应用程序产生的数据比拟少，协定栈向缓冲区搁置数据效率不高时，如果每次都等到 MSS 再发送的话，可能因为等待时间太长造成提早。在这种状况下，即便数据长度没有达到 MSS，也应该把数据发送进来。

但协定栈并没有通知咱们怎么均衡这两个因素，如果数据长度优先，那么效率有可能比拟低；如果工夫优先，那又会升高网络的效率。

通过了一段时间。。。。。。

假如咱们应用的是长度无限法令：此时缓冲区已满，协定栈要发送数据了，协定栈刚要把数据发送进来，却发现无奈一次性传输这么大数据量（绝对的）的数据，那怎么办呢？

在这种状况下，发送缓冲区中的数据就会超过 MSS 的长度，发送缓冲区中的数据会以 MSS 大小为一个数据包进行拆分，拆分进去的每块数据都会加上 TCP，IP，以太网头部，而后被放进独自的网络包中。

到当初，网络包曾经筹备好发往服务器了，然而数据发送操作还没有完结，因为服务器还未确认是否曾经收到网络包。因而在客户端发送数据包之后，还须要服务器进行确认。

TCP 模块在拆分数据时，会计算出网络包偏移量，这个偏移量就是绝对于数据从头开始计算的第几个字节，并将算好的字节数写在 TCP 头部，TCP 模块还会生成一个网络包的序号（SYN），这个序号是惟一的，这个序号就是用来让服务器进行确认的。

服务器会对客户端发送过去的数据包进行确认，确认无误之后，服务器会生成一个序号和确认号（ACK）并一起发送给客户端，客户端确认之后再发送确认号给服务器。

咱们来看一下理论的工作过程：

首先：客户端在连贯时须要计算出序号初始值，并将这个值发送给服务器。

接下来：服务器通过这个初始值计算出确认号并返回给客户端（初始值在通信过程中有可能会抛弃，因而当服务器收到初始值后须要返回确认号用于确认）。

同时：服务器也须要计算出从服务器到客户端方向的序号初始值，并将这个值发送给客户端。而后，客户端也须要依据服务器发来的初始值计算出确认号发送给服务器。

至此：连贯建设实现，接下来就能够进入数据收发阶段了。

数据收发阶段中，通信单方能够同时发送申请和响应，单方也能够同时对申请进行确认。

申请 – 确认机制十分弱小：通过这一机制，咱们能够确认接管方有没有收到某个包，如果没有收到则从新发送，这样一来，凡是网络中呈现的任何谬误，咱们都能够即便发现并补救。

下面的文字不够活泼，动画能够更好的了解申请 – 确认机制：

▲ 上图援用自《跟着动画来学TCP三次握手和四次挥手》

网卡、集线器、路由器（见《史上最艰深的集线器、交换机、路由器性能原理入门》）都没有谬误补救机制，一旦检测到谬误就会间接抛弃数据包，应用程序也没有这种机制，起作用的只是 TCP/IP 模块。

因为网络环境复杂多变，所以数据包会存在失落状况，因而发送序号和确认号也存在肯定规定，TCP 会通过窗口治理确认号，咱们这篇文章不再赘述，大家能够浏览《通俗易懂-深刻了解TCP协定（下）：RTT、滑动窗口、拥塞解决》来寻找答案。

PS：另一篇《咱们在读写Socket时，到底在读写什么？》中用动画具体阐明了这个过程，有趣味能够读一读。

6、Socket 是如何断开连接的

当通信单方不再须要收发数据时，须要断开连接。不同的应用程序断开连接的机会不同。

以 Web 为例：浏览器向 Web 服务器发送申请音讯，Web 服务器再返回响应音讯，这时收发数据就全副完结了，服务器可能会首先发动断开响应，当然客户端也有可能会首先发动（谁先断开连接是应用程序做出的判断），与协定栈无关。

无论哪一方发动断开连接的申请，都会调用 Socket 库的 close 程序。

咱们以服务器断开连接为例：服务器发动断开连接申请，协定栈会生成断开连接的 TCP 头部，其实就是设置 FIN 位，而后委托 IP 模块向客户端发送数据，与此同时，服务器的Socket会记录下断开连接的相干信息。

收到服务器发来 FIN 申请后：客户端协定栈会将Socket标记为断开连接状态，而后，客户端会向服务器返回一个确认号，这是断开连接的第一步，在这一步之后，应用程序还会调用 read 来读取数据。等到服务器数据发送实现后，协定栈会告诉客户端应用程序数据曾经接管结束。

只有收到服务器返回的所有数据，客户端就会调用 close 程序来完结收发操作，这时客户端会生成一个 FIN 发送给服务器，一段时间后服务器返回 ACK 号。至此，客户端和服务器的通信就完结了。

下面的文字不够活泼，动画能够更好的阐明这个过程：

▲ 上图援用自《跟着动画来学TCP三次握手和四次挥手》
PS：断开连接的具体理论知识，能够浏览《实践经典：TCP协定的3次握手与4次挥手过程详解》、《跟着动画来学TCP三次握手和四次挥手》，这里不再赘述。

7、Socket的删除

上述通信过程实现后，用来通信的Socket就不再会应用了，此时咱们就能够删除这个Socket了。

不过，这时候Socket不会马上删除，而是等过一段时间再删除。

期待这段时间是为了避免误操作，最常见的误操作就是客户端返回的确认号失落，至于期待多长时间，和数据包重传的形式无关，这里咱们就深刻展开讨论了。

对于Socket操作的全过程，如果从零碎的角度来看，可能会更深刻一些，倡议能够深刻浏览张彦飞的《深刻操作系统，从内核了解网络包的接管过程(Linux篇)》一文。

8、系列文章

本文是系列文章中的第14篇，本系列文章的纲要如下：

[1] 网络编程懒人入门(一)：疾速了解网络通信协定（上篇）
[2] 网络编程懒人入门(二)：疾速了解网络通信协定（下篇）
[3] 网络编程懒人入门(三)：疾速了解TCP协定一篇就够
[4] 网络编程懒人入门(四)：疾速了解TCP和UDP的差别
[5] 网络编程懒人入门(五)：疾速了解为什么说UDP有时比TCP更有劣势
[6] 网络编程懒人入门(六)：史上最艰深的集线器、交换机、路由器性能原理入门
[7] 网络编程懒人入门(七)：深入浅出，全面了解HTTP协定
[8] 网络编程懒人入门(八)：手把手教你写基于TCP的Socket长连贯
[9] 网络编程懒人入门(九)：艰深解说，有了IP地址，为何还要用MAC地址？
[10] 网络编程懒人入门(十)：一泡尿的工夫，疾速读懂QUIC协定
[11] 网络编程懒人入门(十一)：一文读懂什么是IPv6
[12] 网络编程懒人入门(十二)：疾速读懂Http/3协定，一篇就够！
[13] 网络编程懒人入门(十三)：一泡尿的工夫，疾速搞懂TCP和UDP的区别
[14] 网络编程懒人入门(十四)：到底什么是Socket？一文即懂！（* 本文)

9、参考资料

[1] TCP/IP详解 – 第17章·TCP：传输控制协议
[2] TCP/IP详解 – 第18章·TCP连贯的建设与终止
[3] TCP/IP详解 – 第21章·TCP的超时与重传
[4] 疾速了解网络通信协定（上篇）
[5] 疾速了解网络通信协定（下篇）
[6] 面视必备，史上最艰深计算机网络分层详解
[7] 如果你来设计网络，会怎么做？
[8] 如果你来设计TCP协定，会怎么做？
[10] 浅析TCP协定中的疑难杂症(下篇)
[11] 敞开TCP连贯时为什么会TIME_WAIT、CLOSE_WAIT
[12] 从底层动手，深度剖析TCP连贯耗时的机密

（本文已同步公布于：http://www.52im.net/thread-38…）

关于网络编程:网络编程懒人入门十四到底什么是Socket一文即懂

1、引言

2、Socket 是什么

3、Socket 是如何创立的

4、Socket 是如何连贯的

5、Socket 是如何收发数据的

6、Socket 是如何断开连接的

7、Socket的删除

8、系列文章

9、参考资料

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于网络编程:网络编程懒人入门十四到底什么是Socket一文即懂

1、引言

2、Socket 是什么

3、Socket 是如何创立的

4、Socket 是如何连贯的

5、Socket 是如何收发数据的

6、Socket 是如何断开连接的

7、Socket的删除

8、系列文章

9、参考资料

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复