关于tcp:TCP之拥塞窗口

关注公众号: 高性能架构摸索。后盾回复【材料】，能够收费支付

学过网络相干课程的，都晓得 TCP 中，有两个窗口：

滑动窗口(在咱们的上一篇文章中有讲)，接管方通过通告发送方本人的能够承受缓冲区大小（这个字段越大阐明网络吞吐量越高），从而管制发送方的发送速度。
拥塞窗口，也就是本文要讲的。

一个连贯的 TCP 双端只是网络最边缘的两台主机，他们不晓得整个网络是如何工作的，因而他们不晓得彼此之间的无效吞吐量。因而，他们必须找到一种办法来确定它。咱们称之为拥塞窗口 (CWND)。这是在咱们必须进行并期待确认之前能够发送的字节数。

拥塞窗口是决定任何时候能够收回的字节数的因素之一。拥塞窗口由发送方保护，是阻止发送方和接管方之间的链路因流量过多而过载的一种伎俩。这不应与发送方保护的滑动窗口相混同，滑动窗口的存在是为了避免接管方过载。拥塞窗口是通过预计链路上有多少拥塞来计算的。

拥塞窗口对于设施来说是本地的，并且永远不会在连贯上共享，这与在每个段中发送的接收器窗口不同。在任何给定工夫，设施最多能够发送由接收器窗口和拥塞窗口之间的最小值指定的字节数，如上面的公式所示：

transmittable bytes = min(cwnd, rwnd)

这意味着如果拥塞窗口小于接管窗口，则设施能够在期待确认之前传输多达拥塞窗口中定义的字节数。相同，如果接管窗口小于拥塞窗口，则设施能够在期待确认之前最多传输接收器窗口中定义的字节数。

拥塞窗口依据网络拥塞动态变化。每次未确认段时，都假设是因为网络拥塞。拥塞窗口随工夫演变的形式被定义为一个算法，这取决于实现。咱们当初将介绍最常见的一种。该算法遵循以下规定：

拥塞窗口从一个段的大小开始（大概 1KB）
定义了一个拥塞窗口阈值（ssthresh）
如果收到确认，并且以后拥塞窗口大小小于 ssthresh，则拥塞窗口加倍
如果收到确认，但拥塞窗口大于或等于 sshthresh，则拥塞窗口减少其初始值（例如 1KB）
如果一个段没有被确认从而触发重传，拥塞窗口就会减半并且 ssthresh 被搁置在这个值
拥塞窗口不能大于接收器窗口

该规定中包含咱们常常听过的几种算法：

慢启动(slow-start)
拥塞防止(congestion avoidance)
疾速重传(fast retransmit)
疾速复原(fast recovery)

通过上面的图片，能够不便大家更加疾速的了解拥塞窗口的算法机制。

从上图中能够看出，每个设施都会跟踪本人的拥塞窗口（CWND，绿色）和对端的接收器窗口 (RWND)。

当主机开始发送数据时，如果立刻所大量数据字节注入到网络，那么就有可能引起网络拥塞，因为当初并不分明网络的负荷状况。因而，较好的办法是先探测一下，即由小到大逐步增大发送窗口，也就是说，由小到大逐步增大拥塞窗口数值。通常在刚刚开始发送报文段时，先把拥塞窗口 cwnd 设置为一个最大报文段 MSS 的数值。而在每收到一个对新的报文段的确认后，把拥塞窗口减少至少一个 MSS 的数值。用这样的办法逐渐增大发送方的拥塞窗口 cwnd，能够使分组注入到网络的速率更加正当。

每通过一个传输轮次，拥塞窗口 cwnd 就加倍。一个传输轮次所经验的工夫其实就是往返工夫 RTT。不过“传输轮次”更加强调：把拥塞窗口 cwnd 所容许发送的报文段都间断发送进来，并收到了对已发送的最初一个字节的确认。

另，慢开始的“慢”并不是指 cwnd 的增长速率慢，而是指在 TCP 开始发送报文段时先设置 cwnd=1，使得发送方在开始时只发送一个报文段（目标是试探一下网络的拥塞状况），而后再逐步增大 cwnd。

上面，咱们从示例图着手，来剖析慢启动的过程。

在协商连贯时，两个设施替换它们的接收器窗口(在这种状况下它们都有 32KB)
双端都以 1KB 的拥塞窗口开始，但因为在该示例中客户端将是惟一发送数据的客户端，因而它将是惟一一个显着应用此值的客户端。
在第 2 行，客户端收到一个 ACK 并将其 CWND 加倍(当初是 2k)
服务器在第 3 行收到一个 ACK 时也做同样的事件
客户端发送两段 1k 的数据，它们稍后在第 6 行和第 7 行确认，其中客户端上的拥塞窗口加倍（4k，而后是 8k）
而后，客户端再次发送 1k 数据并立刻失去确认，无效地再次将拥塞窗口加倍（当初第 9 行为 16k）。
这在第 10-11 行反复，其中 CWND 达到 32k。
此时，除非接收端窗口也增长，否则拥塞窗口不能再增长。

慢启动的整个过程如下：

初始化 cwnd = 1
通过 1 个 RTT, 即收到一个 ACK，cwnd = 2^(1) = 2
通过 2 个 RTT, cwnd = 2^(2) = 4
通过 3 个 RTT, cwnd = 2^(3) = 8

让拥塞窗口 cwnd 迟缓地增大，即每通过一个往返工夫 RTT 就把发送方的拥塞窗口 cwnd 加 1，而不是加倍。这样拥塞窗口 cwnd 按线性法则迟缓增长，比慢开始算法的拥塞窗口增长速率迟缓得多。

无论在慢启动阶段还是在拥塞防止阶段，只有发送方判断网络呈现拥塞（其依据就是没有收到确认），就要把慢启动 ssthresh 设置为呈现拥塞时的发送方窗口值的一半（但不能小于 2）。而后把拥塞窗口 cwnd 从新设置为 1，执行慢开始算法。这样做的目标就是要迅速缩小主机发送到网络中的分组数，使得产生拥塞的路由器有足够工夫把队列中积压的分组处理完毕。

“拥塞防止”并非指齐全可能防止了拥塞。利用以上的措施要完全避免网络拥塞还是不可能的。“拥塞防止”是说在拥塞防止阶段将拥塞窗口管制为按线性法则增长，使网络比拟不容易呈现拥塞

cwnd = i
通过 1 RTT, cwnd = i+1
2 RTT, cwnd = i+2
3 RTT, cwnd = i+3

TCP 有一个疾速传输个性——在它的计时器到期之前从新传输失落的段。
为了容许疾速传输，咱们须要为发送方和接管方设置一些规定。

作为接收者，它应该始终发送它冀望接管的序列号。
例如，当接管方接管到第 1 段时，它以 ACK2 响应，
作为发送方，它应该疏忽定时器并在收到 3 个反复的 ACK 后立刻开始重传失落的段。

用一句话详情，就是发送端在收到 3 个反复无序的 ACK 时候，它假设数据包失落并重传该数据包，而无需期待重传计时器到期。

而在此时，拥塞窗口的变动过程如下：

ssthresh 设置为拥塞窗口的 1 /2
拥塞窗口大小设置为 ssthresh
从新进入拥塞防止阶段

当收到第 3 个反复的 ACK 时，将 ssthresh 设置为以后拥塞窗口 cwnd 的一半。重传失落的报文段。设置 cwnd 为 ssthresh 加上 3 倍的报文段大小。
每次收到另一个反复的 ACK 时，cwnd 减少 1 个报文段大小并发送 1 个分组（如果新的 cwnd 容许发送）。
当下一个确认新数据的 ACK 达到时，设置 cwnd 为 ssthresh（在第 1 步中设置的值）。这个 ACK 应该是在进行重传后的一个往返工夫内对步骤 1 中重传的确认。另外，这个 ACK 也应该是对失落的分组和收到的第 1 个反复的 ACK 之间的所有两头报文段的确认。这一步采纳的是拥塞防止，因为当分组失落时咱们将以后的速率减半。

疾速重传和疾速复原的目标是：疾速复原失落的数据包。
如果没有疾速重传和疾速复原这俩算法，那么 tcp 可能

Tahoe 算法是 TCP 的晚期版本。除了具备 TCP 的根本架构和性能外，引入了慢启动、拥塞防止以及疾速重传机制。
在该算法中，疾速重传机制策略如下：

ssthresh 设置为拥塞窗口的 1 /2
拥塞窗口大小设置为 1
从新进入慢启动阶段

Reno 与 Tahoe 相比，减少了疾速复原阶段，也就是说，实现疾速重传后，进入了拥塞防止阶段而不是慢
启动阶段。
Reno 在疾速重传阶段，从新发送数据之后：

ssthresh 设置为拥塞窗口的 1 /2
拥塞窗口设置为之前的 1 /2
进入疾速复原阶段
在疾速复原阶段，每收到反复的 ACK，则 cwnd 加 1；收到非反复 ACK 时，置 cwnd = ssthresh，转入拥塞防止阶段；
如果产生超时重传，则置 ssthresh 为以后 cwnd 的一半，cwnd = 1，从新进入慢启动阶段。

Reno 疾速复原阶段退出条件：收到非反复 ACK。

在 Reno 版本中，若同时有多个数据包失落，则大部分必须等到 TimeOut 之后，才进行重传。这是因为在 Reno 中，同时有多个数据包失落时，只有收到局部失落数据的 ACK，便退出疾速复原。而之所以能收到局部失落数据的 ACK，这是因为在疾速重传阶段，只从新发送了局部失落的数据。而在 Reno 完结疾速复原，进入拥塞防止阶段之后，对于其余未从新发送的数据包来说，经常没有足够的反复 ACK 来触发疾速重传机制。只好等等 TimeOut，而 TimeOut 对于 TCP 性能有十分大的影响，在期待 TimeOut 这段时间，无奈发送新的数据包，而在 TimeOut 之后，CWND 被从新设置为 1。

基于上述起因，NewReno 优化了该机制，NewReno 在收到局部失落数据的 ACK 后，并不会退出疾速复原阶段，而是期待所有失落的包都从新发送之后，才退出疾速复原阶段。这就使得 NewReno 在遇到多个数据包同时失落时，不须要期待 TimeOut，便可从新发送所有失落的数据包，进而减小 TimeOut 对性能的影响。

除了 NewReno 的办法之外，要解决大量数据包失落的问题，还有一个解决方案，就是让发送端晓得，哪些数据包曾经送达，哪些数据包曾经失落。
SACK 批改在接收端发送反复的 ACK 时，同时在 ACK 中携带间断的曾经收到的数据序列号范畴，而间断数据序号范畴与间断数据序号范畴之间的距离就是曾经失落的数据。

共同点：进步网络性能。

不同点：

流量管制：在 TCP 连贯上实现对发送流量的管制，思考点对点之间对通信量的管制，端到端，即：管制发送端的数据发送速率，使接收端能够来得及接管，保障网络高效稳固运行。
拥塞管制：解决网络拥塞景象，思考网络可能接受现有的网络负荷，全局性变量，波及所有的路由器、主机以及与升高网络传输性能无关的因素。避免过多的数据注入到网络，使网络中的路由器或链路不致过载，确保通信子网能够无效为主机传递分组。

1、在一个窗口内反复丢包会造成影响吗？
会。如果只丢一个包，那么收到非反复 ACK 时，就能确认完本窗口内所有的包。而后进入拥塞
防止阶段。这就是 Reno 想达到的。
而如果失落多个包，那么收到非反复 ACK 时，不能确认完本窗口内所有的包。然而，也会退出疾速复原，
进入拥塞防止阶段。

这个时候可能会产生两种状况：

屡次进行疾速重传和疾速复原。又发现丢包，再次进入疾速重传和疾速复原。留神，每次进入疾速重传和疾速复原时，ssthresh 和 CWND 都要减半。屡次丢包最终会导致 ssthresh 指数减小。通过画 cwnd(t)图能够发现，不仅这段时间吞吐量非常低，而且导致复原完后拥塞防止的终点非常低，从而导致之后的吞吐量也很低。
通过屡次疾速重传和疾速复原，接着产生传输超时。

2、为什么产生拥塞时，还减少 cwnd？

在检测到丢包时，窗口为 CWND。这时候网络中最多有 cwnd 个包(传输中 < CWND)。每当收到一个反复的 ACK，则阐明有数据包来到网络，达到接收端了。那么，此时网络中还能够再包容 1 个包。因为发送端滑动窗口不能挪动了，所以如果想放弃持续放弃固定个数的传输数据包，能够使 CWND + 1。这样一来，能够进步吞吐量。而实际上，在 fast recovery 期间发送的新数据包比起产生丢包的 CWND 来说，曾经是大大减少了。

关于tcp:TCP之拥塞窗口

概念

算法

慢启动

拥塞防止

疾速重传

疾速复原

算法

Tahoe

Reno

NewReno

SACK

滑动窗口与拥塞窗口

Q&A