17.3 TCP的首部
T C P数据被封装在一个I P数据报中,如图1 7 - 1所示。
图1 7 - 2显示T C P首部的数据格式。如果不计任选字段,它通常是 2 0个字节。
每个T C P段都包含源端和目的端的端口号,用于寻找发端和收端应用进程。这两个值加上I P首部中的源端I P地址和目的端I P地址唯一确定一个T C P连接。
有时,一个I P地址和一个端口号也称为一个插口( s o c k e t)。这个术语出现在最早的 T C P规范(R F C 7 9 3)中,后来它也作为表示伯克利版的编程接口(参见 1 . 1 5节)。插口对(s o c k e t p a i r)(包含客户I P地址、客户端口号、服务器 I P地址和服务器端口号的四元组 )可唯一确定互联网络中每个T C P连接的双方。
序号用来标识从T C P发端向T C P收端发送的数据字节流,它表示在这个报文段中的的第一个数据字节。如果将字节流看作在两个应用程序间的单向流动,则 T C P用序号对每个字节进行计数。序号是32 bit的无符号数,序号到达2 3 2-1后又从0开始。
当建立一个新的连接时, S Y N标志变1。序号字段包含由这个主机选择的该连接的初始序号I S N(Initial Sequence Number)。该主机要发送数据的第一个字节序号为这个 I S N加1,因为S Y N标志消耗了一个序号(将在下章详细介绍如何建立和终止连接,届时我们将看到 F I N标志也要占用一个序号)。
既然每个传输的字节都被计数,确认序号包含发送确认的一端所期望收到的下一个序号。因此,确认序号应当是上次已成功收到数据字节序号加 1。只有A C K标志(下面介绍)为 1时确认序号字段才有效。
发送A C K无需任何代价,因为 32 bit的确认序号字段和A C K标志一样,总是T C P首部的一部分。因此,我们看到一旦一个连接建立起来,这个字段总是被设置, A C K标志也总是被设置为1。
T C P为应用层提供全双工服务。这意味数据能在两个方向上独立地进行传输。因此,连接的每一端必须保持每个方向上的传输数据序号。
T C P可以表述为一个没有选择确认或否认的滑动窗口协议(滑动窗口协议用于数据传输将在2 0 . 3节介绍)。我们说T C P缺少选择确认是因为 T C P首部中的确认序号表示发方已成功收到字节,但还不包含确认序号所指的字节。当前还无法对数据流中选定的部分进行确认。例如,如果1~1 0 2 4字节已经成功收到,下一报文段中包含序号从 2 0 4 9~3 0 7 2的字节,收端并不能确认这个新的报文段。它所能做的就是发回一个确认序号为 1 0 2 5的A C K。它也无法对一个报文段进行否认。例如,如果收到包含 1 0 2 5~2 0 4 8字节的报文段,但它的检验和错, T C P接收端所能做的就是发回一个确认序号为 1 0 2 5的A C K。在2 1 . 7节我们将看到重复的确认如何帮助确定分组已经丢失。
首部长度给出首部中 32 bit字的数目。需要这个值是因为任选字段的长度是可变的。这个字段占4 bit,因此T C P最多有6 0字节的首部。然而,没有任选字段,正常的长度是 2 0字节。在T C P首部中有6个标志比特。它们中的多个可同时被设置为 1。我们在这儿简单介绍它们的用法,在随后的章节中有更详细的介绍。
- U R G 紧急指针(u rgent pointer)有效(见2 0 . 8节)。
- A C K 确认序号有效。
- P S H 接收方应该尽快将这个报文段交给应用层。
- R S T 重建连接。
- S Y N 同步序号用来发起一个连接。这个标志和下一个标志将在第 1 8章介绍。
- F I N 发端完成发送任务。
T C P的流量控制由连接的每一端通过声明的窗口大小来提供。窗口大小为字节数,起始于确认序号字段指明的值,这个值是接收端正期望接收的字节。窗口大小是一个 16 bit字段,因而窗口大小最大为 6 5 5 3 5字节。在2 4 . 4节我们将看到新的窗口刻度选项,它允许这个值按比例变化以提供更大的窗口。
检验和覆盖了整个的T C P报文段:T C P首部和T C P数据。这是一个强制性的字段,一定是由发端计算和存储,并由收端进行验证。 T C P检验和的计算和 U D P检验和的计算相似,使用如11 . 3节所述的一个伪首部。
只有当U R G标志置1时紧急指针才有效。紧急指针是一个正的偏移量,和序号字段中的值相加表示紧急数据最后一个字节的序号。 T C P的紧急方式是发送端向另一端发送紧急数据的一种方式。我们将在2 0 . 8节介绍它。
最常见的可选字段是最长报文大小,又称为 MSS (Maximum Segment Size)。每个连接方通常都在通信的第一个报文段(为建立连接而设置 S Y N标志的那个段)中指明这个选项。它指明本端所能接收的最大长度的报文段。我们将在 1 8 . 4节更详细地介绍M S S选项,T C P的其他选项中的一些将在第2 4章中介绍。
从图1 7 - 2中我们注意到T C P报文段中的数据部分是可选的。我们将在 1 8章中看到在一个连接建立和一个连接终止时,双方交换的报文段仅有 T C P首部。如果一方没有数据要发送,也使用没有任何数据的首部来确认收到的数据。在处理超时的许多情况中,也会发送不带任何数据的报文段。