第3章 IP:网际协议

3.1 引言

I P是T C P / I P协议族中最为核心的协议。所有的 T C P、U D P、I C M P及I G M P数据都以I P数据报格式传输(见图 1 - 4)。许多刚开始接触 T C P / I P的人对I P提供不可靠、无连接的数据报传送服务感到很奇怪,特别是那些具有 X . 2 5或S N A背景知识的人。

不可靠(u n r e l i a b l e)的意思是它不能保证 I P数据报能成功地到达目的地。 I P仅提供最好的传输服务。如果发生某种错误时,如某个路由器暂时用完了缓冲区, I P有一个简单的错误处理算法:丢弃该数据报,然后发送 I C M P消息报给信源端。任何要求的可靠性必须由上层来提供(如T C P)。

无连接(c o n n e c t i o n l e s s)这个术语的意思是 I P并不维护任何关于后续数据报的状态信息。每个数据报的处理是相互独立的。这也说明, I P数据报可以不按发送顺序接收。如果一信源向相同的信宿发送两个连续的数据报(先是 A,然后是B),每个数据报都是独立地进行路由选择,可能选择不同的路线,因此 B可能在A到达之前先到达。

在本章,我们将简要介绍 I P首部中的各个字段,讨论 I P路由选择和子网的有关内容。还要介绍两个有用的命令: i f c o n f i g和n e t s t a t。关于I P首部中一些字段的细节,将留在以后使用这些字段的时候再进行讨论。 RFC 791[Postel 1981a]是I P的正式规范文件。

3.2 IP首部

I P数据报的格式如图3 - 1所示。普通的I P首部长为2 0个字节,除非含有选项字段。

速读原著-TCP/IP(IP首部)_首部

分析图3 - 1中的首部。最高位在左边,记为 0 bit;最低位在右边,记为31 bit。 4个字节的32 bit值以下面的次序传输:首先是 0~7 bit,其次8~15 bit,然后1 6~23 bit,

最后是24~31 bit。这种传输次序称作big endian字节序。由于T C P / I P首部中所有的二进制整数在网络中传输时都要求以这种次序,因此它又称作网络字节序。以其他形式存储二进制整数的机器,如little endian格式,则必须在传输数据之前把首部转换成网络字节序。

目前的协议版本号是4,因此I P有时也称作I P v 4。3 . 1 0节将对一种新版的I P协议进行讨论。首部长度指的是首部占 32 bit字的数目,包括任何选项。由于它是一个 4比特字段,因此首部最长为6 0个字节。在第8章中,我们将看到这种限制使某些选项如路由记录选项在当今已没有什么用处。普通I P数据报(没有任何选择项)字段的值是 5。

服务类型(TO S)字段包括一个3 bit的优先权子字段(现在已被忽略),4 bit的TO S子字段和1 bit未用位但必须置0。4 bit的TO S分别代表:最小时延、最大吞吐量、最高可靠性和最小费用。4 bit中只能置其中1 bit。如果所有4 bit均为0,那么就意味着是一般服务。 RFC 1340[Reynolds and Postel 1992] 描述了所有的标准应用如何设置这些服务类型。 RFC 1349[Almquist 1992]对该R F C进行了修正,更为详细地描述了 TO S的特性。

图3 - 2列出了对不同应用建议的 TO S值。在最后一列中给出的是十六进制值,因为这就是在后面将要看到的t c p d u m p命令输出。

速读原著-TCP/IP(IP首部)_字段_02

Te l n e t和R l o g i n这两个交互应用要求最小的传输时延,因为人们主要用它们来传输少量的交互数据。另一方面, F T P文件传输则要求有最大的吞吐量。最高可靠性被指明给网络管理(S N M P)和路由选择协议。用户网络新闻( Usenet news, NNTP)是唯一要求最小费用的应用。

现在大多数的T C P / I P实现都不支持TO S特性,但是自4.3BSD Reno以后的新版系统都对它进行了设置。另外,新的路由协议如 O S P F和I S - I S都能根据这些字段的值进行路由决策。在2 . 1 0节中,我们提到S L I P一般提供基于服务类型的排队方法,允许对交互通信数据在处理大块数据之前进行处理。由于大多数的实现都不使用 TO S字段,因此这种排队机制由S L I P自己来判断和处理,驱动程序先查看协议字段(确定是否是一个 T C P段),然后检查T C P信源和信宿的端口号,以判断是否是一个交互服务。一个驱动程序的注释这样认为,这种“令人厌恶的处理方法”是必需的,因为大多数实现都不允许应用程序设置TOS字段。

总长度字段是指整个 I P数据报的长度,以字节为单位。利用首部长度字段和总长度字段,就可以知道 I P数据报中数据内容的起始位置和长度。由于该字段长 1 6比特,所以 I P数据报最长可达 6 5 5 3 5字节(回忆图 2 - 5,超级通道的 M T U为6 5 5 3 5。它的意思其实不是一个真正的M T U—它使用了最长的I P数据报)。当数据报被分片时,该字段的值也随着变化,这一点将在11 . 5节中进一步描述。

尽管可以传送一个长达 6 5 5 3 5字节的I P数据报,但是大多数的链路层都会对它进行分片。而且,主机也要求不能接收超过 5 7 6字节的数据报。由于 T C P把用户数据分成若干片,因此一般来说这个限制不会影响 T C P。在后面的章节中将遇到大量使用 U D P的应用( R I P,T F T P,B O O T P,D N S,以及S N M P),它们都限制用户数据报长度为 5 1 2字节,小于5 7 6字节。

但是,事实上现在大多数的实现(特别是那些支持网络文件系统 N F S的实现)允许超过 8 1 9 2字节的I P数据报。总长度字段是 I P首部中必要的内容,因为一些数据链路(如以太网)需要填充一些数据以达到最小长度。尽管以太网的最小帧长为 4 6字节(见图 2 - 1),但是I P数据可能会更短。如果没有总长度字段,那么I P层就不知道4 6字节中有多少是I P数据报的内容。标识字段唯一地标识主机发送的每一份数据报。通常每发送一份报文它的值就会加 1。在11 . 5节介绍分片和重组时再详细讨论它。同样,在讨论分片时再来分析标志字段和片偏移字段。

RFC 791 [Postel 1981a]认为标识字段应该由让IP发送数据报的上层来选择。假设有两个连续的I P数据报,其中一个是由T C P生成的,而另一个是由U D P生成的,那么它们可能具有相同的标识字段。尽管这也可以照常工作(由重组算法来处理),但是在大多数从伯克利派生出来的系统中,每发送一个I P数据报,I P层都要把一个内核变量的值加1,不管交给IP的数据来自哪一层。内核变量的初始值根据系统引导时的时间来设置。T T L(t i m e - t o - l i v e)生存时间字段设置了数据报可以经过的最多路由器数。它指定了数据报的生存时间。T T L的初始值由源主机设置(通常为 3 2或6 4),一旦经过一个处理它的路由器,它的值就减去 1。当该字段的值为 0时,数据报就被丢弃,并发送 I C M P报文通知源主机。第 8章我们讨论Tr a c e r o u t e程序时将再回来讨论该字段。

我们已经在第 1章讨论了协议字段,并在图 1 - 8中示出了它如何被 I P用来对数据报进行分用。根据它可以识别是哪个协议向 I P传送数据。首部检验和字段是根据I P首部计算的检验和码。它不对首部后面的数据进行计算。 I C M P、I G M P、U D P和T C P在它们各自的首部中均含有同时覆盖首部和数据检验和码。

为了计算一份数据报的 I P检验和,首先把检验和字段置为 0。然后,对首部中每个 16 bit进行二进制反码求和(整个首部看成是由一串 16 bit的字组成),结果存在检验和字段中。当收到一份I P数据报后,同样对首部中每个 16 bit进行二进制反码的求和。由于接收方在计算过程中包含了发送方存在首部中的检验和,因此,如果首部在传输过程中没有发生任何差错,那么接收方计算的结果应该为全 1。如果结果不是全1(即检验和错误),那么I P就丢弃收到的数据报。但是不生成差错报文,由上层去发现丢失的数据报并进行重传。

I C M P、I G M P、U D P和T C P都采用相同的检验和算法,尽管 T C P和U D P除了本身的首部和数据外,在I P首部中还包含不同的字段。在 RFC 1071[Braden, Borman and Patridge 1988]中有关于如何计算I n t e r n e t检验和的实现技术。由于路由器经常只修改 T T L字段(减1),因此当路由器转发一份报文时可以增加它的检验和,而不需要对 I P整个首部进行重新计算。 R F C

1141[Mallory and Kullberg 1990]为此给出了一个很有效的方法。

但是,标准的BSD实现在转发数据报时并不是采用这种增加的办法。每一份I P数据报都包含源 I P地址和目的 I P地址。我们在 1 . 4节中说过,它们都是 32 bit的值。

最后一个字段是任选项,是数据报中的一个可变长的可选信息。目前,这些任选项定义如下:

• 安全和处理限制(用于军事领域,详细内容参见 RFC 1108[Kent 1991]) • 记录路径(让每个路由器都记下它的 I P地址,见7 . 3节)

• 时间戳(让每个路由器都记下它的 I P地址和时间,见7 . 4节)

• 宽松的源站选路(为数据报指定一系列必须经过的 I P地址,见8 . 5节)

• 严格的源站选路(与宽松的源站选路类似,但是要求只能经过指定的这些地址,不能经过其他的地址)。

这些选项很少被使用,并非所有的主机和路由器都支持这些选项。

选项字段一直都是以 32 bit作为界限,在必要的时候插入值为 0的填充字节。这样就保证I P首部始终是32 bit的整数倍(这是首部长度字段所要求的)。