本文转载自:http://shixm.javaeye.com/blog/839128

看下图:

 

我们在使用netstat -n时就能看到当前端口的状态

状态转换图中状态的描述:

CLOSED:无连接是活动的或正在进行

 

LISTEN:服务器在等待进入呼叫

 

SYN_RECV:一个连接请求已经到达,等待确认

 

SYN_SENT:应用已经开始,打开一个连接

 

ESTABLISHED:正常数据传输状态

 

FIN_WAIT1:应用说它已经完成

 

FIN_WAIT2:另一边已同意释放

 

ITMED_WAIT:等待所有分组死掉

 

CLOSING:两边同时尝试关闭

 

TIME_WAIT:另一边已初始化一个释放

 

LAST_ACK:等待所有分组死掉

 

在TCP/IP协议中,TCP协议提供可靠的连接服务,采用三次握手建立一个连接。 第一次握手:建立连接时,客户端发送syn包(syn=j)到服务器,并进入SYN_SEND状态,等待服务器确认; 第二次握手:服务器收到syn包,必须确认客户的SYN(ack=j+1),同时自己也发送一个SYN包(syn=k),即SYN+ACK包,此时服务器 进入SYN_RECV状态; 第三次握手:客户端收到服务器的SYN+ACK包,向服务器发送确认包ACK(ack=k+1),此包发送完毕,客户端和服务器进入 ESTABLISHED状态,完成三次握手。 完成三次握手,客户端与服务器开始传送数据,也就是ESTABLISHED状态,我们每次netstat -a 时看到最多的状态。

 

在上述过程中,还有一些重要的概念: 未连接队列:在三次握手协议中,服务器维护一个未连接队列,该队列为每个客户端的SYN包(syn=j)开设一个条目,该条目表明服务器已收到SYN包, 并向客户发出确认,正在等待客户的确认包。这些条目所标识的连接在服务器处于Syn_RECV状态,当服务器收到客户的确认包时,删除该条目,服务器进入 ESTABLISHED状态。

 

其中SYN,ASK是服务器客服端唯一标识使通信不被串掉

 

当然我们三次握手时可能会timeout也就是会产生如此状态,这对我们查问题比较有用SYN_SENT发送信号----FIN ---ITMED_WAIT --重试---close

 

到这里我们来理解下DOS***用TCP/IP语言我们可以称做SYN浑水,***一直去给服务器发SYN_SENT去握手,最后一直不去建立连接导 致服务器一直在FIN ---ITMED_WAIT等待握手,并尝试N次连接如果期间不断发送就会造成很多连接导致服务器瘫痪。所以配置防火墙时要注意这些状况。注 意:windows防火墙我们开放端口是要选择TCP还是UDP开放,如果选择错了连接也是无法进行的。




主要部分,四次握手:

 

断开连接其实从我的角度看不区分客户端和服务器端,任何一方都可以调用close(or closesocket)之类

 

的函数开始主动终止一个连接。这里先暂时说正常情况。当调用close函数断开一个连接时,主动断开的

 

一方发送FIN(finish报文给对方。有了之前的经验,我想你应该明白我说的FIN报文时什么东西。也就是

 

一个设置了FIN标志位的报文段。FIN报文也可能附加用户数据,如果这一方还有数据要发送时,将数据附

 

加到这个FIN报文时完全正常的。之后你会看到,这种附加报文还会有很多,例如ACK报文。我们所要把握

 

的原则是,TCP 肯定会力所能及地达到最大效率,所以你能够想到的优化方法,我想TCP 都会想到。

 

当被动关闭的一方收到FIN报文时,它会发送ACK确认报文(对于ACK这个东西你应该很熟悉了)。这里有个

 

东西要注意,因为TCP 是双工的,也就是说,你可以想象一对TCP 连接上有两条数据通路。当发送FIN报文

 

时,意思是说,发送FIN的一端就不能发送数据,也就是关闭了其中一条数据通路。被动关闭的一端发送

 

了ACK后,应用层通常就会检测到这个连接即将断开,然后被动断开的应用层调用close关闭连接。

 

我可以告诉你,一旦当你调用close(or closesocket),这一端就会发送FIN报文。也就是说,现在被动

 

关闭的一端也发送FIN给主动关闭端。有时候,被动关闭端会将ACK和FIN两个报文合在一起发送。主动

 

关闭端收到FIN后也发送ACK,然后整个连接关闭(事实上还没完全关闭,只是关闭需要交换的报文发送

 

完毕),四次握手完成。如你所见,因为被动关闭端可能会将ACK和FIN合到一起发送,所以这也算不上

 

严格的四次握手---四个报文段。

 

在前面的文章中,我一直没提TCP 的状态转换。在这里我还是在犹豫是不是该将那张四处通用的图拿出来,

 

不过,这里我只给出断开连接时的状态转换图,摘自<The TCP /IP Guide>:

 

给出一个正常关闭时的windump信息:

 

14 : 00 : 38.819856 IP cd - zhangmin. 1748 > 220.181 . 37.55 . 80 : F 1 : 1 ( 0 ) ack 1 win 65535

 

14 : 00 : 38.863989 IP 220.181 . 37.55 . 80 > cd - zhangmin. 1748 : F 1 : 1 ( 0 ) ack 2 win 2920

 

14 : 00 : 38.864412 IP cd - zhangmin. 1748 > 220.181 . 37.55 . 80 : . ack 2 win 65535

 

补充细节:

 

关于以上的四次握手,我补充下细节:

 

1. 默认情况下(不改变socket选项),当你调用close( or closesocket,以下说close不再重复)时,如果

 

发送缓冲中还有数据,TCP 会继续把数据发送完。

 

2. 发送了FIN只是表示这端不能继续发送数据(应用层不能再调用send发送),但是还可以接收数据。

 

3. 应用层如何知道对端关闭?通常,在最简单的阻塞模型中,当你调用recv时,如果返回0,则表示对端

 

关闭。在这个时候通常的做法就是也调用close,那么TCP 层就发送FIN,继续完成四次握手。如果你不调用

 

close,那么对端就会处于FIN_WAIT_2状态,而本端则会处于CLOSE_WAIT状态。这个可以写代码试试。

 

4. 在很多时候,TCP 连接的断开都会由TCP 层自动进行,例如你CTRL+C终止你的程序,TCP 连接依然会正常关

 

闭,你可以写代码试试。



特别的TIME_WAIT状态:

 

从以上TCP 连接关闭的状态转换图可以看出,主动关闭的一方在发送完对对方FIN报文的确认(ACK)报文后,

 

会进入TIME_WAIT状态。TIME_WAIT状态也称为2MSL状态。

 

什么是2MSL?MSL即Maximum Segment Lifetime,也就是报文最大生存时间,引用<TCP /IP详解>中的话:“

 

它(MSL)是任何报文段被丢弃前在网络内的最长时间。”那么,2MSL也就是这个时间的2倍。其实我觉得没

 

必要把这个MSL的确切含义搞明白,你所需要明白的是,当TCP 连接完成四个报文段的交换时,主动关闭的

 

一方将继续等待一定时间(2-4分钟),即使两端的应用程序结束。你可以写代码试试,然后用netstat查看下。

 

为什么需要2MSL?根据<TCP /IP详解>和<The TCP /IP Guide>中的说法,有两个原因:

 

其一,保证发送的ACK会成功发送到对方,如何保证?我觉得可能是通过超时计时器发送。这个就很难用

 

代码演示了。

 

其二,报文可能会被混淆,意思是说,其他时候的连接可能会被当作本次的连接。直接引用<The TCP /IP Guide>

 

的说法:The second is to provide a “buffering period” between the end of this connection

 

and any subsequent ones. If not for this period, it is possible that packets from different

 

connections could be mixed, creating confusion.

 

TIME_WAIT状态所带来的影响:

 

当某个连接的一端处于TIME_WAIT状态时,该连接将不能再被使用。事实上,对于我们比较有现实意义的

 

是,这个端口将不能再被使用。某个端口处于TIME_WAIT状态(其实应该是这个连接)时,这意味着这个 TCP

 

连接并没有断开(完全断开),那么,如果你bind这个端口,就会失败。

 

对于服务器而言,如果服务器突然crash掉了,那么它将无法再2MSL内重新启动,因为bind会失败。解决这

 

个问题的一个方法就是设置socket的SO_REUSEADDR选项。这个选项意味着你可以重用一个地址。

 

对于TIME_WAIT的插曲:

 

当建立一个TCP 连接时,服务器端会继续用原有端口监听,同时用这个端口与客户端通信。而客户端默认情况

 

下会使用一个随机端口与服务器端的监听端口通信。有时候,为了服务器端的安全性,我们需要对客户端进行

 

验证,即限定某个IP某个特定端口的客户端。客户端可以使用bind来使用特定的端口。

 

对于服务器端,当设置了SO_REUSEADDR选项时,它可以在2MSL内启动并listen成功。但是对于客户端,当使

 

用bind并设置SO_REUSEADDR时,如果在2MSL内启动,虽然bind会成功,但是在windows平台上connect会失败。

 

而在linux上则不存在这个问题。(我的实验平台:winxp, ubuntu7.10)

 

要解决windows平台的这个问题,可以设置SO_LINGER选项。SO_LINGER选项决定调用close时,TCP 的行为。

 

SO_LINGER涉及到linger结构体,如果设置结构体中l_onoff为非0,l_linger为0,那么调用close时TCP 连接

 

会立刻断开,TCP 不会将发送缓冲中未发送的数据发送,而是立即发送一个RST报文给对方,这个时候TCP 连

 

接就不会进入TIME_WAIT状态。

 

如你所见,这样做虽然解决了问题,但是并不安全。通过以上方式设置SO_LINGER状态,等同于设置SO_DONTLINGER

 

状态。

 

断开连接时的意外:

 

这个算不上断开连接时的意外,当TCP 连接发生一些物理上的意外情况时,例如网线断开,linux上的TCP 实现

 

会依然认为该连接有效,而windows则会在一定时间后返回错误信息。

 

这似乎可以通过设置SO_KEEPALIVE选项来解决,不过不知道这个选项是否对于所有平台都有效。