准备

请自行查找或使用如下参考资料,了解 Wireshark 的基本使用:

选择对哪块网卡进行数据包捕获:

wireshark 分析 追踪流 wireshark怎么追踪流_wireshark 分析 追踪流

开始/停止捕获:

wireshark 分析 追踪流 wireshark怎么追踪流_服务器_02

了解 Wireshark 主要窗口区域:

wireshark 分析 追踪流 wireshark怎么追踪流_服务器_03

设置数据包的过滤:

先ping www.baidu.com

wireshark 分析 追踪流 wireshark怎么追踪流_wireshark_04

再过滤只留百度的ip(183.232.231.172)

wireshark 分析 追踪流 wireshark怎么追踪流_wireshark_05

跟踪数据流:

wireshark 分析 追踪流 wireshark怎么追踪流_wireshark 分析 追踪流_06

先选择其中的一条,再点击分析下的追踪流选择TCP流,或者是选择一条后直接点击快捷键CTRL+ALT+SHIFT+T。

数据链路层

实作一 熟悉 Ethernet 帧结构

使用 Wireshark 任意进行抓包,熟悉 Ethernet 帧的结构,如:目的 MAC、源 MAC、类型、字段等。

wireshark 分析 追踪流 wireshark怎么追踪流_wireshark 分析 追踪流_07

✎ 问题

你会发现 Wireshark 展现给我们的帧中没有校验字段,请了解一下原因。

答:Wireshark 抓包前,在物理层网卡已经去掉了一些之前几层加的东西,比如前导同步码,FCS等等,之后利用校验码CRC校验,正确时才会进行下一步操作,这时才开始进行抓包,因此,抓包软件抓到的是去掉前导同步码、FCS之外的数据,校验字段会被过滤掉,所以没有校验字段。

实作二 了解子网内/外通信时的 MAC 地址

ping 你旁边的计算机(同一子网),同时用 Wireshark 抓这些包(可使用 icmp 关键字进行过滤以利于分析),记录一下发出帧的目的 MAC 地址以及返回帧的源 MAC 地址是多少?这个 MAC 地址是谁的?

首先ping 192.168.43.101

wireshark 分析 追踪流 wireshark怎么追踪流_测试工具_08


然后再抓包分析:

wireshark 分析 追踪流 wireshark怎么追踪流_wireshark_09


发现目的MAC是3c:f0:11:18:af:38,再在arp缓存中查看该MAC是谁:

wireshark 分析 追踪流 wireshark怎么追踪流_服务器_10


可以看出此MAC地址是旁边台计算机192.168.43.101的地址。

然后 ping qige.io (或者本子网外的主机都可以),同时用 Wireshark 抓这些包(可 icmp 过滤),记录一下发出帧的目的 MAC 地址以及返回帧的源 MAC 地址是多少?这个 MAC 地址是谁的?

首先ping qige.io

wireshark 分析 追踪流 wireshark怎么追踪流_服务器_11


然后再抓包分析:

wireshark 分析 追踪流 wireshark怎么追踪流_wireshark_12


发现目的 MAC 是82:98:ce:7b:6a:23。

wireshark 分析 追踪流 wireshark怎么追踪流_网络_13


可以看出此MAC地址是网关的地址。

再次 ping www.cqjtu.edu.cn (或者本子网外的主机都可以),同时用 Wireshark 抓这些包(可 icmp 过滤),记录一下发出帧的目的 MAC 地址以及返回帧的源 MAC 地址又是多少?这个 MAC 地址又是谁的?

ping百度的某个ip(14.215.177.39)

wireshark 分析 追踪流 wireshark怎么追踪流_测试工具_14


然后使用wireshark抓包:

wireshark 分析 追踪流 wireshark怎么追踪流_服务器_15


发现目的 MAC 是82:98:ce:7b:6a:23。

wireshark 分析 追踪流 wireshark怎么追踪流_wireshark_16


可以看出此MAC地址是网关的地址。

**问题
通过以上的实验,你会发现:
访问本子网的计算机时,目的 MAC 就是该主机的
访问非本子网的计算机时,目的 MAC 是网关的
请问原因是什么?

答:因为访问本子网的计算机不需要经过网关,也就不需要访问网关的MAC,收到的目的MAC就是本子网内的MAC,而访问子网外的计算机时,就需要经过网关,所以当接收包时,目的MAC就是网关的MAC。

实作三 掌握 ARP 解析过程

为防止干扰,先使用 arp -d * 命令清空 arp 缓存

wireshark 分析 追踪流 wireshark怎么追踪流_wireshark_17

ping 你旁边的计算机(同一子网),同时用 Wireshark 抓这些包(可 arp 过滤),查看 ARP 请求的格式以及请求的内容,注意观察该请求的目的 MAC 地址是什么。再查看一下该请求的回应,注意观察该回应的源 MAC 和目的 MAC 地址是什么。

wireshark 分析 追踪流 wireshark怎么追踪流_网络_18


wireshark 分析 追踪流 wireshark怎么追踪流_网络_19


该帧为广播帧,回应的源MAC是a0:a4:c5:c6:94:6d,目的MAC是00:00:00:00:00:00。

再次使用 arp -d * 命令清空 arp 缓存

wireshark 分析 追踪流 wireshark怎么追踪流_网络_20

然后 ping qige.io (或者本子网外的主机都可以),同时用 Wireshark 抓这些包(可 arp 过滤)。查看这次 ARP 请求的是什么,注意观察该请求是谁在回应。

首先ping qige.io:

wireshark 分析 追踪流 wireshark怎么追踪流_测试工具_21


再使用wireshark用arp过滤抓包:

wireshark 分析 追踪流 wireshark怎么追踪流_测试工具_22


发现回应的目的MAC是22:20:dc:4e:35:79

wireshark 分析 追踪流 wireshark怎么追踪流_服务器_23


而这个MAC地址刚好是网关的MAC。

**问题
通过以上的实验,你应该会发现,
ARP 请求都是使用广播方式发送的
如果访问的是本子网的 IP,那么 ARP 解析将直接得到该 IP 对应的 MAC;如果访问的非本子网的 IP, 那么 ARP 解析将得到网关的 MAC。
请问为什么?

答:对于没有配置缺省网关的计算机要和其他网络中的计算机实现通信,网关收到源计算机的ARP请求会使用自己的MAC地址与目标计算机的IP地址对源计算机进行应答,访问非子网IP时是通过路由器访问的,路由器再把发出去,目标IP收到请求后,再通过路由器端口IP返回去,那么ARP解析将会得到网关的MAC。

网络层

实作一 熟悉 IP 包结构

使用 Wireshark 任意进行抓包(可用 ip 过滤),熟悉 IP 包的结构,如:版本、头部长度、总长度、TTL、协议类型等字段。

wireshark 分析 追踪流 wireshark怎么追踪流_测试工具_24

**问题
为提高效率,我们应该让 IP 的头部尽可能的精简。但在如此珍贵的 IP 头部你会发现既有头部长度字段,也有总长度字段。请问为什么?

答:有头部长度字段和总长度字段是为了方便上层将 IP 包中的数据提取出来,如果只有其中一个长度字段,那么提取数据就会出现错误,不知道数据部分有多长。

根据规定,一个 IP 包最大可以有 64K 字节。但由于 Ethernet 帧的限制,当 IP 包的数据超过 1500 字节时就会被发送方的数据链路层分段,然后在接收方的网络层重组。
缺省的,ping 命令只会向对方发送 32 个字节的数据。我们可以使用 ping 202.202.240.16 -l 2000 命令指定要发送的数据长度。此时使用 Wireshark 抓包(用 ip.addr == 202.202.240.16 进行过滤),了解 IP 包如何进行分段,如:分段标志、偏移量以及每个包的大小等

首先ping 202.202.240.16 -l 2000:

wireshark 分析 追踪流 wireshark怎么追踪流_wireshark_25


再用wireshark抓包202.202.240.16:

wireshark 分析 追踪流 wireshark怎么追踪流_测试工具_26

**问题
分段与重组是一个耗费资源的操作,特别是当分段由传送路径上的节点即路由器来完成的时候,所以 IPv6 已经不允许分段了。那么 IPv6 中,如果路由器遇到了一个大数据包该怎么办?

答:转发到支持该数据传输的路由上或者丢弃该数据包。

实作三 考察 TTL 事件

在 IP 包头中有一个 TTL 字段用来限定该包可以在 Internet上传输多少跳(hops),一般该值设置为 64、128等。
在验证性实验部分我们使用了 tracert 命令进行路由追踪。其原理是主动设置 IP 包的 TTL 值,从 1 开始逐渐增加,直至到达最终目的主机。
请使用 tracert www.baidu.com 命令进行追踪,此时使用 Wireshark 抓包(用 icmp 过滤),分析每个发送包的 TTL 是如何进行改变的,从而理解路由追踪原理。

首先输入tracert www.baidu.com命令:

wireshark 分析 追踪流 wireshark怎么追踪流_网络_27


再进行icmp过滤找出TTL如何变化:

wireshark 分析 追踪流 wireshark怎么追踪流_服务器_28


通过对比发现,TTL从1开始,每经过一个路由,TTL的的设置就会增加1,直到到达目的地址。发送包才将TTL设置为64或者128,将数据按照路由的顺序进行数据的发送。

**问题
在 IPv4 中,TTL 虽然定义为生命期即 Time To Live,但现实中我们都以跳数/节点数进行设置。如果你收到一个包,其 TTL 的值为 50,那么可以推断这个包从源点到你之间有多少跳?

答:经过14跳,因为一般TTL的设置为与其最靠进的2的n次幂,50离2^6近,所以64-50=14。

传输层

实作一 熟悉 TCP 和 UDP 段结构

用 Wireshark 任意抓包(可用 tcp 过滤),熟悉 TCP 段的结构,如:源端口、目的端口、序列号、确认号、各种标志位等字段。

wireshark 分析 追踪流 wireshark怎么追踪流_服务器_29

用 Wireshark 任意抓包(可用 udp 过滤),熟悉 UDP 段的结构,如:源端口、目的端口、长度等。

wireshark 分析 追踪流 wireshark怎么追踪流_测试工具_30

**问题
由上大家可以看到 UDP 的头部比 TCP 简单得多,但两者都有源和目的端口号。请问源和目的端口号用来干什么?

答:因为一个进程对应了一个端口,或者一个进程对应了多个端口,端口的作用就是用来唯一标识这个进程。源端口标识发起通信的那个进程,目的端口标识接受通信的那个进程。

实作二 分析 TCP 建立和释放连接

打开浏览器访问 qige.io 网站,用 Wireshark 抓包(可用 tcp 过滤后再使用加上 Follow TCP Stream),不要立即停止 Wireshark 捕获,待页面显示完毕后再多等一段时间使得能够捕获释放连接的包。

wireshark 分析 追踪流 wireshark怎么追踪流_测试工具_31

请在你捕获的包中找到三次握手建立连接的包,并说明为何它们是用于建立连接的,有什么特征。

wireshark 分析 追踪流 wireshark怎么追踪流_服务器_32


答:第一次握手是从用户到服务器,第二次握手是从服务器到用户,第三次握手是从用户到服务器,通过三次握手就可将用户与服务器相连接起来,在第一次握手时ACK = 0 ,SYN = 1,第二次握手时ACK = 1 ,SYN = 1,第三次握手时ACK = 1 ,SYN = 0

请在你捕获的包中找到四次挥手释放连接的包,并说明为何它们是用于释放连接的,有什么特征。

wireshark 分析 追踪流 wireshark怎么追踪流_wireshark 分析 追踪流_33

答:第一次挥手是从用户到服务器,第二次挥手是从服务器到用户,第三次挥手是从服务器到用户,第四次挥手是从用户到服务器,通过四次挥手就可将用户与服务器释放连接,在第一次挥手时ACK = 1 ,FIN = 1,第二次挥手时ACK = 1 ,FIN = 0,第三次挥手时ACK = 1 ,FIN = 1,第四次挥手时ACK = 1 ,FIN = 0。

**问题一
去掉 Follow TCP Stream,即不跟踪一个 TCP 流,你可能会看到访问 qige.io 时我们建立的连接有多个。请思考为什么会有多个连接?作用是什么?

答:这属于短连接,这为了实现多个用户进行访问,对业务频率不高的场合,不让其长期占用通道,开辟了多个传输通道,作用是加快传输数据的速度。

**问题二
我们上面提到了释放连接需要四次挥手,有时你可能会抓到只有三次挥手。原因是什么?

答:原则上来说是有四次挥手,出现三次的原因是因为服务器将同意断开连接和请求断开连接合并到一块发送给用户,即将第二次和第三次挥手合并。

应用层

应用层的协议非常的多,我们只对 DNS 和 HTTP 进行相关的分析。

实作一 了解 DNS 解析

1.先使用 ipconfig /flushdns 命令清除缓存,再使用 nslookup qige.io 命令进行解析,同时用 Wireshark 任意抓包(可用 dns 过滤)。

wireshark 分析 追踪流 wireshark怎么追踪流_服务器_34

2.你应该可以看到当前计算机使用 UDP,向默认的 DNS 服务器的 53 号端口发出了查询请求,而 DNS 服务器的 53 号端口返回了结果。

wireshark 分析 追踪流 wireshark怎么追踪流_服务器_35

3.可了解一下 DNS 查询和应答的相关字段的含义

**问题
你可能会发现对同一个站点,我们发出的 DNS 解析请求不止一个,思考一下是什么原因?

答:原因有可能是在域名解析过程中最先从浏览器中检查是否有相应的网址,如果没有的话就在本地hosts文件中查看是否有网址对应的ip,如果有就完成域名解析,如果没有就要想本地DNS服务器发起请求,若缓存中有ip,则直接返回,若没有则读取根DNS服务器,向上发起请求直至得到ip。

实作二 了解 HTTP 的请求和应答

1.打开浏览器访问 qige.io 网站,用 Wireshark 抓包(可用http 过滤再加上 Follow TCP Stream),不要立即停止 Wireshark 捕获,待页面显示完毕后再多等一段时间以将释放连接的包捕获。

wireshark 分析 追踪流 wireshark怎么追踪流_服务器_36

2.请在你捕获的包中找到 HTTP 请求包,查看请求使用的什么命令,如:GET, POST。并仔细了解请求的头部有哪些字段及其意义。

HTTP请求消息为GET时:

wireshark 分析 追踪流 wireshark怎么追踪流_网络_37


host为请求资源所在的服务器,Accept是用户代理可处理的媒体类型,content-type是实体主体的媒体类型,user-agent是HTTP客户端程序段信息。

HTTP请求消息为post时:

wireshark 分析 追踪流 wireshark怎么追踪流_wireshark_38


host为请求资源所在的服务器,content-length是实体主体的自然语言,user-agent是HTTP客户端程序段信息,cache-control是控制缓存的行为,content-type是实体主体的媒体类型。

3.请在你捕获的包中找到 HTTP 应答包,查看应答的代码是什么,如:200, 304, 404 等。并仔细了解应答的头部有哪些字段及其意义。

wireshark 分析 追踪流 wireshark怎么追踪流_网络_39


此次捕捉到应答的代码是200,server是HTTP服务器的安装信息,Date是创建报文的日期时间,Content-type是实体主体的媒体类型,Transfer-encoding是指定报文主体的传输编码方式,connection是逐跳首部、连接的管理,cache-control是控制缓存的行为,pragma是报文指令。

问题
刷新一次 qige.io 网站的页面同时进行抓包,你会发现不少的 304 代码的应答,这是所请求的对象没有更改的意思,让浏览器使用本地缓存的内容即可。那么服务器为什么会回答 304 应答而不是常见的 200 应答?

答:因为之前是200,说明之前没有缓存上这个内容,304表示内容没有变,此时可以直接可以直接在缓存区获取到需要的内容,不需要服务器在回复对应的内容,可以减少服务器的一些工作。