双点双向重分布导致路由环路，你要怎么解？

转载

释然IT杂谈 2021-11-10 16:50:02

文章标签 路由协议路由表 ip地址负载均衡 redis 文章分类 代码人生

双点双向重分布导致路由环路，你要怎么解？_路由表

加群交流在后台回复“加群”，添加小编微信，小编拉你进去

后台回复“724”获取入门资料

多个路由协议?再正常不过了

作为一名网络行业从业者，我多么希望面对的网络架构是完美的。

就好比玩游戏可以开挂，要是生活、工作也能开挂多好。

但日常工作中，你会发现企业网络也好,其他类型的网络也好。

总是存在各种瑕疵，各种不和谐。

其中一个不和谐，就是一张网同时由存在多个路由协议互联互通。

再奇葩一点，多个路由协议之间通过多台路由器重分发路由，来提供两两之间的可达性。

此话怎么讲?

让我们来看一个拓扑:

双点双向重分布导致路由环路，你要怎么解？_ip地址_02

上图中，存在两个路由域，OSPF域以及RIP域，两个域通过两台路由器互联在一起。

同时，为了交换两个域内的路由，让OSPF内的设备能够与RIP设备互联互通，我们需要在两台路由器上作双点双向重分发。

什么时候存在多个路由域?

双点双向重分布导致路由环路，你要怎么解？_ip地址_03

总之，不管什么原因，当两个不同的路由协议同时存在于网络中，并有两台路由器做双向重分发时。

若不采取人为干涉，网络故障就发生了。

网络故障，什么网络故障，可否说清楚点?

这里故意卖个关子，先看一个案例，你就明白了。

一个诡异的路由问题：

上面以OSPF和RIP组成的拓扑为例讨论此问题。

既然这样，就顺水推舟，采用此拓扑搭建一个实验环境。

让我们一起来看看，当OSPF和RIP两个点互相重分发以后，到底会发什么事情?

拓扑如下:

双点双向重分布导致路由环路，你要怎么解？_ip地址_04

拓扑简介

上述拓扑中，存在两个路由协议，分别是OSPF (下方) ，RIP (上方)。

OSPF内部有R5，R6四台路由器。

RIP内部有R3，R4四台路由器。

R1和R2则是同时处于RIP和OSPF域中。

路由器之间的IP地址为路由器的数字名称组合而成。例如R1和R3之间的链路则是: 13.1.1.0/24。

R1是13.1.1.1/24，R3则是13.1.1.3/24, 以此类推，非常容易理解。

为了验证连通性, R4和R6_ 上开启了两个还回接口lo0。

R4的Io0 IP为4.4.4.4/32。R6的lo0 IP为6.6 6.6/32。

重分发说明:

此实验中，R1和R2同时双向重分发OSPF和RIP。即向OSPF里重分发了RIP的路由,向RIP内重分发了OSPF的路由。

实验目的：

很简单，只需要让R4和R6的I0IP地址互联互通即可。

实验配置：各路由器配置如下:

#####R4:

interface Loopback0

ip address 4.4.4.4 255.255.255.255

interface Ethernet0/0

ip address 34.1.1.4 255.255.255.0

router rip

version 2

network 4.0.0.0

network 34.0.0.0

no auto-summary

#####R3:

interface Ethernet0/0

ip address 13.1.1.3 255.255.255.0

interface Ethernet0/1

ip address 23.1.1.3 255.255.255.0

interface Ethernet0/2

ip address 34.1.1.3 255.255.255.0

router rip

version 2

network 13.0.0.0

network 23.0.0.0

network 34.0.0.0

no auto-summary

####R1:

interface Ethernet0/0

ip address 13.1.1.1 255.255.255.0

interface Ethernet0/1

ip address 15.1.1.1 255.255.255.0

router ospf 1

#重点来了，OSPF重分发RIP

redistribute rip subnets

network 15.1.1.0 0.0.0.255 area 0

router rip

version 2

#RIP重分发OSPF

redistribute ospf 1 metric 1

network 13.0.0.0

no auto-summary

#####R2

interface Ethernet0/0

ip address 23.1.1.2 255.255.255.0

interface Ethernet0/1

ip address 25.1.1.2 255.255.255.0

router ospf 1

redistribute rip subnets

#OSPF重分发RIP

network 25.1.1.0 0.0.0.255 area 0

router rip

version 2

redistribute ospf 1 metric 1

#RIP重分发OSPF

network 23.0.0.0

no auto-summary

####R5

interface Ethernet0/0

ip address 25.1.1.5 255.255.255.0

interface Ethernet0/1

ip address 15.1.1.5 255.255.255.0

interface Ethernet0/2

ip address 56.1.1.5 255.255.255.0

router ospf 1

network 0.0.0.0 255.255.255.255 area 0

####R6

interface Loopback0

ip address 6.6.6.6 255.255.255.255

interface Ethernet0/0

ip address 56.1.1.6 255.255.255.0

router ospf 1

network 0.0.0.0 255.255.255.255 area 0

上述配置浅显易懂，也没有什么复杂的网络技术,简单说来就是在R1和R2上开启了两个路由协议，并做了互相重分发。

但是，往往越简单的东西，破坏力越大。

一段时间以后，各个路由协议收敛完成。

接下来看看各个路由器的路由表:

R4:

R3:

R1:

R2:

R5:

R6:

上面的路由表，不知道你是否看出来端倪。(悄悄提示:注意4. 4.4.4/32的路由。)没看出来也无所谓，请继续往下走。

实验结果验证：

接下来进行验证环节。

很简单，验证方法为R6是否能够ping得通R4的还回地址4.4.4.4。

###R6测试：

以R6的接口56.1.1.6/32为源来ping 4.4.4.4

非常完美

以R6的环回6.6.6。6为源来ping 4.4.4.4

居然不通？？？？

神奇的事情发生了，R6以56.1.1.6为源ping 4.4.4.4没有问题，但是以6.6.6.6为源ping 4.4.4.4则失败。

为了验证数据包的路径，这一次试试traceroute,如下所示：

采用R6的接口56.1.1.6为源

上述结果没有问题，数据包经过4跳后到达R4。

让我们继续采用R6的环回6.6.6.6为源做traceroute

双点双向重分布导致路由环路，你要怎么解？_负载均衡_14

##哎呀，环路了。

##怪不得，ping不通呢

从上面的traceroute发现一个很奇怪的问题，当以R6的接口IP地址6.6.6.6为源时，就出现环路。

“全网路由都正常，4.4.4. 4和6.6 66都在路由表里面，逻辑上没问题。”

“莫非此网络还出神灵了不成，估计是Cisco bug，让我们重启路由器试试，不行的话再报case报修"。

这是很多朋友遇到此问题第一时间的反应。

但是，小编喜欢

刨根问底，分析细节。

环路问题分析

首先，从环路的信息开始分析。

上述traceroute环路发生在R1，R2, R3, R5之间，

R3做了一件很诡异的事情。

首先R3收到到达4.4.4 4的数据包，由于R3是唯一一台去往R4的路由器，逻辑上来讲,

不犹豫R3会把此数据包直接转发给R4。

但是R3不仅没有，反而发送给了R2。

那是什么神奇的力量让R3做如此选择呢?让我们再看看R3的路由表:

双点双向重分布导致路由环路，你要怎么解？_redis_15

有意思，R3去往R4的4.4.4.4居然有两个下一跳。

第一个是去往真正的目的地，即R4。

第二个则是去往R2。

凭什么让R2认为它自己可以到达R4的4.4.4.4?

这次查看R2的路由表:

双点双向重分布导致路由环路，你要怎么解？_负载均衡_16

R2从R5学习到的4.4.4.4。

这件事情越来越有意思了。

以此类推，往下追查: .

R5的路由：

双点双向重分布导致路由环路，你要怎么解？_ip地址_17

R1的路由：

双点双向重分布导致路由环路，你要怎么解？_路由协议_18

最后发现，R5的路由来源于R1,而R1的4.4. 44/32则是来源于R3的RIP。

所以R1这里算是回到正轨了。

那为什么R5会有R1传来的4.4.4. 4/32路由，还是OSPF。

答案是:重分发。

看到这里，相信你对于此问题的理解心中已有八九分。

双点双向重分布导致路由环路，你要怎么解？_路由协议_19

因为上述原因，R3又收到了一份R2发过来的4.4.4.4/32路由。凑巧的是，R3从R4那里学到的4.4.4.4/32度量值metric为1，而R1在做OSPF>RIP重分发时，也指定了metric度量值为1。为此，R3上的4.4.4.4/32同时存在两个下—跳:

双点双向重分布导致路由环路，你要怎么解？_负载均衡_20

现在，我们总算了解清楚为什么R3上有两个下一跳的原因。

接着往下走。

详解R6诡异的ping

上述分析只是解释了R3的下一跳问题，但是开篇提到的最根本问题仍然没有回答。

为什么R6以56.1.1.6为源可以ping 4.4.4.4，但是以6.6.6.6接口地址为源反而不行?

在分析此问题之前，先说说一个背景知识，网络设备如何做负载均衡。

网络设备负载均衡浅谈

双点双向重分布导致路由环路，你要怎么解？_ip地址_21

简单聊完负载均衡以后，回到话题。

对R3来说，去往4.4.4.4有两个下一跳，一个是正确的下一跳R4，另外一个则是错误的下—跳R2。

从负载均衡的特性来看，R6通过不同IP地址ping R4的还回地址4.4.4.4，并得到了不同的结果。

其原因可能就是遭糟遇了负载均衡算法的影响。

那如何证明此猜想是正确的。

还真有办法，方法就是去查阅转发表。

如下所示：

双点双向重分布导致路由环路，你要怎么解？_redis_22

#上述内容为转发表FIB针对4.4.4.4/32的表项

# 接下来就是见证奇迹的时刻。

#我们可以通过一个命令来确认R3针对某个IP源、目标地址组合会采用那一个下一跳。

如下所示：

双点双向重分布导致路由环路，你要怎么解？_redis_23

#上述命令询问R3,要是一个源地址为56.1.1.6目标地址为4.4.4.4的数据包，你选那一个接口？

#R3回答：送它去R4(34.1.1.4)

双点双向重分布导致路由环路，你要怎么解？_ip地址_24

#同理，当源地址为6.6.6.6目标为4.4.4.4的数据包来时。

#R3说，送它去R2(23.1.1.2)

看了上面的输出，瞬间豁然开朗。

原来这就是R6出现如此奇葩i问题的根本原因。

再次证明，当出现某些奇葩问题时，先从每一个环节出发，掌握细节部分，逐个击破。

问题并不—定都是硬件设备故障或者软件BUG。

但是，故事还没有完，请继续。

把偶尔变成必然

双点双向重分布导致路由环路，你要怎么解？_ip地址_25

综上所述，你可能质疑上述实验是一个“巧合”，现实生活中并不一定存在。

让我逐个澄清：

关于重分发度量值为1的情况，其实日常工作环境中，出现的比例相当高。例如在上述RIP网络中，R4后面可能还有更多的网络节点，而这些节点都通过RIP发布网段到网络中，最终导致R3上肯定有某一条路由和R2“"环路""的方式发布过来的度量值相同。

此时问题就发生了

而针对第二项，的确是一个概率性问题，而其导致的问题就是，你不知道什么时候某一个网段不工作了。例如上述案例中是6.6.6.6为源到4.4.4.4不通，但是可能某一天又变为56.1.1.6为源到4.4.4.4不通了。原因是转发表会把之前随机选择的端口记录超时掉，然后重新选择。(就好比打麻将，玩完一局以后洗牌再重来。)

但是，我个人认为上述"所谓的巧合"案例是极其值得分享，至少你遇到此种问题时，知道如何下手分析。

必然发生的网络环路：

最后，再给你演示—个必然发生的网络环路。

再次奉上R3的4.4.4.4路由条目:

双点双向重分布导致路由环路，你要怎么解？_负载均衡_26