文章目录
- 前言
- MPLS概述
- MPLS基本网络结构
- MPLS体系结构
- MPLS包头结构
- 抓包现象
- LSP建立过程
- LSP建立方式
- 静态LSP
- 动态LSP
- LSP会话建立
- LDP邻居发现
- LDP邻居建立
- 标签的发布方式
- 标签的分配方式
- 标签的保存方式
- LDP建立LSP过程
- MPLS数据转发过程
- 特殊标签
- 实验配置
前言
在90年代中期,当时路由器技术的发展远远滞后于网络的发展速度与规模,主要表现在转发效率低下、无法提供QOS保证。原因是:当时路由查找算法使用最长匹配原则,必须使用软件查找;而IP的本质就是“只关心过程,不注重结果”的“尽力而为”。当时江湖上流行一种论调:过于简单的IP技术无法承载网络的未来,基于IP技术的因特网必将在几年之后崩溃。
在各种方案中,IETF确定MPLS协议作为标准的协议。MPLS采用短而定长的标签进行数据转发,大大提高了硬件限制下的转发能力;而且MPLS可以扩展到多种网络协议(如IPv6,IPX等)。
MPLS概述
MPLS协议从各种链路层协议(如PPP、ATM、帧中继、以太网等)得到链路层服务,又为网络层提供面向连接的服务。MPLS能从IP路由协议和控制协议中得到支持,路由功能强大、灵活,可以满足各种新应用对网络的要求。
我们将分为以下两部分讲解MPLS协议:
MPLS的基本结构;
MPLS LSP的建立过程和数据的转发过程。
MPLS基本网络结构
在MPLS网络中,路由器的角色分为两种:
LER(Label Edge Router): 在MPLS网络中,用于标签的压入或弹出,如上图中的RTB,RTD。
LSR(Label Switched Router):在MPLS网络中,用于标签的交换,如图中的RTC。
根据数据流的方向,LSP的入口LER被称为入节点(Ingress);位于LSP中间的LSR被称为中间节点(Transit);LSP的出口LER被称为出节点(Egress)。
MPLS报文由Ingress发往Transit,则Ingress是Transit的上游节点,Transit是Ingress的下游节点;同理,Transit是Egress的上游节点,Egress是Transit的下游节点。
MPLS作为一种分类转发技术,将具有相同转发处理方式的报文分为一类,称该类报文为一个FEC(Forwarding Equivalent Class)。
FEC的划分方式非常灵活,可以是以源地址、目的地址、源端口、目的端口、协议类型或VPN等为划分依据的任意组合。
MPLS体系结构
控制平面:负责产生和维护路由信息以及标签信息。
路由信息表RIB(Routing Information Base):由IP路由协议(IP Routing Protocol)生成,用于选择路由。
标签分发协议LDP(Label Distribution Protocol):负责标签的分配、标签转发信息表的建立、标签交换路径的建立、拆除等工作。
标签信息表LIB(Label Information Base):由标签分发协议生成,用于管理标签信息。
转发平面:即数据平面(Data Plane),负责普通IP报文的转发以及带MPLS标签报文的转发。
转发信息表FIB(Forwarding Information Base):从RIB提取必要的路由信息生成,负责普通IP报文的转发。
标签转发信息表LFIB(Label Forwarding Information Base):简称标签转发表,由标签分发协议建立LFIB,负责带MPLS标签报文的转发。
MPLS路由器上,报文的转发过程:
当收到普通IP报文时,查找FIB表,如果Tunnel ID为0x0,则进行普通IP转发;如果查找FIB表,Tunnel ID为非0x0,则进行MPLS转发。
当收到带标签的报文时,查找LFIB表,如果对应的出标签是普通标签,则进行MPLS转发;查找LFIB表,如果对应的出标签是特殊标签,如标签3,则将报文的标签去掉,进行IP转发。
MPLS包头结构
MPLS标签封装在链路层和网络层之间,可以支持任意的链路层协议,MPLS标签的长度为4个字节,共分4个字段:
Label:20bit,标签值域;
Exp:3bit,用于扩展。现在通常用做CoS(Class of Service),当设备发生阻塞时,优先发送优先级高的报文;
S:1bit,栈底标识。MPLS支持多层标签,即标签嵌套。S值为1时表明为最底层标签;
TTL:8bit,和IP报文中的TTL(Time To Live)意义相同。
标签空间是指标签的取值范围。标签空间划分如下:
0~15:特殊标签。如标签3,称为隐式空标签,用于倒数第二跳弹出;
16~1023:静态LSP和静态CR-LSP(Constraint-based Routed Label Switched Path)共享的标签空间;
1024及以上:LDP、RSVP-TE(Resource Reservation Protocol-Traffic Engineering)、MP-BGP(MultiProtocol Border Gateway Protocol)等动态信令协议的标签空间。
抓包现象
LSP建立过程
LSP建立方式
静态LSP:用户通过手工方式各个转发等价类分配标签建立转发隧道;
动态LSP:通过标签发布协议动态建立转发隧道;
静态LSP
特点:
1)不使用标签发布协议,不需要交互控制报文,资源消耗较小;
2)通过静态建立的LSP不能根据网络拓扑变化动态调整,需要管理员干涉;
3)静态LSP适用于拓扑结构简单并且稳定的网络;
如图所示拓扑,MPLS网络中有一个100.1.1.1/32的用户,静态为该路由建立一条LSP,配置过程如下:
配置LSR ID用来在网络中唯一标识一个MPLS路由器。缺省没有配置LSR ID,必须手工配置。为了提高网络的可靠性,推荐使用LSR某个Loopback接口的地址作为LSR ID。
mpls lsr-id lsr-id //配置本节点的LSR ID
如果要修改已经配置的LSR ID,必须先在系统视图下执行undo mpls命令。
执行undo mpls命令会删除所有MPLS配置,导致MPLS业务中断。因此,请配置前对网络中每个LSR的LSR ID进行统一规划,避免出现修改LSR ID的情况。
使能MPLS
system-view
mpls //进入MPLS视图
interface interface-type interface-number //配置需要转发MPLS报文的接口
mpls //使能接口的MPLS,默认情况下,接口的MPLS能力处于未使能状态
动态LSP
动态LSP:动态LSP通过LDP协议实现对FEC的分类、标签的分配及LSP的建立和维护等操作;
特点:
1)、组网配置简单,易管理与维护;
2)、支持基于路由动态建立LSP,网络拓扑变化时,可以及时反映网络情况;
如图所示拓扑:
1)、Egress路由器RTD为本地存在的路由分配标签,并将路由和标签的绑定关系主动发送给上游邻居路由器RTC;
2)、路由器RTC收到下游邻居路由器RTD的路由和标签的绑定关系后,将其记录到LIB中,并将自己分配的标签和路由的绑定关系发送给上游邻居路由器RTB;
3)、RTB执行相同的动作将标签和路由的绑定关系发送给上游邻居路由器RTA,RTA为Ingress路由器,没有上游邻居,因此动态的LSP完成建立;
LSP会话建立
LDP邻居发现
当两台设备使能了MPLS和MPLS LDP后,LSR通过周期性(5S)地发送Hello消息表名自己的存在,这个消息是封装在UDP报文中,源目端口都为646,该消息的目的IP地址为组播IP地址224.0.0.2(224.0.0.2是所有路由器或者三层交换机都会监听的)。
LDP的Hello消息中,携带有Transport Address字段,该字段与设备配置的LSR ID一致,利用Hello里面的Transport ID来建立三次握手。
传输地址较大的一方作为主动方,发起TCP连接。RTB作为主动方发起TCP连接,RTA作为被动方等待对方发起连接。
LDP邻居建立
LDP协议主要使用四类消息:
发现(Discovery)消息:用于通告和维护网络中邻居的存在,如Hello消息。
会话(Session)消息:用于建立、维护和终止LDP对等体之间的会话,如Initialization消息、Keepalive消息。
通告(Advertisement)消息:用于创建、改变和删除FEC的标签映射,如Address消息、Label Mapping消息。
通知(Notification)消息:用于提供建议性的消息和差错通知。
LDP邻居建立过程如图所示:
1)、两个LSR之间互相发送Hello消息,Hello消息中携带传输地址,双方使用传输地址建立LDP会话。
2)、传输地址较大的一方作为主动方,发起TCP连接,如图所示,RTB作为主动方发起TCP连接,RTA作为被动方等待对方发起连接。
3)、TCP连接建立成功后,由主动方RTB发送初始化消息,协商建立LDP会话的相关参数。LDP会话的相关参数包括LDP协议版本、标签分发方式、Keepalive保持定时器的值、最大PDU长度和标签空间等。
4)、被动方RTA收到初始化消息后,如果RTA接受相关参数,则发送初始化消息,同时发送Keepalive消息给主动方RTB。如果被动方RTA不能接受相关参数,则发送Notification消息终止LDP会话的建立。
5)、主动方RTB收到初始化消息后,接受相关参数,则发送Keepalive消息给被动方RTA。如果主动方RTB不能接受相关参数,则发送Notification消息给被动方RTA终止LDP会话的建立。
6)、当双方都收到对端的Keepalive消息后,LDP会话建立成功。LDP会话建立成功后,进行FEC的创建与标签的分发。
标签的发布方式
1)、DU(Downstream Unsolicited,下游自主方式)华为设备默认采用DU的方式发布标签;
DU方式可以直接向邻居分配标签。在网络拓扑发生变化时,采用DU方式可以快速反应为新的拓扑分发标签,收敛时间相对于DoD方式较短;
2)、DoD(Downstream on Demand,下游按需方式)配置DoD的标签发布方式 ;
DoD方式需要邻居发送请求标签后,才会为其分发标签;
如图所示拓扑:
采用DU方式分发标签,对于目的地址为100.1.1.1/32的分组,下游RTD(Egress)通过标签映射消息主动向上游RTC(Transit)通告自己主机路由100.1.1.1/32的标签;
采用DoD方式分发标签,对于目的地址为100.1.1.1/32的分组,上游RTC(Transit)向下游发送标签请求消息,下游RTD(Egress)收到标签请求消息后,才会向上游发送标签映射消息;
标签的分配方式
1)、Independent(独立标签分配控制方式):本地LSR可以自主地分配一个标签绑定到某个IP分组,并通告给上游LSR,而无需等待下游的标签;
2)、Ordered(有序标签分配控制方式):只有当该LSR已经具有此IP分组的下一跳的标签,或者该LSR就是该IP分组的出节点时,该LSR才可以向上游发送此IP分组的标签。目前设备只支持Ordered;
如图所示拓扑:
采用Independent方式:
如果标签发布方式为DU,且标签分配控制方式为Independent,则RTC(Transit)无需等待下游RTD(Egress)的标签,就会直接向上游RTB分发标签。
如果标签发布方式为DoD,且标签分配控制方式为Independent,则发送标签请求的RTB(Transit)的直连下游RTC(Transit)会直接回应标签,而不必等待来自下游RTD(Egress)的标签。
采用Ordered方式:
如果标签发布方式为DU,且标签分配控制方式为Ordered,则RTC(Transit)只有收到下游RTD(Egress)的标签,才会向上游RTB分发标签。
如果标签发布方式为DoD,且标签分配控制方式为Ordered,则发送标签请求的RTB(Transit)的直连下游RTC(Transit)只有收到下游RTD(Egress)的标签,才会向上游RTB分发标签。
标签的保存方式
标签的保持方式:
Liberal(自由标签保持方式):对于从邻居LSR收到的标签映射,无论邻居LSR是不是自己的下一跳都保留。
Conservative(保守标签保持方式):对于从邻居LSR收到的标签映射,只有当邻居LSR是自己的下一跳时才保留。
当网络拓扑变化引起下一跳邻居改变时:
使用自由标签保持方式,LSR可以直接利用原来非下一跳邻居发来的标签,迅速重建LSP,但需要更多的内存和标签空间。
使用保守标签保持方式,LSR只保留来自下一跳邻居的标签,节省了内存和标签空间,但LSP的重建会比较慢。
如图所示:路由表中,RTB通过RTD到达100.1.1.1/32的路径最优,RTB从RTC收到分配给100.1.1.1/32的标签处理方式有以下两种:
一是RTB保留从RTC收到的标签信息,二是RTB不保留从RTC收到的标签信息,前者称为Liberal方式,后者称为Conservative方式。
LDP建立LSP过程
IGP协议负责实现MPLS网络内路由可达,为FEC的分组提供路由;
LDP协议负责实现对FEC的分类、标签的分配以及LSP的建立和维护等操作;
如图所示拓扑,LDP动态建立LSP的过程如下:
1)、RTD上存在100.1.1.1/32的主机路由,因为RTD是Egress节点,所以直接向自己上游邻居RTC发布100.1.1.1/32与标签的绑定关系;
2)、RTC收到下游邻居RTD分配的100.1.1.1/32与标签的绑定关系后,将标签记录在自己的LIB表中,并向上游邻居RTB发布100.1.1.1/32与标签的绑定关系,同时RTC查看自己IP路由表中到达100.1.1.1/32的下一跳是否为RTD,如果IP路由表中的下一跳为RTD,则RTC使用RTD分配的标签封装到达100.1.1.1/32的数据;如果IP路由表中的下一跳不是RTD,则RTC保留RTD分配的标签作为备用标签;
3)、RTB收到下游邻居RTC分配的100.1.1.1/32与标签的绑定关系后,执行与RTC相同的动作;
4)、RTA收到下有邻居RTB分配的100.1.1.1/32与标签的绑定关系后,查看自己IP路由表中到达100.1.1.1/32的下一跳是否为RTB,如果IP路由表中的下一跳为RTB,则RTA使用RTB分配的标签封装到达100.1.1.1/32的数据;如果IP路由表中的下一跳不是RTB,则RTA保留RTB分配的标签作为备用。因为RTA为Ingress,最终到达100.1.1.1/32的LSP完成建立。
基本配置
mpls lsr-id lsr-id //配置本节点的LSR ID
mpls //使能全局MPLS功能,并进入MPLS视图;
mpls ldp //使能全局的LDP功能,并进入MPLS-LDP视图;
interface interface-type interface-number //进入需要建立LDP会话的接口视图;
mpls //使能接口的MPLS能力;
mpls ldp //使能接口的MPLS LDP能力。
MPLS数据转发过程
在MPLS网络中,数据包在每台路由器上根据已分配的标签进行标签的封装和转发;
分析数据包到达Egress节点RTD上怎么处理?如果MPLS网络中业务量很大,Egress节点的处理方式有何不妥?
如图所示拓扑,MPLS数据转发过程如下:
1)、RTA上收到访问100.1.1.1/32的数据包,如果数据包为普通的IP报文,则查找FIB表,因为Tunnel ID为非0x0,封装已分配的标签1027进行MPLS转发;如果数据包为带标签的报文,查找LFIB表,封装已分配的标签1027进行MPLS转发;
2)、RTB收到RTA发送的带标签1027的报文,查找LFIB表,封装已分配的出标签1026进行MPLS转发给RTC;
3)、RTC收到RTB发送的带标签1026的报文,查找LFIB表,封装已分配的出标签1025进行MPLS转发给RTD;
4)、RTD收到RTC发送的带标签1025的报文,查找LFIB表,出标签为Null,表明数据包已经到达Egress节点,所以路由器将数据包的标签信息去掉,并对数据包进行三层处理,查找IP路由表发现100.1.1.1/32的路由为自己本地的路由,根据IP路由表中的出接口进行IP数据的封装并转发。
如果MPLS网络中的业务量很大,则每次数据包在Egress节点都要进行两次处理才能进行正确的路由转发,这样会导致Egress节点的处理压力增加,路由器的处理性能降低。我们希望在Egress节点上只处理一次就能将数据包正确转发,以提高Egress的转发性能,所以提出了PHP技术。
特殊标签
3标签:别名为PHP(Penultimate Hop Popping,倒数第二跳弹出),具体过程如下:
RTC收到RTB发送的带标签1026的报文,查找LFIB表,发现分配的出标签为隐式空标签3,于是执行弹出标签的动作,并将IP数据包转发给下游路由器RTD;
RTD收到RTC发送的IP报文,直接查找自己的FIB表,根据FIB表中的出接口进行IP数据的封装并转发;
0标签
0标签:别名IPv4 Explicit NULL Label(显示空标签0)表示该标签必须被弹出(即标签被剥掉),且报文的转发必须基于IPv4;
实验配置
本实验模拟BGP路由黑洞,用MPLS解决黑洞问题;
1)、AS200内部配置OSPF,进程1,区域0,RID手动配置L0地址,宣告接口地址,使用通配符0.0.0.0;
#
R2
#
ospf 1 router-id 2.2.2.2
area 0
network 2.2.2.2 0.0.0.0
network 23.1.1.2 0.0.0.0
#
R3
#
ospf 1 router-id 3.3.3.3
area 0
network 3.3.3.3 0.0.0.0
network 23.1.1.3 0.0.0.0
network 34.1.1.3 0.0.0.0
#
R4
ospf 1 router-id 4.4.4.4
area 0
network 34.1.1.4 0.0.0.0
#
2)、建立BGP邻居关系;
R2/4使用L0建立ibgp关系;
R1/2,R4/5分别使用物理接口建立ebgp邻居;
R1宣告1.1.1.1/32,R5宣告5.5.5.5/32,起源属性‘i’;
R1
bgp 100
peer 12.1.1.2 as-number 200
network 1.1.1.1 255.255.255.255
R 2
bgp 200
peer 4.4.4.4 as-number 200
peer 4.4.4.4 connect-interface loopBack0
peer 12.1.1.1 as-number 100
peer 4.4.4.4 enable
peer 4.4.4.4 next-hop-local
R5
bgp 300
peer 45.1.1.4 as-number 200
network 5.5.5.5 255.255.255.255
3)、配置MPLS LDP
AS200为MPLS域,在R2/3/4上配置LDP;
R2
mpls lsr-id 2.2.2.2.2
mpls
mpls ldp
interface g 0/0/1
mpls
mpls ldp
R3
mpls lsr-id 3.3.3.3
mpls
mpls ldp
interface g 0/0/1
mpls
mpls ldp
interface g 0/0/0
mpls
mpls ldp
R4
mpls lsr-id 4.4.4.4
mpls
mpls ldp
interface g 0/0/0
mpls
mpls ldp
4)、R2/4上配置命令,使得BGP路由可以‘借用’下一跳地址的标签
route recursice-lookup tunel
5)、在R1ping -a 1.1.1.1 5.5.5.5 使用 display mpls lsp 查看R2/4lsp