引子
先从三张图开始:
图一,“OSI 7层参考模型”和“TCP/IP模型”。应该都会熟悉,是学计算机相关专业时,怎么都会绕不开的一个知识点。
将要介绍的波分传输系统,在这两个模型中,都位于最底下的那层,也是大部分读者很少会接触到的一层。用“默默”两字来形容,比较贴切。根据模型可以推测,通常位于模型越低的层级,发生异常时,对上层级的影响越大。所以,波分传输系统是如何“保护”生产网络的呢?请带着这个问题,接着往下。
图二,“复兴大桥”。可能有点陌生,是位于中国浙江省杭州市的一座跨钱塘江的大桥,也称“钱江四桥”。这座桥除了夜景很美之外,还是一座双层双主拱的钢管混凝土组合系杆拱桥,上层为快速机动车道,下层是非机动车道和公交车道。
这种双层架构的桥,在占地面积固定的情况下,把桥的整体运输能力提升了一倍。使不同类型的交通工具,在不同的桥面可以同时有序行驶。
图三,“彩虹大桥”。肯定都没见过,是在“复兴大桥”的基础上,通过简单的复制粘贴,生硬地修改出来的桥。该桥在相当不成熟的修图技巧下,轻松突破了物理极限,使之一下子就具备了10层桥面的运输能力。
波分传输系统实现的效果,和这座“彩虹大桥”有些许相似,通过使用了特定的波分传输设备,将一对物理光纤的传输能力,进行几十倍的提升。
还请再看多一眼“彩虹大桥”,因为这座桥和接下来的三个问题,将带你慢慢踏入波分世界的大门。
What?
波分传输系统是什么?
波分,完整的说法是,密集型光波复用(DWDM:Dense Wavelength Division Multiplexing),是一种光波段的波分复用技术。为了充分利用单模光纤1.55μm低损耗区带来的巨大带宽资源,根据波长或频率的不同,将光纤的低损耗区划分为若干个光波道,每个波道设置一个光波作为载波。在发送端,采用光合并复用器将不同规定波长的信号光载波合并起来送入一根光纤进行传输。在接收端,再由一个光分解复用器将这些不同波长承载不同信号的光载波分开。在一对光纤中,可以实现多路光信号的复用传输。因此,能在给定的信息传输容量下,减少所需要的光纤的总数量。
波分传输系统大体可以分成四部分:
OTU(Optical channel Transport Unit),光信道转换单元。负责将数通设备光模块发出来的信号光,转换成特定波长的光。
数通设备是一种相对于传输设备而言的说法,通常是指对IP报文进行数据处理的网络设备,比如交换机,路由器,防火墙等等。数通设备由于涉及的厂商和型号众多,为了能使用光纤相互通信,会遵照标准,使用特定波长的光信号。比如波长为1310nm的光信号(单模)或者波长为850nm的光信号(多模)。
而OTU的作用,就是将这些来自数通设备波长一致的“白光”,翻译转换成特定不同波长的“彩光”,用于下个阶段的合成或分解。
OMU/ODU(Optical Mux/demux Unit),光合/分波复用单元。位于发送端的是OMU,作用是将OTU翻译后的各个不同波长的“彩光”进行合并;在接收端的ODU则相反,对合并后的光进行处理,将其分离成不同波长的“彩光”,使每个波长承载的光信号能被OTU再次翻译回数通设备原来的光信号,完成数据通信。
OA(Optical Amplifier),光放大器。光信号在合波/分波的过程中,会存在功率的衰减。光在介质中传播也是有损耗的,随着传输距离的增加,累积的损耗也会随之增大。
所以在发送端、接收端,必要时在传输的中途,会引入光放大器。将光信号的功率进行放大,以保证整个传输的过程更稳,让传输的距离延长。
波分的监控和管理。波分在传输的过程中,会使用一个独立于业务波道的波长,来对传输的过程进行监控和管理信息的同步。而波分设备,就是这些功能的具体硬件载体。通过波分网管系统,管理所有的波分设备:对硬件设备进行配置下发和同步,对硬件设备上报的告警进行确认和处理,对硬件设备的功率和状态进行采集等等。生产网络中,对具备能力的波分网管,已经引入了ARM服务器和NCE的国产化组合。
再简单介绍下波分设备的三种常见形态:
小型波分:体积小,耗电少,交流/直流电都能对应支持,安装灵活。传输的总带宽相对较低。
大型波分:体积大,耗电多,通常只支持低压直流电,要改造机柜,安装繁琐。传输的总带宽相对较高。
盒式波分:形态和服务器类似,是一种新形态的波分设备,支持交流和高压直流电,安装方便。传输总带宽相对较高。
How?
生产网络是如何使用波分传输系统的?
通过三角形,来对波分传输系统的平衡有个初步的认知。
下面是熟悉的“项目管理三角形”,每个项目都要平衡由时间、成本和范围组成的“三角形” ,若更改其中一项,就会影响另外至少一项。项目管理需要维持三角形的平衡。
在“项目三角形”的基础上,把“范围”更换成 “能力”,就可以得到一个“波分三角形”。
成本,指的搭建系统需要花费的资金成本和时间成本;
时间,指故障时,系统恢复信号传输能力所需要的时间;
能力,指系统的传输带宽能力,及所具备的其他功能。
随着技术的迭代升级,“波分三角形”中三个条件的牵制会逐步减少,但规律依然存在。
服务于银行生产网络的波分传输系统,最看重的是“时间”,即故障发生时,对业务的影响时间越少越好。
具体怎么去实现呢?
1、架构选择
一个生产机房,分别通过两对光纤连接其他两个生产机房,也配合了数通设备层面的冗余。即单个机房,会使用四对光纤和其他机房进行数据传输。这四对光纤,被平均分成两个平面。两个不同的平面,严格按照不同的物理路径进行分离,并且在具备资源的情况下,会继续将同一平面内的两对光纤再进行物理路径的尽量分离。两个机房之间的传输,除了使用不同平面的光纤外,还会借助另一个生产机房的波道进行穿通,来提高冗余度。
这样是为了提高,挖掘机一铲子下去,或打桩机一桩锤下去后,机房涉及光纤的存活概率。
2、保护使用
生产网的波分传输系统,使用的是光层保护。该保护方式,会将传输的光信号复制成两份,通过两对不同平面的光纤分别送达目的站点。正常情况下,会选择主用光纤传递过来的那份信号。一旦主用光纤故障,则会在50ms内自动将光信号切换到备用的那对光纤上。切到备用光纤后,数通设备的端口随即恢复,传输的带宽也恢复正常。结合上面的架构选择,单个生产机房在极端情况下,最多可同时承受三对不同光纤的中断,而业务不受影响。
在光层保护上也做了进一步区分:在重要的生产交易机房,选用“线路侧1+1保护”,即在OTU翻译时,会将翻译后的光信号输出两份,对每一个波道进行1+1保护,让冗余性更高;而在对实时性要求不高的功能机房中,则选用 “主光侧1+1保护”,针对合波之后的主用光纤进行1+1保护,在能应对绝大多数故障场景的基础上,可简化运维和降低成本。
3、成熟可靠
对于波分硬件的选择,生产网络中引入的是国内传输厂商的小型波分设备,选用的是被市场长时间检验过的成熟可靠的产品型号。软硬件版本相对稳定,可减少因软硬件版本变动而带来的对业务可能有影响的变更次数;异常的案例库相对齐全,遇到问题时有可参考的快速解决方案。最后,这些成熟的型号已完成国产化,在供应上也相对自主可靠。
Why?
为什么银行生产网络要使用波分传输系统?
因为在依赖光纤进行跨机房传输的场景下,使用波分传输系统能解决一些问题:
降低光纤故障对业务的影响。租用的运营商光纤,平均故障修复时间大约是160min,而应用波分传输系统的光层保护后,光信号的恢复时间会降低至50ms以内。极大地减少了光纤故障时,业务带宽恢复所需要的时间。另外,运营商在修复光纤时,可能会产生一阵时断时通的抖动。在波分传输系统的启用保护后,光信号会自动切换到备用光纤上,修复过程中主用光纤的抖动也就自然地被屏蔽掉了,避免了光纤修复过程中对业务的二次影响。
减少传输成本。在超过10G带宽的跨机房传输场景下,使用运营商的专线成本会非常高。所以在生产网络建设初期,大带宽的跨机房数据传输,采取租用光纤和数通长距光模块的组合来实现。但随着跨机房带宽需求的增加以及网络架构的迭代,光纤租用的需求数量也会随之增加,带来更大的成本。
引入波分传输系统后,可在一对光纤上传输40/80对光纤的内容,大大地减少租用光纤的数量,直接节约了生产网在传输上所花费的成本。而且需要使用的带宽越多,波分传输系统带来的成本优势就越大。
增加传输距离。数通设备的光模块对光纤的距离(对应衰耗)是有要求的,成熟的商用产品通常支持的距离是在100km以内。而波分传输系统,在使用光/电中继站对信号的放大后,可轻松突破这个距离,扩展了生产机房的选址范围。
简单总结起来,波分传输系统给生产网络带来的好处就是:恢复快,更便宜,传得远。
写在最后
很开心有机会能借助TCTP公众号的平台,让大家对日常基本上不会直接触到的波分传输系统,可能有了一个初步的认知了,吧?从是什么,到怎么用,也回答了为什么要。这套系统能直接守护我行的生产网络,也间接地让业务运行得更好更稳定。
网络,从概率上来看,是不可能永远不会断的。而网络运维室,一直努力的方向就是,让网络中断的概率尽可能地降低,让业务对网络故障的感知尽可能减少,默默地守护好业务。然后再顺便做几个策略单。
希望看了这篇文章的你,以后在看到被挖开的道路,或地面上裸露的光缆时,能偶尔想起还有波分传输系统存在~
最后,还记得文章里的那座“彩虹大桥”,有几层呢?