【虹科】如何逐跳识别网络问题_网络端到端监控

首先,让我们定义问题。随着网络变得越来越大,它们变得越来越复杂,但为什么呢?好吧,让我们用道路来比喻。假设您有一条穿过城镇的道路,并且像许多小城镇一样,就在它的中间是一个十字路口。没问题,加个红绿灯。但随后城镇发展壮大,修建了更多道路,并设置了另一个十字路口,并设置了另一个红绿灯。然后是另一个,另一个,依此类推。他们很少为成长而计划,即使有计划,他们通常也不得不改变。

每当一个新的十字路口被设置红绿灯时,城市的道路就会变得更加复杂,更难导航和管理。当事故发生时,街道变慢,很难知道原因并修复它。这正是网络发生的情况,除了每个十字路口没有红绿灯,而是有一个路由器或一个开关。而且每增加一个新的网络段,就会增加一个新的交换机或路由器,网络变得更加复杂。根据定义,每次将路由器或交换机添加到网络中,创建一个新网段时,数据包通过该网段所需的时间更长,从而使网络速度变慢。

网络设备简史

到今天,实际上就在几年前,交换机、路由器和防火墙等网络设备的功能非常明确。这是因为它们是使用ASIC和FPGA构建的这是非常明确的。但是这些设备已经取得了长足的进步,并且它们现在越来越多地由软件定义,而不是明确定义。因此,固件中决定如何、何时、为什么以及在何处逐跳路由数据包的算法可以完全改变,而无需更改硬件。这使得限制延迟或其他问题可能发生或由“网络”或“应用程序”引起的区别变得有趣且不那么真实,因为在当今时代,软件定义网络(又名SDN),整个网络就是一个应用程序

好消息是,与每个城市路口的红绿灯不同,每个带有路由器或交换机的网络路口都是一个逐跳识别网络问题的机会。但什么是跳?首先,它不应与 Ihop 混淆,即使在大多数主要交叉路口都有 Ihop,并且通过 Ihop 的延迟可能非常高。在网络世界中,跃点是数据包通过路由器或交换机的行为,而跃点数是数据包在到达目的地的过程中经过的路由器和交换机的数量。由于许多原因(请记住 SDN),它可能非常动态,包括路由器和交换机可以根据 QoS 设置在不同的路由上发送数据包,这可以提高或降低特定协议或人群的网络性能。

如何识别网络问题

但是有一些方法可以逐跳识别网络问题。最基本的是从命令行对 IP 地址或域名使用 tracerte。将向您显示通过路由器和交换机的路径,作为数据包沿途的每一跳,以及每一跳所用的时间。这是一个非常有用的网络故障排除工具,允许 NetOps 团队了解网络的逐跳行为。但它有严重的局限性。首先,它不是真正的流量。这是您正在做的事情,因此 tracerte 数据包可能不会到达真正的应用程序数据包可能已经到达的位置,或者以相同的方式确定了优先级,因此结果可能会有所不同。此外,出于安全原因和好的原因,在交换机和路由器上并不总是启用 tracerte,或允许通过防火墙。

另一种(更好的)逐跳识别网络问题的方法是使用许多路由器和交换机上可用的 NetFlow 和 IPFIX。NetFlow 是Cisco 定义的协议,可提供有关通过路由器或交换机的数据包流的详细信息。IPFIX 是 NetFlow 的公共标准版本。有关NetFlow和 IPFIX 的更多详细信息超出了本文的范围,但它们是引人入胜的主题,应该更好地理解以充分利用它们。我离题了,这里的主要观点是有一些可用的解决方案可以从庞大的网络中的大量路由器和交换机中收集 NetFlow 和 IPFix。这些解决方案直观地显示了数据包所采用的逐跳路由。

虹科LiveNX是卓越的网络监控解决方案,可以收集上千个设备的NetFLow/IPFIX或者Sflow等流信息,在单一的视图进行关联分析,可轻松进行逐条分析。

【虹科】如何逐跳识别网络问题_网络流量监控_02

 

【虹科】如何逐跳识别网络问题_NPM_03

网络监控和主动故障排除解决方案

【虹科】如何逐跳识别网络问题_网络性能监控_04

更高级的解决方案可以显示不同应用程序随时间推移的逐跳路径。更重要的是,高级解决方案可以主动识别逐跳问题并生成警报。这是游戏从对报告的问题进行故障排除到在报告问题之前监控网络的地方。

最后,对于那些没有 NetFlow 和/或 IPFIX 功能的网络部分,有一些解决方案可以接入网络或通过跨端口提供数据包,该端口可以自行生成 IPFIX 并将其发送到 IPFIX收集器。这些高级数据包捕获和 IPFIX 分析解决方案还可以使用大多数路由器和交换机不提供的质量指标来扩展 IPFIX。更重要的是,这些数据包捕获和分析解决方案捕获数据包,因此可用于深入分析数据包并更详细地执行逐跳分析。

【虹科】如何逐跳识别网络问题_网络流量监控_05

来自路由器和交换机的NetFlow 和 IPFIX也可以与数据包捕获和分析设备结合使用,以从路由器和交换机生成的流向下钻取到不同设备上捕获的数据包。这样,一个数据包捕获设备可以用于许多不同的路由器和交换机。

这些用于识别逐跳分析的各种日益先进的方法对于监视和排除逐跳以及许多其他网络行为非常有帮助。当然,随着所选方法变得更加先进和自动化,价格也会上涨。即使您选择开源解决方案,也必须对其进行部署、管理、维护、更新等。而且每种方法都有其需要的地点和时间,这就是为什么了解如何使用所有这些方法很重要的原因。

【虹科】如何逐跳识别网络问题_网络端到端监控_06

虹科提供具有端到端监控分析能力的解决方案LIveNX和数据包捕获分析设备LiveWire/LiveCaapture,两者既可以单独使用也可以集成到一起实现更强大的分析能力。

  • 网络性能监控
  • 应用性能监控
  • 端到端可视化
  • flow到数据包详细分析
  • 高速全流量捕获分析
  • 上百种详细报告
  • 高级异常检测和预测分析