PTP实现网络高精度

精选转载

alision082 2014-09-12 10:20:54

文章标签 PTP 文章分类 网络安全

1.0 简介

美国国家半导体的DP83640精密PHYTER?实现了IEEE 1588精密时间协议（PTP）的时钟关键部分，允许高精度 IEEE 1588节点实现。当使用包含IEEE1588功能器件、边界时钟和透明时钟的网络时，利用非常简单的时钟伺服算法来确定速率调整和时间校正，可以获得非常高的精度。不需要复杂处理，只需要对协议测量进行简单平均或滤波即可。当网路由不具有IEEE 1588能力的器件构成时，包延时偏差（PDV）就很重要。简单时钟伺服不会提供很高精度的同步。

本文描述了一种同步方法，它可以为较大PDV系统带来更高的同步精度。这里描述的方法试图检测最小延时，或 “幸运包”。这个方法还利用了DP83640 时钟控制机理来独立控制时钟速率和时间校正，从而将时钟时间精度内的过冲和摆动降低到最小。

2.0 背景

IEEE1588精确时间协议给从机提供了基本信息，用以确定相对于最高级主时钟的频率以及时间偏差。基本算法包括使用各自的同步和延时请求消息来测量主机到从机之间和从机到主机的路径延时。图1显示了最基本的IEEE 1588的时序图。

PTP实现网络高精度_PTP

主机到从机和从机到主机的延时为：

MSdelay = t2 - t1

SMdelay = t4 –t3

单向延时或称为平均路径延时正是这两个延时的平均值

MeanPathDelay = (MSdelay + SMdelay)/2

理想情况下，时间偏移为：

offset_from_master = MSdelay – meanPathDelay

在包含支持IEEE-1588网络元件（桥、开关、路由器）的网络中，包延时偏差基本上可以忽略。在边界时钟器件中，同步时钟在网络元件上得以保持，它与上游主机同步时间和速率，并充当下游器件的主机。在透明时钟器件中，因为PTP报文要经过这个器件，所以通过测量其停留时间来校正包延时偏差。

PTP实现网络高精度_PTP_02

在无1588能力的网络中不做补偿，导致包延时变量大概是几十或几百微妙的数量级。这些延时变得非常明显，使得单一测量极度不正确。

在使用只有简单平均和滤波的基本算法的单开关条件下，得到了图2在80%流量条件下的MTIE（最大时间间隔误差）测试波形。很容易看到，这种方法提供了相对较差的同步，其误差达到100ms之大。

2.1 建议算法

在无1588能力元件的网络中，包延时可能在每个器件的最小物理延时和通过每个器件的最大延时总和的范围内变化。实践中，每个设备经常会有最小传输延时，因此主机到从机产生最小的总包延时。基本操作是尝试检测最小延时，或者“幸运延时”，利用这些包的结果进行速率和时间校正。算法基本上可分为三级：平均路径延时测量、速率校正和时间校正。

2.1.1 平均路径延时测量

在大多数网络中，最小路径延时是相对恒定的值。再次配置网络能够引起步长变化，但是这种配置并不是经常性的。因此有可能采用长期跟踪最小环回延时（即全部的同步延时请求计算）的方式来检测最小平均路径。这种方法保持最后N个平均路径延时测量记录，并从中找到最小值：

Min_meanPathDelay(n) = min(meanPathDelay[n+1-N:n]

其中，Min_meanPathDelay(n)为第n次测量记录中保留的N个数据中的最小值。

进行速率校正和时间校正时确定最小平均路径是关键。

2.1.2 速率校正

速率校正通过测量跟随的同步周期并测量每个消息从主机开始与到达从机之间的差异进行。这给出了从机频率相对于主机频率的一个基本比值并可以用来校正频率差。因为包延时偏差可能很明显，这可能使任何单一的速率测量有很大的不精确性。

例如，如果同步周期每秒8个同步，误差在 125ms内可能是100us或者接近1000ppm。如果算法是平均所有速率测量，也许需要成百上千秒来测量速率以得到合理的估算。使用低廉的振荡器时会发生短期频率变化，平均时间较长会导致不能对这种频率变化进行控制。可替代的方法是，建议的算法利用平均路径延时测量来检测短时等待包时，只使用这些包检测对主机的频率偏移。

如果包满足一个好的最小环回延时要求，通过比较上一个 “好包”时间来测量速率。*估“好包”时，需要在质量和数量上进行权衡。如果质量过于严格，就可能无法获得足够的信息来跟踪频率变化。但如果不够严格，速率计算结果中可能包含过量的偏差。

图3表明用于决定速率的同步消息之间的最基本的关系。

PTP实现网络高精度_PTP_03

从这个图中，速率比值为

rate_ratio(n) = (T2(n) – T2) / (T1(n) –T1)

另外，为准备另一个测量，需要设置：

T1=T1(n)，T2=T2(n)

由于测量中存在误差，仍然需要一些平均或滤波测量。

为了简化，使用指数移动平均或平滑函数来跟踪速率。这个等式为：

rate_avg(n) = Rate_avg(n-1)

+α(rate_ratio(n) – rate_avg(n-1))

α的典型值通常设为0.1，但是在某些诸如提高或降低速率的延长周期场合，这个值可能会有所增加。

2.1.3 时间校正

确定时间偏移的典型方法是使用同步消息来确定对主机的偏差。常使用平均或滤波的方式来平滑连接，并避免每次测量的过量校正。对于时间校正来说，利用两个不同的机制来检测和校正时间偏差。

第一个机制的基本想法是寻找最小延时。基本算法是在最近的延时中检测最小的主机到从机的延时。为防止过量校正，也对时间校正进行了限制。这种算法依赖于大量的同步消息，比IEEE－1588网络本身需要的同步报文更多。另外，在延时请求测量之后，算法可能使用主机到从机延时或从机到主机延时中产生更小偏差的一个延时。在一个方向的流量变得拥堵的情况下，另一个方向可以提供更精确的时间偏差的测量。这个方法基于它拥有的最好信息而在每个周期都进行校正。如果没有收到真实的最小延时消息报文，这将导致不适当的校正。原因是算法不能确定测量误差是由时间偏差还是由包延时偏差引起的。

第二个时间校正机制是尝试只使用延时来进行校正，前提是这些延时已经确定为真实最小延时包。它有助于避免对时间值的无效校正。这个机制的基本想法是使用同步和延时请求来进行时间校正。对于同步消息，如果主机到从机延时小于最小平均路径延时，测量结果就显示至少有一个主机到从机延时减去最小平均路径延时的时间偏差。这种情况下，时间校正是基于偏差测量进行的。如果主机到从机的延时高于最小平均路径延时，无法知道误差是由时间偏差引起的还是包延时偏差引起的，所以不会做校正。对于延时请求消息也相似，如果从机到主机的延时小于最小平均路径延时，测量结果就显示有至少为平均路径延时减去从机到主机延时的时间偏差发生。注意，这里检测到的时间偏差是正的，而主机到从机延时测量中的结果是负的。

两个方法都是通过调节一段时间内的精准时间协议的时钟速率来进行时间校正。为了避免速率的大波动，每一个校正都限制幅值。这将有助于降低由于时间偏移的快速校正而引起的时间间隔误差。在第二个机理中通过保持时间误差值进行处理。当因接收到的同步或延时请求引起的新误差计算出来时，如果这个新误差代表了一个更大的偏差，时间误差就更新为新值。否则，时间误差保持不变。基于时间误差，只能进行有限的校正并从时间误差中去除。因此，在完成校正之前，偏移测量可能进行多次校正。

PTP实现网络高精度_PTP_04

第二个机理很少有无效的校正，但是呈现出更长的无校正周期；基于速率校正误差，很可能会出现漂移。尽管第二个机理在重流量和多开关的条件下显得更好，但两者的总体结果相似。由于第二个机理产生更好的结果，结论部分详述这些结果。

3.0 测试平台

测试时钟伺服算法的*估平台是基于FPGA的常规*估平台，ALP（模拟测试发射平台）。ALP平台包含一个小的 FPGA来实现MAC接口、数据包缓冲和与DP83640以太网物理层设备进行通讯的MDIO管理界面。ALP板子包括与PC主机通讯的USB接口。在PC主机上，ALP软件运行PTP协议来建立和分析包并控制PHY中的PTP硬件的操作。ALP平台合并了支持两个独立的PHY器件的逻辑和连接。

测试平台对包和控制的处理能力进行了限制，它限制了可以处理的同步周期的数量。每秒多达8个同步脉冲时同步工作良好，但是超过这个值则不能维持速率。由于电信和其它的应用需要的速率是每秒大约100个同步消息，这个平台不能提供嵌入式平台能够提供的相同等级下的同步。DP83640 硬件没有限制器件工作在更高同步速率环境中的器件。

这个限制特殊针对*估平台。 ALP平台提供了一个GUI和支持Python脚本语言的脚本机理。通过ALP GUI，在Python中运行PTPv2协议和时钟伺服算法可以得到全面测试。

对于最简单的测试，由单HP网络设备开关组成网络。使用独立的ALP平台并设置为想提供网络的规定比例利用率的开关发送广播流量来产生额外的流量。针对有主机、从机之间三个开关组成的网络的测试也做过。

PTP主机使用一个OCXO作为参考时钟源，PTP从机使用的是一个廉价TCXO参考。

4.0 测试结果

建议算法通过流量负载达到80%以上的单开关或者多开关来测试性能。设定主机每秒发送8个同步消息，而从机相对于每个同步消息，发送一个延时-响应消息。流量负荷通过随机大小的广播包来产生，变化内部包间隔以产生特定流量。流量通过测试网络中的一个开关的可用端口引入。时间误差数据采用DP83640 PTP主机的事件时间戳能力来捕获并保存以备*估。除计算标准偏差外，在每个流量条件下，还产生 MTIE和TDEV（时间偏差）图。测试持续时间最短为4小时，最长为8小时。

PTP实现网络高精度_PTP_05

4.1 单开关结果

下图显示了单开关在20%，50%和80%流量负载时的 MTIE，TDEV的结果。除了测试结果，测试图形还显示了通信规格中的两个屏蔽。这个结论很容易满足G.823对于PDH 接口的要求，但不能完全满足G.811 PRC要求。需要进一步优化，尤其是提高同步速度，来满足PRC要求。

PTP实现网络高精度_PTP_06

4.2 多开关测试

测试是在三个开关网络中完成的，三个开关由一个DLink DES1105 5端口开关、一个Linksys SD205 5端口开关和一个 HP网络设备8000M组成。测试结果是在三个开关20%，50% 的利用率，流量注入到第三个开关的条件下得到的。如所期望，这个结果不如单开关好，但是仍然显示出所示满足规格的潜力。如下图形表明不同流量条件下的MTIE和TDEV。

PTP实现网络高精度_PTP_07

4.3 其它测试结果

虽然没有得到具体的结果，但是算法表现为对流量在0到 80%之间变化的良好响应。如果流量超过80%，算法仍然需要精简以便处理明显更少的最小延时包。

PTP实现网络高精度_PTP_08

5.0 其它机会

这个文档描述了一种工作算法，但仍有很大可能在将来的开发中提高和测试这种算法。以下列出了一些可能：增加同步速率：增加同步速率需要将平台移到可以支持更高包速率，可能达到100同步/秒或者更高这样的平台上。这可能需要移到诸如飞思卡尔的MCF5234BCCKIT Coldfire 这样的嵌入式平台。

PTP实现网络高精度_PTP_09

这样做允许对算法进行很多改进，例如为每个速率和时钟校正做许多延时测量等。改善速率适应性：一些最大误差是由于算法在跟踪本地振荡器频率变换时的响应缓慢造成的。跟踪速率并且进行调整的改进算法在整体结果上具有很大的提高。更大的网络上测试：具有更多实际流量条件的更大网络上进行扩展测试。

VLAN标签上测试：使能VLAN标签、允许基于VLAN优先级域，处理PTP包的IEEE802.1Q优先级可以提高测试结果。

6.0 结论

这个文档描述了由无IEEE1588能力的器件组成的网络中，使用DP83640以太网物理层设备来同步时钟的一种算法。此算法虽然不能在所有条件下提供完整的解决方案，但表明了这种解决方案的可行性。每秒8个同步消息条件下，系统可以准确的在重负载单开关中进行同步。在更大的同步消息速度下，期望这个算法在更大的网络中有更高的精确等级。