网络通信 频道

SNC保护在故障测试定位中的应用

  SNC保护即子网连接保护,是通道保护的一种,当工作在单端倒换、不可恢复和1+1方式下时,无需启动协议,实现起来简单,倒换速度快,因此得到广泛应用。

  SNC保护的工作原理是“双发选收”,即发端桥接工作信道和保护信道,收端选取其中质量较好的一路信道。发端的桥接可以看作广播,使工作信道和保护信道都承载业务信号,我们可以通过对保护信道的测试来获取业务信号的信息而不会影响业务的正常使用。由于多数厂商支持不中断业务的SNC保护,因此,我们可以利用这种方法实现对业务的在线监测。

  这里介绍一次利用SNC保护对故障进行测试和定位的实例,其测试方法具有一定的实用意义,希望能为广大传输网络维护工作者提供借鉴。

1、故障现象

  2 Mbit/s电路故障,在SDH网络的两端(上下2 Mbit/s业务处)环回测试不通。在转接设备DXC上将交叉连接数据重做后恢复,网络结构示意如图1所示。




图1 网络结构示意


  通过对74条同类故障进行分析,发现故障具有以下特征:

  ●所有电路都通过本端A厂商DXC设备转接,90%以上的电路经过B厂商的网络转接,不足10%的电路未通过B厂商的网络转接;

  ●故障发生在B厂商SDH环网络倒换恢复之后;

  ●干线对端使用B厂商的STM-1设备上下2 Mbit/s业务,故障发生时STM-1设备的2 Mbit/s端口出现“INT_TU_LOP”告警;

  ●在DXC设备中将电路交叉连接重做后故障恢复,同时“INT_TU_LOP”告警消除。

  从上述现象分析来看,绝大多数故障与A厂商DXC设备和B厂商设备有关,而SDH环倒换是故障的触发条件。因此,我们需要针对A厂商DXC设备与B厂商设备进行对接测试。

  我们首先利用闲置的设备模拟图1所示搭建测试平台,经过两周的环倒换测试,故障始终未出现,我们只好把注意力放在现网中。在一次线路割接之后,我们终于发现了两条电路对端出现“INT_TU_LOP”告警,SDH网络两端(上下2 Mbit/s业务处)测试不通。两条电路的名称分别是“GD-PR29”和“GS-PR20”,我们先对GD-PR29进行故障测试定位。

2、测试方案

  (1)测试的总体思路:在不改变故障状态的前提下,从电路所经过的设备中选取几个参考点,测试信号的质量,定位故障源。

  (2)电路路由情况:电路通过①1-2-3-U6-8上2 Mbit/s—(622 Mbit/s光口对接)—②-3-4-9-1-#2-332—(DXC设备内部交叉连接)—②1-3-2-2-241—(155 Mbit/s光口对接)—③—(2.5 Gbit/s光口对接)—④S1-10—(SDH环网络)—⑤S5-1—(155 Mbit/s光口对接)—⑥S4-15下2 Mbit/s业务,如图2所示。




图2 电路路由情况


  我们看到,整个电路在转接过程中均为全光口转接,而光口是无法利用仪表进行在线监测的。如果断开网元②和网元③互连的155 Mbit/s光口测试,这种操作类似于网络倒换或在DXC重做数据,使业务产生中断,这样很可能导致电路故障恢复;而且断开155 Mbit/s光路测试对业务的影响较大。经查,该155 Mbit/s通道已开通61个2 Mbit/s业务。如果把业务导走再进行测试,这样多的电路很难保证在下一次网络倒换之前完全疏导完毕,而且网络倒换很有可能使故障恢复。因此,我们决定利用SDH设备提供的SNC保护功能,在不改变故障状态的情况下,将关键参考点的信号引出测试。

3、实施方法

  (1)如图2所示,选取网元②、④、⑤三个监测点,利用SNC保护功能将业务信号引出测试。在②号节点,将TU12信号②-3-4-9-1#2-332桥接到空闲2 Mbit/s端口2-3-15-1测试;在④号节点,将进入155 Mbit/s端口S1-10的信号桥接至S28-3测试;在⑤号节点,将进入155 Mbit/s端口S5-1的信号桥接至S8-4,再通过另一环网将信号引到G站S25-12口测试。这里,由于B厂商10 Gbit/s设备只提供对支路进行SNC保护,因此无法对网元⑤收网元④线路的VC4时隙进行桥接测试。

  (2)为了确保所测试的业务信号正确,我们在业务的两端设置了踪迹追踪字节(J2),并在监测过程中实时读取追踪字节状态。

  (3)找一条走同一VC4的2 Mbit/s电路作同样的测试作为参照,参照电路选取相同VC4的2M7。

4、测试过程

  4.1 电路GD-PR29的测试

  (1)搭建测试平台参考图2所示,其中仪表3、仪表5选用Agilent ProBER II型2 Mbit/s误码分析仪,仪表4选用WG 2 Mbit/s误码分析仪,仪表1、仪表2选用Agilent 37718 SDH分析仪。

  (2)在G站网元①2 Mbit/s端口1-2-3-U6-8设置J2字节发“1-2-3-U6-8”,D站网元⑥2 Mbit/s端口S4-15设置J2字节发“011_S4-15”,D站网元⑥155 Mbit/s端口S6-1设置J1字节发“011_S6-1”。

  (3)测试结果:

  ●G站仪表3收到信号状态正常,D站仪表4收到告警,说明该电路G站收D站方向正常,D站收G站方向故障,业务单通。

  ●G站仪表5收状态正常。

  ●G站仪表2对业务所在的TU12时隙241进行监测,状态正常,无告警,AU4的J1字节收无法辨认,TU12-241的J2字节收“1-2-3-U6-8”。

  ●G站仪表1(实际上是D站网元⑤故障电路所在VC4桥接出来的信号)对业务所在的TU12时隙241进行监测,收到“LP_RDI”告警,AU4的J1字节收到“011_S6-1”,TU12-241的J2字节收“011_S4-15”。

  4.2 正常电路2M7的测试

  (1)在G站网元①2 Mbit/s端口2-3-15-3设置J2字节发“2-3-15-3”,D站网元⑥2 Mbit/s端口S2-7设置J2字节发“011_S2-7”,并将2 Mbit/s端口环回。D站网元⑥155 Mbit/s端口S6-1设置J1字节发“011_S6-1”。

  (2)测试结果:

  ●G站仪表2对业务所在的TU12时隙131进行监测,状态正常、无告警,AU4的J1字节收无法辨认,TU12-131的J2字节收到“2-3-15-3”。

  ●G站仪表1(实际上是D站网元⑤故障电路所在VC4桥接出来的信号)对业务所在的TU12时隙131进行监测,无告警,AU4的J1字节收到“011_S6-1”,TU12-131的J2字节收到“011_S2-7”。

  4.3 后续测试

  我们将电路GD-PR29在G站DXC网元②上交叉连接重做,网元⑥“INT_TU_LOP”告警消除,用2 Mbit/s误码仪做环回测试,电路状态正常。这说明我们测试的电路是我们要找的同一类故障电路。

  我们对另一条故障电路GS-PR20也做相同的测试,测试结果相同。

  4.4 测试结果分析

  在对电路GD-PR29的测试中,从网元②桥接出来的业务信号为正常状态,J2字节为端口①-1-2-3-U6-8所发的J2字节,说明从端口①-1-2-3-U6-8到DXC桥接参考点之间的传输无问题。需要注意的是,这里DXC的业务信号未测试完全,所以不能完全排除DXC的问题。

  从网元④桥接出来的信号状态正常,这里J2字节为端口①-1-2-3-U6-8所发的J2字节,说明从端口①-1-2-3-U6-8经过网元②、③再到网元④桥接参考点这段传输无问题。这里,我们可以排除A厂商DXC设备的故障。

  我们再看从网元⑤桥接出来的信号收“LP_RDI”告警。J2字节为011_S4-15,这是网元⑥S4-15的J2字节,所以网元⑤桥接的方向是收S5-1端口的,LP-RDI告警说明网元⑤收网元⑥的TU12业务信号是正常的,而网元⑥收网元⑤方向故障。这种设备属于B厂商低端设备,使用时间较长,不支持桥接功能,因此无法深入到STM-1设备内部进行测试。由于故障产生在低阶通道,同一VC4无其他业务受影响,INT_TU_LOP告警出现在2 Mbit/s端口,而网元④、⑤是10 Gbit/s网元,无上下2 Mbit/s业务的能力,也无TU12的交叉矩阵,不会对TU12级别的业务信号进行处理,交叉连接都是VC4或VC4以上级别的,因此,我们将故障定位在B厂商STM-1设备上。

  另一条电路GS-PR20测试结果与GD-PR29相同,验证了测试结果的可靠性。

5、后续处理

  B厂商对测试结果进行分析后,对全网的STM-1设备进行了一次软件升级,网络运行至今,未再出现类似问题。

6、总结

  在本案例中,测试时遇到两个条件限制:一是不允许在SDH网内部中断业务测试,因为这样做会改变故障状态,使故障恢复;二是由于业务全光口转接,无法进行在线监测。这时,我们可以考虑使用SNC保护功能,在不损伤业务的前提下,选取适当的参考点,将业务信号引出测试。这种方法可以广泛应用在因以上条件限制而无法进行在线监测的关键参考点上。此外,在测试中我们还可以通过踪迹字节(J1、J2)的设置,验证所测试信号的正确性。
0
相关文章