网络通信 频道

真凶何在?七天追查网络瘫痪故障

  编者按:山东某大型集团,网络突然出现大面积瘫痪故障,并导致企业多天业务无法正常运转。此企业系统工程师在七天的昼夜追查中,终于查出是交换机环路问题引起的,但故障真凶又是什么呢?我们又需要从中反思什么呢?


  【IT168 报道】我们单位用SDH设备在山东省东部县市之间组了一个环网,除了传输单位内部的办公网(主要是互联网)外,也传输其它单位的一些专网。

  即SDH设备负责提供传输通道,交换机负责各个网络业务的接入,这样网络结构比较简单明了,实际运行的状态也是比较稳定的,但是最近一段时间,由于泗水所用的一台连接用户的交换机(不是核心的华为3528交换机)出现环路故障,造成整个企业的所有业务都受到了影响,在老总的强压下,我们经过七个昼夜,终于查到了故障真凶,并解决了问题。


  首战失利:追查ARP攻击无果

  前一段时间,东环所在的曲阜经常有人反映说上网时经常出现丢包现象,联想到最近局域网中经常出现的ARP地址欺骗病毒,我就向曲阜分管网络的技术人员介绍了一下排查局域网中ARP地址欺骗病毒的方法,希望通过找到并解决感染ARP地址欺骗病毒的机器来解决丢包的问题,结果,曲阜那边还没有查出结果,泗水那边也反映上网时有严重的丢包,我也向泗水的技术人员介绍了排查局域网中ARP地址欺骗病毒的方法,结果泗水的同事很快的在局域网中就发现了感染病毒的机器,捎带着还发现了一个问题,即由于前几天下雨打雷,单位中有几台连接用户的交换机都出现若干端口损坏的情况。


  由于泗水与曲阜的故障现象极为相似,所以我们也判断曲阜的丢包除了由于病毒的原因外,还有可能是交换机由于雷击出现了故障,但是这些猜想都需要等到下星期正式工作日的时候才能得出结果,因为双休日人员不在班上不好查。但是在星期天的时候,另外一个客户Q反映故障的电话让我们重新认识到故障的严重性,这是我们为该客户在济宁至曲阜间开通了一个专网,我先用图示说明一下网络结构(由于SDH可以视为透明传输的通道,所以在图中只画交换机的组网),如图2所示,


 

0
相关文章