3、在将故障排查范围锁定在位于四楼的五家单位之后,笔者认为既然重新启动四楼某个交换机的设备,能够暂时地将网络故障恢复,只是在半个小时之后,相同的网络故障现象才会再次现象;对照这种特殊的现象,笔者怀疑可能是网络广播风暴,造成了交换机在一定时间内发生了堵塞现象,最终堵死了核心交换机的对应交换端口。为了便于分析故障,笔者利用专业的网络监听工具对四楼交换机的级联端口进行了网络传输数据包分析,结果发现无论是输入数据包流量,还是输出数据包流量,都非常地大,几乎超过了正常数值的100倍左右,这说明四楼的网络中出现了网络堵塞现象。
4、那么究竟是网络病毒引起的网络堵塞,还是网络环路引起的网络堵塞呢?笔者打算观察一下故障交换机级联端口的状态信息变化,特别是输出广播包的变化,如果输出广播包每秒钟都在不停增大的话,那十有八九就能证明四楼网络中存在网络环路现象;基于这样的分析思路,笔者使用Console控制线直接连接到故障交换机上,以系统管理员身份登录进入该系统后台,同时使用display命令查看了该交换机级联端口的输出广播包的变化,并且每隔一秒钟查看一次,之后比较每次查看的结果,经过反复测试,笔者发现故障交换机的输出广播包大小果然在不断地增大着,这说明四楼的五家单位中,肯定存在网络环路现象。
5、仔细查看了四楼的两台交换机,笔者发现它们之间的物理连接是正常的;此外,这两台交换机的各个交换端口直接与四楼各个房间的墙上上网插口相连,按理来说,只要各个房间不随意使用交换机进行级联,应该不会出现网络环路现象的。现在既然证明四楼网络中存在网络环路现象,这说明肯定有人在随意使用交换机进行扩展上网,我们只要找到扩展交换机,并对它的物理连接进行检查,就能迅速找到具体的故障节点了,于是笔者电话联系四楼各家单位的网络管理员,要求他们对各个办公房间进行检查,并上报使用下级交换机的房间;没有多长时间,检查结果就反馈给了笔者,竟然有10个左右的房间使用了下级交换机进行扩展上网。
6、笔者深知这10个房间的网络连接,最有可能出现网络环路现象,那究竟是哪一个房间呢?难道笔者依次要到各个房间的现场,查看他们的网络连接吗?经过认真考虑,笔者找来了组网资料,将这10个房间使用的交换端口号码一一找了出来,之后使用网络线缆直接插入到这些交换端口中,并在这些端口的视图模式状态下,依次ping故障交换机的IP地址,结果ping到第六个交换端口时,笔者发现从该端口无法正常ping通;为了判断该交换端口是否真的存在问题,笔者又在该交换端口视图模式状态下,使用display命令查看了该交换端口的状态信息,经过查看分析,笔者发现该交换端口的输入、输出数据包大小明显不正常,于是笔者估计该交换端口肯定是造成故障交换机工作状态不正常的原因。查阅档案资料后,笔者迅速根据那个交换端口号码,找到了对应的那个上网房间,到了现场后,笔者发现该房间中仅有的两个上网端口,都连接了小集线器,而这两台集线器下面都连接有几台计算机,更要命的是还有一条网络线将它们直接连接在了一起,这样一来这两个集线器之间就形成了一个网络环路,该环路造成的广播风暴最终堵塞了故障交换机的级联端口,从而造成了整个四楼网络都不能正常上网。
故障解决
将该多余的网络线缆拔除之后,笔者重新查看了该交换端口的状态信息,结果发现输入、输出数据包大小都恢复了正常,再次查看核心交换机上对应的交换端口状态时,发现原因的“down”状态已经变成了“up”状态,而且此时笔者也能正常ping通四楼的故障交换机了,这说明问题果然是由四楼某个房间的用户非法扩展使用交换机或集线器引起的。
后来,笔者经过进一步询问上网用户了解到,他们的房间在前天晚上进行了打扫除,当时所有的网络线全部被拔了下来;当清洁工作结束之后,上网用户由于对连接知识了解不多,就随意进行了插接,最终造成了网络环路现象
故障总结
通过对这则网络故障的深入排查,我们不难看出,在管理、维护网络过程中,必须要对整个网络的组网结构有一个全面、清晰的了解,同时要仔细考虑交换端口的上网配置。当遇到网络故障时,一定要结合故障现象,逐步缩小故障排查范围,然后借助专业工具来测试上网数据包的大小变化,快速定位故障节点。