3.应对网络环路故障
某大楼网络共包含12个虚拟工作子网,每一楼层的所有计算机都通过1000M六类双绞线连接到华为系列的可管理交换机设备上,各个楼层中的二层交换机全部通过1000M级别的光纤线路连接到大楼网络的华为S8500核心路由交换机上,核心路由交换机再使用千兆光纤线路连接到单位的天融信硬件防火墙上,最后通过本地的电信线路访问Internet网络,平时大楼内各个楼层的计算机都能正常上网,遇到一些极个不能上网的现象时,网络管理员经过控制交换机系统,都能快速找到故障原因,并能快速恢复网络故障。
然而好景不长,某天上午,网络管理员先是接到来自10楼上网用户的故障保修电话,说是该楼层中的所有计算机瞬间都不能上网了;刚开始的时候,网络管理员估计夏天到了,肯定是楼层交换机工作时间长了,内部无法及时散发出来的热量造成了交换机的工作状态不正常了,对于这样的现象,往往只要让交换机稍微休息一会,再重新启动一下就能解决问题了。刚准备按照这样的思路进行操作,谁曾想到,在短短的几分钟了,其他楼层的上网用户也不停向网络管理员进行电话“求援”,并且申请解决的故障现象几乎都是相同的,显然这样的现象肯定不是由于交换机自身散热不良引起的,毕竟在相同的时间段内不可能有这么多楼层交换机同时出现散热不好的现象,看来问题很可能是大楼网络的核心交换机或硬件防火墙遇到了意外。
网络管理员立即以特权账号登录进入核心交换机后台管理系统,在该系统的命令行状态,使用ping命令测试了硬件防火墙的IP地址,测试结果发现ping命令可以测试成功,不过响应时间明显有点偏长;既然硬件防火墙能够被正常ping通,那就意味着该设备的工作状态是正常的,于是笔者决定还是先来查看一下核心交换机的工作状态是否正常。想到做到,网络管理员在核心交换机的后台管理界面,执行“system”字符串命令,将交换机系统切换到系统全局配置状态,在该状态下输入字符串命令“display cpu”,单击回车键后,笔者发现核心交换机每一块插卡上的CPU消耗率都达到了50%以上,而在正常工作状态下,每块交换插卡的CPU消耗率都应该在20%左右,显然大楼网络内的上网流量出现了异常,正是这些大容量的数据交换信息在不停冲击核心交换机的插卡,才导致了核心交换机的系统CPU资源被大量消耗,最终造成了核心交换机工作状态不正常。
那么究竟是什么因素造成了大楼网络内的上网流量出现了明显异常呢?是恶意使用BT下载?是网络病毒?还是网络环路呢?
笔者立即在核心交换机的后台系统使用“display dia”命令,对核心交换机的各个光纤端口状态进行了扫描诊断,结果发现与硬件防火墙保持连接的那个光纤端口数据流量竟然达到了19000M/s左右,而这样大的数据流量BT下载应用是不可能达到的,而网络病毒也没有这样的能力,很显然这么大的数据流量只有网络环路才能做得到。为了验证自己的猜测,网络管理员立即使用“display interface”字符串命令,来查看核心交换机每一个光纤端口的输入、输出流量,对于那些输入、输出流量同时达到1000M/s以上级别时,继续不停执行“display interface”字符串命令,看看输出广播包数量每秒钟增加的幅度有没有超过500M/s左右大小,如果超过这个大小,那就说明对应交换端口下的虚拟工作子网中存在网络风暴现象。经过对每一个交换端口的输入、输出流量进行详细检查,网络管理员终于找到“g0/1/6”这个光纤端口数据流量不正常,输入流量竟然也达到了5000M/s左右,经过反复执行“display interface g0/1/6”字符串命令,网络管理员最终确认连接到“g0/1/6”这个光纤端口下的虚拟工作子网中存在网络风暴现象。
为了弄清楚究竟是硬件设备损坏还是网络环路引起了网络风暴现象,网络管理员立即来到与“g0/1/6”这个光纤端口保持连接的楼层交换,以系统管理员权限登录进入该楼层交换机的后台管理系统,并使用ping命令测试核心交换机的IP地址时,发现ping命令根本无法测试成功,很显然该楼层交换机工作状态不正常。不得已,网络管理员只好使用“display interface”字符串命令,对该交换机的每一个以太交换端口进行检查,结果看到“e0/35”这个交换端口的输入、输出流量竟然达到了10000M/s级别,立即进入“e0/35”这个交换端口的视图配置状态,执行字符串命令“shutdown”,将“e0/35”交换端口的工作状态临时关闭;之后,网络管理员重新ping了一下核心交换机的IP地址,这一次测试竟然成功了,这说明该楼层交换机的工作状态已经恢复正常。
完成上面的检查工作后,网络管理员随即又联系了刚才报修故障的几位上网用户,请他们配合进行一下上网测试,没有多长时间,所有上网用户的回复都说网络访问已经正常,这说明大楼各个楼层不能上网的故障已经被成功解决了。
后来,网络管理员又查阅了相关的档案资料,发现使用“e0/35”交换端口的上网用户是1613房间,网络管理员立即火速赶到该房间现场,对他们的上网线路进行了检查,结果发现该房间下挂了一台普通的集线器,而恰好该房间当天有人在维修窗户,在维修期间工作人员将所有网络线缆全部拔了下来,在窗户修好之后,工作人员由于不熟悉网络连接操作,就随意地进行了网络连接操作,最终引起了网络环路现象,从而造成了整个大楼网络上网出现了故障。