网络通信 频道

技术解析:破解交换机无法ping通之谜

  交换机是局域网中一种很重要的网络设备,它的工作状态与客户端系统的上网状态息息相关。可是,在实际工作过程中,交换机的状态很容易受到外界的干扰,那样一来局域网中就会出现各种各样的网络故障;为了保证网络运行稳定,我们必须在平时对交换机进行妥善管理、维护,避免交换机发生故障。这不,笔者在对单位局域网进行维护时,曾经遇到过物理连接不当,而造成楼层交换机无法ping通的故障现象。这种网络故障的排查让笔者颇费一番周折;由于该故障相对典型,而且其排查思路可供借鉴,现在笔者就将它贡献出来与大家分享。

  案发现场

  笔者所在的大楼包含若干个单位,为了保证每个单位都能独立上网,并且要求它们的上网状态不受其他单位的影响,笔者选用了路由交换机作为大楼网络的核心交换机,同时在交换机上对每个单位设置了不同的虚拟工作子网。由于各家单位分布在不同的楼层,每个楼层分布的单位家数也不完全相同,有的楼层有两、三家单位,有的楼层多达五、六家单位,不同楼层的单位工作子网全部通过对应楼层的交换机,连接到大楼局域网中,并通过大楼网络中的硬件防火墙访问Internet网络。

  为了提高网络管理效率,网络管理员平时都会通过远程连接方式对交换机进行管理、维护;可是,今天早上一上班,笔者在扫描诊断局域网核心交换机各个交换端口的工作状态时,发现其中某个交换端口处于down状态。查看网络管理档案,找到连接该端口的是四楼某二层交换机,远程登录该楼层交换机时,发现迟迟无法登录成功,使用ping命令测试该交换机的IP地址时,返回的结果为“Request time out”;就在笔者纳闷为什么没有人报故障时,电话铃声如期而至,果然来自四楼的用户开始接二连三地报修网络故障了。根据上述故障现象,笔者估计可能是楼层交换机的工作状态出现了意外,于是跑到该故障交换机现场,切断该设备的电源,过一段时间后再次接通电源,进行重新启动,等到启动操作完毕后,笔者又使用了ping命令测试该交换机的IP地址,此时返回的结果已经正常,而且远程登录操作也能够很顺利地进行。然而,半个小时之后,该故障交换机又出现了相同的故障现象,并且进行ping命令测试时,又返回了不正常的测试结果;后来笔者不放心,又重新经过反复启动测试,发现故障交换机始终无法正常ping通。

  深入排查

  既然经过反复重启不能解决问题,笔者估计引起该故障的原因比较复杂,考虑到这种故障现象在网络管理过程中经常会碰到,于是笔者按照下面的思路进行了深入排查:

  1、考虑到整个大楼网络中,只有四楼的某个楼层交换机出现这种现象,笔者初步判断可能是该楼层交换机自身问题引起的,为了能够确保可以准确定位故障原因,笔者准备利用一台工作状态正常的交换机来替换故障交换机,看看故障现象是否仍然存在;同时,将那台被怀疑可能存在问题的交换机连接到一个独立的网络工作环境,经过半个小时的测试、观察,笔者看到那台被连接到独立网络环境的故障交换机工作状态是正常的,而且在该网络环境下可以ping通它的IP地址,而那台新替换的交换机连接到大楼网络后,却不能正常ping通了;依照这些现象,笔者认为四楼的交换机自身出现问题的可能性几乎没有。

  2、在排除了故障交换机自身状态因素后,笔者对整个大楼网络的组网结构和网络状态重新进行了回顾。由于大楼中其他楼层的用户都能正常上网,唯独四楼的一部分用户不能上网;查阅四楼的组网资料,笔者看到四楼分布了五家单位,当时网络管理员在四楼布置了两台楼层交换机,将它们通过级联方式连接在一起,同时在这两台交换机中划分了五个虚拟工作子网,保证了每家单位都能独立地工作于自己的虚拟工作子网中。既然核心交换机上的对应端口已经被down掉,那么整个四楼的所有单位都不能上网才对,为什么现在只有一部分用户上报故障现象呢?等到上班时间一到,笔者立即电话联系其他几家没有报修网络故障的单位,得到的答复说他们刚刚才发现网络访问不正常,正准备向大楼网络管理员求救,如此说来整个四楼的所有单位都是不能正常上网的,那么引起该故障的原因应该在这几家单位的虚拟工作子网中。

0
相关文章