企业局域网发生故障是不可避免的,因此网络故障管理的主要任务之一是及时发现并排除网络故障。一般当网络发生物理连接不通、不能浏览Web等连通性故障时,因为故障现象比较明确,所以容易观察和定位故障点,解决起来也不困难。然而最令人头痛的故障类型是,网络的物理连接是通的,但网速却莫名地变慢。在本文中我结合自己的经验,就导致此类故障的因素进行分析,并和大家共享自己的解决方法。
1.由网线连接方法及网线质量而导致的网速变慢
(1)因素分析
局域网的安装从电缆开始,电缆是整个网络系统的基础。我做了一个大概的估计大约有50%一70%的网络故障与电缆有关,电缆本身的质量及电缆安装的方法都直接影响到网络能否健康地运行。大家知道,双绞线是由四埘线按严格的规定紧密地绞和在一起的,用来减少串扰
和背景噪音的影响。。同时,在T568A标准和T568B标准中仅使用了双绞线的1、2和3、6四条线,其中1、2用于发送,3、6用于接收,而且1、2必须来自一个绕对,3、6必须来自一个绕对。只有这样,才能最大限度地避免串扰,保证数据传输。在大量实践中发现不按正确标准(T586A、T586B)制作的网线,存在很大的隐患。表现为:一种情况是刚开始使用时网速就很慢;另一种情况则是开始网速正常,但过了一段时问后,网速变慢。后一种情况在台式电脑上表现非常明显,但用笔记本电脑检查时网速却表现为正常。
(2)排错方案
对于这一问题经多次实践发现,因不按止确标准制作的网线引起的网速,变慢还同时与网卡的质量有关。一般台式计算机的网帚的性能不如笔记本电脑的,因此,在用交换法排除故障时,使用笔记本电脑检测网速正常并不能排除网线不按标准制作这一问题的存在。因此实际使用中应当严格按照F586A或T586B标准来JK制网线,在检测线缆故障时笔记本电脑和台式电脑相结合。
2.网络中存在回路导致网速变慢
(1)因素分析
当网络涉及的节点数不足很多、结构不足很复杂时,这种现象一般很少发生。但在一些比较复杂的网络中,经常有多余的备用线路,如无意间连上时会构成回路;或者交换机的uplink口一般都和1/24口共用一个物理通道,如果1/uplink或24/uplink同时接上客户机,也会造成异常。例如某医院的网线从网络中心接到门诊大楼,再从门诊大楼接到总务科,同时从网络中心又有一条备用线路直接连到总务科,若这几条线同时接通,则构成回路,数据包会不断发送和校验数据,从而影响整体网速。这种情况查找比较困难。
(2)解决方案
为避免这种情况发生,要求在铺设网线时一定养成良好的习惯:网线打上明显的标签,有备用线路的地方要做好记载。当怀疑有此类故障发生时,一般采用分区、分段、逐步排除的方法。
3.网络设备硬件故障引起的广播风暴而导致网速变慢
(1)因素分析
作为发现未知设备的主要手段,广播在网络中起着非常重要的作用。然而,随着网络中计算机数量的增多,广播包的数量会急剧增加。当广播包的数量达到30%时,网络的传输效率将会明显下降。当网乍或网络设备损坏后,会不停地发送广播包,从而导致广播风暴,使网络通信陷于瘫痪。因此,当网络设备硬件有故障时也会引起网速变慢。
(2)排错方案
当怀疑有此类故障时,首先可采用冒换法替换集线器或交换机来排除集线设备故障。如果这些没备没有故障,关掉集线器或交换机的电源后,在命令行下用“Ping”命令对所涉及计算机逐一测试,找到有故障网卡的计算机,更换新的网卡即町恢复网速正常。网卡、集线器以及交换机是最容易出现故障引起网速变慢的设备。
4.网络中某个端口形成了瓶颈导致网速变慢
(1)因素分析
实际上,路由器广域网端口和局域网端口、交换机端口、集线器端口和服务器网卡等都可能成为网络瓶颈。其原因主要是因为端口锁死、端口故障、端口模式不匹配所致。
(2)排错方案
当网速变慢时,我们可在网络使用高峰时段,利用网管软件查看路由器、交换机、服务器端口的数据流苗;也可用Netstat命令统计各个端口的数据流量。据此确认网络数据流通瓶颈的位置,设法增加其带宽。具体方法很多,如更换服务器网卡为lOOM或1000M、安装多个网卡、划分多个VLAN、改变路由器配置来增加带宽等,都町以有效地缓解网络瓶颈,町以最大限度地提高数据传输速度。
5.蠕虫等病毒的影响导致网速变慢
(1)因素分析
通过E-mail散发的蠕虫病毒对网络速度的影响越来越严重,危害性极大。这种病毒导致被感染的用户只要一上网就不停地往外发邮件,病毒选择用户个人电脑中的随机文档附加在用户
机子的通讯簿的随机地址上进行邮件发送。成百上千的这种垃圾邮件有的排着队往外发送,有的又成批成批地被退回来堆在服务器上。造成个别骨干互联网出现明显拥塞,网速明显变慢,使局域网近于瘫痪。
(2)解决方案
管理员必须及时升级内网计算机所用杀毒软件,操作系统也要及时升级、安装系统补丁程序,同时卸载不必要的服务、关闭不必要的端口,以提高系统的安全性和可靠性。
6.一个相关排错案例
为了时大家对局域网连通性故障的排错有一个感性的认识,为此我列举一个案例。
(1)故障状态
某单位的网络突然出现严重堵塞,主机间的数据频频中断,协同办公不能正常进行,在线视频系统经常掉线。另外,无论是从文件服务器中上传还是下载文件都异常缓慢,有时会因超时而中断。
(2)故障诊断
在一台主机上用ping命令测试到网关的连通性,输入命令“ping 192.168.2.1 -n 1000”发送1000个Ping包测试网关。测试结果可以ping通网关,但是发现掉包现象很严重,1000个包有720个包丢了,丢包率为72%,持续掉包时间也很长。运行arp -a命令,发现网关IP和网关MAC地址指向正确,通过上面的测试基本排除网络设置错误以及ARP欺骗。
接下来在核心交换机上做镜像用Sniffer对整个内网进行监控。监控结束后分析时发现网络利用率达到了97%,这是很不正常的现象。以该单位的网络规模以及日常业务量网络利用率应该在20%-30%之间,这样可以断定造成网络丢包的根源应该是异常流量占用大量的网络带宽所致。
继续分析发现MAC为00-0A-E6-98-84-B7的主机占了整个网络流量的57.87%,初步把目标锁定在该主机上,继续分析没有发现大量的广播包,因此完全排除了广播风暴影响。找到00-0A-E6-98-84-B7对此主机分析,发现该主机的网络活动非常可疑,进入该主机的数据包才700多个,而出去的数据包在短短的10多分钟内就有了几十万个包,这是极不正常的。
(3)故障解决
通过对00-0A-E6-98-84-B7主机的单独抓包分析,发现该主机通过UDP协议项向外网的一个IP进行数据拷贝,可以断定该主机应该被植入了木马。接下来在交换机上对该主机隔离断开其网络连接,整个网络马上就恢复了正常。最后用杀毒软件对该主机进行杀毒,杀毒完毕后接入网络一切正常,故障解决。
最后,希望本文就网络连通故障的因素分析、解决之道,以及最后的相关案例解析,能够从理论到实践对大家进行网络排错有帮助。