网络通信 频道

网管调查——企业网络自动掉线之谜

  【IT168 专稿】企业网络特别是中小企业经常会遇到这样或那样奇怪的网络故障,其中最让网络管理员头疼的就要属外部网络连接中断了,因为随着网络的发展,很多员工特别是高新技术产业都脱离不了网络了。一旦企业内网和外部网络连接中断,基本上大部分业务都将无法顺利开展。最近笔者受到一家公司邀请处理企业网络自动掉线之谜,下面本人将处理该故障的全部过程罗列出来和各位IT168的读者分享。

  一,事情起因:

  笔者受一位朋友所托处理其所在公司中的网络故障,该网络是一个小型局域网,计算机数量大概有20台。通过二层交换机连接到一起,二层交换机的Uplink口连接TP-LINK公司的宽带路由器,路由器的外部WAN口通过ADSL线路连接外部网络。(如图1)

  最近该公司的网络管理员离开了工作岗位,新上任的网络管理员刚刚接手工作就遇到了网络故障。具体表现为企业外网连接基本上两小时自动掉一次线,然后过一分钟又自动连接上。虽然耽误时间只有一分钟,但是由于企业很多业务都是在线完成的,视频点播系统也对网络的连通性要求很高,网络一旦出现偶尔断开的问题后这些服务的使用都受到影响。

  该网络管理员查询了各个线缆连接以及各个员工计算机的系统,没有发现任何病毒和物理问题,各个员工用机系统也都是开启了Windows Update服务的,基本上所有补丁都及时安装。

  二,初步分析:

  笔者到达该公司后首先从故障的表现上分析,第一问题出现在断网,第二特征是每隔两小时断一次,第个三特征是断完后过一分钟又能够自动连接。

  就笔者日常维护网络经验来说——断网主要有两方面引起,一方面是线路本人链路不稳,另一方面是蠕虫病毒造成的。笔者联系了电信部门检查了ADSL电话线路没有发现任何问题,因此排除了第一个方面的可能,于是将问题的关键点放到了蠕虫病毒上。毕竟当网络中蠕虫数据包过多很可能造成宽带路由器的“假死”,从而逻辑关闭对应端口,这样就造成了断网问题,而逻辑关闭接口后会自动打开,从而与断网后一分钟又能够自动连接的现象相吻合。

  既然已经初步分析了症状根源,那么着手查毒即可。众所周知很多蠕虫病毒特别是ARP欺骗病毒,他的传播威力是巨大的,只要网络中有一台机器感染,网络内所有计算机的网络访问都受到影响。之后笔者顺从这个观点详细检查了所有员工计算机,没有发现任何问题。而且在出现断线时笔者查询ARP缓存表显示出来的网关MAC地址信息和顺利上网时是一致的,这说明断网并不是因为ARP欺骗引起的。

  三,深入分析:

  通过上面的种种排查已经彻底将病毒引起这个假设否定了,那么还有什么可能造成企业网络每隔两小时就自动断线一次并在一分钟后顺利连接呢?

  为了更好的定位故障笔者决定使用最基本最直接的网络故障排查方法——分割法解决难题,也就是说将网络各个区域隔离开来检查。首先笔者关闭了大多数员工计算机,只让一台笔记本上网。结果问题依旧。看来问题不是出现在计算机上,笔者判断故障根源在交换机和路由器以及线路本身。

  接下来使用笔记本脱离交换机直接连接路由器上网,结果还是两小时自动断一次,之后顺序恢复连接。因此判断故障不在交换机上,而出在路由器或线路本身。

  笔者继续将笔记本直接连接ADSL猫,在操作系统中手工建立拨号程序,拨号上网,结果发现自动断线问题没有再出现,这说明线路是好的,ADSL猫也没有任何问题。故障肯定出现在宽带路由器上。

  一般来说宽带路由器硬件不会出现问题,大部分错误都出现在软件设置上。于是笔者通过其管理地址和帐号进入管理界面,一一比对各个参数设置信息,结果发现在“网络参数->WAN口设置”处的拨号设置被设置为“按需连接,在有访问时自动连接,自动断线等待时间5分钟”了。这说明当企业内网中有人要访问外部internet时宽带路由器才会拨号上网,而且当网络需求在5分钟之内没有时就会自动断线。笔者将其修改为“自动连接,在开机和断线后自动连接”后问题解决,企业内网再也没有出现上述两个小时一次的断网现象。(如图2)

  四,总结:

  本次故障的根源是宽带路由器上WAN口拨号连接信息设置错误造成的,按照常理应该不会有人随意修改他,本人怀疑是离任网管做的手脚。当企业在五分钟之内没有internet访问时宽带路由器就自动切断了外部网络拨号连接,这时有人会发现无法上网,而宽带路由器会在接下来的一分钟之内根据“按需连接”方式,在有人有访问需求的情况下迅速再次拨号连接ADSL线路,从而出现了一分钟后网络又恢复正常的现象。

0
相关文章