网络通信 频道

子网过多也惹祸

公司主干网络是由各种型号的Cisco交换机搭建起来的企业级多层交换网络,在网络的运行过程中曾发生了一次严重的网络故障,本文详细阐述了这次网络故障的分析及解决办法,以飨读者。

网络架构
  公司主干网络由两台互为冗余的Cisco6500系列中心交换机和三台Cisco4000系列分中心交换机组成,各子公司都通过Cisco3524交换机连接到主干。各子公司都有自己的独立的VLAN,且子公司间的VLAN不能互相访问,但能与集团公司的VLAN互相访问。

故障现象
  公司网络管理段中的网管机不能访问到全部的Cisco交换机,只有登录到中心交换机的三层上才能访问到所有Cisco交换机;同时公司的网络管理段不能访问到部分子公司的主机,也只有到中心交换机的三层上才能访问。
  部分网段的电脑开机后无法立即与网络连通,需要过10分钟左右才能正常连通。但连通后,网段内的PC机就不能连通,此时这两个区域与其它网段的PC能正常连通。
  部分子公司反映电脑开机后无法与网络连通,需要过10分钟左右连通才正常。

故障解决
  首先考虑会不会是病毒造成的网络故障,但通过扫描软件扫描各网段未发现大量的异常包,同时查看各中心交换机的性能状态,CPU和内存的利用率并未明显升高,因此断定此故障并非由网络病毒导致。
  通过研究故障现象发现:只要登陆到中心交换的三层中就可以访问到集团网络中的任一台交换机和任一台PC机,同时不能连通的两台PC机都位于不同的交换机下。会不会是中心交换引擎出了问题,比如路由表问题。于是通过在中心主交换机6509上修改配置并进行反复比较试验,最后通过禁用CEF(Cisco Express Forwarding,Cisco快速转发)解决了网络管理段不能访问全部交换机的问题,网段之间的PC机也能连通。故障似乎得到了解决。
  CEF是Cisco所提倡使用的一种快速交换模式,正常情况下不应该导致该故障出现,并且该网络系统已正常工作了数年,禁用了CEF却导致了中心交换的CPU利用率提高到了90%以上,中心交换性能明显下降。因此分析会不会是其它问题(如中心交换机的硬件故障)导致网络不连通,但是通过交换机提供检测命令进行检查未发现任何硬件故障信息。
  此后的几天中我们一直在检查网络中其它交换机的配置信息,试图从其它角度来分析解决这次故障。我们发现电化厂网络中的3524交换机的配置文件里有如下一些语句:
     no spanning-tree vlan 101
     no spanning-tree vlan 43
     no spanning-tree vlan 15
  通过与以前备份的交换机配置文档比较,这些语句在以前的文档里并不存在,进一步查看各交换机的配置发现所有的3524交换机下都有这些语句,而且各3524交换机中被no spanning-tree的VLAN并不相同。接着我们在电化厂的3524交换机上打命令show span vlan 101, 结果如下:
    Spanning tree 101 is not currently active
    The following parameters have been configured :
    Stp Status         :Disabled
    Protocol          :EEE
    Max Age (sec)     : 20
    Hello time (sec)    :2
    Forward Delay (sec) :15
    Bridge Priority     : 32768
  为什么3524上VLAN101的STP(生成树协议)是Disabled的呢? 查看文档,原来3500系列交换机虽然同时能支持250个VLAN,但只能支持在64个VLAN上运行STP,而最近一段时间由于不断有新网段加入到集团主干网络中,已使网络的VLAN数上升到了70个。于是我们把中心交换机的CEF重新启用,并把3524交换机上未使用的VLAN的生成树关掉(no spanning-tree vlan 30),再启用Vlan101(spanning-tree vlan 101),保存修改,把交换机重启一下之后,问题解决了。
  至此,此次网络故障得到彻底解决,各种故障现象都已消除,中心交换的各性能状态指标恢复正常。

公司主干网络是由各种型号的Cisco交换机搭建起来的企业级多层交换网络,在网络的运行过程中曾发生了一次严重的网络故障,本文详细阐述了这次网络故障的分析及解决办法,以飨读者。

网络架构
公司主干网络由两台互为冗余的Cisco6500系列中心交换机和三台Cisco4000系列分中心交换机组成,各子公司都通过Cisco3524交换机连接到主干。各子公司都有自己的独立的VLAN,且子公司间的VLAN不能互相访问,但能与集团公司的VLAN互相访问。

故障现象
公司网络管理段中的网管机不能访问到全部的Cisco交换机,只有登录到中心交换机的三层上才能访问到所有Cisco交换机;同时公司的网络管理段不能访问到部分子公司的主机,也只有到中心交换机的三层上才能访问。
部分网段的电脑开机后无法立即与网络连通,需要过10分钟左右才能正常连通。但连通后,网段内的PC机就不能连通,此时这两个区域与其它网段的PC能正常连通。
部分子公司反映电脑开机后无法与网络连通,需要过10分钟左右连通才正常。

故障解决
首先考虑会不会是病毒造成的网络故障,但通过扫描软件扫描各网段未发现大量的异常包,同时查看各中心交换机的性能状态,CPU和内存的利用率并未明显升高,因此断定此故障并非由网络病毒导致。
通过研究故障现象发现:只要登陆到中心交换的三层中就可以访问到集团网络中的任一台交换机和任一台PC机,同时不能连通的两台PC机都位于不同的交换机下。会不会是中心交换引擎出了问题,比如路由表问题。于是通过在中心主交换机6509上修改配置并进行反复比较试验,最后通过禁用CEF(Cisco Express Forwarding,Cisco快速转发)解决了网络管理段不能访问全部交换机的问题,网段之间的PC机也能连通。故障似乎得到了解决。
CEF是Cisco所提倡使用的一种快速交换模式,正常情况下不应该导致该故障出现,并且该网络系统已正常工作了数年,禁用了CEF却导致了中心交换的CPU利用率提高到了90%以上,中心交换性能明显下降。因此分析会不会是其它问题(如中心交换机的硬件故障)导致网络不连通,但是通过交换机提供检测命令进行检查未发现任何硬件故障信息。
此后的几天中我们一直在检查网络中其它交换机的配置信息,试图从其它角度来分析解决这次故障。我们发现电化厂网络中的3524交换机的配置文件里有如下一些语句:
 no spanning-tree vlan 101
 no spanning-tree vlan 43
 no spanning-tree vlan 15
通过与以前备份的交换机配置文档比较,这些语句在以前的文档里并不存在,进一步查看各交换机的配置发现所有的3524交换机下都有这些语句,而且各3524交换机中被no spanning-tree的VLAN并不相同。接着我们在电化厂的3524交换机上打命令show span vlan 101, 结果如下:
 Spanning tree 101 is not currently active
 The following parameters have been configured :
 Stp Status         :Disabled
 Protocol          :EEE
 Max Age (sec)     : 20
 Hello time (sec)    :2
 Forward Delay (sec) :15
 Bridge Priority     : 32768
为什么3524上VLAN101的STP(生成树协议)是Disabled的呢? 查看文档,原来3500系列交换机虽然同时能支持250个VLAN,但只能支持在64个VLAN上运行STP,而最近一段时间由于不断有新网段加入到集团主干网络中,已使网络的VLAN数上升到了70个。于是我们把中心交换机的CEF重新启用,并把3524交换机上未使用的VLAN的生成树关掉(no spanning-tree vlan 30),再启用Vlan101(spanning-tree vlan 101),保存修改,把交换机重启一下之后,问题解决了。
至此,此次网络故障得到彻底解决,各种故障现象都已消除,中心交换的各性能状态指标恢复正常。

公司主干网络是由各种型号的Cisco交换机搭建起来的企业级多层交换网络,在网络的运行过程中曾发生了一次严重的网络故障,本文详细阐述了这次网络故障的分析及解决办法,以飨读者。

网络架构
公司主干网络由两台互为冗余的Cisco6500系列中心交换机和三台Cisco4000系列分中心交换机组成,各子公司都通过Cisco3524交换机连接到主干。各子公司都有自己的独立的VLAN,且子公司间的VLAN不能互相访问,但能与集团公司的VLAN互相访问。

故障现象
公司网络管理段中的网管机不能访问到全部的Cisco交换机,只有登录到中心交换机的三层上才能访问到所有Cisco交换机;同时公司的网络管理段不能访问到部分子公司的主机,也只有到中心交换机的三层上才能访问。
部分网段的电脑开机后无法立即与网络连通,需要过10分钟左右才能正常连通。但连通后,网段内的PC机就不能连通,此时这两个区域与其它网段的PC能正常连通。
部分子公司反映电脑开机后无法与网络连通,需要过10分钟左右连通才正常。

故障解决
首先考虑会不会是病毒造成的网络故障,但通过扫描软件扫描各网段未发现大量的异常包,同时查看各中心交换机的性能状态,CPU和内存的利用率并未明显升高,因此断定此故障并非由网络病毒导致。
通过研究故障现象发现:只要登陆到中心交换的三层中就可以访问到集团网络中的任一台交换机和任一台PC机,同时不能连通的两台PC机都位于不同的交换机下。会不会是中心交换引擎出了问题,比如路由表问题。于是通过在中心主交换机6509上修改配置并进行反复比较试验,最后通过禁用CEF(Cisco Express Forwarding,Cisco快速转发)解决了网络管理段不能访问全部交换机的问题,网段之间的PC机也能连通。故障似乎得到了解决。
CEF是Cisco所提倡使用的一种快速交换模式,正常情况下不应该导致该故障出现,并且该网络系统已正常工作了数年,禁用了CEF却导致了中心交换的CPU利用率提高到了90%以上,中心交换性能明显下降。因此分析会不会是其它问题(如中心交换机的硬件故障)导致网络不连通,但是通过交换机提供检测命令进行检查未发现任何硬件故障信息。
此后的几天中我们一直在检查网络中其它交换机的配置信息,试图从其它角度来分析解决这次故障。我们发现电化厂网络中的3524交换机的配置文件里有如下一些语句:
 no spanning-tree vlan 101
 no spanning-tree vlan 43
 no spanning-tree vlan 15
通过与以前备份的交换机配置文档比较,这些语句在以前的文档里并不存在,进一步查看各交换机的配置发现所有的3524交换机下都有这些语句,而且各3524交换机中被no spanning-tree的VLAN并不相同。接着我们在电化厂的3524交换机上打命令show span vlan 101, 结果如下:
 Spanning tree 101 is not currently active
 The following parameters have been configured :
 Stp Status         :Disabled
 Protocol          :EEE
 Max Age (sec)     : 20
 Hello time (sec)    :2
 Forward Delay (sec) :15
 Bridge Priority     : 32768
为什么3524上VLAN101的STP(生成树协议)是Disabled的呢? 查看文档,原来3500系列交换机虽然同时能支持250个VLAN,但只能支持在64个VLAN上运行STP,而最近一段时间由于不断有新网段加入到集团主干网络中,已使网络的VLAN数上升到了70个。于是我们把中心交换机的CEF重新启用,并把3524交换机上未使用的VLAN的生成树关掉(no spanning-tree vlan 30),再启用Vlan101(spanning-tree vlan 101),保存修改,把交换机重启一下之后,问题解决了。
至此,此次网络故障得到彻底解决,各种故障现象都已消除,中心交换的各性能状态指标恢复正常。

文章转载地址:http://www.365master.com/kt_article_show.php?article_id=1902&categ_code=10041003

0
相关文章