网络通信 频道

排除网络故障六步走

  网络故障的排除方法有一些普遍原则,在下文中,我们将使用OSI参考模型的语言,从一个具体的路由器实验环境的角度来观察排除网络故障的过程,然后我们将给出一个一般性的解决网络问题的方法。
  一、排除网络故障的总体模型
  当排除计算机网络故障时总体的步骤是这样的:
  步骤1 对问题进行定义:故障的特征以及潜在的原因是什么?
  步骤2 收集相关信息并明确可能的原因。
  步骤3
  考虑这些信息的可能性。根据所收集的信息,把注意力集中在与特定问题相关的方面(在这一步里将问题限定了范围)。步骤4 创建一个行动计划,在设计计划时,应该在一次操作中只改变一个变量。
  步骤5 实施该计划。在测试是否出现相应故障特征时,应该仔细地执行每一步。
  步骤6 仔细观察这些结果并明确是否已经解决了问题。如果解决了该问题,整个过程就结束了。
  最后,如果没有解决问题,则转移到在列表中的下一个最可能的原因,返回到步骤4,重复该过程一直到问题解决为止。
  二、模型应用举例
  
  网络设置如上图所示,当尝试从Lab-E到Lab-A进行ping时,收到了一系列的超时信息:
  Lab-a#ping lab-e
  Type escape sequence to abort.
  Sending 5, 100-byte ICMP Echos to 210.93.105.2, timeout is 2 seconds:
  …
  Success rate is 0 percent (0/5)
  第一步 对问题进行定义
  故障的特征及潜在的原因是什么?可以从列出其特征开始,本例即为不能从Lab-E到Lab-A ping通。然后列出由各层引起的潜在原因:
  ● 第一层
  电缆质量不好; 电缆没有连接好; 集线器掉电。
  ● 第二层
  接口被关闭; 不恰当的封装类型设置(高层数据链路控制HDLC是在串口上的缺省类型); 在串口上设置的时钟速率不正确。
  ● 第三层
  错误的接口地址; 错误的子网掩码; 错误的路由选择信息。
  第二步 收集相关信息并明确可能的原因
  可以通过使用路由器的show命令来明确故障。由于该网络有一个统一的控制,每个路由器的路由选择表应该包括该广域网中的所有网络。
  在Lab-A的特权执行模式提示符下输入show ip route命令, 应该显示所有的八个网络。但路由选择表只显示了八个网络中的七个。
  第三步 考虑可能性
  根据所收集的信息,把注意力集中在与特定问题相关的方面,并确定该故障的范围。为了实现这一点,必须简化搜索范围,从一张大图转移到一个更集中、更明细的地点以确定故障在何处。
  来自路由选择表的信息表明网络204.204.7.0有两跳之距离。与Lab-A有两跳距离的是Lab-C,它是共享Lab-A的RIP协议的最后一台路由器。应该在这最后一台收到信息的路由器上开始排除网络故障。远程登录到路由器C,输入show run命令以查看路由器的运行配置信息,一定要把配置文件做成系统日志(把配置信息写入到工程日志中,或者把配置信息复制并粘贴到一个记事本文件中去)。
  在输入show ip route命令以后,收集与最后显示的网络相连的接口的信息。在该提示符下,输入show int S0,显示所有关于该接口的当前信息。应把所得信息做入系统日志。
  第四步 创建一个行动计划
  在设计计划时,应该在一次操作中只改变一个变量。
  根据关于Lab-C所运行的配置信息,要确保所有部分都经过了正确的配置。然后查看show int S0以后得到的信息,确认该接口状态以及该线路协议状态。该信息将显示该电缆是否与在另外一端的设备相连接,以及该数据链路层是否在正常运行。从这两个show命令中,可知该路由器被正确配置了并且处于正常的运行状态。那么故障一定发生在下一台路由器,即Lab-D上。这就是一个排除或简化问题的过程。一个好的行动计划应该是这样的:先尝试Telnet到路由器Lab-D上,然后转移到Lab-D的终端以检查所运行的配置是否有错误。如果在配置中没有发现错误,就需要检查S1接口了。
  第五步 实施计划
  首先尝试Telnet到路由器Lab-D上,但是失败了,现在须转移到与Lab-D相连的终端。进入特权执行模式并输入show run命令。从命令清单中可看到在Lab-D上的路由选择协议是内部网关路由协议(IGRP)而不是路由信息协议(RIP)(路由器Lab-C正在使用)。为了纠正这个错误,需要进入全局配置模式,输入type no router igrp 111,并输入命令router rip。再输入网络命令network 210.93.105.0及network 204.204.7.0(这些是与Lab-D直接相连的网络)。然后键入Ctrl-Z并输入copy run start。
  第六步 仔细观察结果
  现在可以通过对Lab-E和Lab-A使用ping命令来测试连通性,结果恢复正常。
  尽管本例在路由器的配置文件中发现了一个错误并对它进行了改正,但在其他情况下仅解决一个问题或许并不会成功地恢复连通性。有些故障是由多重原因引起的,如果没有能修复该故障,那么就返回到步骤4并重新设计出一个方案来。
  
  
文章转载地址:http://cisco.chinaitlab.com/trouble/1785.html
0
相关文章