网络通信 频道

如何增强网络排错技能

如何增强网络排错技能

   我喜欢将排除网络故障的过程视为一个漏斗形的过程,在面积最大的顶部,是故障的症状,接下来是大量的故障原因和相关因素,在底部是排除该故障的特定手段。排除网络故障基本上是一个过滤信息和匹配症状的过程。以下是少费功夫排除网络故障时需要注意的几点。 

保持开放的头脑

我们每个人都有适合自己的网络领域,如果喜欢硬件,你可 能会花很多时间在网络连线和交换机上,但如果只是喜欢软件,你可能在两个小时焦头烂额地机器指令检查之后,才发现问题原来是网络连线松了。这可能是一个漫长的过程,要试着将导致故障的原因定位更广一点,要确定你不会忽视任何一个故障原因。

查明出故障的时间

多数情况下,网络从正常到不正常有一小段时间。弄清这个时间,或者查明故障发生的时间,能让你排除和故障原因无关的症状,这对重新明确有关的症状是很重要的。

使用书写板

对排除网络故障来说一块大的白色书写板非常有用。开始排除故障时,你可以将所有故障和症状写在上面,缩小问题范围之后可以删掉或略过那些无用信息,这样摆在你面前的就只有与故障有关的因素了。书写板也有助于向同事们阐明当前的问题。

最近,我在白色书写板上写道:我们不能正常ping通外部网。看到这个通告后,一位同事告诉我,我们的DNS服务器工作不正常。在书写板上解决问题便于交流,并能使所有用户都清楚问题。这种情况下,一旦故障正确定位,则问题也就解决了。

首先检查硬件

开始排除故障的第一步是详细分析故障症状,决定它主要是由软件故障还是由硬件故障造成的。由于以下原因,大部分人都会忽略首先检查硬件这一重要规则:
 
硬件看起来太简单 


硬件通常在我们不愿接触的地方。
用机器指令检测故障比伸手、曲膝或者爬上爬下摆弄机器更轻松。
修复硬件故障所需成本更高,花费时间更长,因此你可能将其视为最后的手段。
既然硬件故障最易排除,所以应该首先检查它,解决网络故障要遵循以下步骤:


检查网线及网线与机器的连接。
运行硬件测试分析工具,察看它们是否存在细微错误。
如果可以的话,重新启动服务器,路由器或硬件设备。这一方法排除了无数故障,从键盘锁定引发的故障到路由故障。
在另一台机器或另一个测试网络上重现问题从而排除故障。
排除软件故障

如果所有硬件都工作正常,那就应该开始研究软件故障了。谈到网络时,与此相关的软件故障通常有三类。下面一一列出。

主机上的故障

如果机器上某个网络应用锁上了或者出故障了,那你必须确定是什么原因导致了这个故障。如果此应用你最近升级过(或者该应用在你升级过的操作系统上),则你可能不得不到应用开发商网站去查找是否有相应补丁。

当机器上某个用户在使用浏览器,某个应用或进行网络连接时出了故障,在另一个用户或另一台机器上重现故障可以缩小故障原因的查找范围。这种方法也可用于排除桌面电脑和服务器的网络故障。

同时,你还必须注意系统配置错误。例如,Windows 2000有非常强大的本地安全策略和组策略,新手对这些策略的错误配置可能导致严重问题。因此,确定问题是由用户配置引起的还是由计算机引起的也非常重要。

如果你的网络中使用Windows NT4 域或Windows 2000 域,在域控制器里检查登录信息是排除登录故障的重要一步。Windows事件察看器是一个查找故障的强大工具,如果事件察看器给出了事件ID号,你就可以进入微软知识库站点,以事件ID号为关键字进行搜索,搜索结果可以列出故障症状,原因及相关解决办法。这比理论上的东西更好,它是一个能让网络管理员高效工作的优秀故障排除工具。我至少每月使用微软知识库一次,如果你使用的是其他操作系统,那你就只能人工察看日志文件,或者只能用平台上带的日志文件阅读器进行工作了。

局域网上的故障 

当出现网络连接故障时,你应该做的第一件事是:如果是Windows系统,使用IPConfig/all命令(如果是Linux,使用IFConfig)。若得出的结果是你的机器拥有固定IP地址、子网掩码、网关,那么接着应该使用ping命令,首先,ping localhost或者ping 127.0.0.1(在DOS命令行下),然后,ping故障主机的IP地址以确定你的网络适配器正常工作。

如果上述ping命令的结果都是连接不通畅,那么在确信机器的TCP/IP网络配置与网络适配器已进行了正确绑定,而且网络适配器正常工作之前,你不必ping更远的地址。

但如果上述两个ping命令都显示连接通畅,那你接着就应该ping默认网关,以确信你的主机能与它正常连接。若这也连接通畅,就ping网关以外的IP地址(连在你广域网或互联网上的IP)。如果结果仍然正常,ping一个互联网上拥有正式域名(FQDN)的服务器进行再次检查,如ping yahoo.com,从而确信DNS服务器正常工作。

如果以上所有的ping命令结果都是正常,而你仍然连不上互联网或广域网,那就应该检查软件配置了。

广域网上的故障

有时你碰到的故障是在本地无法解决的。如租用的线路和广域网连接断开了,远程办公网因为该地的路由器故障而断线了。如果你找不到自己的硬件和软件故障,而且你认为广域网可能存在问题,就或许要求助于电信供应商(如果是互联网连接故障),或者另一个办公网的同事(如果故障出自远程办公室的广域网连接上)。

最后的问题

下面是一些补充建议:


将问题缩小到容易处理的范围。
与本部门的同事分享你的观点和思考过程。
不要在雇员和客户面前排除故障。如果可以的话,尽量到办公室里,关上门,打开求助服务器或语音信箱来排除故障。在没有其他人干扰的情况下更能把精力集中在问题上。
求助!使用互联网或求助于另一位技术人员,你可能会找到一位碰到过相同问题的人,这是寻求建议的非常好的时机。
暂时不去排除故障,理清所有思路,给自己一段回顾所有要素,探寻开始时被忽略的其它可能解决办法的时间。

 

转载地址:http://www.net130.com/CMS/Pub/network/network_manage/231913.htm

0
相关文章