网络通信 频道

Ultra60工作站网络故障排除

 

本文出自《网管员世界》2002年第12期 故障诊断 栏目
Unix系统工作站网络故障一般表现为工作站之间、工作站与微机或交换机之间不能通信。多数情况是因为工作站网络端口的连接、网络连线的折断或交换机端口故障所致。有时也因为网络掩码和缺省路由的设置问题造成故障。这些故障一般容易查找排除。而对于工作站主板网络端口故障因为发生的几率几乎为零,往往被维修人员忽略。本人在十余年的网络、Unix工作站系统管理及日常维护、维修工作中,也是第一次遇到此类故障。基于它的特殊性,在此把故障的排除过程介绍给大家,供同行参考。

故障现象

今年8月22日,我院某研究部门一台Sun公司的Ultra60工作站(系统平台为Solaris 2.6),在网络改造测试中,发现该机与外界网络通信延迟时间较长,同时存在时断时通网络故障。

故障检测与分析

首先,检测网络连线与交换机端口的通信,测试结果正常。但是将网线接入主机后,做网络测试,故障依旧。
其次,检查网络配置:Unix系统的Sun工作站网络配置在/etc/hosts文件,同时还有网络掩码设置/etc/inet/netmasks和缺省路由设置/etc/defaultrouter两个文件,检查结果设置均正确。
用# ifconfig -a命令检查网络掩码设置和主机网络端口设置也正确。
用# /usr/sbin/sys-unconfig 命令删除系统原来的配置,然后再重新对系统IP、netmasks、hostname、root口令等进行配置,故障依旧。
以上检测说明,网络故障与交换机、连线和系统网络设置无关。故障源可能在主板的网络控制部件。为了进一步验证故障在网卡上,采用了以下方法:
1. 用命令# ifconfig hme0 10.0.209.119 netmask down先将本机网络设置失效。用#ping 10.0.209.119命令测试本机不通。
2. 用命令# ifconfig hme0 10.0.209.119 netmask up恢复本机网络设置。 用#ping 10.0.209.119命令测试本机通信正常,但与外界不能通信。
3. 使用同网段工作站设备的网线连接到本机,关机后再开机,故障依旧。
4. 用dmesg 命令检查网卡是否连上,即Link Up
# dmesg |grep hme0
显示一切正常,不能说明网卡故障。
5. 用交叉线对连两台工作站,用#ping命令测试网络通信,故障依旧,但几分钟后发现有通信信息,丢包率为99%。说明网卡未完全损坏。
6. 恢复原来的网络连接,将两台工作站都连接到交换机上,相互使用Ping测试网络,通信不连续,但是用Telnet命令根本无法登录,且很长时间无反应。
根据以上现象判断,该机网卡已出现故障,但并没有完全丧失工作能力,尚有部分功能存在;但已无法满足正常的工作需求,决定维修。但由于该机网卡镶嵌在主板上,维修费用很高。因此决定购买单独的Ultra60 PCI网卡。

故障排除

1. 将新购的Ultra60 PCI网卡插在PCI插槽。
2. 将网线RJ45接入新网卡。
3. 开机。Ok: boot -r;重新配置系统文件,并用root账号登录。
用ping和Telnet命令测试网络通信正常。
要注意的是,/etc/hostname.hme0文件内容只有本机的主机名,为了保证本机通信网址的惟一性,要将/etc/hostname.hme0去掉,从而保证/etc/hostname.hme1文件的惟一性,因为在网络中,如果单机工作站不做路由器使用,一台工作站只能保留一个hostname文件。
至此故障排除。

 

文章转载地址:http://www.365master.com/kt_article_show.php?article_id=1534&categ_code=10151002

0
相关文章