网络通信 频道

使用Smartmontools监控Linux磁盘存储设备

    3. 全面检测硬盘健康

    smartctl -A /dev/hda1

    下面详细解读检测信息:

    1.ID检测代码

    ID检测代码不是唯一的,厂商可以根据需要,使用不同的ID代码或根据检测参数的多少增减ID代码的数量。例如,西数公司的产品ID检测代码为“04”,检测的参数是Start_Stop_Count(加电次数),而富士通公司同样代码的检测参数却为“Number of times the spindle motor is activated”(电机激活时间)。

    2.属性描述(Attribute_NAME)

    属性描述(Attribute_NAME)即检测项目名称。可由厂商自定义增减,由于ATA标准不断更新,有时候同一品牌的不同型号产品也会有所不同。但必须确保S.M.A.R.T规定的几个主要检测项目。

• Read Error Rate 错误读取率

• Start/Stop Count 启动/停止次数(又称加电次数)

• Relocated Sector Count 重新分配扇区数

• Spin up Retry Count 旋转重试次数(即硬盘启动重试次数)

• Drive Calibration Retry Count 磁盘校准重试次数

• ULTRA DMA CRC Error Rate (ULTRA DMA奇偶校验错误率)

• Multi-zone Error Rate 多区域错误率

    对Linux系统管理员必须深入了解它们的具体含义,理解属性监测值的含义。

    3.阈值(Thresh)

    又称门限值。是由硬盘厂商指定的可靠的属性值,通过特定公式计算而得。如果有一个属性值低于相应的阈值,就意味着硬盘将变得不可靠,保存在硬盘里的数据也很容易丢失。可靠属性值的组成和大小对不同硬盘来说是有差异的。这里需要注意的是,ATA标准中只规定了一些S.M.A.R.T参数,它没有规定具体的数值,“Thresh”的数值是厂商根据自己产品特性而确定的。

    4.属性值(Attribute value)

    属性值是指硬盘出厂时预设的最大正常值,一般范围为1~253。通常,最大的属性值等于100(适用于IBM、昆腾、富士通)或253(适用于三星)。当然,也有例外的时候,比如由西部数据公司生产的部分型号硬盘,就用了两个不同的属性值,最初生产时属性值设为200,但后来生产的硬盘属性值又改为100。

    5.最大出错值(Worst)

    最大出错值是硬盘运行中曾出现过的最大的非正常值。它是对硬盘累计运行的计算值,根据运行周期,该数值会不断地刷新,并且会非常接近阈值。S.M.A.R.T分析和判定硬盘的状态是否正常,就是根据这个数值和阈值的比较结果而定。新硬盘开始时有最大的属性值,但随着日常使用或出现错误,该值会不断减小。因此,较大的属性值意味着硬盘质量较好而且可靠性较高,而较小的属性值则意味着故障发生的可能性增大。

    总结:FLAG是标记,标准数值(VALUE)应当小于或等於关键值(THRESH)。WHEN_FAILED 代表错误信息,WHEN_FAILED纵行是空行,说明硬盘没有故障。如果WHEN_FAILED显示数字,表明硬盘磁道可能有比较大的坏道。它是S.M.A.R.T针对前面的各项属性值进行比较分析后,提供的硬盘各属性目前的状态,也是我们直观判断硬盘“健康”状态的重要信息。作为用户,只要观察“Worst”和“Threshold”值的关系,并注意状态提示属性状态信息即可大致了解硬盘的健康状况。

 

0
相关文章