三、信息采集
通过这些告警分析机制是不是网络管理起来稍微好一点,不会没有头绪了?^_^
笔者认为作为一个优秀的网络运营管理软件,最重要的不是报警,不是告警分析,是如何去预防故障的出现-预警。
而要做到预警首先就要做到信息采集的实时。NetGain底层的采集器和监控器可以对网络设备进行直接的采集和状态监控,从而实时的了解网络设备的运行情况。监控器可以对网络中任意的元素进行主动的探测,来获取设备的可用性和性能数据。实时监控工具每5秒钟采集一次数据,从而从这些数据中分析故障发生的可能性。
数据采集到后还要通过一系列的分析得出故障发生的可能性,这就要介绍到NetGain的SLA了。
SLA代表了网络的整体状态,它是由无数个监控器的参数配置体现的网络服务水平。我们首先要对每个监控器逐一进行配置。监控器可以收集到的信息包括下表中的数据。
然后分别对每项数据进行预警参数配置。也就是说,我们事先对某一项的指标进行设置,如果超过了这一指标时则发生预警。例如,在服务器CPU使用率超过80%的时候作出预警,或者在某端口的流量超过设定的正常值的时候预警。这样就避免了很多网络故障的发生。
总体的来看,我们对所有的监控器进行的配置组合起来就是网络整体的水平。SLA的值可以体现出我们网络运行的整体状况。
信息1(点击看大图) |
信息2(点击看大图) |
信息3(点击看大图) |
信息4(点击看大图) |
除了拓扑管理,可用性和性能管理,流量监控, SLA,故障管理,统一事件处理平台,告警分析之外,还有一些其他功能也是非常有用的。