网络通信 频道

NetGain综合运营管理器详解(图)

    【IT168 专稿】在上一篇的使网络稳定运行的保障产品(图)文章中笔者已经分析了NetGain这款产品的重要性,下面说明一下这款产品的主要功能,它到底能帮你做些什么事情,对公司的业务到底会有何帮助。

NetGain(点击看大图)

    在目前的各种企业里,没有单纯的IT项目和业务,只有需要IT支撑的业务项目,而现在的企业业务比较依赖于IT,所以IT部门将网络运营的如何会直接关系到公司的业务项目进行情况。

    首先,对于IT部门来说,管理起网络内所有网络设备、操作系统和所有应用程序是第一步,最好能即时的看到各种设备的运行情况,这样才能对掌握整个网络有个基本的条件。

    NetGain这个产品可以通过Ping、Telnet、Polling等方式自动发现网络中所有节点上的设备,并通过图形化的方式自动生成IP拓扑视图。根据其发现的设备类型,通过SMNP Get方式采集被监控节点的配置信息;通过支持不同网络歇息的监控器获取节点系统与应用的信息;通过接受来自被管理节点的Trap信息及主动轮询Ping的方式对网络连通性故障进行发现,并将故障信息与网络拓扑进行关联;利用已生成的网络拓扑关系对故障根源进行分析,帮助管理员对网络问题进行快速的诊断和定位。

    网络管理员可以根据管理的需要,确定资源发现的范围,如指定相关的IP 网段和地址,从而提高自动发现过程的效率,实现有目标的管理。能够被系统自动发现的信息除了IP,操作系统,设备型号,软硬件配置列表等基本信息外,还能够匹配NetGain Enterprise Manager 内部的现有的监控器自动扫描节点上的可监控项目,包括接口、系统性能、数据库、Web 服务等,并自动创建默认的监控器,自动开始监控其可用性和健康性。

    NetGain对于拓扑图的管理分为4种,分别从不同的角度不同的层次提供多种表现形式的网络拓扑显示:IP拓扑视图、网络视图、业务视图和自定义拓扑视图。并且实时监控和显示视图中网络元素的状态。拓扑图中的颜色分为红色、黄色和绿色,分别代表报警的级别,用来表示目前该设备所发生的故障的级别。这样的话,管理人员通过拓扑视图可以很容易并且细致的观察网络设备的状态变化。当拓扑图中呈现非正常运行情况颜色时可以直接点击拓扑节点查看相关的告警信息。

IP拓扑视图(点击看大图)

    IP拓扑视图是传统网管意义上的拓扑视图,NetGain依据自动发现的网络配置和连接信息以及节点上的配置信息,自动对每一个节点的端口和IP路径进行发现和建立模型,自动建立IP拓扑视图,并且在拓扑视图上监控其服务的健康性和可用性。

网络视图(点击看大图)

    网络视图是针对IT部门对自己的网络结构都有自己特有的划分和管理模式的特点,用于建立与企业内部管理模式相适应的逻辑网络视图。例如,可以按照网段分布、地域分布等划分划分创建不同的子网络视图。

    业务视图为运营商和企业从业务划分的角度提供IT资源管理的视图,建立从业务或者客户到IT资源以及性能之间的依赖关系。即,以业务为主线,将每项业务所依赖的网络资源、系统资源、应用软件贯穿起来,形成绑定业务的拓扑视图,实现面向业务的监控和管理。比如,IDC 运营商可以为每个大客户建立客户视图,还可以为每项业务建立服务视图。当业务所依赖的某个IT 资源出现告警和故障时,代表此项业务的图标将在拓扑图中呈现不同的报警颜色。

自定义拓扑视图(点击看大图)

    自定义拓扑视图:除了上述基于网络结构视角的“网络视图”和基于业务视角的“业务视图”,还可以根据用的不确定需要从任何角度对网络拓扑进行调整,允许根据任何的网络属性建立网络的分区视图。如,过滤不需要监控和显示的网络节点,为短期的业务或者网络调整建立临时的监控视图等。视图的创建只需简单的拖拉和拷贝操作就能实现。

资源查询(点击看大图)

资源查询:NetGain提供了非常丰富的资源查询机制。可以按照资源的网络结构,业务视图结构,以及资源的设备类型,服务类型,IP地址等不同方式从系统用中查询任意被管理的对象。这样,对于网络管理员来说,可以按照网络结构或者设备类型来查找设备是再方便不过了,而对于公司高层人员来说,也可以从业务结构视图一目了然的看到网络内所有的设备。

    二、故障处理

    如果产生了故障,NetGain是如何处理相关一大堆的事情的呢?

    首先,故障产生后第一件事情就是产生报警。市面上其他网络管理类产品同样也是这样处理,这是毫无疑问的。NetGain的优势在于,它可以过滤报警、合并报警和进行相关的一些分析。

报警(报警)

    网络管理员们经常很头大的事情就是,看到一大堆的报警在闪来闪去,却不知道如何下手。报警分为很多种,同一设备的报警、同一类型的报警、同一故障引发的报警等等。当乱了头绪,不知道那些报警是最紧急的,哪些报警是直接关系到业务的时候,业务必然会受到影响。邮件发不出去了、网络断掉了、数据库受损了、服务器瘫痪了……

合并规则(点击看大图)

    首先,我们要将同一设备的相同告警合并压缩成一个,这样报警界面就不会看起来那么烦乱不会引起告警风暴。在一条告警内的详细信息中就可以看到相关告警发生的次数和时间。

过虑告警(点击看大图)

    其次,排除不需要关心的告警信息。用户故障管理系统的告警过滤功能是通过预先定义过滤规则的,这样就可以使不需要被关心的告警信息被屏蔽掉,使管理员可以集中精力在重要告警事件的监视和处理上。

映射规则(点击看大图)

    映射规则分为两种。第一种:将内部采集器获取得各种原始信息转换为同一标准格式的映射,原始数据信息会记录在告警的附加信息中。第二种:将具体告警问题的描述映射卫人性化的业务语言方便查看,也可以设置告警的紧急情况。这样网络管理员处理故障的轻重缓急就可以根据业务的重要性来分配。

相关性规则(点击看大图)

    最后则是相关性分析。网络环境中来自不同信息源(网络设备、主机系统、应用软件)的告警信息必然是相互依赖不可分割的。通常由于网络端口不通造成服务器无法通讯,业务无法正常运转等连锁反映。如果不将根源去除的话,就有如去病没有根治一样。如果在这种情况下将IT分为不同层次分别管理则管理员会看到来自不同网管软件的大量告警,短时间之内无法确定真正的故障根源在哪里。所以相关性分析很重要,它将依赖于同一故障的告警归纳为一条根源告警,点击根源告警则可以看到相应的告警。

    三、信息采集

    通过这些告警分析机制是不是网络管理起来稍微好一点,不会没有头绪了?^_^

    笔者认为作为一个优秀的网络运营管理软件,最重要的不是报警,不是告警分析,是如何去预防故障的出现-预警。

    而要做到预警首先就要做到信息采集的实时。NetGain底层的采集器和监控器可以对网络设备进行直接的采集和状态监控,从而实时的了解网络设备的运行情况。监控器可以对网络中任意的元素进行主动的探测,来获取设备的可用性和性能数据。实时监控工具每5秒钟采集一次数据,从而从这些数据中分析故障发生的可能性。

    数据采集到后还要通过一系列的分析得出故障发生的可能性,这就要介绍到NetGain的SLA了。

    SLA代表了网络的整体状态,它是由无数个监控器的参数配置体现的网络服务水平。我们首先要对每个监控器逐一进行配置。监控器可以收集到的信息包括下表中的数据。

    然后分别对每项数据进行预警参数配置。也就是说,我们事先对某一项的指标进行设置,如果超过了这一指标时则发生预警。例如,在服务器CPU使用率超过80%的时候作出预警,或者在某端口的流量超过设定的正常值的时候预警。这样就避免了很多网络故障的发生。

    总体的来看,我们对所有的监控器进行的配置组合起来就是网络整体的水平。SLA的值可以体现出我们网络运行的整体状况。

信息1(点击看大图)

信息2(点击看大图)

信息3(点击看大图)

信息4(点击看大图)

    除了拓扑管理,可用性和性能管理,流量监控, SLA,故障管理,统一事件处理平台,告警分析之外,还有一些其他功能也是非常有用的。

    四、其他功能

    性能统计和分析报表

    NetGain可以存储所有监控器所采集的性能数据,能够随时生成任意指定时间内的性能分析报表和服务水平(SLA)报表。服务水平(SLA)报告的主体可以是网络视图和业务视图中的任何对象:可以是一个监控器、也可以是一个网络节点、或者一个设备组、一项业务映射、一个客户。使管理者能够多层次多角度的了解网络和业务的运行状态。报表格式包括了:曲线图、直方图、饼图、线面图、数据表,仪表图等等。并提供历史数据查询。与此同时,用户还可以通过NetGain Enterprise Manager 提供的报表定制机制,对报表模版进行定制和报表的生成。

性能统计和分析报表(点击看大图)


 
    专家知识库

    NetGain还为故障管理提供了故障排除的专家知识库。它可以将故障分析信息和相关的解决方案记录下来,当再次遇到同样的告警时,系统将从知识库中搜索出历史解决方案和建议,提供给当前的操作人员, 从而达到经验共享和快速解决问题的目的。

知识库(点击看大图)

    事件的自动通知功能

    当新发生的时间信息满足预先制定的过滤条件时,通过调用内部或者外部命令的方式来视线对告警事件的自动响应。如主动发送E-mail、手机短信、 执行声音或者闪烁告警页面等及时的将告警信息通知到相关的管理员。NetGain还可以实现在故障处理超时的时候自动升级告警级别。

警告通知(点击看大图)

    故障自动恢复

    当一个告警事件需要重复相同反复的工作时,或者简单处理就可以完成的工作的时候,可以使用故障自动恢复功能,实现了操作的简便。

    管理员可以将日常诊断/排除故炸果那的重复性操作步骤定义为系统脚本,当符合过虑条件的告警发生时自动触发脚本的执行,无需人工干预,不仅降低了成本,同时也保障了业务的不间断运行。

    用户权限管理

    作为IT架构的综合管理工具,NetGain为运营商和企业提供了多方位的管理功能,不同岗位的管理者所需要管理的对象以及各自的操作职权都可以分开管理。

    用户权限管理分为4种。用户和角色管理、IP访问权限管理、功能权限管理、管理域权限管理。
用户和角色管理时为了保证安全性通过用户和角色控制每个管理员的权限,实现用户和角色的多对多管理,严格划分职责和权限。超级管理员可以创建角色和用户,并为不同的角色分配不同的功能权限和管理域权限。一个角色可以包含多个用户,一个用户可以属于多个角色。

    IP访问权限管理是为了进一步保障NetGain用户网络环境的安全性,禁止非法访问,超级管理员可以为每个用户置顶登陆NetGain的客户端IP地址或者地址段。

    功能权限是指管理员在NetGain EM Web 管理页面中能进行哪些功能操作。超级管理员可以为不同的角色分配不同的功能权限,比如,可以指定业务人员只能查看系统告警但不能对告警进行任何操作,或者指定开发人员没有“资源管理”权限。不同权限的管理员通过Web 登录NetGain后将看到完全不同的功能页面。

    管理域权限是指管理员对树型网络结构和树型业务视图中的哪些对象和分支有管理的权限。超级管理员可以为不同的角色分配不同的管理域权限。管理员登录后只能收到来自其管理域的事件,只能监控和操作其管理域中的监控对象。

    五、IT综合管理系统市场分析

    在讨论过NetGain综合运营管理系统的功能之后,我们来比较一下国内国外市场上的同类产品。

    首先,比较的是国外几款知名产品,惠普的OpenView、IBM的Tivoli还有CA的Unicenter。

    OpenView集成了网络管理和系统管理各自的优点,形成了一个单一而完整的管理系统。丰富的产品线可满足客户的多种需要,产品包括统一管理平台、全面的服务和资产管理、网络安全管理、服务质量保障、故障自动监测和处理、设备搜索、网络存储、智能代理及其Internert环境的开放式服务等丰富的功能特性。

    IBM的Tivoli Netview基于JAVA的控制台较从前的具有更大的灵活性。可扩展性和直观性,可允许管理人员从网络中的任何位置访问Tivoli NetView。从这个网络客户程序可以获得有关节点的状况、对象收集与时间方面的信息,也可以对Tivoli NetView服务器进行实时的诊断。

    CA的Unicenter可以管理复杂的WEB网络、桌面系统、应用程序和数据库。并且还能管理非 信息技术设备,如销售点、自动柜员机、制造设备、环境设备、医疗设备和电源线等,能够提供真正的端到端的企业管理。

    以上三种都是国外知名的管理软件,他们都是很庞大的企业管理软件,对IT设备等的管理分类很细致。像HP的openview在客户的网络环境管理方面就提供了customer views for network node manager,在用SNMP控制基本网络设备、关键系统和应用方面提供了extensible SNMP agent,在关于互联网完整基础设施的单一集成视图上提供了internet servisce,在支持问题监测与统计数据、告警,一起映射到单一显示屏方面提供了network node manager等等很多种类。他们的优势各不相同,但是总的来说是完全、细致、可以做到绝对管理好你的网络。

    他们的弊端也是共同的,在针对国内市场来说,这么庞大的软件系统在安装调试方面的周期是很长的,并且技术含量很高,一定要专业人员来做。另一方面,价格也十分昂贵,国内的企业绝大部分都承受不起。

    那么我们再看看国内产品---神州数码的LinkManager网络管理系统。

    LinkManager 网管系统是一套基于Windows NT平台的高度集成、功能较完善、实用性强、方便易用的全中文用户界面网络管理系统。它是神州数码网络有限公司根据中国用户的实际需求,遵循ISO网络管理模型的五大功能域(性能管理、配置管理、故障管理、计费管理及安全管理)的架构,自行组织研发出来的一套具有自有知识产权的网管系统。它能够对神州数码网络有限公司推出的具有SNMP功能的网络设备提供齐全的设备管理和功能管理,同时也能够良好地支持其他任何具有通用SNMP功能的网络设备,提供整个网络的拓扑结构和常用网络管理信息。

    无论对于单个局域网还是较大型的TCP/IP互联网,它都有较强的网络拓扑发现能力,并且对于网络互连逻辑有较好的识别能力,给管理员提供了全局、立体化的管理视角。对于性能管理方面也可以做到为操作员提供被管理设备的各种信息,提供线图和直方图直观的监测被管理设备的网络活动,支持VLAN信息展现等。在时间管理策略上提供了三类事件管理。系统事件,网络设备的SNMP Trap事件,网络设备的SNMP阈值Trap事件。它也提供了可靠的安全平台,友好的用户界面,设备管理能力也很强。和国外三种产品相比较来看,它的缺陷,也是这个产品的重点,在它针对网络设备的管理上,而缺乏了系统和应用的管理及其在对网络全局统一的控制上。

    笔者个人比较推荐的产品是:游龙科技的siteview和网利公司的NetGain。

    这两款产品对网络中应用系统、服务器、网络设备都有很好的故障监测和性能管理,设计全面功能强大的监测器全面监测整个网络的运行状态。与三款知名的国外产品相比,它们的价格可以被国内企业所接受,虽然在个别功能上可能没有国外产品的强大,但是已经可以满足国内用户的需求,算是国内用户的上选了^_^。

0
相关文章