【IT168专稿】在美国,思科的网络产品无以伦比,但是,再先进的网络设备都要有趁手的网络性能管理工具来支持和管理。随着计算机网络技术的发展,网络应用已经成为了人们无法割舍的情节,然而频繁发生的网络中断事件和网络安全破坏事件,使人们对网络应用既爱又恨。为了最大限度地减轻网络故障给我们带来的不便,国内外都开发了不少有针对性的网络性能管理工具。本文是一篇思科结合OpManager管理工具的网络性能管理解决方案介绍,以此启发国内的网络性能管理方案的制造商,来开发更加适合我国应用特点的网络性能管理工具。概括来说,美国的OpManager是一款功能强大的网络故障诊断和网络性能管理工具软件,它占据了全美网络性能管理的半壁江山,OpManager的长处在于无论大型的网络系统还是小型的网络系统,都可以得心应手地完成日常的管理和维护。
下面给出的解决方案,分几个方面对基于思科网络架构的OpManager应用特点加以介绍,以便供国内的相关厂家和用户了解国外的最新相关技术动态。
1、支持基于SNMP陷阱和系统日志的网络中断故障解决策略
图1 使用OpManager快速诊断网络中断
SNMP(Simple Network Management Protocol),即简单网络管理协议,其前身是简单网关监控协议(SGMP),用来对通信线路进行管理。在应用过程中,业界对SGMP进行了不断的修改,并加入了符合Internet定义的SMI和MIB体系结构,逐渐形成了著名的SNMP。SNMP的目标是管理互联网当今Internet上工作的众多厂家所生产的软硬件资源,因此SNMP受Internet标准网络管理框架的影响巨大,现在SNMP已经更新到了第三版,其功能较以前已经大大地加强和改进了。其体系结构是围绕着五个目标进行设计的:一是保持管理代理(agent)的软件成本尽可能低;二是最大限度地保持远程管理的功能,以便充分利用Internet丰富的网络资源;三是网络的体系结构必须有足够的可扩充余地;四是保持SNMP的独立性,即使之不依赖于具体的计算机、网关和网络传输协议而发挥应有的作用;五是要保证SNMP体系本身的安全性。
OpManager具备较为强大的事件管理功能,可以在第一时间告知管理者你的网络系统可能出现了什么故障,并尽可能准确地给出应对措施。除了通过ICMP和SNMP轮询手段发现问题之外,OpManager还提供对SNMP陷阱接收模式和网络设备系统日志接收模式的全面支持。一旦网络系统出现故障,OpManager就会以电子邮件、SMS或者向你的ServiceDesk发送传票的方式告知你。使用OpManager,还可以保存网络上每个终端所访问链接路径,可以使你方便获得有关服务供应商的详细信息,同时可以在链接出现故障时获得相关信息。比如,你可能会收到类似的警报信息:“LA路由器的0端口出现中断”。因此,无论何时何地,只要你的网络出现了不能登录网页情况发生时,你都可以有确凿的依据来向你的网络服务供应商提供清晰的处理方案。
2、方便了解应用程序的性能及其对网络的影响
采用了思科架构的网络数据中心,目前受到了越来越多应用程序所带来的压力。统计数据表明,2008-2009年度数据中心受到应用程序数量膨胀所带来的前所未有的压力。这种压力一方面来自确实产生了越来越多的来自用户方的需求,另一方面则是对网络性能和安全的应用程序越来越多。这些越来越多处于膨胀阶段的应用程序,不仅已经成为了给数据中心的存储容量产生压力的重要因素,也为网络信息系统的故障排查带来了前所未有的挑战。面对众多的应用程序,它们都可能成为影响网络系统性能的重要因素。经用户使用证明,OpManager具有较为卓越的处理众多应用程序,并从中排查可能故障源的能力,这是OpManager与其它相关系统相比较为明显的不同之处。
无论是Windows服务器程序,还是Exchange服务器中的应用程序,还是活动目录以及SQL服务器下的其它类别的应用程序,OpManager都可以提供全面、强大、无盲点的监控支持。监控程序完全工作在可视化的模式之下,而且监控的目的在于诊断故障的具体位置,OpManager的定位可以基本明确到是哪个子网的哪台服务器或终端,是由于哪个服务器软件或应用程序的一次什么样的操作导致了网络故障的出现,可以采取什么样的常规措施来解决该故障。或者当故障出现的原因比较复杂、或不常见,现有管理人员没有能力解决问题、且需要向网络服务供应商联系时,如何向服务供应商描述故障出现的缘由等等。总之,OpManager有足够的设计能力可以应对目前应用程序规模的不断膨胀,而且可以事先分析已经安装或正在安装的应用程序可能会对目前的网络结构和性能产生什么样的影响,图2 给出了OpManager针对应用程序性能及其对网络影响情况所做的分析。
3、OpManager借助思科的IPSLA解决广域网的延迟问题
在广域网应用中,由于广域网自身结构的先天不足,经常会出现由于网络延迟造成的网络访问速度下降问题。OpManager利用思科的IPSLA技术,利用图表显示网络可用性的分布情况和解决广域网RTT延迟问题,可以精确给出最大延迟时间和可选网络路径。仅仅知道已经出现的网络延迟事件是不够的,OpManager利用计算机图形学理论,分析整个从源到目的位置的交通状况,并与用户的预期时间进行对比,从而给出优化的网络通道,全面提高网络的通讯性能。图3给出了使用OpManager并结合思科的IPSLA来完成网络延迟事件分析的功能界面。
4、使用思科的Netflow分析网络流量和网上交通状况
网络的交通拥挤情况如何,能否以直观的方式来了解,回答是肯定的。OpManager借助思科的Netflow工具,可以准确判定哪些用户或者哪些应用程序是造成网络拥堵的罪魁祸首。Netflow可以提供网络流量的会话级视图,可以记录每个TCP/IP事务的信息。虽然它不能象tcpdump那样提供网络流量的完整记录,但是作为信息的汇总,它所提供的信息更易于用来完成管理和故障的排除。Netflow的完整结构包括三个部分:探测器,采集器,报告系统。探测器用来监听网络数据,采集器用来收集探测器传来的数据,而报告系统用来从采集器所收集到的数据产生出易读的、可操作的处理报告。将一些恶意性的用户和应用程序识别出来,对节省宝贵的网络资源至关重要。
5、网络的自动调整与配置管理
当一个网络处于极度的低迷状态运行时,网络的性能就完全失去了保障,这时就需要对网络配置进行必要的调整,以便使之恢复正常的状态。然而,网络的配置是整个网络管理环节中最为复杂的工作,经验的积累不用说有多么重要。即使有经验的网络管理员,也不敢保证可以解决任何出现的网络配置问题。OpManager的一个特别重要的功能就是可以在有条件的基础上完成网络设备的自动配置调整,并可以定期对网络配置信息进行备份,以便在故障到来而时候,完成配置的自动调整和管理,这无疑会减轻网络管理人员的繁重负担。图5就给出了OpManager在网络自动调整和配置管理方面常见功能。
6、VoIP性能的监控和故障排除
无论是对VoIP设备就绪情况的自查,以及对VoIP设备性能的实时监控,还是对已经出现的VoIP呼叫故障的诊断和排查,OpManager都提供了丰富的功能和边界的工具,如图6所示。
7、丰富的、可视化的个性化地图体验
细心地读者可能已经感受到了,上述OpManager功能体验中,都离不开直观、内容丰富的可视化显示效果的支持。OpManager允许您利用Web浏览器来创建具有智能效果的地图,而且该地图具有和实际数据同步实时更新的功效,假如地图的数据来自于Google地图网,当Google的官方数据发生变更之后,OpManager的网络可视化信息也随之发生着变化,而且变化之后的信息可以以特殊的方式(比如红色)显示。图8是一个网络管理员使用谷歌在OpManager使用了地图功能的一个实例,该实例完成了针对分布于美国全国的48个分支机构的网络节点的监控。当监控图像上的一个地点变成了红色,该网络管理员马上就可以知道处于该位置的网络系统出现了故障,进一步点击该点所在的链接,立刻就会得到更为具体的故障诊断信息和可以采取的应对措施建议。
结束语
网络性能的管理已经成为提高软件整体应用效果的大课题,如何才能最大限度地发挥计算机网络的整体性能,如何才能减少网络故障给实际应用带来的不便,如何才能尽快确诊和定位网络故障,已经成为网络应用技术市场和领域热点。相信随着技术的不断发展和完善,人们必将迎来一个更加便捷、安全、舒适的网络环境。