用户面对复杂\异构\庞大的网络环境,IT部门面临各种挑战,目前的管理手段很难实现PC-服务器-网络-数据库-中间件-应用系统全方位集中监控;客户需要一个整体的便于使用,产品成熟,功能全面,有很强的可扩展性的解决方案。
完全标准化、产品化的工具,能够满足目前的客户需求同时也能满足用户在未来相当长的一个时间段内功能上扩展的需求的产品;先进的体系架构,优秀的模块化功能组件。
产品功能定义
- 采集方式灵活,除支持本地数据采集外应该同时支持跨区域的分布\群集架构;
- 在满足针对网络、服务器、数据库、WEB、邮件、中间件等监管需求的同时还能满足业务和基于流程方面的管理需求;
- 采集方式安全可靠;多种协议支持和扩展;
- 完善可靠智能的故障处理手段,能够支持和自由定义多种的报警方式;
- 细颗粒度的用户认证和权限管理功能,能够实现不同用户非配不同权限和资源;
- 应用组建实现模块化功能,所有组件都可独立开发、安装、卸载,每个功能模块独立拥有业务接口和页面,同时能够实现调用其它组件或模块接口和数据;
- 面向服务的架构,每个业务、应用对应一个服务,界面层与业务逻辑层分离;
- 数据库通过实体XML描述实现,实现Java对象与关系的映射(Object-Relation Mapping),支持不同的数据库,业务逻辑层直接操作对象。
- 高度模块化界面,界面每个部分可在不同页面重新调用/使用;
- 支持B/S-C/S统一管理界面;
- 过滤一般性抖动故障:当出现故障后,系统应能够对故障信息进行验证,过滤掉抖动性故障。同时,当故障产生后,系统应能够以更加密集的监测频率监测故障点数据,直至故障消除;
- 智能告警关联(依靠):报警只报故障源头,系统应当能够屏蔽因故障源头造成的直接或间接故障对报警信息的干扰,实现准确故障报警;
- 业务、职能相关投影(虚拟组):对监测器能够进行重新编排,以便对影响业务的指标进行统一集中管理。应支持多套监测器重组方案,便于从多个角度对监测进行管理;
- =平面历史数据展现:应提供能够展示每个监测数据历史数据的汇总界面,方便对监测器数据进行回顾,快速寻找问题;
- 智能图表比例调整:图表应能够根据实际数据值进行智能比例尺缩放,便于观察出细微变化对系统性能的影响;
- 系统负载排名:监控系统应能够将监测的历史数据进行排名,帮助分析系统压力集中的关键点,解决系统性能瓶颈;
- 故障排查分析:出现故障后,监控系统应该能够将同类型或者故障设备历史同期数据进行叠加分析,帮助找到引发故障的根源,从而彻底消除故障;
- 资源节约:能够通过计划任务等方式,对监测时间、监测频率进行规划,以节约不必要的监测对系统的开销。