【IT168专稿】随着计算机的发展和普及,计算机系统数量与日俱增,其配套的环境设备也日益增多,计算机房已成为各大中型企业的重要组成部分。机房的环境设备(供配电、UPS、空调、消防、保安等)必须时时刻刻为计算机系统提供正常的运行环境。因为,一旦机房环境设备出现故障,就会影响计算机系统运行,造成数据传输或存储故障,当严重事故时会造成机房内计算机设备报废,机房服务器长时间瘫痪,后果不堪设想。
企业机房环境监控系统就是通过分布在各机房内和设备中的传感器搜集数据。对会影响系统运行的因素,包括各种设备,如:UPS电源、交流稳压电流、发电机组、机房专用空调机组等的工作是否正常,机房的环境(温度、湿度)、火警报警系统、机房内的水害和安全防卫措施(门禁系统、电视监控系统)纳入网络管理范围。在监控网络中,操作者设定所需监测的温度、湿度、压力、电压、电流等监测数据的正常值,当某一部分某个参数的输入值超出设定的正常范围,监控系统就会发出报警信号,提醒机房操作人员注意,以便及时采用相应的措施。
根据企业机房的具体实际情况,一般纳入环境监控系统管理范围的项目包括:机房网络供电(市电)质量;UPS主机的运行状态;机房恒温、恒湿专用空调的运行状态;机房内所有机柜内部的状态;机房主要工作区域内的温、湿度控制;计算机房内火灾报警系统中各探测器工作状态;自动气体灭火系统以及机房内水害报警等。面对如此多的项目,在设计时到底应该怎么进行呢?在这里将我们企业实现企业机房环境监控系统的一些经验与大家共享。
一、规划设计原则
* 提供机房安全的管理;
* 方便对设备和环境的监控,提高机房的维护效率;
* 详实的系统运行状态的记录和报警,做到无人职守。
二、企业机房监控系统说明
中心采用InfraStruXure监控系统,它是把计算机房内会影响计算机运行的各种因素,如环境的温度、湿度、电力供应情况、空调设备运转情况,纳入监控范围,另外计算机房的安全措施,如:门禁管制、消防设备工作情况,也可一并接受本系统的监视。机房内的工作人员,可从InfraStruXure 系统的图形警示板灯号和警报声,得知目前机房内,所被监控的设备,是否有异常情况发生。系统所提供的监控项目及架构:环境系统、空调系统、电力系统和门禁系统。
1、设备和环境监控系统
我们这里采用APC 公司企业级电源管理产品“英飞”管理器(InfraStruXure Manager)v4.0。“英飞”管理器是一种使用方便、易于通过浏览器访问的管理工具,用于帮助系统管理员方便地管理网络关键物理基础设施(NCPI)。它使用户不但可以对网络关键物理基础设施状况进行快速的评估,而且能够在影响可用性的事件发生时,通知相关管理人员;其分析功能帮助管理员对系统可用性、电源、运行时间及空调等需求的变化进行规划;通过“英飞”管理器的一个简单的管理界面,或者将“英飞”管理器集成到用户习惯使用的管理系统中,可以大大降低管理网络关键物理基础设施的复杂性,提高管理效率(图1)。
图1 |
“英飞”管理器支持各种类型的APC网络化设备,如:UPS、PDU、制冷设备及环境检测设备,并具有一个集中管理控制台,网络中的所有APC设备的状态、运行状况都能够通过这个控制台界面显示出来,用户可以通过这个界面很方便的对整个APC基础设施进行监控及配置。
我们看到它是一种1U 机架式服务器,对各种APC 产品提供了方便的、基于 Web的集中监视和管理。其配置为800 MHz 处理器、256 MB 内存、40 GB 硬盘,在PDU机柜上放置了一个24口集线器,通过CAT5网络线缆与APC设备连接,收集InfraStruXure系统的全部信息,只需要用户的一个IP地址。它实现主要功能如下:
①集中管理
可以通过网络上任何位置的web浏览器远程配置、控制和监视APC InfraStruXure 整个系统以及所有子系统的组件(包括电源系统、机柜系统、制冷系统),图2就是InfraStruXure 系统网络管理结构图。
图2 |
②电流阀值监测
可监控每一分支电路的电流,并且报告潜在的超载情况,确保连接的设备正常工作。
③环境监测
通过APC的环境监测器可监测环境温度、湿度、漏水报警和干节点输入,对于潜在的环境问题产生报警通知,以预防由于环境问题对InfraStruXure系统组件造成损坏(图3)。
图3 |
④电子邮件/短信通知
可以在电源系统或环境发生问题,并可能对负载造成影响之前及时通知用户。由于该管理器中内置E-mail报警功能,可通过电子邮件的形式通知管理员,甚至还可以将通过电子邮件服务商借助移动通信网络把电子邮件转换成手机短信来通知UPS管理员。
⑤网络集成管理
在网络管理系统中设置SNMP陷阱(事件),可以仅在一个界面中显示所有APC子系统的组件和网络结构,方便管理。
⑥事件日志
可以通过事件日志纪录确定事件发生的时间和相互顺序。
⑦数据日志
可以提供每个APC InfraStruXure子系统组件的历史数据,用以对设备使用作以分析。
⑧自动侦测APC InfraStruXure子系统组件
可以自动发现和管理新的子系统组件,无需手动添加,减少安装时间。
⑨APC企业级网络集中管理
APC Enterprise Manager是一个基于Web的企业级、大量UPS集中网络管理、实时管理和报表管理软件平台,即可实现对APC所有系列UPS及网络附件产品进行集中实时管理。当电源问题出现时及时通知用户,独特的设备报表和电池状态报告可以对各基础组件作及时的维护和保养,此管理软件已经集成在“英飞”管理器(InfraStruXure Manager)V4.0内(图4)。
图4 |
⑩APC远程监控服务
APC远程监控服务是一项需要购买的专业服务。通过APC专业工程师对用户的设备和周围环境进行监控管理,可用最小的成本满足IT管理者对电源设备管理的要求,保证做到防患于未然。