网络通信 频道

企业机房环境监控系统架构初探

  【IT168专稿】随着计算机的发展和普及,计算机系统数量与日俱增,其配套的环境设备也日益增多,计算机房已成为各大中型企业的重要组成部分。机房的环境设备(供配电、UPS、空调、消防、保安等)必须时时刻刻为计算机系统提供正常的运行环境。因为,一旦机房环境设备出现故障,就会影响计算机系统运行,造成数据传输或存储故障,当严重事故时会造成机房内计算机设备报废,机房服务器长时间瘫痪,后果不堪设想。

  企业机房环境监控系统就是通过分布在各机房内和设备中的传感器搜集数据。对会影响系统运行的因素,包括各种设备,如:UPS电源、交流稳压电流、发电机组、机房专用空调机组等的工作是否正常,机房的环境(温度、湿度)、火警报警系统、机房内的水害和安全防卫措施(门禁系统、电视监控系统)纳入网络管理范围。在监控网络中,操作者设定所需监测的温度、湿度、压力、电压、电流等监测数据的正常值,当某一部分某个参数的输入值超出设定的正常范围,监控系统就会发出报警信号,提醒机房操作人员注意,以便及时采用相应的措施。

  根据企业机房的具体实际情况,一般纳入环境监控系统管理范围的项目包括:机房网络供电(市电)质量;UPS主机的运行状态;机房恒温、恒湿专用空调的运行状态;机房内所有机柜内部的状态;机房主要工作区域内的温、湿度控制;计算机房内火灾报警系统中各探测器工作状态;自动气体灭火系统以及机房内水害报警等。面对如此多的项目,在设计时到底应该怎么进行呢?在这里将我们企业实现企业机房环境监控系统的一些经验与大家共享。
  
  一、规划设计原则
  * 提供机房安全的管理;
  * 方便对设备和环境的监控,提高机房的维护效率;
  * 详实的系统运行状态的记录和报警,做到无人职守。

  二、企业机房监控系统说明
  中心采用InfraStruXure监控系统,它是把计算机房内会影响计算机运行的各种因素,如环境的温度、湿度、电力供应情况、空调设备运转情况,纳入监控范围,另外计算机房的安全措施,如:门禁管制、消防设备工作情况,也可一并接受本系统的监视。机房内的工作人员,可从InfraStruXure 系统的图形警示板灯号和警报声,得知目前机房内,所被监控的设备,是否有异常情况发生。系统所提供的监控项目及架构:环境系统、空调系统、电力系统和门禁系统。

  1、设备和环境监控系统
  我们这里采用APC 公司企业级电源管理产品“英飞”管理器(InfraStruXure Manager)v4.0。“英飞”管理器是一种使用方便、易于通过浏览器访问的管理工具,用于帮助系统管理员方便地管理网络关键物理基础设施(NCPI)。它使用户不但可以对网络关键物理基础设施状况进行快速的评估,而且能够在影响可用性的事件发生时,通知相关管理人员;其分析功能帮助管理员对系统可用性、电源、运行时间及空调等需求的变化进行规划;通过“英飞”管理器的一个简单的管理界面,或者将“英飞”管理器集成到用户习惯使用的管理系统中,可以大大降低管理网络关键物理基础设施的复杂性,提高管理效率(图1)。

图1

  “英飞”管理器支持各种类型的APC网络化设备,如:UPS、PDU、制冷设备及环境检测设备,并具有一个集中管理控制台,网络中的所有APC设备的状态、运行状况都能够通过这个控制台界面显示出来,用户可以通过这个界面很方便的对整个APC基础设施进行监控及配置。

  我们看到它是一种1U 机架式服务器,对各种APC 产品提供了方便的、基于 Web的集中监视和管理。其配置为800 MHz 处理器、256 MB 内存、40 GB 硬盘,在PDU机柜上放置了一个24口集线器,通过CAT5网络线缆与APC设备连接,收集InfraStruXure系统的全部信息,只需要用户的一个IP地址。它实现主要功能如下:

  ①集中管理
  可以通过网络上任何位置的web浏览器远程配置、控制和监视APC InfraStruXure 整个系统以及所有子系统的组件(包括电源系统、机柜系统、制冷系统),图2就是InfraStruXure 系统网络管理结构图。

图2

  ②电流阀值监测
  可监控每一分支电路的电流,并且报告潜在的超载情况,确保连接的设备正常工作。

  ③环境监测
  通过APC的环境监测器可监测环境温度、湿度、漏水报警和干节点输入,对于潜在的环境问题产生报警通知,以预防由于环境问题对InfraStruXure系统组件造成损坏(图3)。

图3

  ④电子邮件/短信通知
  可以在电源系统或环境发生问题,并可能对负载造成影响之前及时通知用户。由于该管理器中内置E-mail报警功能,可通过电子邮件的形式通知管理员,甚至还可以将通过电子邮件服务商借助移动通信网络把电子邮件转换成手机短信来通知UPS管理员。

  ⑤网络集成管理
  在网络管理系统中设置SNMP陷阱(事件),可以仅在一个界面中显示所有APC子系统的组件和网络结构,方便管理。

  ⑥事件日志
  可以通过事件日志纪录确定事件发生的时间和相互顺序。

  ⑦数据日志
  可以提供每个APC InfraStruXure子系统组件的历史数据,用以对设备使用作以分析。

  ⑧自动侦测APC InfraStruXure子系统组件
  可以自动发现和管理新的子系统组件,无需手动添加,减少安装时间。

  ⑨APC企业级网络集中管理
  APC Enterprise Manager是一个基于Web的企业级、大量UPS集中网络管理、实时管理和报表管理软件平台,即可实现对APC所有系列UPS及网络附件产品进行集中实时管理。当电源问题出现时及时通知用户,独特的设备报表和电池状态报告可以对各基础组件作及时的维护和保养,此管理软件已经集成在“英飞”管理器(InfraStruXure Manager)V4.0内(图4)。

图4

  ⑩APC远程监控服务
  APC远程监控服务是一项需要购买的专业服务。通过APC专业工程师对用户的设备和周围环境进行监控管理,可用最小的成本满足IT管理者对电源设备管理的要求,保证做到防患于未然。

  2、各个子系统所提供的监控项目
  ①低压配电系统
  进线柜在运行中有很多重要的参数,例如电压、电流、功率、(有功、无功)功率因数、频率电度(有功、无功),通常是采用在电屏面安装仪表,由人工监视,柜内的自动空气断路器,过流保护的工作状态,以及总开关的状态也是由人工在现场监视。现在,进线柜的供电参数通过智能电量仪表把运行状态以数据的形式传输给计算机系统,智能模块采样后传输给“英飞”管理器,使现场达到无人值守。

  ②泄漏检测系统:
  主要用途是用于测量区域式漏水,它的原理是:控制器与金属材料线做成感应绳连接,用感应绳将有水源的地方围起。一旦有液体发生泄漏,感应绳通过控制器将接点式信号输到“英飞”管理器,及时通知有关人员排除。
 
  ③空调监控系统
  系统可全面诊断空调状况,监视空调的各种参数,可以通过系统直接设定空调机的各种参数,包括各种调试参数,系统—旦有报警,将自动切换到相关画面。越限参数将变色,并伴随有报警声音,有相应的处理提示,及相关处理提示。对重要参数,可作曲线记录,用户可通过曲线记录直观地看到空调机组的运行品质。空调机组即使有微小的故障,也可以通过系统检测出来,及时采取步骤防止空调机组进一步损坏。对严重的故障,可按用户要求加设电源电话语音报警。对普通空调,可加设自动启动装置,防止因空调电源停电后来电,空调不能自动启动,造成机房内温度过高。

  ④UPS系统
  全面诊断UPS状况,监视UPS的各种参数。一旦UPS报警,将自动切换到相关画面。越限参数将变色,并伴随有报警声音,有相应的处理提示。可根据用户需要设置电话语音通知。对于重要的参数,可作曲线记录,可查询一年内的曲线,并可显示选定某天的最大值,最小值,使管理人员对UPS的状况有全面的了解。 

  ⑤机房内温、湿度检测
  由于机房面积较大,为了监视机房内的温度、湿度的质量,现加装温、湿度传感器检测机房内各点的温、湿度;机柜内各点的温、湿度,以保证机房内各设备正常工作,不受侵蚀。

  ⑥保安电视监控系统
    保安电视监控系统通过前端的高清晰度摄像头及时有效的截取监控画面,再通过视频线传送给监控中心,并结合场地需要,可选配大容量硬盘存储功能,  夜间自动切换黑白镜头功能,动态摄像功能。在摄像头的布置上,可以根据用户的需要,对主入口、设备区进行监控。

  ⑦门禁监控功能
  可以与监控中心联动,一旦出现火情等情况,可紧急打开疏散门,保证人员疏散。

  三、小结
  我们在使用这套机房环境监控系统一年多以来,提高了工作效率,改变了原先机房值班人员定时巡查机房环境设备,减轻了管理人员的负担,做到能及时排除故障,能够科学管理,分析发生故障原因,对已发生的故障作全面的分析数据,使得问题得到完善的解决。因此,对机房环境与设备的集中监控和科学管理,采用一套好的机房环境监控系统就显得非常重要,也是大型机房随着IT技术发展的必然趋势。

0
相关文章