【IT168 厂商动态】随着各行各业信息化程度的不断提高,运维工作在IT部门工作中的比重越来越大。常言道,三分建设,七分运维。高效、精准、体系化的运维工作可以最大限度的将已有IT资源的承载能力发挥到极致,并最大程度的保障业务的正常运行。对一个团队的运维工作效果的考量可以有多个维度,资源监控是否实时准确、CMDB的数据是否完善、运维操作中自动化比例是否足够、运维流程是否规范清晰,绩效考核是否准确合理等。总之,一套完善高效的运维体系,对于各行各业的客户来说,都越发成为了一种刚需。为了更好的帮助企业建立起完善的运维体系,一体化运维平台的理念和产品也随之孕育而生。电力公司,作为保障国家重大战略资源的核心机构,其IT系统上承载的业务,关乎我们每个人的生产和生活。本文将从电力公司的业务架构的角度入手,阐述新华三的一体化运维平台在电力行业IT部门运维工作中发挥的重要作用。
一、一体化运维平台
ITIL定义了运维的三要素:人、流程和技术工具。一套完善的运维体系,必然是要将这三者完美融合在一起,产生化学反应,从而达到运维的终极目标:保障业务的正常运行。而从技术工具的角度看,一套完善又复杂的运维体系,总要有一套软件平台来去承载。而这套软件平台,又必然要能够将人、流程和技术三要素融为一体。于是,就有了一体化运维平台的概念。虽然都遵循了ITIL的基础理念,但市面上各个厂家的一体化运维平台无论是设计还是实现都有很大的差别。新华三的一体化运维平台,从逻辑上,可以分为四个大的方面:监控平台、自动化平台、流程平台以及CMDB。
▲图1 新华三一体化运维平台的架构
1、监控平台:
监控平台是一体化运维平台的基础平台,是将数据中心中涉及到的软硬件IT资源的运行状态、告警等信息统一监控起来。新华三的监控平台除了汇聚了各模块的运行数据,还要从业务的视角对监控数据进行整合和梳理,将IT资源运行与业务的健康、繁忙状况精确对应。从而更加精准的帮助运维人员快速发现问题、定位问题。
▲图2、业务视角的整合梳理
2、自动化平台
自动化平台是运维自动化工具的整合,代表了运维团队当前运维自动化的技术水平。包括自动巡检,自动告警分析,操作系统与虚拟化平台的自动化部署、脚本的自动执行与编排等。通过自动化工具,可以极大的将运维人员从重复的低技术含量的工作中解脱出来,大大提升运维的工作效率。
3、流程平台
流程平台是承载运维团队标准化流程工作的软件平台。承载的流程均是基于ITIL的运维管理流程,如事件管理、问题管理、变更发布管理、值班管理、知识库管理等。通过流程平台可以规范运维流程、量化运维考核、传递运维经验等。
4、CMDB配置管理数据库
CMDB的中文名称是配置管理数据库。它是一体化运维平台的核心所在。所谓的运维体系,严格意义上来说,也就是一个以CMDB为核心的运维体系。CMDB根据实现的程度分为两级:低级的CMDB全方位记录IT资产属性信息,形成运维团队的“台账”系统;高级的CMDB还要基于记录的资产属性信息,梳理并维护资源之间的关系网络。一个全面、实时、精准的CMDB可以支撑所有运维工作的正常运转,为运维团队提供分析和决策的依据。
所以,一体化运维平台是一个内涵丰富的软件系统。其监控平台、自动化平台、流程平台与CMDB之间数据相互拉通,有机的融为一体。如监控平台中的配置项数据变化会自动同步CMDB;监控平台中发现的严重告警会自动生成流程平台中的工单,并触发自动化平台执行相应的检验和自愈操作等。总之,依托一体化运维平台,为客户打造一个完整的运维体系。
二、一体化运维平台在电力信息网中的应用
在电力行业中的网络分为调度网、信息网以及通信网。其中调度网相对独立,承载电力在电厂、变电站之间调度传输的业务,可理解为电力行业的生产网,其IT建设运维由自动化处负责;而信息网和通信网的承载了电力公司的办公业务、销售运营业务以及各电力公司之间的VPN通信业务等,运维主体一般由该省级电力公司直属的信通公司负责。
电力信息网规模大,软硬件资源的数量和种类都非常多。以某省电力公司为例,其信息网软硬件资源数量可达上万。为了运维和维护这张网络,信通公司一般采用“面向告警”的运维方式。一体化运维平台中的监控平台在这种运维方式下发挥了非常重要的作用。
信通公司设置监控部门,24小时通过监控平台对各种IT资源的运行状态进行监控。当发现资源产生重要级别以上的告警的时候,就立刻电话通知运检部门相关的责任人。运检部门是信通公司负责维修排障的部门,人数可达数百,半数以上为厂商驻场工程师。运检工程师通过监控平台了解详细告警信息,并及时处理。监控部门看到监控平台上告警恢复以后,作为工单结束的标志。
三、一体化运维平台在电力调度网中的应用
调度网作为电力公司的生产业务网,承载着各区域、各电厂、各变电站之间的电力调度传输的信息业务。调度网的网络、业务的建设和运维的复杂度要超过信息网和通信网。在调度网中,一体化运维平台所发挥的价值,以及它对调度网运维工作模式的改进,更是不可估量
1、省级调度网的网络架构
▲图3 省级调度网网络架构示意图
在调度网中,按照业务的不同分为一、二、三区。其中一区二区为生产大区,主要承载的业务为调度监控类业务、调度规划类业务、安全校验类业务等生产业务,一二区之间通过防火墙相连;三区又称为管理大区,承载着日常管理类业务(统称OMS系统)。管理大区与生产大区之间通过正反向隔离墙相连,少量数据通过摆渡的方式在两区之间传递。省调的生产大区和管理大区分别通过调度纵向骨干网,上联国调网调,下联各地调中心。
2、一体化运维平台在省调中的定位
在调度网中,一直存在着两个非常重要的平台:D5000平台和OMS平台。D5000平台涵盖了生产区和管理区业务系统之间的数据总线、服务总线,以及支撑这些业务系统所需要的国产数据库、操作系统、中间件等IT资源。调度网中所有的业务应用,都同意承载在D5000之上。D5000中的监控模块可以对其承载的业务系统进行监控,也可以对D5000本身的数据库、操作系统、服务器等进行监控;OMS系统是省调管理类业务的总称,包含了自动化处日常工作所需要的所有管理应用如资产信息库、工单流程等。
单纯的从D5000与OMS系统这两大平台的功能来看,分别与一体化运维平台之间有重叠。一体化运维平台似乎只能作为一个硬件监控的工具,D5000的数据来源之一。而通过新华三一体化运维平台在某省调中心里的应用实践来看,结果并非如此。即使D5000与OMS系统已经存在,一体化运维平台依然发挥着不可替代的作用。
关键在于一体化运维平台的定位是IT资源层面的统一运维平台和智能分析辅助决策工具。D5000的监控能力更多地体现在对业务应用本身的监控上,对于IT资源层面的监控能力较弱,尤其缺失对网络、存储等资源的监控,无法实现对IT资源层面统一的监控。OMS系统中有资产信息库和流程平台,但需要手动录入资产信息和事件工单,流程与监控脱节,自动化程度略有欠缺。
▲图4一体化运维平台的定位
在实践中,某省调中心通过新华三BSM一体化运维平台实现IT资源层面的大集中监控,并通过业务视角梳理成一张张业务卡片,与D5000上承载的业务应用一一对应。这种监控模式可以实现提前预防的效果,即当D5000上的业务应用尚可使用,但其对应的业务卡片健康度繁忙度却已经出现异常之时,提前介入解决问题。同时,通过CMDB中配置项关系的建立维护与智能分析,为运维人员提供智能辅助决策的依据。通过定制开发,实现了一体化运维平台中的CMDB、流程平台与OMS系统对应模块的数据互通,大大的增强了OMS的实时性和自动化能力。该省调中心创新性的将基于ITIL的运维体系引入省调运维工作,通过建立D5000平台、OMS平台和一体化运维平台三足鼎立又融汇贯通的运维格局,大大提升了运维水平。
3、一体化运维平台在省调中的实践效果
电力调度网作为一个承载特殊业务的网络(如图5所示),想充分发挥一体化运维的价值,还需要跨越几大技术门槛。
○ 正反向隔离墙的打通,使一、二区能够监控到的数据能统一的汇总到三区展示管理
○ 对国产数据库、操作系统的适配
○ 符合三级等保和四级等保的要求
○ 运维平台与OMS系统的对接
新华三一体化运维平台,通过实践积累,逐一跨越了技术门槛,实现了在多个省调中心的部署和使用。
▲图5某省调中心一体化运维平台部署架构图
结束语
电力行业是关乎国计民生的重大行业,随着IT信息化的不断发展,运维工作也将变得越发重要。在电力系统的十三五规划中,明确提出了对一体化运维建设思路的指导和要求。一体化运维平台的建设将越发成为推动电力行业IT水平发展的关键力量!