IT运维与业务融合是时下IT界最热门的话题之一。随着IT项目建设的不断深入和完善,核心业务系统的平稳运行已经成为了企业管理人员普遍关注,但又不堪重负的问题。近几年,我们发现有很多IT部门的管理者会炫耀已有的运维产品,很多企业管理人员最愿意谈论的,则是对业务服务有效管理的“亮点”,因为这能让企业获得全新的竞争效能,实现IT的价值。
在夸夸其谈的背后,IT系统若真的发生微小故障,却仍然会对核心业务带来巨大的影响,此时的业务服务管理就真的成为了浮云。因此,我们必须先把IT基础设施管理的完善和深入,进而获取“管理要素”,才可能使业务管理不会沦为是纸上谈兵。
为何业务服务管理受众人之捧
实际上在二十余年之前(1989年),就已经有了业务服务管理(Business Service Management,BSM)的理念基础,这套运维前辈们总结的IT服务管理(ITSM)理念和标准(ITIL),虽然有所变化,但其精髓时至今日仍然为企业提供了很好的借鉴。那么,为何现如今的企业管理者和IT部门的最高指挥官都在关注业务服务管理呢?
随着IT与业务融合受到越来越多的关注,BSM作为一个更高层次的概念,不仅是IT管理的规范化和流程化,还能促进IT与业务的加速融合。企业的领导层可以在运维部门、业务部门、资源之间很好地形成一种架构,以业务为中心,以部门为导向的方法,来处理业务对IT的需求。当你看到如此之多的好处,作为决策者,谁也不会放弃崭新的方法,以释放未被利用的IT性能,并对业务扩展的机会迅速做出反应。而CIO或是CTO则可以把BSM当成改变自己“公司地位”的手段,以便用非技术的业务术语向业务部门表述IT战略及IT资源的分配状况。这有助于IT部门和服务提供方摆脱由来已久的成本中心形象,促成BSM项目建设,能让IT部门终于有机会与业务面对面的交谈,并且提供了IT与业务相协调的确凿证据。
急功近利让BSM成为浮云
在现实的IT管理中我们都会遇到这样的情况,IT部门在整个企业架构中人员都相对较少,专业人员缺乏,这是IT部门经常反映比较多的问题。北塔软件通过对近百家企业IT部门关注点进行了调研,发现50%以上IT部门人员认为,设备管理仍然是最基础、最核心的运维起点。同时,90%以上的工程师认为抛弃基础设施管理去谈运维不具有实际意义,他们最害怕的还是设备故障造成的业务中断,因为这会影响业务部门以及领导对IT部门的绩效考核等等。
以最闪耀的“私有云”建设为例。目前,大多数数据中心都对具体的子系统分别部署了各自为战监控系统,私有云的远大目标让数据中心成为了一个更加复杂的系统,其中包括各种不同的团队、工具和流程,数据中心的设备蔓延成为了业务与IT融合的绊脚石。大而无当的硬件系统仍然需要大量劳动力进行维护,时间一长,数据中心运维工作就会越来越复杂,导致运维特有的灵活性下降,企业对“私有云”的忠诚度也会锐减。
北塔软件的调查结果让我们发现,其实大部分企业的基础管理还很不完善,对业务服务管理的建设过于急躁。不能落实对基础设施的统一管理,在这个基础上盲目实行BSM产生了更多“网状化的流程”,管理难度恶化。业务结构不断变化的本性造成运维实体复杂性的增加,因为业务系统中涉及的每个设备对象不能有效的整合,因变革带来的负效应开始出现在网络中。我们看到,运行维护人员依然还是整天还忙于“救火”,只不过是多了一套“救火”的口号而已。
目标回推理论与基础设施管理
很多学过《目标管理》的领导者都知道,世界首屈一指的成功学大师博恩·崔西曾经说过:“设定目标要遵循‘理想化’的原则,如果在设定目标的时候就顾这顾那,将各种限制因素都考虑进去,最终制定的一定是毫无奋斗意义的目标。”但我们也千万不要忘记,目标与现实之间一定存在差距,目标设定的意义正是引领和激励人们克服这个差距,取得成果。
北塔软件认为:“埃德温洛克的目标设置理论告诉我们,企业的IT管理中要实现BSM的目标没有错,错误在于没有制定可执行的计划。从BSM的终极目标开始计算,采用回推的方式,企业就很容易在现阶段找到运维的重点。先把真正急需的功能模块部署起来,根据自身的情况让BSM循序渐进的进行。”
在实现BSM之前,我们应该搭建业务综合管理平台,把所有IT资源整合到一个综合平台进行管理。在此基础上搭建业务模型,模型搭建好,通过“业务视图”便可实现统一管理,业务系统的详细管理流程化实施也相应出来了,这样才可以进入BSM实施阶段。
再往后退一步看,在业务综合管理平台之前,企业要做的事情就是解决设备层面的监控和预警难题。北塔软件副总经理孙永杰先生认为:“由于缺乏工具和资源,应用程序和服务的整体运行状况对企业来说仍是未知的,并且没有方法在 IT 部门中共享累积的知识。使用手动运维方式的用户会发现,IT环境极难控制,网络设备和服务器管理的成本非常高,所以IT部门才会在故障面前普遍显得很被动。”因此,在这一阶段是用户最希望的是把网络、路由器、交换机、服务器等纳入一个平台上进行管理,保证其运行不出问题。通过IT基础设施管理服务的建设,IT部门有能力提供7X24小时全天候对服务器、网络和数据库进行监控。工程师们会习惯,他们每天都会遵照和运用基础设施操作管理、问题管理、变更管理等对应的流程进行日常工作。
以上这些理论和实践,都为引入ITSM、ITIL和本文中反复出现的BSM,做好了积极而有效的准备。通过本文阐述的观点,希望你已经不再止于BSM层面乐观的探讨,而应该从深层次探究其技术的基础。IT部门不如将精力放在研究实现业务服务管理的依据是什么?等等这些很实际的问题。很显然,这需要充足的管理要素,以及步步为营的技术手段和保障措施,这才是IT运维的灵魂和魅力所在。