网络通信 频道

Avocent季晓文:绿色数据中心运维之道

  中国IDC圈12月16日报道:由中国IDC圈、赛迪顾问联合主办,中国计算机报、IT时代周刊、中国IT实验室、通信产业报协办的“IDC产业突破与互联网运维创新论坛。第四届中国 IDC产业年度大典“在北京新世纪日航饭店。世纪厅举行,Avocent季晓文先生出席大会并做主题演讲。

  季晓文:

  大家好!今天荣幸能在这里,在IDC这个非常热门的话题下跟大家展开一些讨论。如果看过Avocent这样一个主题,大家可能会有一些疑惑。Avocent不是一个设备供应商。

  回到原来我们所定义的客户来讲,IT架构是他们非常引以为骄傲的成果。跟IDC有什么关系?谈到了一个它的经历。它去IDC里面租用了资源,空间的资源,安全的资源,电的资源,机柜的资源,然后把自己的设备放进去。但是随着整个架构,IT的核心层面上讲,他将这部分的管理企图外包。这个时候他发现原来所找的IDC没有办法做这个。因为他们只是卖自己的资源而不是卖自己的服务,大多数的IDC是卖资源而不是卖服务的,卖管理服务的。那两家厂商来讲是全球最大的IT厂商,两家都提供了的服务给他的客户。他选择了另外一家。

  在IDC这个市场上参与竞争的人不仅仅是电信运营商,我们的一些民营的运营商,其实来自于国外的很多很多的厂商,或者说来租用原来那些IDC参与者的资源,在上面构建自己的服务,形成一个包裹来提供给他的客户。甚至于他自己在中国大陆上构建自己的服务,呈现给他的客户群。所以说我们会看到在IDC这个市场上,可能服务已经分成了不同的等级。有些只能提供自己的资源服务或者是安全服务,有些能够提供管理服务在这上面。当你需要提供管理服务的时候问题就在这里面,你怎么展现自己的服务?

  又回到我们所构建的这个客户,对于他来讲,他要求这个服务的供应商能够展现自己如何管理他的数据中心的,数据中心当然是构建在他系统里面的一个过程,细节。比如说讲到电,这是一个很高成本的问题。他需要非常详细的报表能够告诉他,到底他的服务器,每一台服务器是如何耗能的,有什么样的趋势,每个月都要有这样的报告。如果不能展现这个报告的话,原来他租用的资源供应商他只能放弃,因为他要看到他所购买的服务到底是什么样的内容,它是怎么组建起来的,怎么运行的。当然大家会说,其实你看到的无非是报表,无非是报告,你不知道报告的内容是否属实。当然这是运营商的诚信在里面,超越了我们的范围。

  如果要上升到IDC这样一种运营服务的供应商角度来说,你必须有能力展现这个方面。当然首先你要有能力提供这个服务。在这样一个背景下,我们会发现对于Avocent这样一个只是在企业用户级层面上的供应商来讲,我们会发现在IDC里面我们有非常大的伸展自己手脚的机会和市场。所以今天我非常荣幸的参与到今天这样一个大会里面去谈我们能够来做什么。

  其实如果看到这一块来讲,我们会发现,对于一般意义上,我们如果把数据中心按照技术的架构展开来,剖析开来,最上面是数据和业务。所以数据中心本身是数据的集合,这是跟业务相关的。下面是IT架构,这里特意分成了逻辑架构。如果我们看一些IT的这样一个将来发展的展望来讲,其实我们将来所看到是一个IT架构是一个逻辑的概念,或者说它是一个虚拟的概念,它是运行在物理基础设施上面的。所以说到了将来那一天来讲,IT架构的调整是可以根据模型来驱动,或者可以根据需求直接驱动的。这是将来的事情。下面是IT基础设施,一台一台的服务器,一台一台的存储设备,网络设备,这是硬的,是一台一台的设备。如果我们把绿色这个概念拿进来,会经常发现这样的趋势。原来我们把IT架构和IT基础设施统称为IT架构交给系统管理员,交给网络管理员,他既管里面的系统,又管里面的硬件。

  我们看到了一个趋势,硬件越来越和软件结合在一起管理。其实系统,逻辑的系统,操作的系统可以游离在硬件之上,可以牵引。所以已经没有必要把操作系统的管理和网络操作系统的管和你的硬件死绑在一起,而可以采取一种资源友好的方式进行大的管理。大的客户群在它的数据中心有一个特定的管理小团队,叫做设备与环境。其实就是这样的,他将设备结合在一起进行管理。这些团队管理硬件,管理机架,管理布线。

  如果把它整合在一起会看到管理的任务在哪里。第一就是配置管理,对于任何一个IT来讲,配置是无所不在的,无论是软件还是硬件,无论是系统还是网络,配置是无所不在的。当然这个配置大家觉得太简单了,无非是把设备上架,其实这就是配置。无非是跳线从这个口到那个口。但是你如果面对的是几百个机柜场所来讲的话,这些配置所产生的数据量已经非常非常的大。它不再是那么简单的可以用一张Excel表就可以理清的。

  如果再讲一个实际的案例,我们帮客户做配置管理系统的时候发现一点。在上这套系统之前他采用了大概6—8张的表在管理自己所有的配置。但是很大一个问题在于数据的不一致性。因为维护这6—8张表的并不是一个人,而是一个Team,甚至是跨越几个Team的,很多人都在往这个表里写配置数据。问题是如何相互之间达成沟通维护这个数据。如果一致性丧失的话,你知道哪个拷贝,或者哪一条数据是真实的?你没有办法判断它。所以说这个时候,原先那种管理模式,当你的规模上升到一定程度的时候必须发生变化了。为什么要引入到原来只是跳几根线的管理。

  监控包括动力监控、环境监控,这是这个里面非常重要的一点。当然配置和监控这两者之间是不可分的。原因是为什么?配置告诉你的是你的现场应该是怎么样的。而监控告诉你的是你的现场实际是怎么样。如果你只知道自己的现场实际是怎么样的话,其实你并不知道现在这个现场是安全的还是有风险的,还是已经存在威胁的,你必须和自己的配置相比较才能得出这个结论。当然有的人说看温度表就知道温度是高过还是过热,其实你的大脑里面有一个配置,是供应商给地的配置。

  对于目前来讲,所有的系统管理员都不能完全依赖于自动化的管理来对自己的系统进行配置,所以系统配置里面必定要引入很多人工的东西,当系统配置需要人工参与的时候,最需要的一点,也是最基本的一点就是接入。怎么保证系统管理员或者是网络管理员,对于这台设备的介入和控制,这是一条链路。当然多人说系统本身是提供链路的。系统提供的很多链路来讲在网络层是一个服务,这个服务的依赖性依赖于系统的正常,包括操作系统内核的起来。所有的系统管理员都会依赖于一些最忽视的,但是最实际的端口。其实这是最实际的。但是当你把硬件和系统管理员剥离开来的话,你需要展现给系统管理员,使得分成管理没有对他的管理任务的实现。

  对于IDC运营商来讲需要监控和配置。对于接口这块来讲,设备在你的场景里面。你需要将这些配置和控制接入的端口能够提供给你的客户。他只能到现场来做,影响他的效率。如果你用一种实际的方式帮他解决的话,这是一种非常好的方案。

  这几方面在构建IDC的运营的时候都可以包含在这里面。成本如何核算是一个商务性的问题。

  讲到配置,我们可以看一下,在这个层面上的配置是异常简单的。说老实话可能只是一些简单的加减法。但是问题是加减法的对象是由于规模的庞大而变得庞大。这个时候来讲,我们所说的一个问题在于模型。通过一个模型将所有的配置数据都关联在一起,这就是配置系统的核心。我相信有一点大家非常明确知道的一点,对于所有管理人员来讲他要的不是数据,要得是信息。你给他一张Excle表只是数据,不是信息。张三写的表交给李四,李四不一定看得懂。但是对于一个模型来讲,它应该有能力展现的是直接的信息,而不是简单的数据。他应该将数据展现成信息,信息再往上是知识。这是另外一个超越的智能系统在这上面。

  信息最简单的是图形化的展示方式。对于这个层面的管理业务来讲,图形化的展示是非常容易理解的。这是一个机房的平面,是非常容易理解的事情。这是一个机柜的信息,这些都是信息,这不是简单的数据。每个人都能看懂。这是这个设备上所查的卡。这是设备与设备之间的连线,你的网络到你的服务器的连线,都非常清晰的展现在这个里面。在这个配置系统里面不是讲这一幅一幅的图记录在这个上面。这就失去了它的意义。它保存的是一个一个的数据,只是它在展现的时候用大家都能理解的方式展现出来。这个时候大家会问,如果这些信息和实际情况是完全属实的话,这就意味着我对管理人员来说很多的工作可以依赖这个模型来做,我的设计,我的调整,我的变更,都可以依赖这个模型来做。但是实际和这个之间如何保持一致,可以有人工的。这里会包含很多新的技术。

  绿色的,红色的,黄色的都代表什么?容量。当我们把IT基础设施,IT硬件设备整合在一起的根本原因在于数据中心其实对于IT来讲是一个容器。它承载了所有的IT硬件,因为IT硬件有自重,有体积,有散热,有耗能。所有的这一切都依赖于数据中心来包裹它,承揽它。所谓的配置就是在于使得你的IT设备进入到这个机房之后消耗最合理的配置,消耗最合理的资源。或者说你的一组IT设备,我们可以这样讲,这个容器是多个维度的。刚才提到的四个维度,承重、散热、空间和耗电。这四个维度任何一个维度被耗尽的情况下这个数据中心就要改建,扩建。当然最理想的情况下,这四个维度都很平均的被耗用。如何做到很平均的耗用?当然我们可以回顾想一个数据中心设计的问题。当我们建设一个数据中心的时候首先看到的是我们会预见将来5年里面我们所采用的IT技术是什么样的技术,是多核技术,刀片技术还是虚拟技术,这些都会决定我们在这四个方面所要承载的负载。所以说我们会根据这些参量建设数据中心。

  但是数据中心一旦被建立的话,会影响你未来1年,2年,乃至于未来生命周期你所放进来的IT设备。今天我们看很多企业的数据中心,机柜里面的设备密度是很低的,一般只有一半左右,可能是电不够了,热太多了等等的一些问题导致我们的机柜密度是偏低的。

  很多方法去解决,其实合理的配置管理是其中可以选择的一种方法,在这个里面。所以说容量的管理是直接跟配置管理相关的。配置管理的角度来讲可以是配置和变更。任何一个配置都会是调整,即使是你管理硬件,随着新业务的上线,旧业务的下线。你的数据中心不停的变化。这当中所发生的也是配置的变更。对于配置变更来讲,变更是一个流程,这里面有很多的阶段,变更的设计,变更的审核,变更的批准,变更的实施,变更的审计等等的阶段都是要在变更这个里面把它纳入起来的。

  当然对于Avocent来讲,我们在自己的解决方案,这个配置系统来讲,它本身不是一个流程控制的系统,但是它是一个实现各个阶段,各个步骤的一个很好的体系。如果你将它和一个自动的流程控制系统衔接起来的话地它会变成一个自动化的配置流程。你把这个系统和你的管理章程结合在一起的话,它是一个人工驱动的,规章驱动的变革的过程。

  资产其实也是非常重要的一部分。所有的地方都是资产。在这个系统来讲,我不把它定成资产管理系统,它更大的作用是在于配置这一方面。当然资产也是必不可少的,因为资产是配置的一部分,很多是这么讲的。讲到资产的话,Avocent有一套完整的资产生命周期管理,从资产的申报一直到资产的报废,处理,这个生命周期都在这个里面。数据中心里面其实是整个生命周期里面的一个阶段,生产阶段。在生产这个阶段里面,资产的情况到底怎么样?可以从这个配置系统里面拿到非常详细的数据。所以说很多时候我们会说你有很多很多的方式去做资产管理,当然我们往往讨论的可能是通过基于IT的发现资产。但是很多资产可能是IT发现不了的,特别是那些连网线都没有接上去的资产,PDU的资产,这些都需要管理。

  基于配置管理系统之后产生报表,对于IDC来说,对于所有人讲,客户看的是报表。报表反映的是过程。报表这块,包括的报表是依赖于数据所产生的,把里面的数据变成了统计的信息展现在面前,这也是这个系统当中非常重要的一个接口。它会给到你或者说你的客户一个非常清晰的,对于某一个特定的周期或者对于某一个类型,某一种配置非常详细的统计的信息。非常重要的一点是统计的信息。

  所以说Avocent提供的叫做AMIE,这是一个非常适用于在数据中心里面,对于物理这个层面进行管理。IDC提供的很多服务都是在物理层面上。有了它之后,其实可以这样讲,原来我们说管理有粗放的管理到细致的管理,其实依赖于配置管理是进入到精细管理的阶段。对于IT来讲,我们同样经历所有管理都到发生变更的阶段。

  监控这块可能不用提太多,环境监控,时时的数据在这个里面。我希望大家能够看到的一点在于对于监控的数据,其实不要太把自己的注意力放在时时的数据。时时数据可能是底层那些运维人员非常关注的一点,他要捕捉异常。但是非常重要的一点是,有没有你们关注过长期的数据?一个阶段性的数据,一个对于监控数据的统计的结果。其实它能够告诉你运行的整体状态到底是怎么样的。

  非常简单提一个问题,如果你只告诉你的客户今天机房是什么温度,你根本没有办法证明明天这个机房还是这个温度。你只能告诉他6个月的温度,1年的温度都是这样的,才会让客户相信明天的温度才会是这样。所以说对于监控来讲,时时的数据非常简单,但是对于数据的整合,统计来讲是监控里面往往被忽视的,它能够展现服务的质量。

  对于连接来讲,这是Avocent的强项,可以说是Avocent的传统。因为我们跟IDC的运营商都有很长期。

0