网络通信 频道

H3C:存储虚拟化,明天会更好

  海量数据的管理需求:虚拟化成为焦点

  首先,让我们来看一组数据:财富500强企业从1996年起存储空间急剧增长,基于服务器的硬盘存储空间从1996年的5TB,2002年增长到50TB,2007年达到230TB。很多企业的存储数据量每年增长50%,有的企业甚至达到了300%,这么巨大的数据增长涉及存储空间、管理等一系列复杂问题,给企业带来巨额的管理成本和设备成本。

  在传统的建设模式中,存储通常是被当作孤岛来管理的,在需要扩展的时候只是简单地添加新的存储子系统,而不是充分发挥现有资源的潜在能力,这种方式导致存储资源的利用率通常只有35%至50%。此外,由于管理存储资源所需要的成本是购买这些资源的三到五倍,为了创建一个高效率的环境,管理员必须掌握各种工具和娴熟的技巧,才能对大型、复杂和异构的环境实施管理。这种日益增长的存储空间和随之而来的管理压力已经成为了CIO们的心病。

  如何解决这个问题?存储虚拟化技术无疑是一个很好的选择。在这样的背景环境下,存储虚拟化技术迅速成为了业界的焦点。近年来,各个存储厂家纷纷推出了各种存储虚拟化产品,比如,H3C IV5000、EMC Invista、IBMSVC等等。一时间存储虚拟化市场风云鹊起,人声鼎沸。面对这么多的虚拟化解决方案,企业CIO们却没有感到庆幸,更多的是一种"乱花渐欲迷人眼"的困惑:到底什么样的虚拟化技术才是适合的解决方案呢?

  带内 VS 带外?实用的才是最好的

  为了对存储虚拟化有一个全面的认识,首先让我们来看看它的定义。

  SNIA(Storage Networking Industry Association,存储网络工业协会)对存储虚拟化是这样定义的:"通过将一个或多个目标(Target)服务或功能与其它附加的功能集成,统一提供有用的全面功能服务。"

  虚拟存储技术将底层存储设备进行抽象化统一管理,向服务器层屏蔽存储设备硬件的特殊性,而只保留其统一的逻辑特性,从而实现了存储系统集中、统一而又方便的管理。对比一个计算机系统来说,整个存储系统中的虚拟存储部分就像计算机系统中的操作系统,对下层管理着各种特殊而具体的设备,而对上层则提供相对统一的运行环境和资源使用方式。

  了解存储虚拟化的定义之后,我们再来看看其实现方式。不管是哪种技术,如果从数据流来看,都可以归为两大类:带内(In-Band)虚拟化和带外(Out-of-Band)虚拟化。

  带内虚拟化是指数据管理设备直接位于主机服务器和存储设备的数据通道中间;带外虚拟化是指数据管理设备位于数据通道之外,仅仅向主机服务器传送一些控制信息(Metadata),来完成物理设备和逻辑卷之间的地址映射。

  这两种虚拟化方法,哪一种更适用呢?

  如果采用带内虚拟化技术,如图1所示,虚拟化引擎位于主机和存储系统的数据通道中间,控制信息和用户数据都会通过它,而它会将逻辑卷分配给主机,就像一个标准的存储系统一样。目前市场上使用该技术的产品主要有IBM的TotalStorage SVC和 H3C IV5000等。


  带内虚拟化的优点是所有的数据访问都会通过虚拟化引擎,它可以很容易的实现存储的整合,并在此基础上为整个存储资源池附加丰富的数据管理功能。比如用户可以将多个不同类型的存储阵列整合成一个大的存储池,然后在不同存储阵列之间实现数据迁移、数据调度,甚至是远程灾备等。此外,带内虚拟化不需要在主机上安装特别的虚拟化驱动程序,使用方式和普通的存储阵列基本相同,实施也很方便。因此,在实际的应用中,带内虚拟化有着广泛的应用。

  但是,用户在部署带内虚拟化时通常面临如下问题:虚拟化设备可能会成为整个系统的性能瓶颈,一旦虚拟化设备发生故障,整个存储系统都会不可用。针对此问题厂家们采用了各种应对方法。以H3C IV5000为例,针对不同的应用规模,推出了不同规格的虚拟化引擎,面向数据中心的高性能的IV5680设备能同时提供16个4Gb FC接口和16个iSCSI接口,而双冗余设计也大大提高了虚拟化设备的可靠性,大容量缓存也保障了虚拟化设备的性能。此外,如果采用了"数据卷虚拟化"功能,在IV5000发生故障的情况下,服务器甚至可以绕过虚拟化引擎,直接访问存储阵列,从而避免了系统的不可用。

  如果采用带外虚拟化技术,如图2所示,虚拟化引擎物理上不位于主机和存储系统的数据通道中间,而是通过其它的网络连接方式与主机系统通讯。这种情况下,在每个主机服务器上都需要安装客户端软件,或者特殊的主机适配卡驱动,这些客户端软件接收从虚拟化引擎传来的逻辑卷结构和属性信息,以及逻辑卷和物理块之间的映射信息,在SAN上实现地址寻址,存储的配置和控制信息由虚拟化引擎负责提供。目前市场上使用该技术的产品主要有EMC的InVista和StoreAge的SVM。


  带外虚拟化的优点是数据流不经过虚拟化引擎,即使虚拟化引擎发生故障,原存储阵列也能继续工作。但是,由于需要配置主机端代理软件,带外虚拟化产生了更大的问题:性能下降、实施复杂、数据管理功能较弱。由于数据流不经过虚拟化引擎,要实施虚拟化,需要在每一台服务器上安装客户端代理,并且初始数据同步需要服务器参与,不仅降低了性能,而且增加了实施的复杂性。此外,带外虚拟化的数据管理功能也比较弱,一般只是用于两台存储之间的数据复制,而存储资源整合、数据迁移等高级数据管理功能实现起来非常困难。因此,带外虚拟化的应用非常受限,除了用于对单个存储阵列进行灾备之外,其它场合的应用非常少。

  虚拟化的更高境界:统一数据管理

  带内虚拟化和带外虚拟化都有各自的缺点,带内虚拟化会影响性能,带外虚拟化的数据管理功能较弱,那么在特定的场合,能否有一种虚拟化技术,能够同时整合两种方案的优点呢?

  H3C在这方面做出了新的探索,在大型监控存储领域和共享灾备存储领域,创造性提出了一套基于统一数据管理的存储虚拟化理论。

  在大型监控系统里面,可能部署成千上万个摄像机和海量的存储空间。如何管理这些摄像头和存储设备之间的对应关系是一个非常复杂的难题。H3C将IP存储和基于DM的数据虚拟化管理相结合,提出了一个革命性的海量存储架构。在新的架构里,所有摄像头和存储阵列通过IP网络互连,任意摄像头和任意存储阵列都可以互相访问,存储的管理通过存储架构的大脑――DM数据管理平台来实现。DM是一个带外的数据管理设备,所有的摄像头和存储资源都由其管理。摄像头需要存储数据时,会统一向DM申请,DM收到申请后,会从存储空间中选择合适的存储资源分配给摄像头,然后摄像头再跟这一块存储资源建立读写关系。在整个系统中,摄像头不需要知道数据存储在哪个阵列上,存储阵列和摄像头之间也没有特定的绑定关系,完全是一种动态的资源分配。这种存储架构既实现了带内虚拟化的海量存储资源的整合和统一管理,又具有带外虚拟化不影响存储访问性能的优点,实现了二者的完美结合。

  继虚拟数据管理在大型监控存储领域得到成功应用之后,H3C又将这种理念推广到共享灾备领域。共享灾备是一种新的灾备模式,它打破了传统的一对一独立自建灾备的方法,通过一个统一的灾备中心,面向多个需要灾备的接入单位提供服务。共享灾备在实现灾备资源整合的同时,大大的降低了建设成本。由于接入单位的环境各不相同,存储、服务器和应用系统五花八门,要在一个统一的灾备中心里实现灾备业务,必须要引入存储虚拟化技术和统一管理技术。H3C在共享灾备业务里引入了UDM(Unified Data Manager)统一数据管理平台。UDM是灾备业务的核心,它负责管理灾备中心的存储资源和存储业务流程。接入单位接入时,需要向UDM提出申请,然后由UDM选择合适的空间提供给用户,并且为用户建立好所需的数据保护关系。从用户角度而言,只需要关心灾备中心能够提供的数据恢复业务级别,而完全不需要了解灾备中心的存储是哪种型号,也不需要关心数据存放在哪个位置。通过这种革命性的虚拟数据管理架构,共享灾备为客户提供存储业务、存储资源和存储用户的融合管理解决方案,并在实际应用中获得了高度的认可。

  存储虚拟化:明天会更好

  今天的虚拟化技术在海量数据管理、异构系统整合、数据灾备领域发挥着重大作用,已经为解决数据管理难题打开了一扇窗。随着技术的不断发展和虚拟化应用的更加深入,以H3C为代表的存储厂家们正在逐步将虚拟化从单纯的设备级层面向数据管理层面提升,而具备强大的数据管理功能的虚拟化解决方案也越来越受到用户的认可。我们相信,随着更智能、更强大的虚拟化数据管理解决方案的推出,存储虚拟化的市场明天一定会更好。

 

0
相关文章