网络通信 频道

经典案例:管理云服务性能的非常好的实践

  当企业把核心IT系统迁移到私有云或者公有云网络之后,工作并没有结束。现在,还有一套不同的技术问题需要处理:即如何管理云,以保证企业的投资得到回报,提供所期待的效率和投资回报。

  由于今年4月发生的亚马逊EC2(弹性计算云)服务中断事故,云管理和云监视已经变得更加重要。在那次事故中,IT领域看到了当云环境遇到故障时会出现什么情况,许多公司的业务随着这次断网故障而中断。最近还发生了一些严重的云中断事故。

  IDC分析师Mary Johnston Turner称,可以得到企业购买的性能是公有云的大陷阱之一。她在最近对250家个用户公司进行的调查报告中指出,服务等级协议性能担保排在重要性的第二位,仅次于应用程序本身的具体需求。

  Turner称,企业非常担心性能。企业对私有云如此感兴趣的原因之一是因为IT领导者负责为自己的用户得到良好的性能。他们不准备把这些巨大的责任交给第三方云厂商。

  当涉及到云计算的时候,管理软件不再是一个事后考虑的事情;它必须是实施的一部分,每一次做决定的时候都必须要考虑如何最好地把云能力集成到企业的IT架构中去。

  软件即服务(SaaS)和基础设施即服务(IaaS)这两种类型的云计算承诺给企业IT任务带来巨大的机会。如果IT专业人员要走在趋势的前面,他们确实需要学习如何在涉及到SaaS和IaaS的问题时像专家一样讲话。

  当涉及到云计算合同的时候,知识是关键,阅读是基础。

  她补充说,那不只是一个云问题,而是复合应用的复杂性产生的一个问题。接下来,这些复合应用将引进到云环境中。

  Turner称,这是一个巨大的挑战。用户需要投资为复合应用和虚拟化环境制作的应用性能管理产品。现在这是一个完整类别的产品。

  这个思路是能够独立地监视应用程序在网络中的性能和在云中的性能,然后能够衡量那个应用程序在什么地方达到了用户的性能要求,是在防火墙内部还是外部。

  IGN.com是全球最大的视频游戏网站之一。对于该公司负责工程的副总裁David Ting来说,监视他的公司的云性能是非常重要的,因为这个业务的存亡取决于把该网站的254万用户连接到该网站由广告支持的在线游戏中的能力。

  Ting称,“对于我们来说,性能就是金钱,因为观看网页是关键。我们是由广告支持的,每一次观看网页的计数都能够帮助本公司带来收入。这是我们密切关注的事情。”

  要使它完全发挥作用,媒体巨头新闻集团旗下的ING娱乐部门使用位于旧金山的New Relic公司的性能监视工具连续不断地观察它的网站在云中的性能。Ting称,我们主要依靠这个工具。对于我们来说,这就是IGN网站的响应时间和每秒处理次数。

  随着云部署的扩展跟踪性能

  IGN.com在大约18个月的时间里一直使用New Relic工具。它首先把非生产性开发和其它应用迁移到云中以观察它们是如何工作的。现在,IGN.com正在把一些新的项目放在云服务器中,包括一个社交媒体栈,这样,该公司就能加强应用程序并且根据需要升级这些应用程序。此外,计划部署在这个云中的一个应用是这个网络的灾难恢复基础设施。

  Ting在谈到该公司的IT系统时表示,这个系统最终将全部迁移到云中。我们未来要做这个事情的时候必须保证性能的稳定性。我们正在关注这个事情。

  Ting称,New Relic工具监视能够提供IGN使用其它工具不能提供的性能指标。这些老式工具进行物理机器监视是很好的,但是,在没有工程团队做大量工作的情况下根本就不能进行应用程序栈监视。

  通过观察New Relic的管理工具,IT员工能够启动更多的基于云的服务器,关闭性能不佳的应用程序实例,然后根据需求增加新的实例以保持用户的响应时间。采用以前的工具,Ting的团队只能了解正常运行时间,看不到响应时间。

  Ting解释说,New Relic为响应时间提供了巨大的可见性。这允许IT员工甚至能够在服务器运行的时候采取行动。例如,我们发现一台Memcached(高性能的分布式内存对象缓存系统)服务器执行的实例性能比这个池中的其它服务器差很多。在进一步调查之前,我们发现一个内存模块出现了故障。在Nagios(一种开源的免费网络监视工具)环境中,那台服务器会一直运行到死机。

  IGN.com目前正在使用亚马逊的EC2服务进入云领域。

  采用New Relic工具, IGN.com能够观察这个三层架构的所有的方面,从它的前台到它的数据库再到它的API(应用程序编程接口)层。这个管理工具帮助保证用户响应时间处于优化状态并且不达到高峰。

  Ting说,“我们能够查看什么正在云中运行,使用插件收集数据并且把这些分析结果发回到New Relic工具。这些数据将非常详细地告诉你这些服务器组的性能如何。”

  “数据量和数据的准确性是非常重要的。这是我们查看指标的起点和能够使用它做出智能化商务决策的起点。”Ting说。

  除了迁移其IT基础设施之外,IGN.com一直在探索利用云托管它的100多个网站中的许多网站以便提高性能和正常运行时间。主要网站包括IGN.com、Askmen.com、Gamespy.com、Fileplanet.com、Teamxbox.com和Gamestats.com。

  “到目前为止,测试一直是积极的。我们已经让一些基础设施部件迁移到了云中。这个事情目前正处在试验阶段。我们在检查性能。”Ting说。

0
相关文章