【IT168 技术】云计算管理员们一般都工作在一个分布式局域网计算基础设施中,它与传统数据中心最大的区别之一就是,所有被存储、调配和管理的数据都在一个私有云中。基于云计算的高效工作负载监控可在性能发生问题之前就提前发现这些问题的苗头,从而防患于未然。了解你的云计算运行详细信息将有助于交付一个更强大的云计算使用体验。
收集云计算性能指标
IT管理员们必须积极主动地收集和记录云计算服务器的性能指标与数据,这主要是因为托管云计算工作负载的大多数服务器都是需要使用专用资源的虚拟机。对于云计算服务器来说,过度分配资源或分配资源不足都是一个需要付出高昂代价的错误。
适当的规划和工作负载管理是任何重大云计算部署工作之前必须实施的环节。当收集运行专用工作负载的特定服务器的性能指标时,管理员们必须评估如下参数:
CPU使用率:云计算服务器必须是物理的或虚拟的。管理员们必须查看机器,并确定用户是如何访问CPU资源的。当无数用户从云计算启动桌面服务或应用程序服务时,必须认真考虑这台服务器需要多少个专用核。
RAM需求:基于云计算的工作负载可以是RAM密集型的。在一个特定服务器上监控一个工作负载,可允许你衡量分配多少的RAM资源。其关键在于按需规划而不过度分配资源,你可以通过工作负载监控来实现这一目标。通过查看一段时间内RAM的使用情况,管理员们可以确定何时将会发生使用高峰以及相应合适的RAM等级。
存储需求:规模规划是云计算工作负载的重要一步。用户设置和工作负载分配都需要空间资源。还必须检查I/O:例如,使用中的引导和大规模应用高峰都可以秒杀任何一个未对这类事件做好预案和采取措施的SAN。通过监控I/O和控制器指标,管理员们可以确定特定存储系统的性能水平。你可以使用固态硬盘(SSD)或板载闪存缓存以阻止I/O高峰。
网络设计:网络及其架构在云计算基层设施与工作负载中起了一个非常重要的作用。监控数据中心和云计算内的网络将有助于确定特定速度需求。从服务器到SAN通过10GbE连接的光纤交换机上行链路将有助于减少瓶颈和改善云计算工作负载性能。
性能监控工具也是非常有用的。Citrix系统公司的EdgeSight收集服务器和端点等级的端点性能指标。通过理解云计算服务器是如何运行以及了解最终客户需求,管理员们可以确定合适的物理基础设施规模以便于支持虚拟实例。
工作流程自动化的优势
主动云计算工作负载监控可执行收集指标和统计数据的任务。在发生应用高峰时,许多系统都可以监控工作负载并提供工作流程自动化服务。
某些诸如旅游业这样的市场,往往在一年中的特定时间段会发生使用高峰事件。为了应对这样的突发事件,可以设置工作负载阈值,以便于一旦需求增加超过预设值时可创建新的虚拟机。因此,最终用户将总是可以访问数据和保持正常的工作负载,而无需做出性能牺牲。
工作流程自动化还有助于灾难恢复和备份等任务。由于在无数网站之间发生了数据复制操作,因此当另一个网站发生数据丢失时,远程的另一个网站就会承担这一工作负载。适当的工作负载监控和数据中心设计可以有助于提升系统的稳定性,而更为重要的是提高业务的连续性。
云计算监控提示
这里列出了一些有助于保持你私有云工作负载正常运行的规则:
了解你的物理资源。尽管在最初的时候物理资源似乎是无穷无尽的,但是事实上它们终究是有穷尽的。如果没有适当地监控和调配这些资源,这些资源会非常迅速地被用尽。云计算工作负载可以提出需求。规划是必须的。
主动保留运行日志。除了主动地监控云计算工作负载,云计算管理人员应当记录在一段时间内这一工作负载或服务器是如何运行的。云计算服务器可以升级,工作负载可以在不同物理主机之间迁移。在这些情况下,知道特定新旧服务器是如何分别设置运行可以有助于计算拥有总成本和投资回报。在很多情况下,良好的性能日志可以提供有用的统计信息以便于证明数据中心新增预算的合理性。
监控端点。从数据中心的角度来看,工程师能够监控和管理活动的工作负载。在端点处监控工作负载活动也是非常重要的。通过了解工作负载是如何被传递、是如何被接受,IT团队可以创建一个更为积极的计算体验。
当用户访问一个云计算中的工作负载时,管理员们就可以查看他们所使用的连接类型、数据如何传至端点以及是否有任何修改。在某些情况下,管理员们可能要使用到数据压缩或带宽优化等技术,从而使工作负载在端点处正常运行。