网络通信 频道

快速发展的人工智能可以激发数据中心创新

  人工智能(AI)的指数级增长为未来提供了令人兴奋的前景,并为包括数据中心在内的各行业提供了无数的潜在好处。然而,人工智能的发展给数据中心行业带来了重大挑战,其中最重要的是鼓励进一步发展所需的资产的概念和实施。

  数据中心老化带来的挑战和行业对实现更高可持续性标准的广泛期望是重大的,但这也激发了运营商、供应商和其他人的创新思维。当涉及到所需的巨大电力负载和冷却计算基础设施的能力时,业界最优秀和最聪明的人正在探索新的途径,将概念从绘图板转化为数据中心的安全、智能和可持续的实际应用。

  据2023年的一项研究预测,到2030年,我们将需要约35GW的云数据中心电力容量来满足人工智能需求,而2022年底所需的电力容量约为17GW。显然,这意味着必须建设更多的数据中心,可以在短时间内进行操作。从根本上说,由于负载曲线并不像当今大多数数据中心那样平坦、一致和静态,因此最重要的是新建建筑,而不是重新利用设施。

  另一个重大挑战是机架密度的增加,或者机架中IT设备的总千瓦数的增加,因此需要消散的热量。如今,大多数托管数据中心每个机架的功率约为7kW。一些超大规模的机架功率更高,达到30-50kW,但对人工智能的预测是每个机架80-150kw。由于在狭小的空间中需要如此多的电力,现有的数据中心无法有效地重新利用。

  考虑到人工智能对电网的需求,公用事业企业目前没有额外的30GW可以交付。结合预计的发电能力需求和从化石燃料转向可再生能源的推动力,在电网和输电系统老化不足以满足长期人工智能需求的背景下,电力供应商需要在短时间内进行大规模优化。

  当人工智能进入学习模式时,我们将观察几个快速负载步骤,其中设备将在50%到70%左右运行,然后上升到100%。它会在那里停留50到100毫秒,然后回落,然后每分钟重复这个过程2到4次,持续10分钟。

  行业动态

  从机架密度和可持续性的角度来看,随着我们对人工智能应用的了解越来越多,数据中心行业的理解也在不断发展。共识似乎是,当人工智能进入学习模式时,我们将观察几个快速加载步骤,其中设备将运行大约50%到70%,然后升至100%。它会停留50到100毫秒,然后下降,然后每分钟重复该序列2到4次,持续10分钟。

  这给系统带来了很大的压力,而发电机无法承受如此大的阶跃负载。然而,它提供了一个很好的创新机会。

  潜在的解决方案

  新产品和解决方案将带来变革,以满足电力生产和管理可持续标准日益增长的需求。例如,机架密度的增加是人工智能发展的一个功能,但从可持续发展的角度来看,它也增加了压力。如果我们在更小的空间内放置更高的功率密度,我们将使用更少的钢材、混凝土和其他建筑材料,从而减少碳排放。

  此外,许多数据中心运营商选择在建筑物外的开关设备屋中,安装低压不间断电源(UPS)系统、配电盘和配电设备。现场制造解决方案为可持续性提供了几个优势;它限制和加快了建设,并提供了更好的废物回收。

  由于机架密度的原因,液体冷却的容量将继续增长,超出我们目前使用的系统。多年来,IT设备的关键电源在数据中心中最为重要。展望未来,冷却将成为同样重要的功能。如果在芯片上升和下降时停止对芯片进行液体冷却,那么当芯片再次上升时,就会失去对冷却的控制。我们正在评估几种可能的解决方案,以帮助转移电力并转移现有拓扑的影响,这样它就不会仅仅影响发电机和/或公用事业。

  对于数据中心市场来说,这是一个非常激动人心的时刻,因为我们预计即将推出的创新将解决优化问题以及人工智能的指数级增长。随着新技术的发展,数据中心历来都在适应变化。那些有可能在人工智能挑战中获得最大成功的人是那些拥抱机遇、跳出众所周知的框框思考并寻求在不增加成本或牺牲可靠性的情况下解决问题的方法的前瞻性思考者。从宏观角度来看,相关的创新有可能超越数据中心,进入其他市场和行业,寻求利用人工智能的诸多优势来推进业务目标,并以促进可持续发展的方式实现这一目标。

0
相关文章