网络通信 频道

赛灵思将数据中心单位功耗性能提升25倍

        【IT168 资讯】在2014年国际超算大会(Super Computing 2014)上,赛灵思公司(Xilinx)推出了针对OpenCL、C和C++的SDAccel开发环境,旨在为数据中心带来非常好的单位功耗性能,从而利用FPGA实现数据中心应用加速。SDAccel是可软件定义的开发环境,它隶属于赛灵思的SDx产品线,也是该产品线的最新成员。

  数据中心运维人员总是不断在寻求更高的服务器性能,尤其是随着云计算的发展带来数据中心的流量激增。目前,他们主要是通过易于编程的多核CPU和GPU来开发应用,但CPU和GPU都遇到了单位功耗性能的瓶颈壁垒。从事海量数据中心应用开发(如密钥加速、图像识别、语音转录、加密和文本搜索等)的设计人员既希望GPU易于编程,同时又希望硬件具有低功耗、高吞吐量和最低时延功能。

  然而,多核CPU和GPU加速器在可扩展性上存在严重的问题:因为客户希望用简单的全高度插入式PCIe开发板作为数据中心服务器的应用加速器。这种开发板经配置可运行高功率图形卡,但客户同时希望功耗不超过25W,以便最大化可扩展性并最小化总功耗。

  赛灵思公司亚太区销售与市场副总裁杨飞解释道,“不论是基于标准的x86服务器环境,还是单位器件功耗达到100W及以上的超算环境,都面临达到功耗天花板上线的困窘,一味的通过CPU/GPU扩展来实现,则意味着性能提升的同时,带来高功耗。而FPGA并行加速器能够突破这个局限。”

赛灵思将数据中心单位功耗性能提升25倍
▲赛灵思公司亚太区销售与市场副总裁杨飞

  赛灵思经过研发发现,基于FPGA的应用加速相比CPU/GPU实现方案,单位功耗性能可提升25倍,而时延则缩短了50到75倍,与此同时还能实现出色的I/O集成(如PCIe、DDR4 SDRAM接口、高速以太网等端口)。赛灵思认为FPGA能够在单芯片提供高能效硬件应用加速的功能,同时降低硬件的功耗。

  那么在同等物理环境中如何解决性能和功耗问题?FPGA也并非功能较多药,赛灵思认为,FPGA用于应用加速的最大问题在于编程,而之前以硬件为中心的传统FPGA开发路径,已经逐渐无法与开发人员的需求进行匹配,如单位功耗性能的提升,易于升级的设计,以及完全的软件开发环境。

  所以SDAccel开发环境能从这些方面给开发人员带来更大便利,简化编程提升FPGA平台用户的生产力,便于开发人员创建优化型的FPGA加速卡,带来更大价值。杨飞强调,“SDAccel可满足正在使用OpenCL或将使用OpenCL的开发人员需求。”

  做到单位功耗性能提升25倍,SDAccel凭借的是突破性的FPGA架构优化编译器,在FPGA上类似CPU/GPU的开发体验和实时运行体验。

  针对OpenCL、C和C++的架构优化编译器

  SDAccel的架构优化编译器相对CPU或GPU,单位功耗性能提高达25倍,相对其它FPGA解决方案,性能和资源效率提高3倍。SDAccel采用了已被1000多名程序员广泛使用的基础编译器技术。SDAccel利用该编译器的功能,使软件开发人员能够利用新的或现有的OpenCL、C和C++代码创建高性能加速器,并针对计算搜索、图像识别、机器学习、编码转换、存储压缩和加密等各种数据中心应用中的存储器、数据流和流水线技术进行了精心优化。

赛灵思将数据中心单位功耗性能提升25倍
▲SDAccel环境包括架构优化的编译器、库、调试器和分析器,并提供类似于CPU/GPU的编程体验。

赛灵思将数据中心单位功耗性能提升25倍
▲SDAccel编译器针对加速应用所进行的一系列优化

  在FPGA上实现完全类似CPU/GPU的开发体验

  借助SDAccel,开发人员能够使用其熟悉的工作流程优化应用,而且即便之前没有FPGA使用经验,也能受益于FPGA平台的优势。集成设计环境(IDE)不仅可提供编码模板和软件库,而且还能对各种开发目标进行编译、调试和特性分析,如在X86平台上仿真、使用快速仿真进行性能验证以及在FPGA处理器上进行本地执行等。IDE可在数据中心用FPGA平台上执行应用。该平台配套提供面向所有支持开发目标的自动仪器插入功能。此外,SDAccel还经过精心设计,使CPU/GPU开发人员能够轻松将其应用迁移到FPGA上,同时还可在他们熟悉的工作流程中维护和复用OpenCL、C和C++代码。

赛灵思将数据中心单位功耗性能提升25倍
▲面向开发人员的开发平台

  综合全面的SDAccel环境包括编程器用IDE、基于C语言的FPGA优化库,以及数据中心现成商用(COTS)平台。

  SDAccel库包括用于高性能低功耗实现方案的内置OpenCL函数、DSP、视频以及线性代数库。针对特定领域加速,赛灵思联盟合作成员Auviz Systems提供了精心优化的OpenCV和BLAS OpenCL兼容型软件库。原有的COTS成员包括Alpha Data、Convey、Pico Computing,预计2015年年初还将增加更多成员。

  在FPGA上实现完全与CPU/GPU的运行时间体验

  只有SDAccel能够支持带有多个程序和类似CPU/GPU按需可加载计算单元的应用。与CPU/GPU类似,SDAccel对于FPGA解决方案的独特之处,在于能够保持程序转换过程中的系统正常工作。SDAccel能够创建可在应用运行过程中加载新加速器内核的FPGA计算单元的环境。在整个应用执行过程中,存储器、以太网、PCIe和性能监控器等关键系统接口和功能均保持工作状态。即时可重配置的计算单元可让多个应用共享FPGA加速器。例如通过对运行系统编程,可支持图像搜索、视频转码和图像处理之间的切换。

       SDAccel的性能和价值

      那么由SDAccel生成的硬件加速器比同类竞争工具生成的加速器相比,有哪些价值呢?

赛灵思将数据中心单位功耗性能提升25倍
▲标准比较手动编码的RTL、SDAccel 以及市场上类似方案生成的结果

0
相关文章