2015年9月16日,OpenPOWER基金会在京召开主题为“开放力量 ? 引领新一代计算技术”的第二代分布式计算技术峰会。恒扬科技携手来自IBM公司、赛灵思公司、无锡中太服务器有限公司、新浪网、清华大学等机构的领导、专家,以及ISV、FPGA技术人员和行业用户200余人共同出席了峰会。
峰会期间,OpenPOWER基金会宣布成立第二代分布式计算联盟,以推动新一代计算技术和应用的发展。同时,构建于SuperVessel云平台上的CAPI FPGA应用加速商城(CAPI FPGA APP Store)也正式上线启动。在峰会现场,来自多家企业和机构的嘉宾介绍演示了采用基于OpenPOWER CAPI和FPGA技术开发的针对擦除码加速、图像处理等应用加速方案。
第二代分布式计算时代到来 顺应大数据时代发展需求
随着移动互联网、物联网、云计算和大数据时代的到来,数据量呈爆炸式增长,新的工作负载不断涌现,企业在数据处理方面面临巨大的挑战,迫使其不得不寻求更加先进、高效的数据处理能力和基础架构。
随着支撑单位硬件计算能力提升的摩尔定律越来越接近极限,数据中心的空间和电力供应也已经无法跟上服务器数量的疯狂增长。分布式计算在软件和硬件架构上迎来了新的变化:新一代应用迫切需要通用处理器计算和特定目的的协处理器计算(加速器,如FPGA)混合异构工作。不同类型的应用负载可以被加载在两种甚至多种类型的处理器件上,以获得超过十倍甚至百倍的性能增速,同时能够相应减少服务器的数量,降低功耗和服务器占用空间。
恒扬科技创始人兼总经理李浩
第二代分布式计算基于POWER架构的实现是通过CAPI技术,让FPGA与POWER CPU直连,为CPU分担特定类型的运算负载,进行应用加速。CAPI技术为POWER CPU接入FPGA提供了方便,进行应用级加速从而达到异构计算。FPGA技术的应用可以帮助大数据的关键应用性能得到数倍到上百倍的性能提升,而功耗相比CPU和GPU有大幅度下降,仅有十瓦或者几十瓦。比如,在数据挖掘领域,第二代分布式计算可以加速至少10倍以上。在癌症治疗应用方案中,对模拟数据的计算加速更加惊人,采用CAPI POWER8+4 FPGA模式可以使FullMonte光子模拟的每个node吞吐量提升64倍以上。
第二代分布式计算联盟成立为IDH和ISV打通创新平台
据赛灵思公司测算,国内从事FPGA技术的开发人员大约为5万人,而根据IBM的数据来源,国内Java软件研发成员有400-500万人,整个软件行业人数更多。这两大阵营中都有着成熟的行业联盟,在FPGA行业,有FPGA独立开发商(IDH,Independent Design House)联盟,致力于加速方案的开发及应用推广。同时,在软件行业,更是有相当规模的行业ISV(独立软件开发商)携手为促进提升产品和方案的性能,以便应对在物联网、移动互联、云计算、大数据分析时代迅速增长的数据以及计算需求而努力。但两者之间的交集并不多见,FPGA技术人员并不清楚行业用户的应用需求,而ISV对于底层FPGA的计算能力又知之甚少。
李浩与赛灵思全球CEO热烈讨论NSA-120加速卡的应用前景
而通过CAPI技术所带来的第二代分布式计算,CPU和加速器能够协同工作,从而达到突破性的性能提升,与此同时,也将横亘在IDH和ISV之间鸿沟一举填平。为更好地利用CAPI技术,也为提升计算性能,IBM公司、赛灵思公司、恒扬科技、无锡中太、新浪网等成立了第二代分布式计算联盟。该联盟旨在推进行业ISV和FPGA与FPGA独立开发商之间的协作创新,以共同将中国的IT产业推进到第二代分布式计算时代。同时,与联盟成立一起还推出了CAPI FPGA应用加速商城。该商城建立于IBM中国研究院打造的SuperVessel云平台上。SuperVessel云平台将为CAPI FPGA应用加速方案提供高隔离性、高稳定安全的云端开发和测试环境,帮助ISV更充分利用OpenPOWER先进的硬件架构,更方便快捷地进行FPGA应用加速方案的设计、编程和构建。
恒扬科技NSA-120加速卡引领CAPI+FPGA加速新时代
在发布会现场,作为第二代分布式计算联盟成员,恒扬科技同时发布了全球首款CAPI+FPGA加速卡NSA-120,该产品基于XILINXKintex UltraScale FPGA芯片,支持IBM CAPI架构,具备高性能、低功耗、低成本、可编程的特性。使用NSA-120加速卡,用户只需要在现有服务器环境下简单安装即可,无需服务器特别的结构、电源和散热支持。另外,NSA-120加速卡还支持XILINX OpenCL软件开发环境SDAccel,为软件工程师开发FPGA加速应用提供了可能。
恒扬科技创始人兼总经理李浩表示,“恒扬科技作为国内领先的FPGA硬件加速卡和应用开发商,其PCIe标准规格的NSA系列硬件FPGA加速卡,在不改变服务器硬件配置、无需额外机架空间、无需额外结构支持、无需额外电源提供、无需额外被动散热的情况下即可简单安装使用,达到硬件松耦合。而且只需要十几瓦到六十瓦的功耗即可达到现有X86服务器三倍到上百倍应用性能的提升,这只有基于FPGA芯片的应用加速卡才能做得到。更为重要的是,恒扬科技结合CAPI接口开发了NPL加速卡平台层套件开发包,大幅度降低技术门槛和研发工作量,简单易用,让众多FPGA应用加速器开发商只需要关注实现核心算法模块即可。恒扬科技愿意和众多应用加速开发商共同努力,构建大数据、云计算、虚拟化、SDN、机器学习等领域的各种应用,通过 FPGA APP STORE应用加速商城,能够为ISV和行业客户提供性能优异的应用加速器解决方案,推动第二代分布式计算的发展。”
恒扬科技大数据产品经理张军的现场讲演
在发布会下午的技术研讨中,恒扬科技大数据产品经理张军先从高性能、低功耗、可编程三个方面阐述了FPGA的特性。张军表示,“FPGA具有高性能、低功耗、可编程三大特性。以Hadoop大数据分析Erasure Code加速为例,其强大的性能能够全面释放CPU处理能力,等效于10~20个CPU核处理能力,其异构计算能力比软件实现提升2.5~3倍的整机性能,同时减少50%的数据存储空间,数据可靠性提升3个数量级。功耗方面,1块FPGA加速卡功耗仅仅约为15Watt~75Watt,其优势显而易见。在线可编程是FPGA的第三个突出优势,由于FPGA天然具备快速迭代开发能力,这种天生的优良基因让用户可以轻松实现大规模在线实施部署。”
作为在FPGA领域有着十余年开发经验的恒扬科技,无疑公司对于FPGA的技术沉淀与功底是不容小觑的。作为技术专家,张军和与会者分享了NSA-120加速卡的独具优势与特点。基于CAPI+FPGA架构的NSA-120加速卡,提前完成了大量的硬件和信号完整性测试,完成了产品化的大量工作,确保了产品硬件的可靠性。此外,NSA-120还为用户提供了独具特色的NPL基础平台开发包,其内含了丰富的统计模块和监控模块,进一步提高了产品运行的可靠性。具备高可靠性的同时,NSA-120还提供了极高的易用性。IDH开发人员无需了解底层硬件,只专注于加速算法设计即可,极大地提高了开发效率并降低了使用难度。为确保使用安全,NSA-120板载两颗加密芯片,一颗为恒扬NPL进行加密,另一颗为IDH的AFU进行加密,以确保IP的安全可靠。最后,张军指出,具备在线可升级能力的NSA-120可支持不同AFU算法模块在线更换,FPGA配置文件可通过在线从CPU升级到外挂FLASH中,现场无须重新启动服务器,在不影响客户业务运行的情况下完成现场升级。