网络通信 频道

Arm发布终端CSS与Kleidi,赋能AI智能手机与PC的未来

  在过去的一年里,AI为移动设备领域带来了革命性的变革,并催生了AI智能手机和AI PC的诞生。在vivo X100和X100 Pro发布会上,我们见证了其自研的蓝心大模型BlueLM的出色表现。OPPO、三星和小米等手机品牌也紧随其后,推出了各自的AI应用,共同推动着移动设备行业的快速发展。

  如今,我们正站在移动设备行业发展的关键节点。IDC数据显示,中国手机市场SoC集成AI引擎的设备占比呈上升态势。预计到2026年,中国市场近50%的终端设备的处理器将带有AI引擎技术,而终端设备是否集成硬件AI引擎以及AI引擎的性能,将成为消费者购买设备的重要参考因素。

  设备端AI正重新诠释着智能手机的“智能性”,而Arm是这一切的基石。Arm的影响力跨越智能手机,延伸至笔记本、可穿戴设备乃至数字电视,以其广泛适用、开发者友好的指令集,为全球计算生态奠定基石。在高能耗需求下,实现更为卓越的能效表现,这是Arm核心竞争力所在。

  在AI加速发展的时代,复杂度与计算需求成倍增长,Arm持续聆听业界声音,利用最新技术成果,为设备端AI的广泛应用铺设道路,赋能合作伙伴快速创新,共赴智能计算的新纪元。就在日前,Arm宣布推出Arm终端计算子系统(CSS)和新的Arm Kleidi软件,重新定义移动端体验。

  Arm终端CSS重塑计算性能与效率边界

  Arm终端计算子系统(CSS)以提供领先的AI体验,为旗舰系统级芯片(SoC)提供基础计算要素,其具备最新的Armv9.2 CPU、Arm Immortalis GPU、基于三纳米工艺生产就绪的CPU和GPU物理实现,以及最新的CoreLink系统互连和系统内存管理单元(SMMU)。

  据悉,Arm终端CSS是迄今速度最快的Arm计算平台,提升了30%以上的计算和图形性能,以应对要求苛刻的实际用例中的安卓工作负载,同时也提高了59%的AI推理速度,适用于更广泛的AI/ML和计算视觉工作负载。结合对软件生态系统的持续优化,Arm正在塑造一个更加丰富、高效、安全的计算未来。

  新的Arm Cortex-X925实现了Cortex-X系列推出以来最高的同比性能提升,该CPU利用了领先的三纳米工艺节点,在 3.8GHz的时钟速率和最大缓存大小的条件下,与2023年旗舰智能手机的四纳米SoC相比,其单线程性能大幅提高36%。而在AI性能方面,Cortex-X925取得了惊人的41%性能提升。

  新的Arm Cortex-A725 CPU将对前沿性能的不懈追求与出色的效率相结合,该CPU将针对AI和手游用例的性能效率提高了35%。这一改进也得益于更新后的Arm Cortex-A520 CPU和更新后的DSU-120,使得采用最新Armv9 CPU集群的消费电子设备可提升能效和可扩展性。

  新的Arm Immortalis-G925 GPU是Arm性能最强、效率最高的GPU,在各款领先的手游应用中实现了37%的性能提升,并在多个AI和ML网络上提升了 34%的性能。Arm Mali-G725和Mali-G625 GPU,面向从高端手机到智能手表和XR可穿戴设备等广泛的消费电子设备市场。

  Arm的安全技术,如内存标记扩展(MTE),也在vivo X100系列、Google Pixel 8等旗舰设备中得到应用,有效提升了用户安全。同时,Windows on Arm(WoA)生态迎来蓬勃发展,众多原生应用和创作者工具的加入,正逐步消除兼容性壁垒,为用户带来无缝的原生体验。

  ▲Arm终端事业部产品管理副总裁James McNiven

  James McNiven指出,“我们的最终目标是让合作伙伴,以及生态系统能够不断创新、实现差异化并更快地进入市场。Arm终端CSS带来了Armv9.2的能效优势,凭借物理实现和持续的软件优化,它将彻底革新开发者和消费者的体验。我们很高兴能够提供面向未来AI的平台,Arm平台是这一未来的基石。”

  面向AI框架开发者的计算内核——Arm Kleidi

  为了帮助开发者充分利用Arm终端CSS的性能优势,Arm隆重推出了Kleidi,一款专为AI和计算机视觉软件领域量身打造的解决方案,Arm Kleidi将有助于软件开发者无缝取得Arm CPU上的最 佳性能,其包括面向 AI工作负载的KleidiAI和面向计算机视觉应用的KleidiCV。

  谈及 Kleidi名称的含义,James McNiven解释道,“Kleidi一词来源于希腊语,意为‘钥匙’,即为开发者解锁更多性能的钥匙。Arm Kleidi将让软件更为高效,以降低能耗,并提高性能。”

  值得一提的是,Kleidi确保开发者能够充分利用Arm终端CSS中最新的Armv9功能,如可伸缩矢量扩展(SVE)。同时,它还为未来如可伸缩矩阵扩展(SME)等创新做好了准备。以Cortex-X925为例,Kleidi技术运行最新Llama 3和Phi-3 LLM的速度比参考实现快2.9倍,且用时不到24小时。

  KleidiAI是一套面向AI框架开发者的计算内核,使他们能够在各种设备上轻松获得Arm CPU上的最 佳性能,并支持Neon、SVE2 和 SME2等关键Arm架构功能。KleidiAI与PyTorch、Tensorflow、MediaPipe 等热门AI框架集成,旨在加速Meta Llama 3、Phi-3等关键模型的性能。

  随着计算机视觉与AI的紧密融合,摄像头管线不再仅限于运行神经网络,还包括众多传统计算机视觉算法。这些算法的性能对摄像头和社交媒体应用的流畅运行至关重要,因此,Arm创建了KleidiCV。当KleidiCV与常用的OpenCV库结合时,性能得到了显著提升。

  James McNiven透露到,“今年,我们还与OpenCV.ai携手,为安卓开发者提供更加便捷的方式,将OpenCV纳入他们的项目中,并从中受益于KleidiCV带来的性能提升。我们为能够提供这样一个基础计算平台而深感兴奋,它将助力实现新一代领先的AI体验。”

  ▲Arm终端事业部产品管理副总裁James McNiven(图左)和vivo首席芯片规划专家夏晓菲(图右)

  作为合作伙伴,vivo始终保持与Arm的密切合作。夏晓菲表示,“我们很高兴看到Arm终端CSS所引入的新方向,以及通过Armv9 CPU与Arm GPU,这套计算子系统将赋能新一代设备端生成式 AI,从而实现沉浸式的智能移动端解决方案。”

0
相关文章