网络通信 频道

从硬件到软件再到生态,Arm展示下一代移动计算的强大力量

  6月13日至14日,Arm媒体技术分享日在北京如期而至。多位Arm技术专家齐聚一堂,围绕Arm终端CSS、CPU、GPU、软件技术展开分享,解读其在移动计算领域的最新动态、创新成果、应用落地、生态布局等内容。

  ▲Arm终端事业部智能手机市场高级总监Steve Raphael

  会上,Arm终端事业部智能手机市场高级总监Steve Raphael在开场致辞中表示,“Arm致力于提供基础的计算平台,助力实现新一代领先的AI体验。我们会持续关注开发者,确保他们能够获得所需的性能、工具和软件库,以释放其创造力并打造下一波AI应用。”

  Arm终端CSS助力AI驱动的消费设备体验

  Arm终端事业部产品管理总监Steve Hopper给大家回顾了Arm在终端设备市场的辉煌创新之旅。自2021年起,Arm全面计算解决方案(TCS)持续刷新移动端计算的极限。初代方案即开创性地集成了Armv9架构CPU集群、高性能Arm Mali GPU及一套完备的系统IP解决方案。

  次年,Arm又推出了第二代Armv9 CPU集群,并揭晓了旗舰级GPU系列——Arm Immortalis。去年,Arm再次升级,发布了Armv9.2 CPU集群及基于先进第五代架构的新GPU系列,持续加速技术进步的步伐。这一连串的创新直接转化为三代产品连续实现性能与效率的双位数飞跃。

  在Specint、Geekbench等权威基准测试中,Arm的解决方案计算性能逐年提升超过15%,彰显出强劲的增长动力。而在多类GPU基准评估及真实游戏场景下,图形处理能力更是实现了超越20%的显著增长。尤为重要的是,Arm每年在能效上也保持了超过15%的提升,实现了速度与效能的双重提升。

  Arm终端CSS配备了第二代Armv9.2 CPU集群,其中包括业界领先的Cortex-X925 CPU,为极致性能而生;以及高效的Cortex-A725和更新后的Cortex-A520 CPU,确保了出色的能效比。这些CPU在先进的三纳米工艺上实现了前所未有的性能和效率水平。

  在图形处理方面,Arm终端CSS引入了基于第五代GPU架构的全新GPU系列。Arm Immortalis-G925专为旗舰移动设备设计,Arm Mali-G725和Mali-G625面向大众行业市场的移动设备,满足多样化的图形需求。Arm终端CSS还采用先进的三纳米工艺,实现卓越的功耗、性能和面积(PPA)平衡。

  ▲Arm终端事业部产品管理总监Steve Hopper

  在Steve Hopper看来,“Arm终端CSS是Arm面向安卓的最快速的计算平台,持续突破移动设备的边界。我们设计了从IP到软件的整个平台,以提供出色能效,从而实现更久、更丰富的移动体验。终端CSS为高端移动设备解锁了AI性能,并推动了AI在更低价位设备中的应用。”

  全新 Armv9 CPU集群专为AI及更多领域打造

  Arm 持续专注于提升 Cortex-X CPU的终极性能。今年新推出的Arm Cortex-X925不仅是Arm迄今为止推出的速度最快、性能最强的CPU。据悉,Cortex-X925的单线程性能提升了36%,AI性能提高了46%。凭借如此优异的表现,这不仅是又一个CPU换代产品,更是实现了空前的IPC表现。

  同时,Arm最新的高效CPU——Arm Cortex-A725,成功实现了性能与效率的完美平衡,与前代相比,性能效率提升了35%。针对最新的三纳米工艺节点,Arm对Cortex-A520进行了优化更新,与去年的Cortex-A520相比,节省15% 的能耗。

  为适应新的高端应用场景,Arm还推出了升级版的动态共享单元DynamIQ Shared Unit(DSU-120),不仅对DSU进行了功能更新,还增加了新的功耗模式,使得在典型工作负载下,与前代相比能耗进一步降低。这些产品都被集成至Arm迄今为止针对安卓系统速度最快的计算平台——Arm终端计算子系统(CSS)。

  无论是在应用启动、网页浏览、游戏、AI还是轻量级媒体处理等方面,Arm都为用户带来了显著的性能提升。考虑到现实环境中用例的复杂性,以及多个CPU间的交互,Arm正努力推动包括软件在内的全方位优化,以实现这些改进。从实际体验来看,新的 Armv9 CPU 集群在大约40个关键指标上平均实现了30%的性能提升。

  ▲Arm终端事业部高级产品经理Manish Pandey

  Arm终端事业部高级产品经理Manish Pandey认为,“Cortex-X925代表了 Arm在性能方面的又一次重大飞跃。得益于这些微架构的进展,我们实现了 Cortex-X系列有史以来最大幅度的性能提升,在基准测试、AI和实际应用中取得了全面提升。我们在CPU IPC方面取得领先地位,增势不减。”

  Armv9.2 CPU集群提供一整套实际用例的改进,集群中各个CPU组件均涵盖广泛的实际用例和工作负载。

  Arm GPU释放潜能:消费电子设备市场中的游戏和AI

  随着大语言模型(LLM)的兴起,AI/ML技术在各类手机应用中日益普及,越来越多地游戏和应用都在采用AI。据data.ai预测,2024年,移动应用商店中至少10%的应用将由AI驱动,为市场注入新的活力。因此,Arm必须持续投入创新,以不断为用户提供新鲜而卓越的移动视觉体验。

  作为人们日常数字生活中不可或缺的一部分,Arm GPU赋能了从当今智能手机上的沉浸式游戏,到各类端侧AI体验的方方面面。目前,Arm合作伙伴的GPU出货量已超过100亿颗,这些GPU广泛应用于包括智能手机、平板电脑、智能电视、机顶盒、智能手表和XR可穿戴设备在内的各类消费电子设备。

  相较于Immortalis-G720,Arm终端CSS参考平台中全新登场的Immortalis-G925在图形应用性能上实现了高达37%的飞跃。在AI/ML网络运算方面,其性能更是显著提升,增幅高达36%。在确保与2023年参考平台相当的游戏体验下,Immortalis-G925在功耗控制上能节省高达30%的能耗,意味着用户享受游戏时间可以变得更长。

  这一出色性能延伸到了关键的手机游戏领域,与Immortalis-G720相比,Immortalis-G925的性能平均提升了46%。单看各款游戏,《原神》的性能提升49%,而《Roblox》的运行速度加快46%。其他热门手机游戏的性能提升幅度均在29%至72%之间,包括《使命召唤手游》、《暗黑破坏神:不朽》等。

  ▲安谋科技(Arm China)市场总监王刚

  安谋科技(Arm China)市场总监王刚表示,“Arm GPU的定位是为合作伙伴面向广泛的终端设备市场赋能极致的视觉体验。Immortalis-G925出色的游戏和AI性能将带领我们迈向崭新时代,为手持设备打造媲美游戏主机的图形效果以及更为智能的应用体验。”

  Arm通过软件加速开发者和用户体验

  在持续快速发展的AI时代,Arm坚定地支持全球数百万开发者,确保他们能够获得所需的性能、工具和软件库,从而顺利地打造下一波令人惊叹的AI体验。基于此,Arm Kleidi应运而生。从概念上讲,Arm Kleidi是一个高度优化的软件库合集,专为Arm CPU设计,内嵌一系列精炼的计算核心代码。

  开发者可以借助Arm超过20年的架构创新,从Armv7架构首次引入高级单指令多数据(SIMD)扩展以支持机器学习(ML)工作负载,到如今的Armv9架构在Arm CPU上囊括了加速和保护高级生成式AI工作负载的功能,这些创新持续推动AI能力和性能的提升。

  Kleidi软件库包含面向AI工作负载的KleidiAI和面向运行于Arm CPU上出色的计算机视觉工作负载的KleidiCV。该软件库可以被直接嵌入到热门的AI框架中,开发者无需进行任何操作。如此一来,开发者可以轻松地启用Arm CPU的 AI 功能,从而快速构建AI应用,并在尽可能广泛的设备上实现最出色性能。

  与此同时,今年Windows on Arm生态也迎来了前所未有的飞跃。不仅体现在应用程序数量的快速增长上,更在于其质量和适配性的显著提升。众多主流应用程序纷纷推出Arm原生版本,其中包括Chrome浏览器这样的重量级应用,它们与Office、Zoom和Adobe等共同构建了一个强大的Arm原生应用阵容。

  同时,面向创作者的开源工具也在Windows on Arm平台上迎来了新的机遇。Audacity、Blender和OBS Studio等工具的加入,不仅丰富了平台的功能,也证明了大量开源库和开发者工具正在积极完成适配工作,为Windows on Arm生态的繁荣贡献力量。

  ▲安谋科技(Arm China)开发者生态高级经理 李陈鲁

  安谋科技(Arm China)开发者生态高级经理李陈鲁指出,“Arm Kleidi是一个面向全行业开放的开源项目,它是一个非常轻量级的软件库,我们设计的时候尽可能地去减少它对外部其他软件环境的依赖性。由于其非常独立,所以Arm Kleidi能够轻松整合到诸多的库中。我们相信 Kleidi的推出能赋能软件开发者无缝获取Arm CPU性能,实现更多AI创新。”

0
相关文章