软硬件技术的布全飞速发展正在将AI从数据中心/云端推向终端设备上。如今,新终在手机、端计电脑等设备上运行AI ,算系已经成为未来趋势。统优体验Arm终端事业部产品管理副总裁 James McNiven在近期接受记者采访时指出 ,化人过去一年 ,工智高性人工智能 (AI) 技术给移动设备带来的验构应用改变令人赞叹。我们正见证 AI 从手机到笔记本电脑所取得的建最显著创新,并由此诞生了 AI 智能手机和 AI PC。终端

James McNiven表示 ,布全设备端 AI 再次重新定义了智能手机的新终“智能性”,而 Arm 则是建站模板端计这一切的基石 。发布会上 ,算系Arm公布了最新的统优体验终端计算子系统(CSS) ,其具备最新的 Armv9.2 CPU、Arm Immortalis™ GPU、基于3nm工艺生产就绪的 CPU 和 GPU 物理实现,以及最新的 CoreLink™ 系统互连和系统内存管理单元 (SMMU)。
除此之外,为了使开发者能够以最高性能快速实现AI创新 , Arm还推出了面向开发人员量身定制的Kleidi软件,云计算其中包括面向AI工作负载的KleidiAI和面向计算机视觉应用的 KleidiCV。
性能大幅提升的CPU/GPU
从数据中心/云走向终端设备,边缘AI对终端设备的计算性能提出更高的要求 。James McNiven认为,AI 时代正加速发展,复杂性随之不断提高 ,计算需求呈指数级增长。为此,Arm不断倾听合作伙伴的意见,持续将我们的免费模板产品及解决方案迭代更新,善用最新的工艺节点,并提供可为实现设备端 AI 奠定基础的平台 。
据介绍,Arm 终端CSS是迄今速度最快的 Arm 计算平台,数据显示 ,Arm终端 CSS提升了 30% 以上的计算和图形性能 ,以应对要求苛刻的实际用例中的安卓工作负载,同时也提高了 59% 的模板下载 AI 推理速度 ,适用于更广泛的 AI/机器学习 (ML) 和计算视觉工作负载。
Arm 终端 CSS 的关键在于 Arm 目前性能最强、效率最高、功能最广泛的 CPU 集群,带来最佳的性能和能效。James McNiven强调,自2021 年推出了专为性能和 AI 而设计的 Armv9 架构,性能方面得到了显著提升 ,其中包括:提高在矢量加速 、机器学习 (ML) 等领域的亿华云计算能力;增强系统的安全性和稳健性;更重要的是 ,增加了面向 AI 的功能 。
此次推出的全新Arm Cortex®-X925 ,实现了 Cortex-X 系列推出以来最高的同比性能提升,该 CPU 利用了领先的三纳米工艺节点 ,在 3.8GHz 的时钟速率和最大缓存大小的条件下,与 2023 年旗舰智能手机的高防服务器四纳米 SoC 相比 ,其单线程性能大幅提高 36% 。而在 AI 性能方面,Cortex-X925 取得了 41% 性能提升,可显著提高如大语言模型 (LLM) 等设备端生成式 AI 的响应能力。
除此之外 ,全新的 Arm Cortex-A725 CPU 将对前沿性能的不懈追求与出色的效率相结合,该 CPU 将针对 AI 和手游用例的性能效率提高了 35% 。这一改进也得益于更新后的 Arm Cortex-A520 CPU 和更新后的 DSU-120 ,使得采用最新 Armv9 CPU 集群的消费电子设备可提升能效和可扩展性。

除了性能提升之外,Arm也更加重视数据安全方面的能力。据了解,Arm 提供的内存标记扩展 (Memory Tagging Extension, MTE) 可帮助开发者在无需侵入式检测的情况下查找和修复代码中的错误,也可在实际操作环境下,用来减少安全漏洞被利用 。目前 ,vivo X100 和 X100 Pro 以及Google Pixel 8旗舰设备现在都允许用户启用 MTE。
在提升CPU性能之外,Arm也特别重视GPU性能的提高 。为此,Arm 发布了迄今为止性能最强 、效率最高的GPU——Arm Immortalis-G925 GPU。数据显示 ,Arm Immortalis-G925 GPU在各款领先的手游应用中实现了 37% 的性能提升,并在多个 AI 和 ML 网络上提升了 34% 的性能。Immortalis-G925 面向旗舰智能手机市场,而包括 Arm Mali™-G725 和 Mali-G625 GPU 在内的全新高可扩展性 GPU 系列,则面向从高端手机到智能手表和 XR 可穿戴设备等广泛的消费电子设备市场 。
“Immortalis-G925 是Arm第三代具备光线追踪技术的 GPU。随着该功能在市场上的推广,Arm一直致力于让开发者尽可能轻松地在移动设备上实现游戏主机级内容。” James McNiven表示,“我们与 Epic Games 合作 ,确保他们的桌面平台渲染器能够在我们的 GPU 上快速高效地运行 。今年 ,我们将持续开展全球的开发者教育活动,以确保游戏开发者能够再现一些精彩示例内容。”
为开发者量身定制的Kleidi
在上周的发布会 ,除了全新的CPU与GPU之外 ,Arm还为开发带来了量身定制的开发软件 ,即Kleidi 。
James McNiven告诉记者 ,“Kleidi” ,在希腊语中代表“钥匙”。它将有助于软件开发者无缝解锁 Arm CPU 上的最佳性能 ,其包括面向 AI 工作负载的 KleidiAI 和面向计算机视觉应用的 KleidiCV。
KleidiAI 是一套面向 AI 框架开发者的计算内核,使他们能够在各种设备上轻松获得 Arm CPU 上的最佳性能,并支持 Neon™ 、SVE2 和 SME2 等关键 Arm 架构功能 。KleidiAI 与 PyTorch 、Tensorflow 、MediaPipe 等热门 AI 框架集成,旨在加速 Meta Llama 3 、Phi-3 等关键模型的性能 ,并且还可前后兼容,以确保 Arm 在引入更多技术时依然能适用未来市场的需求 。
计算机视觉与 AI 紧密相连 ,让摄像头管线不仅仅运行神经网络,还能够运行传统的计算机视觉算法 ,并保证摄像头或社交媒体应用的顺畅运行。James McNiven表示 ,Arm将 KleidiCV 融入到常用的 OpenCV 库时,性能有了显著改进。今年 ,Arm还与 OpenCV.ai 合作,力求让安卓开发者可以更轻松地将 OpenCV 纳入到他们的项目中,并从 KleidiCV 带来的改进中受益 。
“我们的最终目标 ,是让我们的合作伙伴以及我们的生态系统能够不断创新、实现差异化并更快地进入市场。Arm 终端 CSS 带来了 Armv9.2 的能效优势,凭借物理实现和持续的软件优化 ,它将彻底革新开发者和消费者的体验。” James McNiven表示,多年来,Arm进行了大量投资,旨在让人们能够全天候享受更加沉浸式的体验 。但这一切都在发生改变 ,AI 还在向着另一个方向突破计算的极限,并创造出大量新的应用。