端侧AI成为智能手机“刚需”后,下一代芯片架构会如何演进?

3C
基于Arm架构的芯片出货量迄今已累计超过3100亿颗。

1

在AI phone成为智能手机行业的下一个主流方向后,端侧AI成为了从“通信工具”向“智能体”迭代的关键底座。

简单来说,端侧AI就是指将AI模型与算力集成到智能手机本地(如NPU、CPU+GPU异构计算单元),实现数据的本地采集、处理与决策,而非依赖云端服务器。

其核心特征可概括为四点:​​低延迟​​(本地处理无需网络传输,响应速度达毫秒级)、​​高隐私​​(数据存储与计算均在设备端,杜绝泄露风险)、​​离线可用​​(无网络环境下仍能执行智能任务)、​​个性化​​(通过本地学习适应用户习惯,提供定制化服务)。

而作为整个智能手机芯片的最上游供应商——Arm,也开始将Arm架构的升级方向聚焦到端侧AI。目前全球99%的智能手机都采用Arm架构,基于Arm架构的芯片出货量迄今已累计超过3100亿颗。

Arm Unlocked AI技术峰会上海站期间,Arm推出了全新的Arm Lumex计算子系统(Compute Subsystem,CSS)平台。Arm方面称,这是一套专为旗舰级智能手机及下一代个人电脑加速其人工智能(AI)体验的计算平台。

搭载SME2技术的CPU,AI性能提升五倍

新的CPU架构中,Arm发布了搭载SME2(第二代可伸缩矩阵扩展技术)的Arm C1 CPU集群。

“SME2是SME的新一代版本。第一,它新增了更多指令集,可进一步提升性能和能效。第二,它支持更小的数据类型——具体而言是2 bit和4 bit。”

Arm终端事业部产品管理副总裁James McNiven表示,随着每年高度量化模型的不断增多,这类小数据类型在移动生态系统中的重要性正日益凸显。这也是我们重点将SME2整合到Arm Lumex平台中的原因所在。

Arm C1 CPU集群为实际场景中的AI驱动型任务带来了显著的AI性能提升,包括:AI性能提升高达五倍,语音类工作负载延迟降低4.7倍,音频生成速度提升2.8倍。

此外,通过Arm、支付宝与vivo的三方合作下,将大语言模型(LLM)的交互响应时间缩短了多达40%,证明了SME2可为终端设备带来更快速的实时生成式AI体验。

除了速度的提升,在搭载SME2的单个核心上运行神经摄像头降噪功能,可以在1080P分辨率下实现帧率超120帧/秒 (fps),或在4K分辨率下实现帧率达30fps。这使得智能手机用户即使身处光线最暗的场景,也能捕捉到更锐利、清晰的图像。

“我想强调的是,由于SME2直接集成到了CPU当中,在工作负载的支持上能起到高度可扩展性。这意味着,SME2 带来的AI功能不仅能应用于4000元以上的高端手机,还能下沉到2000元等不同价位段的手机中,最大幅度地推广AI技术落地。”Arm高级副总裁兼终端事业部总经理Chris Bergey表示。

Mali GPU,让AI推理性能提升最高20%

CPU之外,全新的Arm Mali G1-Ultra GPU则搭载了新一代光线追踪单元RTUv2。

与前一代Arm Immortalis-G925 GPU相比,Mali G1-Ultra的光线追踪性能提升高达两倍,并在主流图形基准测试中,性能表现提升20%。在AI方面,通过新的FP16矩阵计算路径,该GPU在AI与机器学习网络上的推理速度比 Immortalis-G925快20%。

在边缘计算方面,Mali G1-Ultra引入新的矩阵乘法单元(MMUL) FP16指令,可加速如语义分割、去噪、深度估计、物体检测、语音识别和图像增强等端侧关键AI工作负载。与上一代Immortalis-G925相比,其性能提升高达104%。

Arm提供的数据显示,目前搭载Arm GPU的芯片累计出货量突破120亿颗。

“AI已不再仅仅是一项技术功能,它已成为下一代移动与消费技术的支撑底座。依托Arm Lumex平台,我们持续提升端侧AI体验,以满足用户日益增长的需求与期待。”

Arm高级副总裁兼终端事业部总经理Chris Bergey表示,从出货量角度来看,手机行业的增长已趋于平缓。但是,我们仍处于AI发展的初期阶段,尤其是在手机领域,AI正推动着更高的计算需求,并创造全新的价值。

此外,Chris Bergey还强调领先的手机厂商——无论是苹果还是三星——都已不同程度地朝着自研芯片的方向发展。这实际上是整个泛半导体行业所面临的趋势,Arm CSS平台正是顺应这一趋势而生。

“我们提供一个经过验证的计算基础,让客户能够以相对较低的成本实现自身所需的定制化。”

Chris Bergey称,Arm CSS平台真正的价值并非是“做出比Arm工程师设计的更优秀的Arm CPU”,而是客户通过在 Arm 平台基础上构建自己的SoC,额外创造更大的商业价值。(本文首发于钛媒体APP,作者 | 饶翔宇 编辑 | 钟毅)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 端侧 AI 高隐私,数据不跑云端,再也不怕个人信息泄露,安全感拉满!

    回复 9月13日 · via h5
  • 手机从工具变智能体,端侧 AI 是关键,Arm 这架构升级算打好基础了!

    回复 9月13日 · via android
  • Arm 抓准端侧 AI 趋势升级架构,帮手机厂商跟上节奏,太懂行业需求了!

    回复 9月13日 · via iphone
  • Mali GPU AI 推理快 20%,边缘计算性能提 104%,手机处理 AI 任务更给力了!

    回复 9月13日 · via android
  • 端侧 AI 成手机刚需,Arm 都专门升级架构了,看来以后手机 AI 会更厉害!

    回复 9月13日 · via h5
  • Arm Lumex 平台不光服务旗舰机,还能下沉到 2000 元机,AI 普及要加速了!

    回复 9月13日 · via pc
  • 端侧 AI 让手机从通信工具变智能体,这迭代速度,感觉手机越来越 “聪明” 了!

    回复 9月13日 · via pc
  • 厂商用 Arm 平台做自研 SoC,成本低还能定制,这对中小厂商太友好了!

    回复 9月13日 · via android
  • 神经摄像头降噪能 4K 30fps,暗光拍照也清晰,以后夜拍不用愁了!

    回复 9月13日 · via pc
  • 1080P 120fps 的降噪效果,拍视频画面更稳更清楚,视频博主有福了!

    回复 9月13日 · via iphone
更多评论

快报

更多

02:03

美联储宣布降息25个基点,重启降息步伐

2025-09-17 22:49

香港交易所:施政报告相关举措有利于港股市场多元化发展

2025-09-17 22:46

纳斯达克综合指数跌幅扩大,现跌0.5%

2025-09-17 22:42

9月总票房破10亿

2025-09-17 22:40

*ST南置:拟1元转让房地产开发、租赁业务相关资产及负债

2025-09-17 22:32

押注美股与AI,贝莱德1850亿组合大调仓

2025-09-17 22:24

山子高科重组哪吒汽车?合众新能源管理人:假消息,山子高科只是意向人之一

2025-09-17 22:23

中际旭创:特定股东及其一致行动人7月1日-9月17日累计减持463.41万股

2025-09-17 22:10

美银调查:59%欧洲投资者认为美国劳动力市场疲软是全球增长最大风险

2025-09-17 22:02

宁德时代:钠新乘用车动力电池明年将批量供货

2025-09-17 21:56

加拿大央行:鉴于经济疲软和通胀上行风险减弱,降息是适当的

2025-09-17 21:55

特斯拉股价下跌1.5%,此前六个交易日累计涨幅约22%

2025-09-17 21:50

加拿大央行将基准利率下调25个基点至2.50%

2025-09-17 21:42

上海陆家嘴太古源源邸第三批次售出79套,实现销售额36亿元

2025-09-17 21:38

英伟达股价低开低走,跌幅扩大至2.2%

2025-09-17 21:37

比特币回落至116000美元/枚下方

2025-09-17 21:37

曼联俱乐部股价开盘跌近6%

2025-09-17 21:36

费城半导体指数低开,英伟达等跌超1%

2025-09-17 21:35

具体投资方案存分歧,韩美贸易谈判进入“拉锯战”

2025-09-17 21:34

纳斯达克中国金龙指数盘初大幅上涨2%

29

扫描下载App