FB 建議貼文

選取貼文複製成功(包含文章連結)!

Qualcomm Snapdragon X2 NPU效能稱霸!80 TOPS輾壓群雄,AI筆電2026登場

Qualcomm Snapdragon X2 NPU效能稱霸!80 TOPS輾壓群雄,AI筆電2026登場

ADVERTISEMENT

在看完Snapdragon X2平台的CPU與GPU解析之後,我們一起來看看同樣整合於SoC內的NPU,它以高達80 TOPS的AI運算效能成為現今最強的整合式NPU。

代際效能成長78%

Snapdragon X2平台內建的Hexagon NPU(神經處理器)具有高達80 TOPS的AI運算效能,不但高於現在已推出的AMD Ryzen AI9 HX 375則為的55 TOPS,以及Intel Core Ultra 9 288V的48 TOPS,也高於Apple M4 Max的38 TOPS,成為當今AI運算效最強的整合式。

延伸閱讀:
Intel Panther Lake處理器NPU詳解,效能小幅提升、尺寸驟降40%
AMD Tech Day 2024(三):XDNA 2 AI運算架構解析,Block FP16資料類型運算效率倍增
NPU有什麼用?AMD說明處理器內建Ryzen AI加速單元的好處

Qualcomm為了改進Hexagon NPU的效能表現,分析超過300種不同AI模型運算過程中所占用的資源,並改進架構設計以達到更平均的純量、向量、矩陣運算以及記憶體資源分配,達到提升整體效能表現的成果。

筆者將Qualcomm於Snapdragon Compute Architecture Deep Dive 2025大會的說明整理於下。

Snapdragon X2平台內建的Hexagon NPU具有高達80 TOPS的AI運算效能,較前代產品提高78%。

Qualcomm表示Hexagon NPU能夠滿足代理式AI與多樣AI應用程式的許用需求。

回顧Hexagon的發展史,它在2004年應用於Hexagon DSP(Digital Signal Processor,數位訊號處理器),能夠加速乘積累加運算(Multiply Accumulate,MAC)。而衍生的Hexagon處理器則加強影像方面運算能力,並於2019年進化為Hexagon NPU,進一步強化機器學習運算能力。

在2019年改名為Hexagon NPU之後,運算單元的規模也是逐代擴大,滿足更複雜的運算需求。

Qualcomm分析超過300種不同AI模型對純量、向量、矩陣運算以及記憶體的資源需求,以利改進NPU架構能夠平均分配純量、向量運算以及直接存取記憶體(DMA)頻寬等資源,進而提升整體效能。

Hexagon NPU的純量引擎透過多執行緒技術(SMT)降低運算延遲,並藉由多層級分枝預測、使用者模式權限虛擬DMA、硬體資料同步等功能,以降低運算虛耗。

Hexagon NPU的純量引擎具有12條執行緒,具有與前代NPU相比2倍的記憶體頻寬,並具備64 bit DMA定址能力。

上述這些改進能夠讓Snapdragon X2平台的Hexagon NPU較前代產品的純量運算吞吐量提升143%。

受益於快取記憶體與DMA,讓Hexagon NPU的匯流排頻寬較前代提升127%。

Hexagon NPU的向量引擎具有8條執行緒,每組執行緒具有4組SIMD(Single Instruction Multiple Data,單指令流多資料流)指令窗口,新增支援FP8、BF16等資料類型。

Snapdragon X2平台的Hexagon NPU較前代產品的向量運算吞吐量提升143%。

矩陣運算單元支援2 bit格式的資料權重與FP8、BF16等資料類型,此外也支援融合激勵函數與深度捲積等運算的硬體加速,並具有獨立電源迴路以在閒置時節省電力。

Snapdragon X2平台的Hexagon NPU較前代產品的矩陣運算吞吐量提升78%。

NPU效能對照

Qualcomm為Snapdragon X2平台提供了完整的軟體堆疊,讓多種AI應用程式、執行環境、運算框架能夠分配到最適合的處理器(CPU)、繪圖處理器(GPU)或是NPU等運算單元,達到提供最佳效能同時兼顧電池續航力的效果。

筆者也將Qualcomm提供的官方效能數據整理於下。

Snapdragon X2平台的軟體堆疊可以將Phi、Llama、GPT、Gemini、Stable Diffusion等多種AI軟體,並調用CPU、GPU、NPU等單元執行運算。

利用CPU執行AI運算的特色為具有較快的反應速度,適合文字辨識、Windows Hello偵測,GPU效能較高,適合用於生成式AI。NPU則有出色效能與電力效率,適合持續性AI負載、代理式AI、視訊會議逐字稿等等。

以開啟1組上下文長度為1024個字詞的3B參數量大型語言模型(LLM)的AI代理為例,大約需要6 TOPS才能滿足流暢運作的需求。若將負載提高後,Snapdragon X2平台的80 TOPS AI運算效能能夠應付4組7B參數量的AI代理(需72 TOPS)。

Snapdragon X2 Elite Extreme的Procyon AI效能成績大幅領先Intel Core Ultra 9 288V、Core Ultra 9 285H等競爭對手的處理器,電力效率(每瓦電力獲得的分數)也領先許多。

Snapdragon X2 Elite Extreme與前代Snapdragon X Elite相比,在同樣消耗5 W電力的情況下,執行EDSR超解析度圖像升頻的效能大約成長60%。

在消耗相同電力的前提下,不同的資料類型或量化最佳化具有不同的效能表現。利如從FP16改為INT8或W4A16(INT4的特化量化,代表4 bit Weight與16 bit Activation混合量化)可提升4倍運算表現,若進一步改為W4A8可再提升2倍效能。

Qualcomm整理競爭對手處理器內建NPU的AI運算效能,自家Snapdragon X2 Elite Extreme達到80 TOPS,排名第2的AMD Ryzen AI9 HX 375則為55 TOPS。

在實際進行Procyon AI電腦視覺效能測試時,Snapdragon X2 Elite Extreme大幅領先競爭對手,領先第2名的Apple M4約95.71%。

Snapdragon X2 Elite Extreme在Geekbench AI 1.5也能領先Apple M4約69.78%。AMD Ryzen AI9 HX 370無法完成測試。

Procyon AI電腦視覺效能測的電力效率也是由Snapdragon X2 Elite Extreme大幅領先,可以超前Intel Core Ultra 9 285H達3.8倍。

Hexagon NPU的特色簡表。

首批搭載Snapdragon X2平台的筆記型電腦預計將於2026年上半年推出,屆時我們就有機會一窺新一代Windows on Snapdragon的實際效能與相容性表現。更多Snapdragon X 2平台詳細解說請參考Snapdragon Compute Architecture Deep Dive 2025系列報導

回到系列全文目錄

國寶大師 李文恩
作者

電腦王特約作者,專門負責硬派內容,從處理器、主機板到開發板、零組件,尖端科技都一手包辦,最近的研究計畫則包括Windows 98復活與AI圖像生成。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則