Arm Everywhere 2026：瞄準代理式AI運算需求，推出Arm AGI CPU自有品牌處理器

運算智慧財產公司Arm首度推出自有品牌量產晶片產品，針對資料中心的代理式AI工作負載推出Arm AGI CPU處理器，提供兼顧效能、效率、可擴充性的解決方案。

代理式AI推升CPU運算需求

Arm執行長Rene Haas於Arm Everywhere 2026大會的演說中以Arm晶片可觀的出貨量作為引言，採用Arm架構晶片的總出貨量已經超過3500億顆，達到有史以來地球上曾經存在的人類總數的3倍（1170億人），也是7倍於所有非Arm處理器的總和，每個家庭平均具有160顆Arm晶片，可見得其普及率相當高。

延伸閱讀：
Arm Unlocked Taipei 2025：從雲端到邊緣的AI運算平台策略
 Arm Unlocked Taipei 2025：模組化小晶片架構加速客製化設計，滿足變化快速的市場需求
 Arm策略暨生態系執行副總裁Drew Henry分享趨勢觀點，改善運算平台延續「經濟摩爾定律」
Arm更新Neoverse產品路線圖，推出Neoverse CSS N3、V3等全新第3代Neoverse IP

Rene Haas提到在代理式AI（Agentic AI）發展趨勢的推動下，AI代理（AI Agent）會在接收並分析使用者的指令之後，根據指令自主運作甚至是操作多種應用程式，因此過程除了會因為AI運算需求而增加GPU（繪圖處理器）或AI加速器的運算量之外，也會推高CPU（處理器）的運算需求。

舉例來說，使用者可以跟AI代理說「幫我規劃一個 3 天的東京自由行行程，預算中等，想吃好吃的、也想逛美術館」，AI代理可能會透過瀏覽器查詢餐廳評價、美術館開放時間，並透過App查詢天氣以及地鐵路線並計算交通時間

這個過程可能會使用數種應用程式，而通常每個程式都會占用1個處理器核心，若資料中心的GPU、AI加速器資源充足，但CPU資源較少的話，就會發生效能瓶頸，讓CPU限制整個工作流程完成的速度，進而影響資料中心的收益。上週NVIDIA執行長黃仁勳在GTC 2026大會宣布推出全新Vera CPU機櫃，也是為了解決這個問題。

▲ Arm執行長Rene Haas於Arm Everywhere 2026大會的演說中分享對代理式AI發展的趨勢分析。

▲ Rene Haas提到有史以來地球上曾經存在的人類數量為1170億人，Arm晶片出貨量則到達3倍於此數字的3500億顆，也是7倍於所有非Arm處理器的總和。

▲ Arm的產品延伸至個人裝置、資料中心、自動化與車用電腦等多個不同的垂直領域。

▲ 各領域皆有對應的運算單元、作業系統、軟體堆疊，構成完整的生態系統。

▲ Arm具有CPU、GPU、NPU（神經處理器）、系統IP等多種不同多種智慧財產，後續也推出整合的運算子系統（CSS）以簡化授權流程。

▲ Rene Haas表示過去雲端AI運算仍依賴CPU，其工作主要為協調加速器的運作。

▲ Rene Haas提到代理式AI以驚人的速度成長，並同樣以黃仁勳在GTC 2026大會提出的OpenClaw（龍蝦）為例。

▲ 由於代理式AI會自動操作多款應用程式，因此對CPU資源的需求也隨之提高，若資料中心的CPU數量不足將會造成效能瓶頸。

▲ 因此需要增加更多CPU資源，以確保不會因瓶頸而拖慢GPU的運作。

▲ Arm與早期合作夥伴Meta共同開發Arm AGI CPU，Meta基礎設施主管（Head of Infrastructure）Santosh Janardhan也表示旗下多款AI皆導入AI，對CPU資源也都有所需求。

單一機櫃45,696組核心

根據Arm的預測，資料中心每GW功耗規模的CPU核心需求將從3,000萬組成長至1.2億組，預期成長幅度將超過4倍，代表必須在相同的功耗限制下大幅提升運算能力，Arm架構處理器具有優異效能、高電力效率等優勢，同時其精簡的架構設計可以避免x86架構處理器的虛耗與複雜性，是解決這個問題的理想方案。

Arm雲端AI事業部執行副總裁Mohamed Awad也在Arm Everywhere 2026大會說明Arm AGI CPU的規格，它採用TSMC（台積電）3nm節點製程，每顆CPU由2組小晶片（Chiplet）構成，最多具有136組時脈達3.7 GHz的Arm Neoverse V3架構核心，每個核心具有專屬2 MB L2快取記憶體，TDP（熱設計功耗）為300 W，但不支援多執行緒（SMT）技術，以利在持續高負載下提供可預測的效能，並避免效能降頻（Throttling）與閒置執行緒問題。

Arm AGI CPU支援DDR5-8800記憶體，並提供96條PCIe Gen 6通道，支援CXL 3.0池化記憶體擴充，以及AMBA CHI擴充連接。

在使用1U高度氣冷散熱機架的情況，每組機架可容納2顆CPU，每個機櫃最高可容納8,160組核心，而採用液冷散熱方案的機櫃則可提供高達45,696組核心。

▲ Rene Haas於Arm Everywhere 2026大會正式發表Arm AGI CPU。

▲ Arm AGI CPU採用Neoverse V3架構，最多具有136組核心。

▲ Arm至今除了有IP與CSS等授權方案之外，也提供量產處理器。

▲ Arm AGI CPU具有延遲低於100 ns的最佳化記憶體存取系統，並支援DDR5-8800記憶體，各核心的記憶體頻寬高達6 GB/s。

▲ Arm AGI CPU採用TSMC 3nm節點製程，TDP為300 W。

▲ Arm提供8,160組核心的氣冷機櫃與45,696組核心的水冷機櫃參考設計。

▲ Arm AGI CPU能夠無縫與Neoverse運算平台銜接。

▲ 與x86架構處理器相比，Arm AGI CPU具有高效能核心、世界級電力效率、低延遲等優勢。

▲ Arm AGI CPU具有更高的IPC（Instruction Per Clock cycle，每周期指令）、線性成長的擴充性，並因不像x86需要顧及舊世代相容性而造成電力或晶片面積的效率虛耗。

▲ Mohamed Awad特別強調Arm AGI CPU針對代理式AI應用設計，因此不導入多執行緒（SMT）技術，避免多執行緒瓜分I/O頻寬，以追求更高的持續效能輸出、持續執行緒數與電力效率。

▲ Rene Haas表示與x86架構處理器相比，Arm AGI CPU每機架能夠提供超過2倍的效能輸出。

▲ ASRock Rack（永擎電子）、Lenovo（聯想）、Quanta Computer（廣達）、Supermicro（美超微）等合作夥伴皆會推出對應的機架產品，已開始提供可訂購的商用系統。

▲ Arm計劃於2027年推出Arm AGI CPU 2，並於未來推出Arm AGI CPU 3。

捨棄SMT以追求更好效率

Rene Haas與Mohamed Awad在發表會後與媒體進行訪談，其中Mohamed Awad特別提到不支援多執行緒的因素，在於多執行緒適合應用於低頻寬、高運算負載的使用情境，恰好與代理式AI的特性背道而馳，因此每個核心僅具有1組執行緒，避免造成瓜分I/O頻寬的情況，並追求更高的持續效能輸出、持續執行緒數與電力效率，同時也有助於節省晶片面積。

Arm也於會場展示Arm AGI CPU對應的機架與機櫃，筆者將照片整理於下。

▲ Rene Haas與Mohamed Awad在發表會後與媒體進行訪談。

▲ Arm於會場展示Arm AGI CPU對應的機架與機櫃。

▲ 氣冷版本機架為1U高度，具有2組氣冷散熱的Arm AGI CPU。

▲ Arm AGI CPU採用TSMC 3nm節點製程，晶片上可以看到產地標示為台灣。

▲ 機櫃可容納30組托盤，共具有60顆處理器、8,160組核心。

Arm表示Arm AGI CPU能夠提高工作負載密度、改善AI加速器的資源利用率，以及在資料中心的功耗限制下，提供更多可用的運算資源與核心數，這些優勢將在AI基礎建設以及代理式AI的發展下相當重要。相較於x86架構處理器，Arm AGI CPU能在每機櫃提供超過2倍的效能輸出，並可在GW規模的AI資料中心節省高達100億美元的資本支出（CAPEX）。