Arm最新推出的Lumex CSS平台具有4種不同型號的C1系列處理器可供選擇,搭配C1-DSU動態分享單元最高能夠組成最高14組實體核心處理器的SoC。
家族4成員亮相
Arm終端事業部產品管理總監Ronan Naugton於Arm Unlock大會介紹了最新發表採用Armv9.3架構的C1-Ultra、C1-Premium、C1-Pro、C1-Nano等4款C1系列處理器(CPU)核心。
延伸閱讀:
Arm發表類神經網路升頻技術,NPU嵌入GPU藉AI提升繪圖效能並節省電力
Arm遊戲畫面升頻與畫格生成技術詳細解說:透過小型模型平衡畫面效果與運算成本
Arm發表全新Lumex CSS平台,C1 CPU與Mali G1 GPU為旗艦級手機帶來25%效能增長
Lumex CSS平台搭配全新C1系列處理器,4種型號隨意組裝滿足最高14核心效能怪獸(本文)
Arm Lumex CSS平台Mali-G1系列繪圖處理器與平台功能解析,為旗艦級智慧型手機帶來2倍光線追蹤效能
C1-Ultra與C1-Premium為接替先前Cortex-X925的型號,定位為「超大核」的角色。前者的設計目標為追求極致效能,而後者則在降低些許效能的代價下,大幅縮小35%晶片尺寸,達到更理想的價格、效能、功耗平衡。
C1-Pro則為Cortex-A725的後續型號,屬於「大核」的定位,設計目標為提供持性的高效率運作,作為以電池驅動裝置的主力運算核心。C1-Nano則屬於「小核」是填補Cortex-A520的空間,具有最小的尺寸以及更高的電力效率,適合負則背景執行的程式,或是應用於穿戴式裝置。
上述4種CPU核心型號都支援SME2(Scalable Matrix Extension 2,第二代可擴展矩陣延伸指令集),能夠大幅提升矩陣運算效能,進而提高AI運算的效能,讓更多AI應用程式能夠於CPU執行。
雖然CPU的AI運算效能不如使用繪圖處理器(GPU)或神經處理器(NPU),但是有著更高的開發彈性,而且各種裝置都會具有CPU且碎片化的狀況較為輕微,因此對於AI應用程式、App的相容性比較高,其高度可程式化的優點,也讓它能夠支援更結省運算資源的4Bit甚至2Bit資料類型AI模型。
相對之下,有些裝置可能缺少GPU或NPU,或是即便具有GPU、NPU,但因由不同廠商提供而導致軟體不相容,造成無法啟用加速AI運算的窘境。
另一方面,由於在智慧型手機執行的AI應用程式通常搭配參數量比較低的小型模型,因此使用CPU進行運算比較不會遇到不堪負荷的狀況,且在CPU執行可以省下將資料搬遷到GPU或NPU的效能虛耗,節省保貴的頻寬與電力,並且還能降低些許延遲。衡量各種利弊得失後,使用在智慧型手機透過CPU 執行AI應用程式也不失為權宜之計。
需要注意的是,接替Cortex-A320的C1-Pico雖然也是採用「C1」命名,但它僅採用Armv9.2架構,因此並不屬於Lumex CSS產品系列的成員。











Lumex CSS平台與C1系列CPU效能分析
Ronan Naugton也在會中提出許多C1系列CPU的效能數據,筆者將相關簡報整理於下。










筆者將會在後續文章繼續介紹Lumex CSS平台所帶來的Mali-G1系列GPU以及平台功能,請讀者參考文首延伸閱讀部分瞭解更多資訊。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!