FB 建議貼文

選取貼文複製成功(包含文章連結)!

Arm Lumex CSS平台Mali-G1系列繪圖處理器與平台功能解析,為旗艦級智慧型手機帶來2倍光線追蹤效能

Arm Lumex CSS平台Mali-G1系列繪圖處理器與平台功能解析,為旗艦級智慧型手機帶來2倍光線追蹤效能

ADVERTISEMENT

Arm最新推出的Lumex CSS平台包含3款不同型號的Mali-G1系列繪圖處理器,此外也包含全新C1-DSU動態分享單元,以及能夠節省更多電力的平台功能。

因應日益成長的遊戲需求

Arm終端產品事業部產品管理副總經理James McNiven於Arm Unlock大會提到,83%的遊戲玩家在行動裝置上遊玩遊戲,全球的全年手機遊戲總時數來3900億小時,年度成長幅度達7.9%,並佔據2025年遊戲市場48%的收益,可見手機遊戲市場的盛況。

另一方面,他也特別以UL最新推出的3DMark Solar Bay Extreme為例,說明這個效能測試項目大幅增加光線追蹤運算負載,反映出業界渴望光線追蹤技術打造畫面更逼真的遊戲,以滿足玩家對聲光效果的期望,而Arm也從善如流,推出效能更強大的Mali-G1系列繪圖處理器。

延伸閱讀:
Arm發表類神經網路升頻技術,NPU嵌入GPU藉AI提升繪圖效能並節省電力
Arm遊戲畫面升頻與畫格生成技術詳細解說:透過小型模型平衡畫面效果與運算成本
Arm發表全新Lumex CSS平台,C1 CPU與Mali G1 GPU為旗艦級手機帶來25%效能增長
Lumex CSS平台搭配全新C1系列處理器,4種型號隨意組裝滿足最高14核心效能怪獸
Arm Lumex CSS平台Mali-G1系列繪圖處理器與平台功能解析,為旗艦級智慧型手機帶來2倍光線追蹤效能(本文)

Mali-G1系列繪圖處理器(GPU)可以分為3種型號,10核心以上且具有光線追蹤加速單元的Mali-G1 Ultra,以及6~9核心的Mali-G1 Premium,與1~5核心的Mali-G1 Pro。

與前代14核心Immotaris-G925相比,14核心的Mali-G1 Ultra在遊戲、AI、ML(機器學習)等應用程式的效能提升達20%,繪製相同畫格的電力節省9%,全新的RTUv2(Ray Tracing Unit v2,第2代光線追蹤加速單元)更是可以讓光線追蹤繪圖效能達到2倍,有助於帶來更華麗的遊戲體驗,以及更豐富、複雜的AI應用程式與功能。

手機遊戲市場發展相當蓬勃,2025年遊戲市場中48%收益由手機遊戲貢獻。

Mali-G1系列GPU可以分為Mali-G1 Ultra、Mali-G1 Premium、Mali-G1 Pro等3種型號,在遊戲、AI、ML(機器學習)等應用程式的效能提升達20%,光線追蹤繪圖效能則達到2倍。

Mali-G1 Ultra在遊戲中繪製相同畫格的條件下,消耗電力較Immotaris-G925節省9%。

14核心的Mali-G1 Ultra在多款遊戲的效能表現,較前代14核心的Immotaris-G925提升11~26 %。

效能更高的GPU對AI運算也有所幫助,搭配模型量化、AI加速運算、統一軟體堆疊、改進的互連與記憶體頻寬等措施,都有助於將AI推廣到更多個人裝置。

Mali-G1 Ultra在多種AI應用情境下,效能較Immotaris-G925提升3~104 %。

全新的RTUv2光線追蹤加速單元讓Mali-G1 Ultra的光線追蹤繪圖效能達到Immotaris-G925的2倍。

Mali-G1 Ultra能讓遊戲在不改用軟體方式運算並保持光線追蹤品質的前提下,讓整體遊戲效能增益達到40%。

2nm製程節點也沒問題

Lumex CSS平台除了具有C1系列CPU與Mali-G1系列GPU,也包含C1-DSU(DynamIQ Shared Unit,動態分享單元),以及SI L1系統互連、MMU L1記憶體管理單元等完整的元件與IP(智慧財產),能夠協助晶片開發商降低研發難度並縮短週期,達到加速產品上市的優勢。

C1-DSU能讓IC設計廠商自由選擇最多14組C1系列CPU核心,以滿足上至旗艦級智慧型、個人電腦,下至穿戴式裝置的差異化產品使用需求。SI L1提供整顆SoC內高效能資料傳輸,並整合系統層級快取記憶體(System Level Cache,SLC)以及網路通訊(Network on Chip,NoC)功能。MMU L1則提供高效率的資料傳輸,並支援轉譯為基礎的虛擬化技術(Translation-Based Virtualization),為Android與Windows裝置提供更嚴謹的資安防護。

值得注意的是,雖然在Arm官方投影片中僅提到Lumex CSS平台相容於3nm節點製程,但是在Unlock大會的問答環節中,James McNiven補充Lumex CSS平台也能相容於2nm節點製程,並且有不止1間晶圓代工廠投入生產,但基於業界慣例,並不評論特定合作夥伴。

Lumex CSS平台提供完整的元件與IP,並相容3nm以及更新節點製程,能夠協助晶片開發商加速產品上市時間。

Lumex CSS平台除了具有C1系列CPU、Mail G1系列GPU,還有許多平台功能。

SI L1提供整顆SoC內高效能資料傳輸,甚至能夠整合系統層級快取記憶體與網路通訊功能。MMU L1則提供高效率的資料傳輸,並支援轉譯為基礎的虛擬化技術。

將網路透過NoC整合至SoC內有助於簡化晶片設計並縮小尺寸,相當適合小型、穿戴式裝置導入。

SI L1的高效率互連能提升高階裝置的效能,MMU L1則可達到PPA(Performance、Power、Area,效能、功耗、面積)最佳化的效果。

對軟體開發更友善

Arm提供的KleidiAI函數庫與PyTorch、Media Pipe、Llama CPP、Tencent Hunyuan、Google LiteRT、Alibaba MNN、ONNX、ExecuTorch等主流AI運算框架整合,並且能支援將相同的AI應用程式部署到不同世代的CPU,以取得最佳效能表現,大幅降低軟體開發的難度。

對於平台應用程式的開發者而言,Lumex也提供高度可移植性,例如Gmail、YouTube、Google Photos等App已全面支援SME2指令集,採用Lumex平台的裝置上市即可無縫運行。此外針對Android作業系統的最佳化功能也可以無縫擴展至採用 Arm架構處理器的Windows及其他作業系統。

Arm表示CPU有著普及度、相容性最高的優勢,即便AI運算效能不是最強,建議開發者將其作為「保底」的基礎運算單元,再往GPU、NPU擴展更豐富、複雜的功能。

KleidiAI函數庫整合多種主流AI運算框架,並可自動對支援SME2指令集的CPU進行最佳化。

LiteRT為Google提供的高效能AI執行階段(由TensorFlow Lite發展而來),KleidiAI函數庫也提供SME2指令集最佳化。

Microsoft推出的ONNX執行階段也享有SME2指令集最佳化,能在使用Windows on Arm作業系統時發揮所長。

C1-Pro CPU開啟SEM2指令集之後(黃點),AI運算效能表現甚至能夠超越Mali-G1 Ultra GPU(白色菱型)。

C1-Pro CPU開啟SEM2指令集之後能在多種運算負載提供平均3倍的效能表現。

Lumex CSS平台是款首款為旗艦級AI行動裝置設計的運算子系統,協助晶片設計商開發智慧型手機、平板電腦、筆記型電腦等裝置。

Google Android平台軟體工程師 Iliyan Malchev表示,在SME2指令集的協助下,如Gemma 3這樣的AI模型能夠於各類裝置上直接運行。隨著SME2指令集的持續擴展,行動裝置App開發者將能在整個生態系中無縫部署新一代AI功能,讓使用者能在智慧手機上隨時享受低延遲的AI體驗。

國寶大師 李文恩
作者

電腦王特約作者,專門負責硬派內容,從處理器、主機板到開發板、零組件,尖端科技都一手包辦,最近的研究計畫則包括Windows 98復活與AI圖像生成。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則