FB 建議貼文

選取貼文複製成功(包含文章連結)!

Intel Panther Lake處理器GPU詳解,12組Xe 3核心帶來50%效能成長

Intel Panther Lake處理器GPU詳解,12組Xe 3核心帶來50%效能成長

ADVERTISEMENT

Intel在2025年度Tech Tour.us活動中詳細說明Panther Lake處理器的Xe 3顯示架構內建顯示晶片與NPU 5神經處理器,帶來更出色的顯示、AI效能,以及高達180 TOPS的全機AI運算效能,筆者將在本文先介紹內建顯示晶片。

全新Xe 3架構,維持「B」系列命名

回顧2024年推出的Lunar Lake與Arrow Lake處理器分別採用Xe 2與Xe顯示架構,Panther Lake處理器的內建顯示晶片則採用最新Xe 3顯示架構,並依處理器型號不同提供4核心或12核心配置選擇,能夠帶來超過50%的效能成長。不過比較特別的是它仍然被歸類於「B」系列的Battlemage產品線,未來可能應用於獨立顯示卡的Xe 3P顯示架構才會推進至「C」系列的Celestial產品線。

延伸閱讀:
Intel正式宣布高效能顯示卡品牌「Intel Arc」,2022年第一季推出
【COMPUTEX 2025】Intel發表Arc Pro B系列運算卡,還有雙GPU魔改卡與Battlematrix工作站

相較於Xe 2顯示架構的Render Slice統一由4組Xe核心組成,Xe 3顯示架構則有2或6組Xe核心的組態。

Panther Lake 4 Xe GPU具有2組由2組Xe核心組成的Render Slice,採用Intel 3製程節點。而Panther Lake 12 Xe GPU具有2組由6組Xe核心組成的Render Slice,但採用tsmc(台積電)N3E製程節點。

上述2種內建顯示晶片除了Xe核心數量差異之外,L2快取記憶體、後端管線等配置也有所不同,提供晶片設計的可擴充彈性,也為未來可能的獨立顯示卡鋪路。詳細情參考下列圖文說明。

Panther Lake將繪圖處理器(GPU,紫色)放置於獨立的繪圖處理器模塊,而神經處理器(NPU,淺藍色)則整合於運算模塊之內。

Xe 3架構的內建顯示晶片仍歸類於「B」系列的Battlemage產品線,未來推出的Xe 3P架構(可能應用於獨立顯示卡)才會推進至「C」系列的Celestial產品線。。

Xe 3顯示架構比起Xe 2有著更高的架構可擴充性,以及最佳化的效能表現。

回顧Xe 2顯示架構,Render Slice由4組Xe核心組成。

Xe 2顯示架構的一帶特色就是導入XMX引擎以提升AI運算效能。

Xe 3顯示架構之2種不同的Panther Lake內建顯示晶片具有不同架構配置。

Panther Lake 12 Xe GPU(左)與Panther Lake 4 Xe GPU(右)的裸晶此外從肉眼就可看出明顯差異。

Panther Lake 4 Xe GPU具有2組由2組Xe核心組成的Render Slice,搭載4 MB L2快取記憶體與2組像素後端管線,並且採用Intel 3製程節點。

Panther Lake 12 Xe GPU具有2組由6組Xe核心組成的Render Slice,搭載16 MB L2快取記憶體與4組像素後端管線,採用tsmc N3E製程節點。

內建顯示晶片效能提升50%

Xe 3架構的每組Xe核心具有8組512 bit向量引擎,以及8組2048 bit XMX(Xe Matrix Extension,Xe矩陣延伸指令集)引擎,搭配256 KB L1快取記憶體,並強化光線追蹤單元的運算效能。

受益於XMX引擎的矩陣運算功能,Xe 3架構也能加速AI應用程式的執行,考慮到Panther Lake 12 Xe GPU具有120 TOPS的AI運算效能,加上最高能夠支援容量達96 GB的記憶體LPDDR5-9600,讓它能與AMD Ryzen AI Max+ 395處理器相提並論(全平台126 TOPS AI運算效能)。

另一方面Intel也與Microsoft合作推出以DirectX 12為基礎的Cooperative Vetcor(協同向量)功能,能夠透過GPU渲染器加速矩陣運算,以達到提升AI應用程式效能的效果。

Panther Lake 12 Xe GPU的繪圖效能較Lunar Lake提升最多50%,而與Arrow Lake相比,在相同效能表現下功耗降低40%。至於AI運算部分,Panther Lake 12 Xe GPU能夠提供120 TOPS的INT8 / FP8資料類型AI運算效能,適合應用於如AI圖像生成等間歇、高強度的AI應用程式。

與8 MB容量相比,16 MB的L2快取記憶體能夠節省最多36% SoC互連的資料流量,有助於提升遊戲效能並節省電力消耗。

Xe 3顯示架構的各引擎以及Render Slice皆有所改進,以強化效能並提高利用效率。

Xe 3架構的每組Xe核心具有8組512 bit向量引擎,以及8組2048 bit XMX引擎,L1快取記憶體擴大至256 KB。

向量引擎利用效率最多增加25%執行緒吞吐量,並支援FP8資料類型逆量化(Dequantization)。

XMX引擎支援TF32(TensorFloat 32)、FP16、BF16、INT8、INT4、INT2等資料類型,並提供最高每時脈週期8,192次運算。FP32在反量化後具有每時脈週期2,048次運算效能。

光線追蹤單元的動態光線管理支援非同步光線追蹤運算(Async Ray Tracing)。

GFX功能部分,帶來2倍的各向異性過濾(Anisotropic Filtering,AF)與模板測試(Stencil Test Rate)效能。

與Xe 2架構相比,Xe 3架構在繪圖的各階段有不同的效能改善,以提升整體效能輸出。

Panther Lake的內建顯示效能可較Lunar Lake提升超過50%。

與行動版Arrow Lake相比,Panther Lake內建顯示的電力效率改善超過40%。

Cooperative Vetcor(協同向量),能夠透過GPU渲染器加速矩陣運算,以達到提升AI應用程式效能的效果。

Panther Lake的內建顯示晶片之效能與電力效率皆有大幅改善,Xe媒體引擎新增支援10 bit深度色彩取樣的AVC(H.264)與AV1,以及SONY XAVC-H/ HS / S等影片格式編、解碼硬體加速。

Panther Lake也將支援最新的XeSS 2多重畫格生成,最多能開啟4X畫格生成設定以大幅提升遊戲的FPS效能,此外Xe 3顯示架構也有其他改善遊戲體驗的新功能,筆者將於另一篇文章詳細介紹,請讀者參考全文目錄繼續閱讀。

回到系列全文目錄

國寶大師 李文恩
作者

電腦王特約作者,專門負責硬派內容,從處理器、主機板到開發板、零組件,尖端科技都一手包辦,最近的研究計畫則包括Windows 98復活與AI圖像生成。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則