FB 建議貼文

選取貼文複製成功(包含文章連結)!

Intel Xeon 6+ Clearwater Forest處理器解析,採用全新Darkmont E-Core核心

Intel Xeon 6+ Clearwater Forest處理器解析,採用全新Darkmont E-Core核心

ADVERTISEMENT

代號為Clearwater Forest的Intel Xeon 6+處理器採用Intel 18A製程節點與Foveros Direct 3D先進封裝製造,並使用代號為Darkmont的全新E-Core核心。

同腳位可直接升級

Clearwater Forest是Intel最新推出的伺服器級處理器,開發目標為滿足高密度運算與橫向擴展工作負載(即重視核心數的使用情境),並提高電力效率與降低TCO(Total Cost of Ownership,總持有成本),以滿足資料中心和網路領域的現代運算需求。

延伸閱讀:
Computex 2024:Intel於Technology Tour Taiwan發表Lunar Lake處理器,帶來1.5倍GPU、3倍NPU效能
Intel說明Xeon 6處理器與Gaudi 3加速器優勢,雙路處理器給你滿滿192條PCIe Gen 5通道
Intel推出新款Xeon 6處理器,強化AI運算效能與效益還能跑DeepSeek
Intel Vision 24:Lunar Lake、Xeon 6處理器以及Gaudi 3加速器推動AI無所不在

Intel執行副總裁暨資料中心事業群總經理Kevork Kechichian表示x86生態系統仍有相當大的優勢,包含可靠性、相容性、對舊有程式的支援、軟體連續性、虛擬化支援等層面都有理想成效,而電力效率與運算密度也在Clearwater Forest獲得大幅改善。

Clearwater Forest採用FCLGA7529腳位,目前已推出、相容Xeon 6900P系列處理器的主機板,基本上能夠在更新BIOS / UEFI之後支援Clearwater Forest,以僅替換處理器的方式升級(Drop in Replacement),就能有效提升運算效能以及整體核心數,大幅節省升級成本。

考慮到資料中心的升級週期,由第2代Xeon處理器升級至Clearwater Forest能夠達到8:1的伺服器合併率(Server Consolidation),在提供同等效能的前提下,能將原本1400台伺服器的規模縮減到180台,同時節省750 KW整體電力消耗,節省71%機房空間,對於TCO控管有很大的幫助。

Intel也以Nokia NFVI v5.0(Network Functions Virtualization Infrastructure,網路功能虛擬化基礎設施)與核心網路應用作為成功案例。導入前一代搭載E-core的Xeon 6處理器能為客戶降低最多60%電力消耗、節省60%的伺服器空間,並提升150%的效能,凸顯了電信產業對於高效能、高密度基礎架構的迫切需求,以因應現代5G在效能與永續發展上的挑戰。

代號為Clearwater Forest的Intel Xeon 6+處理器採用Intel 18A製程節點。圖為運算模塊之晶圓。

Clearwater Forest處理器具有3組運算模塊(中央頂層)以及3組主動式基底模塊(中央底層),以及2組I/O模塊(兩側)。

x86生態系統仍有相當大的優勢,包含可靠性、相容性、對舊有程式的支援、軟體連續性、虛擬化支援等優勢。

Clearwater Forest產品名稱為Xeon 6+。而搭載P-Core的產品代號為Diamond Rapids,目前尚未發表名稱。

Clearwater Forest最大的特色就是將單一處理器的核心數拉升至228組,以提供更強悍的效能與應用彈性。

第2代Xeon處理器升級至Clearwater Forest能夠達到8:1的伺服器合併率。將原本1400台伺服器的規模縮減到180台,同時節省750 KW整體電力消耗,節省71%機房空間。

 

全新Darkmont E-Core詳解

Clearwater Forest採用全新Darkmont架構E-Core,與前代Sierra Forest處理器的Crestmont架構E-Core相比,在許多設計細節皆有著重大改進。

其前端(Front-End)管線搭載64 KB 指令L1快取記憶體,具備隨選指令長度解碼器,加速大型程式碼負載,並透過深度分支歷史和更大的結構尺寸強化分枝預測準確度,搭載3組3路(3-wild)指令解碼器,每時脈週期能夠解碼9條指令,帶來50%指令頻寬提升並改善功耗和延遲。

亂序引擎(Out-of-Order Engine)部分則具有8路指令分派埠(8-wide Allocation,提升1.6倍)與16路指令提交埠(16-wide Retire,提升2倍),並將亂序執行視窗擴大至416個指令(Out-of-Order Window,提升1.6 倍),能夠更有效追蹤、重排、等待執行的指令數,以發掘指令間的平行性。而26組執行埠(Execution Porr,提升1.5倍)能夠強化資料平行運算能力,互相搭配之下能夠提高亂序執行的資源使用效率,並提高整體效能輸出。

Clearwater Forest的執行引擎(Execution Engine)具有26組執行埠,能夠接收亂序引擎發派下來的工作負載,其純量引擎具有8組算數邏輯單元,向量引擎則有4組向量 / 浮點數運算單元,支援廣泛的工作負載,並搭配專屬硬體元件提升效率

核心記憶體子系統(Core Memory Subsystem)具有3組載入單元與2組儲存單元,與前代Skymont架構相比載入單元數量成長50%(儲存單元持平),有助於盡早發出載入指令以降低延遲。其深度存取緩衝(Deep Load & Store Buffering)能夠同時追蹤128個L2快取記憶體未命中事件,較前代Skymont架構提升2倍,進階預取器(Advance Perfetcher)能在各階快取記憶體層級偵測多種類型的資料存取流,改善預取機制。

此外Clearwater Forest也提供多像Xeon進階功能,包含        L1資料快取記憶體支援ECC錯誤校正、資料中毒(Data Poisoning)防護、可恢復式機器檢查(Recoverable Machine Check)、本地化機器檢查(Local Machine Check)、52 bit實體位址支援、核心同步執行(Core Lockstep)等等,提供更高層級的資安防護。

根據Intel提供的數據,Clearwater Forest的IPC(Instruction per Cycle,每週期指令數)效能成長幅度達到驚人的17%,Xeon 6+處理器的效能表現最高能夠達到Xeon 6780E的1.9倍,並且提高最多23%電力效率。

Clearwater Forest採用全新Darkmont架構E-Core,核心本體的架構與Panther Lake行動版處理器接近,但是運算模塊設計與跟平台功能則有相當大的差異。

Clearwater Forest的前端管線搭載64 KB 指令L1快取記憶體,以及3組3路指令解碼器,每時脈週期能夠解碼9條指令。

亂序引擎具有8路指令分派埠與16路指令提交埠,亂序執行視窗擴大至416個指令。

執行引擎具有26組執行埠,純量引擎具有8組算數邏輯單元,向量引擎則有4組向量 / 浮點數運算單元。

核心記憶體子系統一也透過增加載入單元數量與透過存取緩衝、進階預取器等功能強化快取與預取機制。

前代Sierra Forest之Crestmont架構與Darkmont架構對比。

與Sierra Forest相比,Darkmont讓Clearwater Forest的電力效能曲線更加漂亮。

筆者將在下篇文章說明Clearwater Forest處理器的封裝與平台功能,請讀者參考全文目錄繼續閱讀。

回到系列全文目錄

國寶大師 李文恩
作者

電腦王特約作者,專門負責硬派內容,從處理器、主機板到開發板、零組件,尖端科技都一手包辦,最近的研究計畫則包括Windows 98復活與AI圖像生成。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則