Arm發表Neoverse V2處理器,伺服器效能再強化

Arm發表Neoverse V2處理器,伺服器效能再強化

ADVERTISEMENT

Arm繼先前針對伺服器、雲端AI運算、邊緣運算、5G基地台等應用所設計的Neoverse V1、N2、E1等處理器解決方案,這次推出強化效能表現的Neoverse V2。

從邊緣到高效能運算

由於現今運算的需求越趨多元,從部署地點與規模進行區分,由「小、近」到「遠、大」大致可以粗略分為邊緣、5G基礎設置、雲端、高效能運算(HPC),這些不同的設備對於運算單元也有相當程度的分歧。

舉例來說,邊緣運算設備的尺寸較小,且可能有較嚴格的電力限制,所以只能搭配單顆具有4~16核心的處理器,而肩負高效能運算任務的超級電腦尺寸可以大至好幾個房間,並且具有充沛的電力供應,規模可以放大到數百萬組處理器核心。

相較之下,傳統x86架構處理器的生態難以滿足如此巨大的需求差異,但Arm架構處理器則更有彈性,能夠依照使用者、客戶的需求自由選則IP,並彈性調整配置,以滿足不斷快速變化的需求。

Arm台灣總裁曾志光(中)、應用工程總監徐達勇(左)、資深技術總監陳胎裕在久違的實體發表會中,為大家說明Arm的新產品。

運算需求隨邊緣、5G基礎設置、雲端、高效能運算(HPC)等不同設備而有巨大的差異。

對於現今的基礎設置而言,規模、效能、功耗都是層層考驗。

放眼未來,基礎設置的發展趨勢會朝無所不在、加速運算、能原效率等方向發展。

多種組合滿足需求

Arm Neoverse平台具有V、N、E等3款不同的系列,其中V系列追求最高的單執行緒效能,適合對運算需求較高的應用情境。而N系列在效能、功耗之間取得較佳的平衡,其目標為在高單顆處理器(Single Socket)中容納更多組核心,以提升系統的多工效能。

E系列則有最佳能源效率,適合運算需求較低或電力預算較低的情境,另一方面由於它省電的特性,很適合應用於全卡功耗為75W以下的PCIe介面的DPU加速卡。

客戶可以自由挑選不同的處理器IP,並可搭配AMBA CHI、UCIe、CXL等晶片互連技術與先進2.5D、3D封裝技術,量身打造最適合自身需求的運算單元。

Neoverse的3款系列各有不同的特色。V系列追求最高的單執行緒效能,N系列則取得效能、功耗的平衡,並在盡可能提高單顆處理器可容納的核心數以提高多工效能,E系列則有最佳能源效率,適合用於資料吞吐工作負載。

Neoverse平台也支援AMBA CHI、UCIe、CXL等晶片互連技術,更加提高SoC開發的彈性。

回顧2022上半年,多位合作夥伴已藉由Arm的IP開發多種不同類型的產品。

Arm的處理器也達到許多里程盃,包括首款記憶體頻寬達1TB/s的處理器,首款核心數超過100組的處理器,首款支援DDR5、PCIe Gen 5的處理器,首款spce Int效能測試超過500分的處理器。

許多PCIe介面的DPU加速卡借助Neoverse N系列處理器低功耗的特色,將整全卡功耗控制在75W以下以滿足PCIe規範。

軟體最佳化與新處理器分進合擊

Neoverse平台也為了簡化開發者的工作流程,並提升整體效能表現,而與許多軟體夥伴保持密切合作關係,不但支援所有主流Linux發行版本,也藉由SystemReady降低軟體移植工作量,並支援Kubernetes等容器與多項持續整合/持續交付(CI/CD)工具,以便為Arm架構提供原生建構。

而這次發表的重頭戲之一,就是代號為Demeter的Neoverse V2處理器,它不但具有最新的V系列處理器核心,有搭載CMN-700網狀互連技術,為超大規模與高效能運算等工作負載提供最佳單執行緒效能,以及防止記憶體攻擊等多項Armv9架構安全性強化功能

在效能改善方面,Neoverse V2將L2快取記憶體容量提升1倍達到2MB,並從 SVE指令集(Scalable Vector Extension,可擴展的向量延伸指令集)升級到SVE2,並支援BF16資料類型,強化包含AI運算在內的整體效能。

所有主流的Linux發行版本皆支援Arm架構處理器,Arm也藉由SystemReady降低軟體移植工作量。

Arm也雲端合作夥伴共同最佳化雲原生的軟體基礎設施、框架與工作負載,支援多項持續整合/持續交付(CI/CD)工具,簡化程式開發與部署。

透過MongoDB最佳化,可以讓Neoverse N1處理器在資料庫應用效能達到x86架構處理器的217%。

採用Neoverse V1核心的AWS EC2 C7g執行個體在BERT自然語言處理模型的效能,較採用最新Intel Xeon核心的C6i高出80%。

Neoverse V2強化整數運算效能、提高L2快取記憶體容量,並導入SVE 2、BF16、INT8 MatMul等指令集。

Neoverse V2內的CMN-700網狀互連技術讓每個處理器支援高達512MB的系統級緩存,以及最高4TB/s的記憶體頻寬,也支援Armv9架構的資安功能。

值得注意的是,先前NVIDIA發表的Grace處理器,就是採用Neoverse V2為基礎,並可透過自家NVLink-C2C互連技術組成Grace CPU超級晶片、Grace Hopper超級晶片等運算單元,後續發展相當值得期待。

國寶大師 李文恩
作者

電腦王特約作者,專門負責硬派內容,從處理器、主機板到開發板、零組件,尖端科技都一手包辦,最近的研究計畫則包括Windows 98復活與AI圖像生成。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則