Arm發表Neoverse V2處理器，伺服器效能再強化

Arm繼先前針對伺服器、雲端AI運算、邊緣運算、5G基地台等應用所設計的Neoverse V1、N2、E1等處理器解決方案，這次推出強化效能表現的Neoverse V2。

從邊緣到高效能運算

由於現今運算的需求越趨多元，從部署地點與規模進行區分，由「小、近」到「遠、大」大致可以粗略分為邊緣、5G基礎設置、雲端、高效能運算（HPC），這些不同的設備對於運算單元也有相當程度的分歧。

舉例來說，邊緣運算設備的尺寸較小，且可能有較嚴格的電力限制，所以只能搭配單顆具有4~16核心的處理器，而肩負高效能運算任務的超級電腦尺寸可以大至好幾個房間，並且具有充沛的電力供應，規模可以放大到數百萬組處理器核心。

相較之下，傳統x86架構處理器的生態難以滿足如此巨大的需求差異，但Arm架構處理器則更有彈性，能夠依照使用者、客戶的需求自由選則IP，並彈性調整配置，以滿足不斷快速變化的需求。

▲ Arm台灣總裁曾志光（中）、應用工程總監徐達勇（左）、資深技術總監陳胎裕在久違的實體發表會中，為大家說明Arm的新產品。

▲ 運算需求隨邊緣、5G基礎設置、雲端、高效能運算（HPC）等不同設備而有巨大的差異。

▲ 對於現今的基礎設置而言，規模、效能、功耗都是層層考驗。

▲ 放眼未來，基礎設置的發展趨勢會朝無所不在、加速運算、能原效率等方向發展。

Arm Neoverse平台具有V、N、E等3款不同的系列，其中V系列追求最高的單執行緒效能，適合對運算需求較高的應用情境。而N系列在效能、功耗之間取得較佳的平衡，其目標為在高單顆處理器（Single Socket）中容納更多組核心，以提升系統的多工效能。

E系列則有最佳能源效率，適合運算需求較低或電力預算較低的情境，另一方面由於它省電的特性，很適合應用於全卡功耗為75W以下的PCIe介面的DPU加速卡。

客戶可以自由挑選不同的處理器IP，並可搭配AMBA CHI、UCIe、CXL等晶片互連技術與先進2.5D、3D封裝技術，量身打造最適合自身需求的運算單元。

▲ Neoverse的3款系列各有不同的特色。V系列追求最高的單執行緒效能，N系列則取得效能、功耗的平衡，並在盡可能提高單顆處理器可容納的核心數以提高多工效能，E系列則有最佳能源效率，適合用於資料吞吐工作負載。

▲ Neoverse平台也支援AMBA CHI、UCIe、CXL等晶片互連技術，更加提高SoC開發的彈性。

▲ 回顧2022上半年，多位合作夥伴已藉由Arm的IP開發多種不同類型的產品。

▲ Arm的處理器也達到許多里程盃，包括首款記憶體頻寬達1TB/s的處理器，首款核心數超過100組的處理器，首款支援DDR5、PCIe Gen 5的處理器，首款spce Int效能測試超過500分的處理器。

▲ 許多PCIe介面的DPU加速卡借助Neoverse N系列處理器低功耗的特色，將整全卡功耗控制在75W以下以滿足PCIe規範。

Neoverse平台也為了簡化開發者的工作流程，並提升整體效能表現，而與許多軟體夥伴保持密切合作關係，不但支援所有主流Linux發行版本，也藉由SystemReady降低軟體移植工作量，並支援Kubernetes等容器與多項持續整合/持續交付（CI/CD）工具，以便為Arm架構提供原生建構。

而這次發表的重頭戲之一，就是代號為Demeter的Neoverse V2處理器，它不但具有最新的V系列處理器核心，有搭載CMN-700網狀互連技術，為超大規模與高效能運算等工作負載提供最佳單執行緒效能，以及防止記憶體攻擊等多項Armv9架構安全性強化功能。

在效能改善方面，Neoverse V2將L2快取記憶體容量提升1倍達到2MB，並從 SVE指令集（Scalable Vector Extension，可擴展的向量延伸指令集）升級到SVE2，並支援BF16資料類型，強化包含AI運算在內的整體效能。

▲ 所有主流的Linux發行版本皆支援Arm架構處理器，Arm也藉由SystemReady降低軟體移植工作量。

▲ Arm也雲端合作夥伴共同最佳化雲原生的軟體基礎設施、框架與工作負載，支援多項持續整合/持續交付（CI/CD）工具，簡化程式開發與部署。

▲ 透過MongoDB最佳化，可以讓Neoverse N1處理器在資料庫應用效能達到x86架構處理器的217%。

▲ 採用Neoverse V1核心的AWS EC2 C7g執行個體在BERT自然語言處理模型的效能，較採用最新Intel Xeon核心的C6i高出80%。

▲ Neoverse V2強化整數運算效能、提高L2快取記憶體容量，並導入SVE 2、BF16、INT8 MatMul等指令集。

▲ Neoverse V2內的CMN-700網狀互連技術讓每個處理器支援高達512MB的系統級緩存，以及最高4TB/s的記憶體頻寬，也支援Armv9架構的資安功能。

值得注意的是，先前NVIDIA發表的Grace處理器，就是採用Neoverse V2為基礎，並可透過自家NVLink-C2C互連技術組成Grace CPU超級晶片、Grace Hopper超級晶片等運算單元，後續發展相當值得期待。