FB 建議貼文

選取貼文複製成功(包含文章連結)!

NVIDIA發表最新MLPerf訓練測試成績,GB200 NVL72提交所有測試成績

NVIDIA發表最新MLPerf訓練測試成績,GB200 NVL72提交所有測試成績

ADVERTISEMENT

NVIDIA在媒體說明會最新MLPerf訓練測試成績,GB200 NVL72不但能夠完成所有測試項目,效能表現與成本效益也大大幅超越前代產品。

MLPerf訓練也全勤

MLPerf是由學術界、研究實驗室和業界人士共同組成組織旨在打造公正且能夠反映實際應用情境的AI運算測試基準。先前NVIDIA已經發表GB200 NVL72在MLPerf推論測試的表現,這次則是發表訓練測試的成績。

延伸閱讀:
NVIDIA發表GB200 NVL72之最新MLPerf推論測試成績,效能領先前代產品30倍
GTC 24:NVIDIA Blackwell AI運算平台架構解析,將72組GB200組成超大型GPU
GTC 24:Blackwell架構詳解!看懂B100、B200、GB200、GB200 NVL72成員的糾結瓜葛

MLPerf自2018年推出基準測試以來,這次已經是第12輪測試,NVIDIA推出的AI運算平台在每項測試皆有出色表現,且提交包含Llama 3.1 405B大型語言模型(Large Language Model,LLM)預訓練在內的所有項目成績,是唯一提交MLPerf Training v5.0基準測試所有項目測試結果的平台。

在全新的Llama 3.1 405B預訓練測試中,Blackwell GPU的效能較前代架構在相同規模下提升了2.2倍。而在Llama 2 70B LoRA微調測試中,搭載8組Blackwell GPU的NVIDIA DGX B200系統效能較前代架構使用相同數量GPU的測試結果提升2.5倍。

NVIDIA在MLPerf Training v5.0訓練測試中創下5項新記錄。

NVIDIA與合作夥伴提交超過50組GB200 NVL72測試成績。NVIDIA與CoreWeave、IBM合作的部分使用提交使用2,496組Blackwell GPU和1,248組 Grace CPU的成績,展現其Scale-Out擴展能力。

在相同數量GPU的條件下,Blackwell架構最高能領先前代Hopper架構達2.6倍。

比較單位成本的訓練效能,Blackwell架構也能達到Hopper架構的1.55倍。也就是說在相同花費下,Blackwell架構具有1.55倍的產出。

NVIDIA的強項在於整合NVLink、InfiniBand等匯流排與網路介面,讓Scale-Out的效率可以達到90%,。

NVIDIA表示這些由代理型AI驅動的應用程式需要仰賴AI工廠產生,而在資料中心電力供應有限的情況下,採用電力效率更高的AI運算單元代表著更高的產出,也將創造更高的產值。

國寶大師 李文恩
作者

電腦王特約作者,專門負責硬派內容,從處理器、主機板到開發板、零組件,尖端科技都一手包辦,最近的研究計畫則包括Windows 98復活與AI圖像生成。

使用 Facebook 留言
許顧問
2.  許顧問 (發表於 2025年6月05日 15:26)
NVIDIA GB200 NVL72 在 MLPerf Training v5.0 測試中展現驚人效能,使用 512 個 GPU 執行 Llama3-405B 模型訓練時,完成時間僅 121.09 分鐘,較上一代 H100 系統快 2.2 倍,顯示 Blackwell 架構與 NVLink Switch 的高效能運算優勢。此類 AI 技術突破亦逐漸被應用於娛樂與數位產業中,像是「賭豬娛樂城論壇」相關平台,正積極導入類似高速資料分析與使用者預測技術,強化遊戲互動與個人化體驗,為用戶提供更加智慧與安全的線上娛樂環境。此趨勢不僅提升平台競爭力,也強化用戶對正規娛樂城的信賴度與留存率。
發表回應
謹慎發言,尊重彼此。按此展開留言規則