2022.09.21 09:00

NVIDIA於GTC 22秋季場發表RTX 40系列顯示卡與多款運算平台與雲端服務

ADVERTISEMENT

NVIDIA在GTC 2022技術大會秋季場發表RTX 40系列顯示卡,以及IGX、Drive Thor等運算平台與Omniverse Cloud雲端服務,強化AI與元宇宙等多元應用。

RTX4090 10月12日登場

在GTC開幕演說一開場,NVIDIA創辦人暨執行長黃仁勳就端出採用Ada Lovelace架構的RTX 40系列顯示卡,首波推出的產品包括GeForce RTX 4090,以及GeForce RTX 4080 16GB、GeForce RTX 4080 12GB。

GeForce RTX 4090將於2022年10月12日搶先開賣,官方定價為美金1,599元,它具有16384組CUDA核心,加速核心時脈可達2.52GHz,搭載寬度為384bit的GDDR6X記憶體,容量高達24GB。

ADVERTISEMENT

GeForce RTX 4080要等到11月才會登場,2者都是採用GDDR6X記憶體,其中16GB版本的記憶體通道寬度為256bit,並具有9728組CUDA核心,加速核心時脈可達2.51GHz。12GB版本的通道寬度僅有192bit,CUDA核心數也縮減約21%,僅有7680組,加速核心時脈為略高的2.61GHz。

這個操作相當了不起,若是其他廠商可能會將「GeForce RTX 4080 12GB」命名為「GeForce RTX 4070」,但在黃老闆妙手刀法之下,頓時讓產品的質感更顯尊爵不凡。另一方面,演說中的投影片也表示GeForce RTX 3080、3070、3060還會繼續販售,或許也暗示了這些產品持續發揮保值的特性。

RTX 40系列將導入渲染器執行重新排序(Shader Execution Reordering,SER)、DLSS 3等新技術,分別能提升25%與4倍遊戲FPS效能。更多技術細節筆者將於日後撰文解析。

ADVERTISEMENT

黃仁勳還是有為玩家帶來好消息,那就是NVIDIA將會推出免費的《傳送門》RTX版,擁有正版《傳送門》的玩家將可於11月下載免費的DLC,以全新的視覺體驗重溫這款經典遊戲。

ADVERTISEMENT

ADVERTISEMENT

H100帶來革命性效能提升

NVIDIA宣佈採用Hooper架構的H100 GPU將進入全面生產階段,並開始於LaunchPad提供H100的存取,用戶能在建置運算叢集之前先體驗與評估H100的效能表現。另外由合作夥伴推出搭載H100的系統也將於2022年10月開始出貨,NVIDIA也將依序推出PCIe介面卡、DGX、HGX等超級電腦產品。

根據NVIDIA官方提供的效能測試數據,64台HGX H100就能帶來等同於320台前代HGX A100的AI訓練、推論平均效能表現。這等同於只需原本1/5的伺服器數量,就能提供相同的效能,並可改善3倍整體持有成本(TCO)與3.5倍能原效率,對用戶來說是相當划算的投資。

NVIDIA超大規模與高效能運算副總裁Ian Buck在簡報中特別說明,現在大型語言模型占據AI運算相當大的比重,例如圖像產生、推薦系統、科學研究、翻譯、文字產生、AI編寫程式都需要大型語言模型的協助。

全新的H100能提供5倍於A100的大型語言模型訓練效能,以及30倍推論效能,提升幅度相當顯著,此外NVIDIA也會推出NeMo LLM Service雲端服務,提供用戶更具彈性的解決方案。

多款運算平台齊發

NVIDIA也在這次GTC發表了多款全新運算硬體與雲端解決方案。首先我們看到針對醫療以及自動化工業應用所推出的IGX,其搭載的Orin模組具有250 TOPS的運算能力,並可擴充高達600 TOPS運算能力的RTX Ampere GPU,同時也搭載ConnectX-7 400GbE串流I/O介面,能夠連接多種外部裝置、現有醫療儀器,進行即時醫療圖像分析以及執行各種AI程式。

而針對智慧型車輛所設計的DRIVE Thor車用SoC,它具有2000 TOPS的FP8資料類型運算能力,並可搭配Hooper GPU、次世代GPU、Grace CPU等不同運算單元,提供充沛且冗餘的運算效能,以同時滿足輔助駕駛、自動駕駛、車用娛樂的需求。不過在這同時NVIDIA也宣佈取消先前的DRIVE Atlan產品(其運算能力僅有1000 TOPS),未來僅會實際推出DRIVE Thor相關產品。

為了為邊緣AI裝置或自走車、機械手臂等小型自動化工業裝置提供更充沛的AI運算效能,NVIDIA也將Orin下放至「Nano家族」,推出Orin Nano運算模組,它具有6個Arm Cortex-A78處理器核心,並可藉由Ampere架構GPU提供40 TOPS INT8資料類型運算能力,整體能夠帶來80倍於Jetson Nano的效能表現,提供4GB、8GB等規格選擇,價格由美金199元(約合新台幣6,295元)起,但不會推出Orin Nano開發者套件。

在元宇宙與Omniverse應用方面,NVIDIA除了推出第2代OVX電腦之外,也宣佈以SaaS(Software as a Service,軟體即服務)的型式推出Omniverse Cloud雲端服務,讓沒有硬體環境的用戶也能快速投入開發流程。

由於GTC發表的資訊相當豐富,筆者也只能挑選一部分進行介紹,讀者可以至GTC特設網站查看更多資訊,或再次觀看由黃仁勳主持的GTC 2022主題演講。筆者也預計於日後更新更多相關報導。

ADVERTISEMENT