NVIDIA於GTC 22秋季場發表RTX 40系列顯示卡與多款運算平台與雲端服務

NVIDIA於GTC 22秋季場發表RTX 40系列顯示卡與多款運算平台與雲端服務

ADVERTISEMENT

NVIDIA在GTC 2022技術大會秋季場發表RTX 40系列顯示卡,以及IGX、Drive Thor等運算平台與Omniverse Cloud雲端服務,強化AI與元宇宙等多元應用。

RTX4090 10月12日登場

在GTC開幕演說一開場,NVIDIA創辦人暨執行長黃仁勳就端出採用Ada Lovelace架構的RTX 40系列顯示卡,首波推出的產品包括GeForce RTX 4090,以及GeForce RTX 4080 16GB、GeForce RTX 4080 12GB。

GeForce RTX 4090將於2022年10月12日搶先開賣,官方定價為美金1,599元,它具有16384組CUDA核心,加速核心時脈可達2.52GHz,搭載寬度為384bit的GDDR6X記憶體,容量高達24GB。

GeForce RTX 4080要等到11月才會登場,2者都是採用GDDR6X記憶體,其中16GB版本的記憶體通道寬度為256bit,並具有9728組CUDA核心,加速核心時脈可達2.51GHz。12GB版本的通道寬度僅有192bit,CUDA核心數也縮減約21%,僅有7680組,加速核心時脈為略高的2.61GHz。

這個操作相當了不起,若是其他廠商可能會將「GeForce RTX 4080 12GB」命名為「GeForce RTX 4070」,但在黃老闆妙手刀法之下,頓時讓產品的質感更顯尊爵不凡。另一方面,演說中的投影片也表示GeForce RTX 3080、3070、3060還會繼續販售,或許也暗示了這些產品持續發揮保值的特性。

RTX 40系列將導入渲染器執行重新排序(Shader Execution Reordering,SER)、DLSS 3等新技術,分別能提升25%與4倍遊戲FPS效能。更多技術細節筆者將於日後撰文解析。

黃仁勳還是有為玩家帶來好消息,那就是NVIDIA將會推出免費的《傳送門》RTX版,擁有正版《傳送門》的玩家將可於11月下載免費的DLC,以全新的視覺體驗重溫這款經典遊戲。

黃仁勳拿出GeForce RTX 4090展示。不知道這位是否為數位影像呢?

GeForce RTX 4090能提供2~4倍於GeForce RTX 3080 Ti的遊戲效能,定價為美金1,599元。

16GB與12GB的GeForce RTX 4080定價分別為美金1,199元、899元。

台灣官方網站曾標示2款GeForce RTX 4080的價格分別為新台幣42,990元、32,990元,後來價格資訊已被撤下。

從規格簡表可以看出3張顯示卡除了記憶體容量不同外,CUDA核心數量的差異也很大。

GeForce RTX 3080、3070、3060等產品還會繼續在市場上存活,且價格與發表時維持相同。

Ada Lovelace架構在渲染器、光線追蹤單元、Tensor核心都有大幅度改進。

渲染器執行重新排序能夠提升2~3倍光線追蹤運算效能,對遊戲的整體效能有25%的提升效果。

DLSS 3則採用更多預測方式,來建構更完善的高畫質遊戲畫面,同時還能提升遊戲FPS效能最高達4倍之譜。

NVIDIA將推出免費的《傳送門》RTX版,擁有正版《傳送門》的玩家將可於11月免費下載DLC。

H100帶來革命性效能提升

NVIDIA宣佈採用Hooper架構的H100 GPU將進入全面生產階段,並開始於LaunchPad提供H100的存取,用戶能在建置運算叢集之前先體驗與評估H100的效能表現。另外由合作夥伴推出搭載H100的系統也將於2022年10月開始出貨,NVIDIA也將依序推出PCIe介面卡、DGX、HGX等超級電腦產品。

根據NVIDIA官方提供的效能測試數據,64台HGX H100就能帶來等同於320台前代HGX A100的AI訓練、推論平均效能表現。這等同於只需原本1/5的伺服器數量,就能提供相同的效能,並可改善3倍整體持有成本(TCO)與3.5倍能原效率,對用戶來說是相當划算的投資。

NVIDIA超大規模與高效能運算副總裁Ian Buck在簡報中特別說明,現在大型語言模型占據AI運算相當大的比重,例如圖像產生、推薦系統、科學研究、翻譯、文字產生、AI編寫程式都需要大型語言模型的協助。

全新的H100能提供5倍於A100的大型語言模型訓練效能,以及30倍推論效能,提升幅度相當顯著,此外NVIDIA也會推出NeMo LLM Service雲端服務,提供用戶更具彈性的解決方案。

採用Hooper架構的H100 GPU將以多種型式陸續投入市場。

HGX H100伺服器有著5倍於前代HGX A100的AI訓練、推論平均效能表現。

圖像產生、推薦系統、科學研究、翻譯、文字產生、AI編寫程式都需要大型語言模型的協助,大型語言模型相關論文也日益增加。

H100能提供5倍於A100的大型語言模型訓練效能,以及30倍推論效能。

NVIDIA也將推出NeMo LLM Service雲端服務。

多款運算平台齊發

NVIDIA也在這次GTC發表了多款全新運算硬體與雲端解決方案。首先我們看到針對醫療以及自動化工業應用所推出的IGX,其搭載的Orin模組具有250 TOPS的運算能力,並可擴充高達600 TOPS運算能力的RTX Ampere GPU,同時也搭載ConnectX-7 400GbE串流I/O介面,能夠連接多種外部裝置、現有醫療儀器,進行即時醫療圖像分析以及執行各種AI程式。

而針對智慧型車輛所設計的DRIVE Thor車用SoC,它具有2000 TOPS的FP8資料類型運算能力,並可搭配Hooper GPU、次世代GPU、Grace CPU等不同運算單元,提供充沛且冗餘的運算效能,以同時滿足輔助駕駛、自動駕駛、車用娛樂的需求。不過在這同時NVIDIA也宣佈取消先前的DRIVE Atlan產品(其運算能力僅有1000 TOPS),未來僅會實際推出DRIVE Thor相關產品。

為了為邊緣AI裝置或自走車、機械手臂等小型自動化工業裝置提供更充沛的AI運算效能,NVIDIA也將Orin下放至「Nano家族」,推出Orin Nano運算模組,它具有6個Arm Cortex-A78處理器核心,並可藉由Ampere架構GPU提供40 TOPS INT8資料類型運算能力,整體能夠帶來80倍於Jetson Nano的效能表現,提供4GB、8GB等規格選擇,價格由美金199元(約合新台幣6,295元)起,但不會推出Orin Nano開發者套件。

在元宇宙與Omniverse應用方面,NVIDIA除了推出第2代OVX電腦之外,也宣佈以SaaS(Software as a Service,軟體即服務)的型式推出Omniverse Cloud雲端服務,讓沒有硬體環境的用戶也能快速投入開發流程。

IGX是為醫療以及自動化工業應用所推出的運算平台。

IGX能夠與現有醫療儀器連接,並提供即時AI醫療影像分析與處理功能。

IGX也能搭配Metropolis應用程式框架,應用於自動化工業領域。

全新的DRIVE Thor車用SoC具有2000 TOPS運算能力,取代只有1000 TOPS的DRIVE Atlan。

DRIVE Thor具有強大的擴充能力,也可搭配Hooper GPU、次世代GPU、Grace CPU等不同運算單元。

Orin Nano運算模組具有6個Arm Cortex-A78處理器核心,以及Ampere架構GPU,整體提供80倍於Jetson Nano的效能表現。

Orin Nano運算模組適合應用於小行型自動化工業裝置。

第2代OVX電腦搭載2路Intel Xeon Platinum 8362處理器,搭配8張Ada Lovelace架構的L40繪圖卡。

NVIDIA也會以SaaS型式推出Omniverse Cloud雲端服務。

不同程度的使用者可以選擇搭載RTX顯示卡的電腦、OVX電腦,並透過基於GeForce NOW的雲端服務將成果推送至各種不同裝置。

由於GTC發表的資訊相當豐富,筆者也只能挑選一部分進行介紹,讀者可以至GTC特設網站查看更多資訊,或再次觀看由黃仁勳主持的GTC 2022主題演講。筆者也預計於日後更新更多相關報導。

國寶大師 李文恩
作者

電腦王特約作者,專門負責硬派內容,從處理器、主機板到開發板、零組件,尖端科技都一手包辦,最近的研究計畫則包括Windows 98復活與AI圖像生成。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則