FB 建議貼文

選取貼文複製成功(包含文章連結)!

【COMPUTEX 2026】AI Agent時代全面來臨!NVIDIA Vera Rubin平台量產,AI盈利模式確立,引領產業新局

【COMPUTEX 2026】AI Agent時代全面來臨!NVIDIA Vera Rubin平台量產,AI盈利模式確立,引領產業新局

ADVERTISEMENT

NVIDIA創辦人暨執行長黃仁勳於Computex台北國際電腦展2026 CEO演說中說明Vera Rubin平台已進入全面量產階段,指出AI已具實用價值並可創造盈利,並發表適用於Windows on Arm平台的RTX Spark處理器。

AI不只好看,還能賺錢

黃仁勳在照慣例在演說開場階段列出眾多合作夥伴與供應鏈,展現力挺台灣的心意。比較特別的是,今年入列的廠商除了科技業者之外,還有幾間餐飲業者,為演說添增不少話題性。

延伸閱讀:
【GTC 2026】NVIDIA Vera Rubin世代7種晶片與5種機櫃打造最強AI工廠,還要送晶片上太空
【GTC 2026】NVIDIA也來養龍蝦,推出NemoClaw為OpenClaw社群帶來更安全便利的選擇
【NVIDIA GTC DC 2025】黃仁勳:當 AI 摩爾定律放緩,就用加速運算與外部擴展解決問題

在演說進入正式環節之後,黃仁勳先分析GitHub程式碼平台的活躍程度,可能看到2025年之後合併請求(Pull Request)、提交程式碼(Commit)、每月新建儲存庫等數量都有明顯提升,表示是由於AI的實用性越來越高,在Vibe Coding與各種開發工具的協助下加速程式開發的工作流程。

在這個過程中,許多開發者會使用雲端AI服務,而這些服務的供應商將可透過以字詞(Token)計費的方式創造盈利,讓AI成為一門真金白銀的生意,呼應先前「買越多、賺越多」(The more you but, the more you make.,指供應商買越多伺服器,就能賺取更多利潤)。

另一方面,代理式AI也是雲端服務供應商的一大機會,代理式AI的運作整合大型語言模型(Large Language Model)以及線束(Harness,指包含工具呼叫、狀態記憶、錯誤處理、安全圍籬等等功能的框架),不但對GPU(繪圖處理器)有著強列需求,也需要CPU(處理器)來協助指派工作與執行傳統應用程式。

最後黃仁勳以指出,在上述邏輯之下選擇伺服器,需要考慮的就是透過提升運算效能的方式降低首個字詞生成時間(Time to First Token,TTFT),以及提高字詞的生成速度。另一方面也需要提高系統可靠度,來降低平均發生中斷的間隔時間(Mean Time Between Interrupt,TTFT),以及提高系統整體可運作時間。

換句話說,就是採購NVIDIA設計的Vera Rubin超級電腦

在演說開場時,黃仁勳照慣例力挺台灣合作夥伴與供應鏈。

「今天晚餐要吃什麼?」(設計對白)

附帶一提,今天在排隊領取入場識別證的過程相當流暢,可能是有神密力量加持。

黃仁勳分析GitHub程式碼平台活躍程度,指出當AI的實用性越來越高,加速程式開發的工作流程,並能為雲端服務供應商等企業創造盈利。

代理式AI在接到指令後,能夠觀察狀況並進行推理,最後自主行動以解決問題,形成真正的生產力。

代理式AI為將大型語言模型搭配線束(Harness),讓它能夠自主調用CPU、GPU等資源執行程式、呼叫其他模型,以完成任務需求。

由於AI運算是營利工具,因此降低首個字詞生成速度與平均發生中斷的間隔時間,並提高字詞生成速度與可運作時間,是採購 AI伺服器的重點考量。

軟體與模型也不能少

黃仁勳在演說中除了提到硬體的重要性之外,也強調各類AI模型以及CUDA-X加速運算函數庫等軟體層面的重要性。

NVIDIA表示TSMC(台積電)導入CUDA-X函數庫和與AI的協助,利用NVIDIA GPU上加速多項工作流程的效率,利如應用cuLitho運算式微影技術函數庫(電腦王報導)提升成本效益或週期時間20%~50%,並透過cuEST電子結構模擬函式庫提升半導體材料設計的化學模擬速度50倍。

NVIDIA先前推出參數量高達550B(5500千億)的Nemotron 3 Ultra高階推理模型,協助開發者建置與部署代理式AI系統,以及應用於物理世界推理與生成的全新Cosmos 3世界基礎模型,應用於於自動駕駛的Alpamayo 2開放式推理模型,以及應用於機器人模擬與機器人學習的Isaac平台

此外NVIDIA也為了協助開發者使用這些工具,推出NVIDIA Agent Toolkit的全新技能(Skill),讓開發者也可利用這些技能搭配NemoClaw BlueprintOpenShell執行環境,建立並部署安全的自主代理式AI。

NVIDIA企業AI代理工具包能夠透過如Nenoclaw等框架搭配AI模型與CUDA-X加速運算函數庫處理許多工作任務。

NVIDIA與Cadence合作推出能用於晶片設計的ChipStack AI超市代理,黃仁勳也透露NVIDIA也正在使用此技術。

NVIDIA發表參數量高達550B(5500千億)的Nemotron 3 Ultra高階推理模型,推動AI的發展與應用。

Nemotron 3 Ultra字詞生成速度較競爭對手高出5倍,執行成本也壓低30%。

新推出的Cosmos 3世界基礎模型,也在多項評比中拿下最高準確度的殊榮。

新推出的Alpamayo 2駕駛推理模型會在自動駕駛車輛的過程中,於背景不斷進行駕駛策略與預防突發狀況的AI推理運算,確保行車安全。

左方的全新人型機器人參考設計(Reference Humanoid Robot)可以搭配現有Isaac GR00T人型機器人平台,加速開發人型機器人的工作流程。

人型機器人參考設計以Unitree(宇樹科技)H2 Plus為基礎,具有31個自由度,搭配的Sharpa Wave 5指機械手則有22個自由度,並且整合Jetson Thor單板電腦與GR00T軟體堆疊,能夠作出許多精細的動作。

在演說最後,黃仁勳以定址於北投士林科技園區的全新總部做為收尾,並祝觀眾有個美好的Computex。

進軍Windows on Arm

黃仁勳在演說過程中發表了與Arm、Microsoft合作,推出應用於Windows on Arm平台的RTX Spark處理器,代號為N1X的它整合20核心Arm架構CPU,與接近行動版GeForce RTX 5070顯示晶片效能的GPU,將應用於筆記型電腦、迷你電腦、工作站等不同型態的產品,適合應用於AI運算與遊戲等情境。

黃仁勳也在演說中強調,Vera Rubin系列產品已經進入全面量產階段,它不單純只是設計給AI運算使用,其中的Vera CPU更是能夠在代理式AI的需求中大展長才,Vera Rubin NVL72系統在降低字詞成本的能力不是以百分比為單位計算,而是節省好幾倍的成本,技術突破相當可觀。

由於篇幅關係,筆者將另外於專文詳細說明RTX Spark處理器與Vera Rubin系統,請讀者關注文末的目錄。

黃仁勳也在演說中提到與Arm、Microsoft合作,攜手推出Windows on Arm平台的筆記型電腦、迷你電腦、工作站等產品。更多資訊將另外以專文說明,請讀者關注文末的目錄。

黃仁勳展示代號為N1X的RTX Spark處理器,它與MediaTek合作設計,並採用TSMC 3nm製程節點。

黃仁勳也介紹了Vera Rubin世代的7種晶片與5種機櫃,並強調Vera處理器在代理式AI運算的優勢。筆者也將於後續專文詳細說明。

Vera Rubin系列產品已經進入全面量產階段,不久之後我們就可以看到新產品的應用實例。

讀者可以在NVIDIA的YouTube頻到觀看演說重播,或是親自參與於2026年6月1日至4日舉行的NVIDIA GTC Taipei at COMPUTEX大會,並持續觀注我們的追蹤報導,以獲取更多資訊。

 NVIDIA於Computex 2026系列報導目錄:
【COMPUTEX 2026】NVIDIA CEO演說:黃仁勳指出AI已具實用價值,還能創造盈利(本文)
【COMPUTEX 2026】NVIDIA推出RTX Spark處理器,搶灘Windows on Arm筆電、迷你電腦、工作站(工作中)
【COMPUTEX 2026】Vera Rubin不只AI,黃仁勳重申Vera CPU的效能更適合代理式AI(工作中)

國寶大師 李文恩
作者

電腦王特約作者,專門負責硬派內容,從處理器、主機板到開發板、零組件,尖端科技都一手包辦,最近的研究計畫則包括Windows 98復活與AI圖像生成。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則