ADVERTISEMENT
NVIDIA發表Nano、Super、Ultra等3種不同量體的Nemotron 3開源模型,協助企業根據執行裝置的規模,快速建構代理式AI服務。
Nemotron 3 Nano主打輕量應用
隨著企業從使用單個AI模型的聊天機器人,提升至使用由多個AI模型共同協作的代理式AI系統(Agentic AI),雖然能夠強化AI所帶來的生產力,但隨之而來的是資料傳輸虛耗(Communication Overhead)、上下文漂移(Context Drift,指AI的回應隨時間變化),以及更高運算需求造成的成本升高。另一方面,日益複雜的多組模型組合與工作流程也會降低整體系統的透明,影響企業採用的信任感。
延伸閱讀:
NVIDIA於SuperComputing 2025大會發表多項產品與資訊,Arm加入NVLink Fusion生態系、打造1打500的超級電腦
NVIDIA透過AI Foundry協助企業客製化生成式AI模型,加速模型微調與部署
NVIDIA推出NeMo Guardrails,防止AI聊天機器人再跟你「一本正經的胡說八道」
【COMPUTEX 2025】NVIDIA執行長黃仁勳Keynote重點整理,代理AI、物理AI、通用機器人趨勢以及NVLink Fusion半客製化AI基礎建設
【GTC 2025】黃仁勳演說深入分析:提出「終極摩爾定律」,追求相同耗電更高效能
NVIDIA推出的Nemotron 3提供Nano、Super和Ultra等3種不同參數量的開源模型,並引入了突破性的混合專家混合(Mixture of Experts,MoE)架構,協助開發者建置和部署大規模多模態代理式AI系統。
Nemotron 3 Nano的模型為30B組參數(300億),並在MoE架構下僅啟用其中3B組活躍參數(30億),它適合應用於軟體除錯(Debug)、內容摘要、AI 助手、資訊檢索等特定任務。與Nemotron 2 Nano相比,其字詞(Token)吞吐量提升至4倍,推理過程消耗的字詞減達60%,能夠顯著降低推理成本,次外它也有高達100萬字詞的上下文窗口(Context Window),有助於記憶更多資訊,並在長期連接時提供更準確的回應。



進階用途選擇Super與Ultra
Nemotron 3 Super具有100B組參數與10B組活躍參數,適用於多模態代理式AI應用,擅長需要整合多種AI模型的多模態推論協作,並能快速完成複雜任務的。
Nemotron 3 Ultra屬於大型推理引擎,具有500B組參數與50B組活躍參數,能夠勝任更複雜的AI使用情境,適用於需要深度研究和策略規劃的AI工作流程。
值得注意的是,Nemotron 3 Super和Ultra支援在NVIDIA Blackwell架構的繪圖處理器(GPU)以NVIDIA獨家的NVFP4(4bit精度浮點數)資料類型進行模型訓練,能夠有效降低記憶體佔用量,並提升訓練速度,使得企應用戶能夠在現有基礎設施上訓練參數量更多的模型,而不用犧牲精確度。


Nemotron 3 Nano現已在Hugging Face推出,同時透過Baseten、Deepinfra、Fireworks、FriendliAI、OpenRouter、Together AI等服務商提供支援, Nemotron 3 Super和Ultra預計於2026年上半年發布。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!