OpenAI又有大動作！gpt-oss模型正式開源：效能直逼o4-mini、單張H100就能跑 | T客邦

半導體/電子產業 5G/網路 AI/大數據電動車/交通

加密貨幣/區塊鏈遊戲/電競雲端/資訊安全商業/金融

尖端科技 3C新品趨勢

抽獎/得獎公告體驗試玩活動課程講座

2025科技趨勢金獎

OpenAI又有大動作！gpt-oss模型正式開源：效能直逼o4-mini、單張H100就能跑

開源界再添勁旅！OpenAI在深夜悄悄宣布推出兩款全新開源語言模型 gpt-oss-120b 與 gpt-oss-20b，不只效能可與自家o4-mini對標，還支援單張H100 GPU順利執行，訓練成本更壓低至不到50萬美元。

這是OpenAI自GPT-2以來首次開放大型語言模型原始架構與參數設定，象徵著開源戰場將再起波瀾。gpt-oss系列也順勢成為目前最接近OpenAI專有模型的開源選項之一，對於資源有限的新創、邊緣部署需求的開發者來說，是一大福音。

兩種版本，對應不同應用情境

本次開源的模型分為兩種版本，滿足不同規模與硬體限制：

gpt-oss-120b：總參數1170億，每個token預設啟用約51億參數參與推理。定位為高推理需求的生產型應用，可在單張80GB H100 GPU上運作。
gpt-oss-20b：總參數210億，每個token啟用36億參數，主打低延遲與本地部署場景，僅需16GB記憶體即可運行，適合邊緣設備或客製化應用。

OpenAI指出，在常見基準測試中，120b與o4-mini表現相當，20b則接近o3-mini，甚至在健康、數學等專業領域測試中，超越了多款商用模型。

開源授權寬鬆、功能完整

gpt-oss系列採用Apache 2.0授權，允許自由研究、修改與商業部署，無需擔心專利風險或copyleft條款。

主要功能亮點包含：

支援函式呼叫、Python程式碼執行、網頁查詢與結構化輸出
提供完整CoT（思維鏈）推理紀錄
訓練時導入MXFP4原生量化技術，強化運算效率
推理資源配置彈性，開發者可依需求設定高、中、低等級

此外，OpenAI也同步釋出使用說明與範例程式碼，並提供可線上試玩的官方網站。

🌐 試玩連結：gpt-oss.com
📄 技術報告（34頁PDF）：點我查看
GitHub專案頁面：👉 github.com/openai/gpt-oss
Hugging Face模型頁：
- 120b 版本
- 20b 版本

效能對標 GPT-4o，成本不到新台幣1,600萬

根據OpenAI說法，gpt-oss整體訓練成本低於50萬美元（約新台幣1,600萬元），但在多項評測中，120b表現與GPT-4o相當，甚至略勝一籌。

在MMLU、HealthBench、AIME數學競賽等指標中，gpt-oss不只擊敗o3-mini，甚至與o4-mini持平或略勝。特別是在CoT推理與工具使用等智能代理任務上，展現極高潛力。

gpt-oss支援OpenAI Responses API格式與思維鏈格式，並能根據提示詞內容，自由調整推理資源投入：

低推理量：適合即時回應、快速回答場景
中推理量：一般應用最佳平衡
高推理量：需要縝密邏輯推理、複雜決策任務

在官方範例中，gpt-oss能透過思維鏈一步步使用工具，自動建構出完整遊戲框架，展現強大邏輯與自主分析能力。

OpenAI執行長奧特曼（Sam Altman）表示，gpt-oss是OpenAI多年研究的濃縮成果，希望透過這兩款模型降低進入門檻，讓更多開發者能參與前沿AI應用。

這次的開源動作也被視為OpenAI在封閉與開放路線之間的重要轉折，對整體AI生態發展意義重大。

#人工智慧 #ai

送【10個ChatGPT的好工具】電子書 Line brand icon

使用 Facebook 留言

謹慎發言，尊重彼此。按此展開留言規則