
開源界再添勁旅!OpenAI在深夜悄悄宣布推出兩款全新開源語言模型 gpt-oss-120b 與 gpt-oss-20b,不只效能可與自家o4-mini對標,還支援單張H100 GPU順利執行,訓練成本更壓低至不到50萬美元。
這是OpenAI自GPT-2以來首次開放大型語言模型原始架構與參數設定,象徵著開源戰場將再起波瀾。gpt-oss系列也順勢成為目前最接近OpenAI專有模型的開源選項之一,對於資源有限的新創、邊緣部署需求的開發者來說,是一大福音。
兩種版本,對應不同應用情境
本次開源的模型分為兩種版本,滿足不同規模與硬體限制:
-
gpt-oss-120b:總參數1170億,每個token預設啟用約51億參數參與推理。定位為高推理需求的生產型應用,可在單張80GB H100 GPU上運作。
-
gpt-oss-20b:總參數210億,每個token啟用36億參數,主打低延遲與本地部署場景,僅需16GB記憶體即可運行,適合邊緣設備或客製化應用。
OpenAI指出,在常見基準測試中,120b與o4-mini表現相當,20b則接近o3-mini,甚至在健康、數學等專業領域測試中,超越了多款商用模型。
開源授權寬鬆、功能完整
gpt-oss系列採用Apache 2.0授權,允許自由研究、修改與商業部署,無需擔心專利風險或copyleft條款。
主要功能亮點包含:
-
支援函式呼叫、Python程式碼執行、網頁查詢與結構化輸出
-
提供完整CoT(思維鏈)推理紀錄
-
訓練時導入MXFP4原生量化技術,強化運算效率
-
推理資源配置彈性,開發者可依需求設定高、中、低等級
此外,OpenAI也同步釋出使用說明與範例程式碼,並提供可線上試玩的官方網站。
-
🌐 試玩連結:gpt-oss.com
-
📄 技術報告(34頁PDF):點我查看
-
GitHub專案頁面:👉 github.com/openai/gpt-oss
-
Hugging Face模型頁:
效能對標 GPT-4o,成本不到新台幣1,600萬
根據OpenAI說法,gpt-oss整體訓練成本低於50萬美元(約新台幣1,600萬元),但在多項評測中,120b表現與GPT-4o相當,甚至略勝一籌。
在MMLU、HealthBench、AIME數學競賽等指標中,gpt-oss不只擊敗o3-mini,甚至與o4-mini持平或略勝。特別是在CoT推理與工具使用等智能代理任務上,展現極高潛力。
gpt-oss支援OpenAI Responses API格式與思維鏈格式,並能根據提示詞內容,自由調整推理資源投入:
-
低推理量:適合即時回應、快速回答場景
-
中推理量:一般應用最佳平衡
-
高推理量:需要縝密邏輯推理、複雜決策任務
在官方範例中,gpt-oss能透過思維鏈一步步使用工具,自動建構出完整遊戲框架,展現強大邏輯與自主分析能力。
OpenAI執行長奧特曼(Sam Altman)表示,gpt-oss是OpenAI多年研究的濃縮成果,希望透過這兩款模型降低進入門檻,讓更多開發者能參與前沿AI應用。
這次的開源動作也被視為OpenAI在封閉與開放路線之間的重要轉折,對整體AI生態發展意義重大。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!