FB 建議貼文

選取貼文複製成功(包含文章連結)!

OpenAI又有大動作!gpt-oss模型正式開源:效能直逼o4-mini、單張H100就能跑

OpenAI又有大動作!gpt-oss模型正式開源:效能直逼o4-mini、單張H100就能跑

開源界再添勁旅!OpenAI在深夜悄悄宣布推出兩款全新開源語言模型 gpt-oss-120b 與 gpt-oss-20b,不只效能可與自家o4-mini對標,還支援單張H100 GPU順利執行,訓練成本更壓低至不到50萬美元。

這是OpenAI自GPT-2以來首次開放大型語言模型原始架構與參數設定,象徵著開源戰場將再起波瀾。gpt-oss系列也順勢成為目前最接近OpenAI專有模型的開源選項之一,對於資源有限的新創、邊緣部署需求的開發者來說,是一大福音。

OpenAI又有大動作!gpt-oss模型正式開源:效能直逼o4-mini、單張H100就能跑

兩種版本,對應不同應用情境

本次開源的模型分為兩種版本,滿足不同規模與硬體限制:

  • gpt-oss-120b:總參數1170億,每個token預設啟用約51億參數參與推理。定位為高推理需求的生產型應用,可在單張80GB H100 GPU上運作。

  • gpt-oss-20b:總參數210億,每個token啟用36億參數,主打低延遲與本地部署場景,僅需16GB記憶體即可運行,適合邊緣設備或客製化應用。

OpenAI指出,在常見基準測試中,120b與o4-mini表現相當,20b則接近o3-mini,甚至在健康、數學等專業領域測試中,超越了多款商用模型。

開源授權寬鬆、功能完整

gpt-oss系列採用Apache 2.0授權,允許自由研究、修改與商業部署,無需擔心專利風險或copyleft條款。

主要功能亮點包含:

  • 支援函式呼叫、Python程式碼執行、網頁查詢與結構化輸出

  • 提供完整CoT(思維鏈)推理紀錄

  • 訓練時導入MXFP4原生量化技術,強化運算效率

  • 推理資源配置彈性,開發者可依需求設定高、中、低等級

OpenAI又有大動作!gpt-oss模型正式開源:效能直逼o4-mini、單張H100就能跑

此外,OpenAI也同步釋出使用說明與範例程式碼,並提供可線上試玩的官方網站。

效能對標 GPT-4o,成本不到新台幣1,600萬

根據OpenAI說法,gpt-oss整體訓練成本低於50萬美元(約新台幣1,600萬元),但在多項評測中,120b表現與GPT-4o相當,甚至略勝一籌

OpenAI又有大動作!gpt-oss模型正式開源:效能直逼o4-mini、單張H100就能跑

OpenAI又有大動作!gpt-oss模型正式開源:效能直逼o4-mini、單張H100就能跑

在MMLU、HealthBench、AIME數學競賽等指標中,gpt-oss不只擊敗o3-mini,甚至與o4-mini持平或略勝。特別是在CoT推理與工具使用等智能代理任務上,展現極高潛力。

gpt-oss支援OpenAI Responses API格式與思維鏈格式,並能根據提示詞內容,自由調整推理資源投入:

  • 低推理量:適合即時回應、快速回答場景

  • 中推理量:一般應用最佳平衡

  • 高推理量:需要縝密邏輯推理、複雜決策任務

在官方範例中,gpt-oss能透過思維鏈一步步使用工具,自動建構出完整遊戲框架,展現強大邏輯與自主分析能力。

OpenAI又有大動作!gpt-oss模型正式開源:效能直逼o4-mini、單張H100就能跑

OpenAI又有大動作!gpt-oss模型正式開源:效能直逼o4-mini、單張H100就能跑

OpenAI執行長奧特曼(Sam Altman)表示,gpt-oss是OpenAI多年研究的濃縮成果,希望透過這兩款模型降低進入門檻,讓更多開發者能參與前沿AI應用。

這次的開源動作也被視為OpenAI在封閉與開放路線之間的重要轉折,對整體AI生態發展意義重大。

janus
作者

PC home雜誌、T客邦產業編輯,曾為多家科技雜誌撰寫專題文章,主要負責作業系統、軟體、電商、資安、A以及大數據、IT領域的取材以及報導,以及軟體相關教學報導。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則