FB 建議貼文

選取貼文複製成功(包含文章連結)!

OpenAI 發表 GPT-5.4 mini 與 nano:效能逼近旗艦、成本大降,小模型協作時代來臨

OpenAI 發表 GPT-5.4 mini 與 nano:效能逼近旗艦、成本大降,小模型協作時代來臨

 

OpenAI 於週二正式推出旗下效能最強的兩款小型模型:GPT-5.4 mini 與 GPT-5.4 nano。這兩款新工具旨在透過更低的延遲與成本,大幅縮小與旗艦模型之間的效能差距。其中 GPT-5.4 mini 在程式編寫、邏輯推理、多模態理解及工具調用等核心指標上,已全面超越前一代 GPT-5 mini,執行速度更提升超過 2 倍。在 SWE-Bench Pro 等基準測試中,其表現已相當接近體型更大的旗艦級 GPT-5.4。

OpenAI 發表 GPT-5.4 mini 與 nano:效能逼近旗艦、成本大降,小模型協作時代來臨

另一款 GPT-5.4 nano 則定位為成本最低、延遲最短的輕量化選項,目前僅透過 API 對開發者開放,專門處理資料分類、擷取及簡單的程式編寫子任務。這兩款模型的推出,主要為了填補大型模型在即時互動情境中因延遲過高而難以落地的空白,將直接影響程式編寫助手、AI 代理系統(AI Agents)及多模態應用等快速成長的商業市場。

OpenAI 發表 GPT-5.4 mini 與 nano:效能逼近旗艦、成本大降,小模型協作時代來臨

OpenAI 發表 GPT-5.4 mini 與 nano:效能逼近旗艦、成本大降,小模型協作時代來臨

mini 版面向大眾,nano 版專供 API 調用

GPT-5.4 mini 即日起在 OpenAI API、Codex 平台及 ChatGPT 三大管道同步上線。在 API 定價方面,GPT-5.4 mini 每百萬輸入 token 為 0.75 美元(約新台幣 24 元),每百萬輸出 token 為 4.50 美元(約新台幣 144 元)。它支援文字與影像輸入、工具調用、函式調用、網頁搜尋、檔案檢索、電腦操作及技能擴充,並具備高達 40 萬 token 的上下文視窗。

在自研的 Codex 平台上,使用 GPT-5.4 mini 僅需消耗 GPT-5.4 配額的 30%,代表開發者處理簡單程式任務的成本,可降至旗艦模型的三分之一左右。此外,Codex 還支援將工作量委派給執行 GPT-5.4 mini 的子代理人,讓推理密度較低的任务自動由更便宜的模型處理。針對 ChatGPT 一般使用者,Free 與 Go 用戶可透過「+」選單選擇「Thinking」功能來使用 GPT-5.4 mini;至於其他付費使用者,在 GPT-5.4 Thinking 達到用量上限後,系統會自動切換至該模型作為備援。

GPT-5.4 nano 的定價更為驚人,每百萬輸入 token 僅 0.20 美元(約新台幣 6.4 元),每百萬輸出 token 為 1.25 美元(約新台幣 40 元)。OpenAI 表示,nano 適合由高階模型統籌調度,負責處理次要支撐任務的子代理人情境。

OpenAI 發表 GPT-5.4 mini 與 nano:效能逼近旗艦、成本大降,小模型協作時代來臨

OpenAI 發表 GPT-5.4 mini 與 nano:效能逼近旗艦、成本大降,小模型協作時代來臨

 

效能實測:mini 緊追旗艦,nano 超越前代

根據 OpenAI 公布的評測數據,GPT-5.4 mini 在程式編寫及多模態任務上的表現尤為突出。在程式測試基準 SWE-bench Pro 中,mini 得分為 54.4%,與 GPT-5.4 的 57.7% 差距縮小至僅 3.3 個百分點,遠高於 GPT-5 mini 的 45.7%。在電腦操作基準 OSWorld-Verified 上,mini 以 72.1% 的成績逼近 GPT-5.4 的 75.0%,大幅領先 GPT-5 mini 的 42.0%。

在工具調用能力方面,GPT-5.4 mini 在 τ2-bench 電信測試中得分 93.4%,較前代提升顯著。在通用智慧測試 GPQA Diamond 中,mini 得分 88.0%,nano 也達到 82.8%,雙雙超越 GPT-5 mini 的 81.6%。不過,GPT-5.4 nano 在部分視覺任務中表現略遜於 GPT-5 mini,例如在 OSWorld-Verified 得分為 39.0%,低於前代的 42.0%。OpenAI 強調,nano 的設計優先考量是低延遲與低成本,而非全面性效能。

OpenAI 發表 GPT-5.4 mini 與 nano:效能逼近旗艦、成本大降,小模型協作時代來臨

子代理人架構:多模型協作成新典範

OpenAI 在發布會中特別強調了這兩款新模型在「多模型分層系統」中的定位。以 Codex 為例,GPT-5.4 負責高層級的規劃、協調與最終判斷,而 GPT-5.4 mini 子代理人則負責並行處理程式碼庫檢索、大檔案審閱及輔助文件處理等細微任務。

隨著小型模型速度更快、功能更強,開發者不再需要依賴單一模型處理所有任務。相反地,可以建構一套系統,由大型模型負責決策,小型模型則快速且大規模地執行任務。這種架構對於高併發工作至關重要,在程式助手、螢幕截圖解析及即時影像理解等情境中,響應延遲直接影響產品體驗。對開發者而言,這代表在不犧牲系統整體智慧水準的前提下,壓降推理成本的路徑已變得更加清晰。

過去我們總在追求最強大的模型,但 GPT-5.4 mini 與 nano 的出現告訴我們,「適才適所」才是商業落地的關鍵。就像一間公司不能只有執行長,也需要大量有效率的基層執行者。OpenAI 透過降低小模型的門檻,實際上是在鼓勵開發者建構更複雜、更低成本的 AI 代理網路。未來 AI 產品的競爭力,可能不在於你用了多強的模型,而在於你如何優雅地讓大大小小的模型協同工作。

 

 

cnBeta
作者

cnBeta.COM(被網友簡稱為CB、cβ),官方自我定位「中文業界資訊站」,是一個提供IT相關新聞資訊、技術文章和評論的中文網站。其主要特色為遊客的匿名評論及線上互動,形成獨特的社群文化。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則