ADVERTISEMENT
OpenAI 宣布即將在今年初夏推出自 GPT-2 以來首個開源語言模型,並以「開源界最強」為目標,主打推理能力強悍、能在高階消費級硬體上運行的語言模型。目前這項計畫由 OpenAI 研究副總裁 Aidan Clark 領軍,仍處於開發初期階段。
根據知情人士透露,這款模型被定位為推理導向模型,類似 OpenAI 旗下的 o 系列產品。OpenAI 有意採用極為寬鬆的開源授權條款,幾乎不設商業或使用限制,與 Meta 的 Llama 或 Google 的 Gemma 相比,更具開放性,也試圖避免後者因條款過於複雜而飽受批評的問題。
目前 OpenAI 正面對多方開源對手的競爭,尤其是來自中國的 DeepSeek AI 實驗室等機構,這些對手透過開放模型讓開發者實驗、甚至允許商用,逐漸在社群中累積聲量。例如 Meta 就在三月初宣布其 Llama 模型下載次數突破 10 億,而 DeepSeek 也吸引了大量用戶與投資者關注。
ADVERTISEMENT
OpenAI 此次推出的開源模型將支援純文字輸入輸出,並可能讓開發者選擇是否啟用「推理模式」。該模式可提升準確度,但也會增加回應延遲,與 Anthropic 等近期推出的推理模型策略相仿。
若市場反應正面,OpenAI 計畫接下來陸續推出更多版本,包括規模較小的模型,以擴大開發者使用範圍。
值得一提的是,OpenAI 執行長 Sam Altman 曾坦言,公司過去在開源策略上「站在歷史的錯誤一邊」,並呼籲重新檢討。雖然目前開源並非 OpenAI 的首要任務,但他也表示未來將持續推出更好的模型,只是領先優勢可能不如以往那麼明顯。
ADVERTISEMENT
這次新模型將經過嚴格的「紅隊測試」與安全評估,OpenAI 承諾會發佈「模型卡片」(Model Card),清楚說明內外部測試結果與安全性分析。Altman 也強調,公司將依據「模型準備度框架」進行全面評估,以避免模型在釋出後產生風險。
不過,OpenAI 近年也曾因安全測試過於倉促、模型卡發布延遲等問題,受到人工智慧倫理專家的批評。Altman 本人更在 2023 年底短暫遭董事會罷免,部分原因也與模型安全審查不周有關。
ADVERTISEMENT
- 延伸閱讀:Llama 4發布開啟開源多模態時代:採用混合專家(MoE)架構,最大模型超越GPT-4o
- 延伸閱讀:DeepSeek-V3 更新:程式碼能力直逼 Claude Sonnet 3.5,開源協定更寬鬆
- 延伸閱讀:AMD 發表開源專案 GAIA,加速本地端大型語言模型高效運行
ADVERTISEMENT