FB 建議貼文

選取貼文複製成功(包含文章連結)!

OpenAI對抗 Meta 與 DeepSeek 壓力升高,預告將在初夏推出GPT-2 以來「最強開源」語言模型

OpenAI對抗 Meta 與 DeepSeek 壓力升高,預告將在初夏推出GPT-2 以來「最強開源」語言模型

OpenAI 宣布即將在今年初夏推出自 GPT-2 以來首個開源語言模型,並以「開源界最強」為目標,主打推理能力強悍、能在高階消費級硬體上運行的語言模型。目前這項計畫由 OpenAI 研究副總裁 Aidan Clark 領軍,仍處於開發初期階段。

根據知情人士透露,這款模型被定位為推理導向模型,類似 OpenAI 旗下的 o 系列產品。OpenAI 有意採用極為寬鬆的開源授權條款,幾乎不設商業或使用限制,與 Meta 的 Llama 或 Google 的 Gemma 相比,更具開放性,也試圖避免後者因條款過於複雜而飽受批評的問題。

目前 OpenAI 正面對多方開源對手的競爭,尤其是來自中國的 DeepSeek AI 實驗室等機構,這些對手透過開放模型讓開發者實驗、甚至允許商用,逐漸在社群中累積聲量。例如 Meta 就在三月初宣布其 Llama 模型下載次數突破 10 億,而 DeepSeek 也吸引了大量用戶與投資者關注。

OpenAI 此次推出的開源模型將支援純文字輸入輸出,並可能讓開發者選擇是否啟用「推理模式」。該模式可提升準確度,但也會增加回應延遲,與 Anthropic 等近期推出的推理模型策略相仿。

若市場反應正面,OpenAI 計畫接下來陸續推出更多版本,包括規模較小的模型,以擴大開發者使用範圍。

值得一提的是,OpenAI 執行長 Sam Altman 曾坦言,公司過去在開源策略上「站在歷史的錯誤一邊」,並呼籲重新檢討。雖然目前開源並非 OpenAI 的首要任務,但他也表示未來將持續推出更好的模型,只是領先優勢可能不如以往那麼明顯。

這次新模型將經過嚴格的「紅隊測試」與安全評估,OpenAI 承諾會發佈「模型卡片」(Model Card),清楚說明內外部測試結果與安全性分析。Altman 也強調,公司將依據「模型準備度框架」進行全面評估,以避免模型在釋出後產生風險。

不過,OpenAI 近年也曾因安全測試過於倉促、模型卡發布延遲等問題,受到人工智慧倫理專家的批評。Altman 本人更在 2023 年底短暫遭董事會罷免,部分原因也與模型安全審查不周有關。

 

 

KKJ
作者

快科技成立於1998年,是驅動之家旗下科技媒體業務,中國極具影響力的泛科技領域媒體平台之一。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則