日本 AI 新創 Sakana AI 宣布推出新產品「Sakana Fugu」,主打將完整的多代理協調系統整合為單一基礎模型。使用者只需透過單一 API,即可讓 Fugu 動態調度不同大型語言模型與代理,處理複雜、多步驟任務。Sakana AI 表示,旗下高階版本 Fugu Ultra 在多項工程、科學與推理基準測試中,已可與 Anthropic Claude Mythos Preview、Fable 5 等前沿模型並列,同時避免企業或組織過度依賴單一模型供應商,降低因出口管制或政策變動導致服務中斷的風險。

從打造更大模型,轉向模型協調
過去幾年,AI 發展多半仰賴打造規模更大、訓練資料更多的單一模型。不過 Sakana AI 認為,真實世界的高難度任務往往需要多種專業知識與技能,單一模型很難在所有情境中都保持最佳表現。因此,Sakana Fugu 的核心不是再打造一個孤立的巨型模型,而是讓模型學會如何協調其他模型。Fugu 本身也是一個語言模型,專門用來判斷何時自行回答、何時呼叫其他代理、如何分派工作,以及如何整合不同代理的結果。
從使用者角度來看,Fugu 就像呼叫一個普通模型;但在系統內部,它會依任務需求動態選擇、協調並驗證多個專家模型的輸出。
可降低單一模型供應商依賴
Sakana AI 特別強調,近期 AI 模型存取權可能受到出口管制、監管政策與外國政策影響,讓企業與國家級組織面臨更明顯的單一供應商風險。若關鍵基礎建設、金融或治理系統過度依賴某一家公司的 API,一旦存取權改變,將可能造成實質衝擊。
Fugu 的設計是讓底層代理模型可被替換。當某個模型供應商限制存取時,系統可改由其他模型接手,維持任務執行能力。Sakana AI 稱,這種模型協調架構可作為追求 AI 主權與系統韌性的實際方案。
Fugu 與 Fugu Ultra 分別鎖定不同工作負載
Sakana Fugu 上線時提供兩種模型,皆可透過 OpenAI 相容 API 存取。
一般版 Fugu 主打效能與低延遲之間的平衡,適合日常工作、聊天機器人、互動式服務,以及程式開發與程式碼審查等場景。對於有資料隱私或法規遵循需求的團隊,Fugu 也允許使用者將特定代理排除在模型池之外。
Fugu Ultra 則鎖定更困難的多步驟任務,會調度更深層的專家代理模型池,以追求更高品質答案。Sakana AI 表示,早期使用者已將 Fugu Ultra 用於 AI 研究、論文重現、資安分析,以及文獻與專利調查等高難度工作。

近 500 名早期使用者參與測試
Fugu 在 beta 測試期間累積近 500 名早期使用者回饋,相較於單次提示的回答品質,Fugu 的價值更明顯體現在長時間、流程複雜且需要持續推進的任務中。例如在自動化資料科學研究情境中,早期使用者讓 Fugu 以近乎全自動模式執行研究流程,系統能自行探索想法、執行實驗、解讀失敗結果、修正方法並持續前進。
Sakana AI 也表示,在程式碼審查、資安評估、論文重現、文獻調查與專利分析等工作中,Fugu 展現出跨步驟閱讀、實作、測試、比對證據、找出缺口並產出報告的能力。
Sakana Fugu 目前已正式開放使用。使用者可透過單一 API 存取 Fugu 與 Fugu Ultra,方案包括日常使用的訂閱制,以及面向高用量與企業工作負載的按量計費方案。
資料來源:Sakana AI
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!