Sakana AI 推出 Sakana Fugu：單一 API 可呼叫各種不同 Agent，效能對標 Claude Mythos

日本 AI 新創 Sakana AI 宣布推出新產品「Sakana Fugu」，主打將完整的多代理協調系統整合為單一基礎模型。使用者只需透過單一 API，即可讓 Fugu 動態調度不同大型語言模型與代理，處理複雜、多步驟任務。Sakana AI 表示，旗下高階版本 Fugu Ultra 在多項工程、科學與推理基準測試中，已可與 Anthropic Claude Mythos Preview、Fable 5 等前沿模型並列，同時避免企業或組織過度依賴單一模型供應商，降低因出口管制或政策變動導致服務中斷的風險。

從打造更大模型，轉向模型協調

過去幾年，AI 發展多半仰賴打造規模更大、訓練資料更多的單一模型。不過 Sakana AI 認為，真實世界的高難度任務往往需要多種專業知識與技能，單一模型很難在所有情境中都保持最佳表現。因此，Sakana Fugu 的核心不是再打造一個孤立的巨型模型，而是讓模型學會如何協調其他模型。Fugu 本身也是一個語言模型，專門用來判斷何時自行回答、何時呼叫其他代理、如何分派工作，以及如何整合不同代理的結果。

從使用者角度來看，Fugu 就像呼叫一個普通模型；但在系統內部，它會依任務需求動態選擇、協調並驗證多個專家模型的輸出。

可降低單一模型供應商依賴

Sakana AI 特別強調，近期 AI 模型存取權可能受到出口管制、監管政策與外國政策影響，讓企業與國家級組織面臨更明顯的單一供應商風險。若關鍵基礎建設、金融或治理系統過度依賴某一家公司的 API，一旦存取權改變，將可能造成實質衝擊。

Fugu 的設計是讓底層代理模型可被替換。當某個模型供應商限制存取時，系統可改由其他模型接手，維持任務執行能力。Sakana AI 稱，這種模型協調架構可作為追求 AI 主權與系統韌性的實際方案。

Fugu 與 Fugu Ultra 分別鎖定不同工作負載

Sakana Fugu 上線時提供兩種模型，皆可透過 OpenAI 相容 API 存取。

一般版 Fugu 主打效能與低延遲之間的平衡，適合日常工作、聊天機器人、互動式服務，以及程式開發與程式碼審查等場景。對於有資料隱私或法規遵循需求的團隊，Fugu 也允許使用者將特定代理排除在模型池之外。

Fugu Ultra 則鎖定更困難的多步驟任務，會調度更深層的專家代理模型池，以追求更高品質答案。Sakana AI 表示，早期使用者已將 Fugu Ultra 用於 AI 研究、論文重現、資安分析，以及文獻與專利調查等高難度工作。

近 500 名早期使用者參與測試

Fugu 在 beta 測試期間累積近 500 名早期使用者回饋，相較於單次提示的回答品質，Fugu 的價值更明顯體現在長時間、流程複雜且需要持續推進的任務中。例如在自動化資料科學研究情境中，早期使用者讓 Fugu 以近乎全自動模式執行研究流程，系統能自行探索想法、執行實驗、解讀失敗結果、修正方法並持續前進。

Sakana AI 也表示，在程式碼審查、資安評估、論文重現、文獻調查與專利分析等工作中，Fugu 展現出跨步驟閱讀、實作、測試、比對證據、找出缺口並產出報告的能力。

Sakana Fugu 目前已正式開放使用。使用者可透過單一 API 存取 Fugu 與 Fugu Ultra，方案包括日常使用的訂閱制，以及面向高用量與企業工作負載的按量計費方案。

資料來源：Sakana AI