Anthropic 宣布推出新一代 Claude Opus 4.8,作為 Claude Opus 4.7 的升級版本。官方表示,Opus 4.8 在程式撰寫、代理式任務、推理能力與實務知識工作等基準測試中都有進步,其中最受強調的改進之一是「誠實度」提升:模型更願意標示不確定性,也較少在證據不足時宣稱已完成進展。Claude Opus 4.8 新模型即日起開放使用,價格維持不變。

更可靠的 AI 協作者
Anthropic 表示,早期測試者認為 Opus 4.8 在執行代理式任務時更加可靠,判斷也更精準。其中一項明顯改善是「誠實度」:模型更願意標示不確定性,也較少在證據不足時宣稱已完成進展。
官方評測顯示,相較 Opus 4.7,Opus 4.8 在自己撰寫的程式碼中,讓缺陷未被指出的機率約降至四分之一。Anthropic 也表示,Opus 4.8 在支持使用者自主性、以使用者最佳利益行動等對齊指標上創下新高,不當行為比例則明顯低於 Opus 4.7。

同步推出三項新功能
Opus 4.8 這次與多項新功能同步推出。首先是 Claude Code 的「動態工作流程」(dynamic workflows),可讓 Claude 規劃大型任務,並在單一工作階段中啟動數百個平行子代理,完成後再驗證輸出結果;這能用於橫跨數十萬行程式碼的大型遷移任務。該功能目前以研究預覽形式提供給 Claude Code Enterprise、Team 與 Max 方案。
其次,claude.ai 與 Cowork 新增「努力程度」控制選項。使用者可在模型選擇器旁調整 Claude 回應時投入的思考量。較高設定可換取更深入的回覆,較低設定則能加快速度並降低速率限制消耗,所有方案都可使用。
第三,Claude Messages API 現在允許在 messages array 中加入 system entries。開發者可在任務進行中更新 Claude 的指令,而不必破壞 prompt cache,也不需要透過使用者回合傳遞更新。
Opus 4.8 預設採用 high effort
Opus 4.8 預設採用 high effort 設定。Anthropic 認為這是品質與使用體驗之間最好的平衡。在程式任務中,這個設定消耗的 token 數量與 Opus 4.7 預設值相近,但效能更好。
使用者也可以選擇 extra 或 max 等更高努力程度;在 Claude Code 中,extra 對應為 xhigh。官方建議,困難任務與長時間非同步工作流程可使用 extra 設定。
未來將推出更高階模型
Anthropic 表示,Claude Opus 4.8 是相較前代「幅度不大但明確有感」的升級。接下來,該公司將持續開發具備類似 Opus 能力、但成本更低的模型,同時也計畫推出比 Opus 更高智慧層級的新模型。
作為 Project Glasswing 的一部分,目前已有少數組織正在使用 Claude Mythos Preview 進行資安工作。Anthropic 表示,這類模型在全面釋出前需要更強的網路安全防護措施,相關工作正在快速推進,預計未來幾週內可向更多客戶開放 Mythos 級模型。
價格與開放時程
Claude Opus 4.8 即日起全面開放。一般使用價格維持與 Opus 4.7 相同,輸入為每百萬 token 5 美元,輸出為每百萬 token 25 美元。
fast mode 可讓 Opus 4.8 以 2.5 倍速度運作,價格為輸入每百萬 token 10 美元、輸出每百萬 token 50 美元。開發者可透過 Claude API 使用 claude-opus-4-8。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!