AI 公司 DeepSeek 宣布推出新一代模型 DeepSeek-V4 預覽版,並同步開源。該系列模型主打最高可支援約 100 萬字的上下文長度,並在 Agent 任務、知識覆蓋與推理能力方面有所提升。DeepSeek-V4 分為兩個版本:V4-Pro 與 V4-Flash,用戶目前可透過官方網站與 App 體驗相關功能,API 亦已更新,開發者可透過調整模型名稱呼叫新版本。

DeepSeek-V4-Pro:對標頂尖閉源模型的旗艦性能
在高階版本方面,DeepSeek 表示,V4-Pro 在 Agent 任務表現上較前代有所進步,尤其是在程式生成與工具調用等場景的評測中,達到目前開源模型中的較高水準。公司內部也已將其用於日常開發任務。與部分閉源模型相比,其表現接近部分高階模型的非推理模式,但在更高強度推理情境下仍存在差距。
在知識能力方面,V4-Pro 在公開測試中優於多數開源模型,但仍略低於頂級閉源模型。推理能力則在數學、STEM 與競賽型程式題目中表現較佳。

DeepSeek-V4-Flash:高性價比的輕量選擇
另一版本 V4-Flash 則主打效率與成本優勢。相較 V4-Pro,其知識覆蓋稍弱,但推理能力接近,適合對速度與成本較敏感的應用場景。在較簡單的 Agent 任務中,其表現與 Pro 版本差距不大,但在複雜任務上仍有落差。

技術方面,DeepSeek-V4 採用新的注意力機制,透過在 token 維度壓縮並結合稀疏注意力方法,以降低長上下文所需的計算與記憶體資源。官方表示,未來其服務將預設支援百萬上下文。


在應用層面,V4 系列已針對多種 Agent 工具進行適配,例如 Claude Code、OpenCode 等,並在程式生成與文件處理任務中有所優化。
API 更新與改版時程
API 部分,目前已支援 OpenAI ChatCompletions 與 Anthropic 相容接口。使用者可透過設定模型名稱為 deepseek-v4-pro 或 deepseek-v4-flash 進行調用。兩個版本均支援一般模式與推理模式,並可透過參數調整推理強度。

此外,DeepSeek 表示,現有 API 模型名稱 deepseek-chat 與 deepseek-reasoner 預計將於 2026 年 7 月 24 日停止使用,過渡期間將分別對應至 V4-Flash 的不同運作模式。
DeepSeek-V4 模型開源連結:
- https://huggingface.co/collections/deepseek-ai/deepseek-v4
- https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4
DeepSeek-V4 技術报告:
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!