FB 建議貼文

選取貼文複製成功(包含文章連結)!

DeepSeek 發佈 V4 系列預覽版:支援百萬長上下文,全面提升 Agent 與推理性能

DeepSeek 發佈 V4 系列預覽版:支援百萬長上下文,全面提升 Agent 與推理性能

AI 公司 DeepSeek 宣布推出新一代模型 DeepSeek-V4 預覽版,並同步開源。該系列模型主打最高可支援約 100 萬字的上下文長度,並在 Agent 任務、知識覆蓋與推理能力方面有所提升。DeepSeek-V4 分為兩個版本:V4-Pro 與 V4-Flash,用戶目前可透過官方網站與 App 體驗相關功能,API 亦已更新,開發者可透過調整模型名稱呼叫新版本。

DeepSeek 發佈 V4 系列預覽版:支援百萬長上下文,全面提升 Agent 與推理性能

DeepSeek-V4-Pro:對標頂尖閉源模型的旗艦性能

在高階版本方面,DeepSeek 表示,V4-Pro 在 Agent 任務表現上較前代有所進步,尤其是在程式生成與工具調用等場景的評測中,達到目前開源模型中的較高水準。公司內部也已將其用於日常開發任務。與部分閉源模型相比,其表現接近部分高階模型的非推理模式,但在更高強度推理情境下仍存在差距。

在知識能力方面,V4-Pro 在公開測試中優於多數開源模型,但仍略低於頂級閉源模型。推理能力則在數學、STEM 與競賽型程式題目中表現較佳。

DeepSeek 發佈 V4 系列預覽版:支援百萬長上下文,全面提升 Agent 與推理性能

DeepSeek-V4-Flash:高性價比的輕量選擇

另一版本 V4-Flash 則主打效率與成本優勢。相較 V4-Pro,其知識覆蓋稍弱,但推理能力接近,適合對速度與成本較敏感的應用場景。在較簡單的 Agent 任務中,其表現與 Pro 版本差距不大,但在複雜任務上仍有落差。

DeepSeek 發佈 V4 系列預覽版:支援百萬長上下文,全面提升 Agent 與推理性能

技術方面,DeepSeek-V4 採用新的注意力機制,透過在 token 維度壓縮並結合稀疏注意力方法,以降低長上下文所需的計算與記憶體資源。官方表示,未來其服務將預設支援百萬上下文。

DeepSeek 發佈 V4 系列預覽版:支援百萬長上下文,全面提升 Agent 與推理性能

DeepSeek 發佈 V4 系列預覽版:支援百萬長上下文,全面提升 Agent 與推理性能

在應用層面,V4 系列已針對多種 Agent 工具進行適配,例如 Claude Code、OpenCode 等,並在程式生成與文件處理任務中有所優化。

API 更新與改版時程

API 部分,目前已支援 OpenAI ChatCompletions 與 Anthropic 相容接口。使用者可透過設定模型名稱為 deepseek-v4-pro 或 deepseek-v4-flash 進行調用。兩個版本均支援一般模式與推理模式,並可透過參數調整推理強度。

DeepSeek 發佈 V4 系列預覽版:支援百萬長上下文,全面提升 Agent 與推理性能

此外,DeepSeek 表示,現有 API 模型名稱 deepseek-chat 與 deepseek-reasoner 預計將於 2026 年 7 月 24 日停止使用,過渡期間將分別對應至 V4-Flash 的不同運作模式。

DeepSeek-V4 模型開源連結:

DeepSeek-V4 技術报告:

 

ycr
作者

PC home 雜誌、T 客邦編輯,也負責 T 客邦影新聞 YouTube 頻道影音製作。關注 AI 相關應用、產業趨勢等消息,並有軟體教學報導。(大頭貼為 AI 生成)

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則