DeepSeek 發佈 V4 系列預覽版：支援百萬長上下文，全面提升 Agent 與推理性能 | T客邦

T客邦為提供您更多優質的內容，採用網站分析技術，若您點選「我同意」或繼續瀏覽本網站，即表示您同意我們的隱私權政策。

我同意

半導體/電子產業 5G/網路 AI/大數據電動車/交通

加密貨幣/區塊鏈遊戲/電競雲端/資訊安全商業/金融

尖端科技 3C新品趨勢

抽獎/得獎公告體驗試玩活動課程講座

DeepSeek 發佈 V4 系列預覽版：支援百萬長上下文，全面提升 Agent 與推理性能

AI 公司 DeepSeek 宣布推出新一代模型 DeepSeek-V4 預覽版，並同步開源。該系列模型主打最高可支援約 100 萬字的上下文長度，並在 Agent 任務、知識覆蓋與推理能力方面有所提升。DeepSeek-V4 分為兩個版本：V4-Pro 與 V4-Flash，用戶目前可透過官方網站與 App 體驗相關功能，API 亦已更新，開發者可透過調整模型名稱呼叫新版本。

DeepSeek-V4-Pro：對標頂尖閉源模型的旗艦性能

在高階版本方面，DeepSeek 表示，V4-Pro 在 Agent 任務表現上較前代有所進步，尤其是在程式生成與工具調用等場景的評測中，達到目前開源模型中的較高水準。公司內部也已將其用於日常開發任務。與部分閉源模型相比，其表現接近部分高階模型的非推理模式，但在更高強度推理情境下仍存在差距。

在知識能力方面，V4-Pro 在公開測試中優於多數開源模型，但仍略低於頂級閉源模型。推理能力則在數學、STEM 與競賽型程式題目中表現較佳。

DeepSeek-V4-Flash：高性價比的輕量選擇

另一版本 V4-Flash 則主打效率與成本優勢。相較 V4-Pro，其知識覆蓋稍弱，但推理能力接近，適合對速度與成本較敏感的應用場景。在較簡單的 Agent 任務中，其表現與 Pro 版本差距不大，但在複雜任務上仍有落差。

技術方面，DeepSeek-V4 採用新的注意力機制，透過在 token 維度壓縮並結合稀疏注意力方法，以降低長上下文所需的計算與記憶體資源。官方表示，未來其服務將預設支援百萬上下文。

在應用層面，V4 系列已針對多種 Agent 工具進行適配，例如 Claude Code、OpenCode 等，並在程式生成與文件處理任務中有所優化。

API 更新與改版時程

API 部分，目前已支援 OpenAI ChatCompletions 與 Anthropic 相容接口。使用者可透過設定模型名稱為 deepseek-v4-pro 或 deepseek-v4-flash 進行調用。兩個版本均支援一般模式與推理模式，並可透過參數調整推理強度。

此外，DeepSeek 表示，現有 API 模型名稱 deepseek-chat 與 deepseek-reasoner 預計將於 2026 年 7 月 24 日停止使用，過渡期間將分別對應至 V4-Flash 的不同運作模式。

DeepSeek-V4 模型開源連結：

DeepSeek-V4 技術报告：

https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

延伸閱讀：DeepSeek 攻略：實測在數學、決策、寫報告等應用表現，和 Gemini 與 ChatGPT 相比誰勝出
延伸閱讀：DeepSeek 推出 V3.2 正式版：性能直逼 Gemini、ChatGPT，並同步開源可使用
延伸閱讀：DeepSeek-V4 正式公測：100 萬超長上下文與 DSA 稀疏注意機制，程式開發能力直逼 Sonnet 4.5

#人工智慧 #ai #ai模型 #agent #deepseek #deepseek-v4

送【10個ChatGPT的好工具】電子書 Line brand icon

1. anadd66 （發表於 2026年5月24日 13:06）

引用回覆

팔로워 구매

틱톡 팔로워 구매하기

인스 타 팔로워

유튜브 구독자 구매

인스 타 한국인 팔로워 구매 후기

謹慎發言，尊重彼此。按此展開留言規則