DeepSeek 攻略：實測在數學、決策、寫報告等應用表現，和 Gemini 與 ChatGPT 相比誰勝出

要說近期 AI 領域最熱門的話題，當然是 DeepSeek。憑藉媲美 OpenAI 的效能和低成本開源技術，具備思考及推理功能，不僅在邏輯和數學計算上表現出色，還能在多重衝突下提供高效的解決方案，短短時間便衝上免費App的下載榜首，並有著改變 AI 市場的態勢。究竟 DeepSeek 是什麼？為什麼吸引市場注意？開源背後的安全性與審查機制引發什麼爭議？與 ChatGPT 和 Gemini 的差異又在哪？

文章目錄

1. DeepSeek 以黑馬之姿登場
- 媲美 OpenAI o1 的效能
- 低成本及開源技術
2. DeepSeek 的優勢與爭議
- 低成本高效的知識蒸餾
- 開源背後的安全與審查疑慮
3. 認識 DeepSeek 基本操作介面
4. 如何跟 DeepSeek 對話？
5. 善用 DeepSeek「深度思考」強項
6. DeepSeek、ChatGPT、Gemini 推理能力比一比

DeepSeek 以黑馬之姿登場

今年農曆新年期間，DeepSeek 在 AI 領域引起廣泛關注。這款由中國新創團隊推出的 AI 語言模式，市場傳言僅耗資 560 萬美元打造，以低成本、高效能的表現，顛覆市場對 AI 發展需耗費巨資的傳統認知，尤其在推出具有「深度思考」的 DeepSeek-R1 語言模型後，迅速吸引全球用戶註冊，更因大量使用者湧入導致伺服器當機。

媲美 OpenAI o1 的效能

DeepSeek（深度求索）是來自中國的新創公司，並推出類似 OpenAI 的ChatGPT AI 聊天機器人——DeepSeek，在截稿前基礎版本是使用 DeepSeek-V3 語言模式，同時也有推出網頁版及手機 App 版本。而在今年 1 月 20 日再推出 DeepSeek-R1 模型，標榜在數學、代碼、自然語言推理等任務上，效能與 OpenAI o1 正式版相當，也就是在回答問題之前會經過「深度思考」的 AI 聊天機器人。

也因為在 DeepSeek 下使用具有深度思考的 DeepSeek-R1 完全免費，比起OpenAI o1 需要有 ChatGPT Plus 方案以上才能使用（一般用戶有每日免費次數的使用限制），因此在推出後短短幾天內，就吸引全球用戶註冊使用。根據美國 CNBC 全國廣播公司商業頻道報導，DeepSeek 在一月於美國發布後，已迅速超越 ChatGPT 成為蘋果 App Store 下載次數第一的免費應用程式；中國三言科技的報導也指出，今年一月 DeepSeek 用戶增加 1.25 億，其中有 80% 是來自一月的最後一周，在沒有廣告投放下，僅 7 天就增加 1 億用戶，也打破 ChatGPT 的記錄。

▲ DeepSeek 是來自中國的新創公司，推出類似 OpenAI ChatGPT 的 AI 聊天機器人——DeepSeek。

▲ DeepSeek 在推出 DeepSeek-R1 語言模型後，曾在蘋果 App Store 免費應用程式中，一度超越 ChatGPT 成為下載第一的 App。

低成本及開源技術

DeepSeek 除了在短時間吸引全球用戶使用外，也因為顛覆市場認為 AI 發展需要龐大預算的認知，強調僅以 560 萬美元打造，連帶影響到投資市場，為高性能晶片市場帶來不確定性，使得美國科技股的市值一度蒸發 1 兆美元，NVIDIA 股價也因此大跌。

由於 DeepSeek 是強調以低成本、高效率、開源技術（open source）為核心，除了證明高效 AI 模型不一定需要龐大的預算與高規格 GPU 外，相較於 OpenAI 採取的封閉式模型策略，DeepSeek 的開源技術，更能吸引全球開發者與企業的關注。主導 Meta AI 研究的首席科學家楊立昆（Yann LeCun），同時也是圖靈獎得主的他曾指出，DeepSeek 成功的最大收穫並非中國競爭對其他國家帶來更大威脅，而是 AI 開源的價值使任何人都能受益。

▲ ChatGPT 原來只有 ChatGPT Pro 方案才能使用 OpenAI o1 推理模型，但近期也開放至 ChatGPT Plus 方案就可使用，至於免費使用的用戶，則有次數的使用限制。

DeepSeek 的優勢與爭議

DeepSeek 在短時間內獲得如此高的關注，具有「深度思考」的 DeepSeek-R1語言模型自然是重要因素，尤其還可以免費使用，大幅降低使用門檻，另外，DeepSeek 背後採用的知識蒸餾（Knowledge Distillation）技術也是重要關鍵，卻也同時成為 DeepSeek 的爭議。

低成本高效的知識蒸餾

知識蒸餾是一種深度學習中的模型壓縮技術，通過將一個大型、複雜的深度學習模型（通常稱為教師模型）的知識，轉移到一個較小且更簡單的模型（通常稱為學生模型）中，從而實現輕量化與高效運算。由於教師模型通常需要長時間及大規模資料集訓練，成本極高，而學生模型在結構上更簡潔，通過學習教師模型及中間知識即可提供高準確率，無需龐大規模的設備。

採用知識蒸餾技術的 DeepSeek，也因此大幅降低 AI 模型的訓練成本，並積極投入開源領域，推出多個開源的多模態 AI 模型，其中最引人注目的包括 Janus-Pro 和 DeepSeek-V2。Janus-Pro 是一個多模態模型，能夠處理圖像、文字等多種資訊；至於 DeepSeek-V2 則是一個大型語言模型，具備強大的自然語言處理能力，而目前 DeepSeek 一般版就已經使用到 DeepSeek-V3，而具有深度思考特質的 DeepSeek-R1 也同樣以開源方式釋出，進一步降低 AI 開發的門檻。

▲ 知識蒸餾（knowledge distillation）一種深度學習中的模型壓縮技術，其具備降低規模、低成本、最佳化特定任務的優勢。（圖片來源：微軟）

▲ 根據 DeepSeek 發布的資料顯示，透過 DeepSeek-R1 的發布，也蒸餾出 6 個小模型，當中 32B 和 70B 模型，在多項能力上超過 OpenAI o1-mini 的效能。（圖片來源：DeepSeek）

開源背後的安全與審查疑慮

雖然低成本及開源是 DeepSeek 的顯著優勢，但也引起市場不少爭議。美國官員擔心，DeepSeek 可能藉由蒸餾技術竊取美國科技公司（如 OpenAI、Google）投入巨額資金和時間開發的 AI 技術；再者，DeepSeek 開源程式碼使其他國家能夠輕易取得這項技術，進一步削弱美國的技術領先優勢。另外，由於 DeepSeek 是中國企業開發的模型，為符合審查要求，大量資訊從訓練數據中被移除，導致知識體系不完整，可能影響 AI 對歷史、政治、社會等人文科目的理解。

也因為這些爭議，許多國家的公務單位或產業選擇禁用 DeepSeek，例如美國國防部與國會、台灣行政院、韓國政府部門等。儘管存在爭議，但從技術層面來看，DeepSeek 以開源、低成本及卓越效能的特色，降低跨入 AI 研發的門檻，無疑正改變 AI 市場的發展。

▲ 由於 DeepSeek 是中國開發的模型，為符合審查要求，有些敏感內容並無法提供回應，這也可能影響 AI 對歷史、政治、社會等人文科目的理解。

認識 DeepSeek 基本操作介面

想要體驗 DeepSeek 也很簡單，只要連上 DeepSeek 官網（chat.deepseek.com），完成基本的註冊後，即可立即使用，至於手機可至 Google Play 或 App Store 下載 DeepSeek，在註冊過程中可以選定以 e-mail 登入，不用綁定手機。且不管是 DeepSeek 的網頁版或手機版本，選單介面都十分簡潔，在對話視窗中，下方可見「深度思考（R1）」和「聯網搜索」二個選項，而一般對話則是使用 DeepSeek-V3 模型，若是勾選深度思（R1），則是採用具有思考能力的 DeepSeek-R1 模型；若點選聯網搜索則會根據網路搜尋結果來回答問題，也就是 RAG（Retrieval-Augmented Generation，檢索增強生成），可解釋為 DeepSeek 的 AI 搜尋功能。

DeepSeek 哪裡下載？

網址：https://chat.deepseek.com

Android：https://ggle.io/7J58

iOS：https://tinyl.io/C3pi

▲ 手機上安裝 DeepSeek App 即可使用，介面也十分簡潔，且提供繁體中文，同樣有深度思考（R1）和網路搜尋，而要按下「+」才會出現可上傳圖片及檔案的選項。

▲ 在網頁上開啟 DeepSeek 官網，按下「開始對話」。

▲ 在註冊過程中可以選定以e-mail登入，或綁定 G-mail 帳號，不用綁定手機。

▲ 登入後就可見對話視窗，一般會採用 DeepSeek-V3 模型，另外還有「深度思考（R1）」和「聯網搜索」可選擇。

▲ 對話視窗後方的迴紋針圖示，是用來上傳附件，有限制最多 50 個檔案，每個不超過 100MB。

如何跟 DeepSeek 對話？

當前使用 DeepSeek 時，不特別點選「深度思考（R1）」和「聯網搜索」，暫且稱為 DeepSeek 基礎版，預設是使用 DeepSeek-V3 模型，標榜效能表現與非開源的 GTP-4o、Claude-3.5-Sonnet、Qwen2.5、Llama-3.1⋯等相當，擅長回答百科知識，且強調回答速度超級快，因此，在大多數的情況下，選擇 DeepSeek 基礎版使用即可。

至於 DeepSeek 的訓練數據為 2024 年 7 月，若是對話的內容是此時間的過去式，在對話視窗中，大都不用按下「聯網搜索」，即可獲得回答。反之，如果是 2024 年 7 月以後發生的事，或是相關的資訊，DeepSeek 會表示「截至我的知識更新日期（2024 年 7 月）」，並提供一些推測的回答，當然，這裡就建議按下「聯網搜索」。

另外，提示詞（Prompt）向來是與 AI 聊天機器人對話中，最重要的自然語言指令，但在與 DeepSeek 對話時，不全然如此。由於 DeepSeek 屬於推理型 AI，因此不太需要過複雜的結構化提示詞，會更強調「準確表達」，例如「你是誰 + 你的目標是什麼」，明確的表達需求及目的，即可生成所需的內容。當然，為加速用戶使用的上手度，DeepSeek 也有提供多種目的「提示庫」，供使用者參考。

▲ DeepSeek 的訓練數據至 2024 年 7 月，超過這日期的問答內容，會出現「我的知識截止日期是（2024 年 7 月）」。

▲ 若是要詢問 2024 年 7 月在此之後的事件或資訊，會建議按下「聯網搜索」，上網搜尋相關的訊息。

▲ 與 DeepSeek 對話不太需要結構化提示詞，會更強調「準確表達」，例如「你是小學生，要解釋區塊鏈是什麼？」

▲ 如果還不能掌握與 DeepSeek 的對話方式，官網（https://tinyl.io/C4AC）也有提供多種目的「提示庫」，供使用者參考。

善用 DeepSeek「深度思考」強項

前面提到，DeepSeek 的「深度思考（R1）」是採用 DeepSeek-R1 模型，以強化學習（Reinforcement Learning，RL）及知識蒸餾（Knowledge Distillation）等技術訓練，擅長邏輯推理、複雜問題解答，由於標榜效能不輸 OpenAI o1，且可完全免費使用，因此在短短時間吸引眾多用戶下載使用。

要善用 DeepSeek 的「深度思考（R1）」強項，關鍵在於掌握它的特性並學會有效下指令。DeepSeek 的深度思考能力來自於其強大的邏輯推理與複雜問題解答能力，這讓它不僅能提供答案，還能深入分析問題的本質，給出更具洞察力的回應。因此，與其將它視為一般的問答工具，不如把它當成一個能協助你深度分析問題的「思考夥伴」。

要發揮 DeepSeek 的深度思考優勢，需要「明確表達需求」。指令詞不需要過於複雜或結構化，但必須清晰、具體。例如，與其問「如何提升作效率？」，改成「我們團隊使用 Trello 管理任務，但常出現任務延誤，你能分析可能的原因並提供改進建議嗎？」這樣的問題能讓 DeepSeek 更精準地理解你的需求，並給出有針對性的回答。

其次，善用「引導式提問」來激發 DeepSeek 的深度思考能力。例如，當你得到初步回答後，可以進一步追問：「如果從資源分配的角度來看，這個問題該如何解決？」或「能否舉一個實際案例來說明可行性？」這種多角度的提問方式，能幫助 DeepSeek 從不同層面進行分析，提供更全面的解決方案。

▲ 要使用 DeepSeek 的深度思考，在對話視窗中，要按下「深度思考（R1）」，使用的是 DeepSeek-R1 模型。

▲ 要發揮 DeepSeek 的深度思考優勢，需要明確表達需求，又不能不給背景，如「如何提升工作效率？」只會得到空泛的回答。

▲ 將問題改為「我們團隊使用 Trello 管理任務，但常出現任務延誤，你能分析可能的原因並提供改進建議嗎？」，DeepSeek 可更精準回答。

▲ 善用「引導式提問」可激發 DeepSeek 的深度思考能力，如獲得回答後進一步問「能否舉一個實際案例來說明可行性？」

DeepSeek、ChatGPT、Gemini 推理能力比一比

回顧去年九月 OpenAI 推出 OpenAI o1 後，推理模型掀起 AI 市場的新一波創新，不過大都需要付費使用，而 DeepSeek 能夠在短時間受到市場矚目的關鍵原因之一，就是讓一般用戶都可以免費使用 DeepSeek 的「深度思考（R1）」，採用的 DeepSeek-R1 推理模型。

具有邏輯推理能力

由於推理模型在生成回應時，不僅依靠語言統計與模式匹配，還具備一套內部的邏輯演算或多層推理過程。這類模型會嘗試像人類一樣，根據問題分解、內部檢查並構建一條「思考路徑」，從而得出更符合邏輯或解題要求的答案。而一般的 AI 聊天機器人，雖然也基於大規模語言模型，但它們主要目的是生成自然流暢的對話回應，通常只是在「模式重組」的基礎上產出答案，而不一定會進行明顯的多層推理或內部邏輯檢查。

AI 聊天機器人開外掛

當前，我們熟悉的 AI 聊天機器人，大都也有加入推理模型的功能，以一般用戶可以免費使用的版本來看，除了 DeepSeek 的「深度思考（R1）」是採用 DeepSeek-R1 模型，ChatGPT 的「推理」目前則是 OpenAI o3-mini 模型，而 Google 的 Gemini 2.0 Flash Thinking 模型則有多模態特性。用戶在與 AI 聊天機器人對話的視窗中，都可以切換為具有推理模型的思考功能，現階段很像 AI 聊天機器的外掛。

以下篇幅則模擬數學計算、決策規畫、生成報告等場景，看看 DeepSeek、ChatGPT、Gemin 在推理功能的表現。

▲ 由 DeepSeek 發布的資料來看，DeepSeek-R1 大規模使用強化學習技術，提升模型推理能力，在數學、程式碼、自然語推理務任上，效能與 OpenAI o1 正式版相當。

▲ 在 ChatGPT 的對話視窗中，切換為「推理」功能，目前是使用 OpenAI o3-mini 模型。

▲ 在 Gemini 切換為 Gemini 2.0 Flash Thinking Experimental，就是以「思考」來回答複雜問題，然後再提供解決方案。

情境 1：數學計算：逐步解題、聯想及比較

Q 1：媽媽去買 3 斤蘋果，每斤 15 元，有張滿 50 減 10 的優惠券，最後會付多少錢？

Q 2：媽媽想要有效使用優惠券，該怎麼買才會最划算？

Q 3：店裡有儲值 100 元可買 120 元商品的活動，媽媽用來買 3 斤蘋果會更划算嗎？

在選擇具有邏輯推理能力的 DeepSeek、ChatGPT、Gemini 進行「推理」或」「思考」的對話時，大都不會立即給出回應，會先經過一段邏輯推理的過程，過程中 DeepSeek 會以簡體中文顯示，ChatGPT 有時繁體中文有時簡體中文，而 Gemini 則是英文。這段「思考」的過程很有趣，會逐一顯出思考的方向跟邏輯，最後再給予答案，從中也可看到 DeepSeek、ChatGPT、Gemini 不同的思考方式。

以日常的算術為例，Q1 算是基本的數學問題，雖然最後的答案都沒錯，但DeepSeek 在思考過程中會延伸出各種假設，如媽媽是否可能買了其他東西、可否以總價再使用優惠券？至於 ChatGPT 倒是很快給出答案，Gemini 則像是以數學證明題的型式給出最後答案。

在 Q2 中想要讓 AI 思考怎麼買最划算，DeepSeek 及 Gemini 都提供 1 個以上的方案，並額外想到能否以加購其他商品的方式，達到 50 元可使用優惠券的門檻，至於 ChatGPT 的回答速度還是最快的，精準的依題目進行數學計算回答，同時提供的備註方案是考慮非整斤購買，那麼就可以買 3.33 斤，達到花費 50 元又能使用優惠券。

最後再以 Q3 進行不同優惠活動的比較，三者在回答的過程中，都有提供不同優惠的使用差異，但 DeepSeek 及 Gemini 在回答的過程中，還會以表格的方向比較出差異，以及多種額外考量。

▲ DeepSeek 每次回答之前，都會與前文連結，並進行不同面向的推理，因此所需時間也較長。

▲ ChatGPT 回答的速度快，精準的進行數學計算回答，同時也會提供可能的備註方案。

▲ Gemini 不管是簡單的算術，或是需要比較的方案，都像以數學證明題的方式來給出回答。

Note 個人感想總結

● DeepSeek：三者中回應速度最慢，但提供詳細的思考面向，甚至最終結論也會從不同角度切入。

● ChatGPT：回應速度最快，與數學相關的答案回答精準，也會有額外的注意提醒，但不會出現過多的假設。

● Gemini：回應速度適中，也會由不同角度提供答案，但不管是簡單的算術，或是需要比較的方案，都像數學的證明題。

情境 2：決策規畫：多重衝突下的解決方案

Q 1：安排台北一日遊，預算有 2,000 元，想去台北 101、故宮、士林夜市、貓空。

Q 2：當天早上會有陣雨，影響戶外行程，景點該如何重新排程？

Q 3：同行友人偏好歷史文化景點，自己喜歡現代建築，行程要如何讓兩人滿意？

在給定預算、時間、天氣狀況和各景點的開放時間等多重限制，讓 DeepSeek、ChatGPT、Gemini 提出最佳方案，用來檢視模型的多變量決策、綜合現實條件考量、資源分配與優先判斷能力。

由回答中可見，DeepSeek 以多變數決策為核心，採用時段交替與景點混搭策略，上午安排故宮、士林官邸等歷史文化景點，下午則轉向北門廣場、台北 101 等現代建築巡禮，並以象山及夜市為結束。此方案動線規畫精細，充分考慮預算、時間與交通調度，並設有多重備案應對早上陣雨的突發狀況，適合追求完美細節及多元體驗的旅客。

ChatGPT 則綜合現實條件，將行程簡化為先滿足歷史文化需求（以故宮為主），再以台北 101 及信義區展示現代化風格。中午和下午皆有彈性選項，並加入貓空纜車與夜市體驗，使整體路線直接明確，方便臨場調整。此方案適合偏好效率、喜歡直接按照計畫進行的旅客。

Gemini 強調資源分配與優先順序的平衡，上午以故宮、大稻埕等歷史景點滿足友人的文化需求，下午轉入台北 101 等現代建築體驗，以貓空及夜市串聯整個行程，達到雙方興趣兼顧的效果。此方案注重雙向互補，既保留歷史韻味，又突顯現代魅力，實現互相尊重與平衡，適合希望雙方均能獲得滿足的旅遊團體。

▲ DeepSeek 在進行 Q1 的行程規畫時，展現多變數決策，並已思考到雨天備案，算是相當完整。

▲ ChatGPT 建議的路線直接明確，也提供備案方便臨場調整，同時也會適時的標記出費用。

▲ Gemini 在建議的路線中，會加入景點的圖片及連結，方便可以直接點選連結查詢。

Note 個人感想總結

● DeepSeek：策略性強、層次分明，展現多變數決策，透過時段交替與景點混搭進行規劃，細節嚴謹且具備多重備案。

● ChatGPT：結構清晰、安排直接，先後順序明確，重點突出，兼顧歷史與現代體驗，強調效率與現場靈活調整。

● Gemini：善用資源分配與優先判斷，均衡兼顧雙方興趣，並加入景點的圖片及網頁連結，讓用戶一目了然。

情境 3：生成報告：文獻查找及批判性思考

Q 1：大學生要交一篇期末報告，主題是為什麼《西遊記》會成為經典？

Q 2：進一步解釋《西遊記》在四大名著中的定位？要引用學術資料來佐證。

Q 3：我認為你分析的很好，但要多一些批判性思考。

由上述的差異性中可見，通常 ChatGPT 回答速度最快、Gemini 次之，DeepSeek 的速度會稍慢一些，且在 DeepSeek、ChatGPT 上，會標示出花了多少時間進行思考或推理。

在 Q1 中要擬定報告方向，從中可見 DeepSeek 言詞犀利，注重文本隱喻、宗教與政治批判，透視角色轉變及社會現實；ChatGPT 回答的結構嚴謹、層次分明，從文學、文化到跨媒體傳播全方位論述《西遊記》成經典的原因；Gemini 發揮多模態模型優勢，風格平實詳盡，以故事魅力、人物塑造和文化傳播闡述經典魅力，並加入圖片輔助。

至於 Q2 中加入學術資料來佐證部分，三者各有側重，分別展現了系統整理、深層批評與綜合闡釋的不同取向。ChatGPT 會引用中國、台灣、香港等學術資料，著重在宗教融合與跨文化影響，而 Gemini 的內容平實詳盡，以浪漫主義色彩、大眾接受度為主要訴求，至於 DeepSeek 則會加入批判隱喻的角度，透過學術資料的多方論述，強調神怪內涵與敘事結構的獨特性。

而在 Q3 加入批判性思考的目的，是想透過反向思考來完整報告的不同面向。而從 Q1 及 Q2 的回答中，可見 DeepSeek 都已加入批判性思考的方向，因此在 Q3 的回答中，會更著重文本隱喻，內容更為艱澀；ChatGPT 則是結構嚴謹層次分明，從文學、文化到跨媒體傳播全方位論述。

▲ DeepSeek 在每一次回答中，其實都有加入反向思考，而最後加入更多批判性思考時，內容更加艱澀。

▲ ChatGPT 在引用學術資料時，會平衡引用中國、台灣、香港等學術資料，著重在宗教融合與跨文化影響。

▲ Gemini 的內容平實詳盡，以浪漫主義色彩、大眾接受度為主要訴求，也提供圖片及連結佐證。

Note 個人感想總結

● DeepSeek：透過學術資料的多方論述，強調神怪內涵與敘事結構的獨特性，特別是批判力度更為尖銳。

● ChatGPT：結構嚴謹、層次分明，從文學、文化到跨媒體傳播全方位論述，平衡引用中國、台灣、香港等學術資料。

● Gemini：發揮多模態優勢，風格平實詳盡，以故事魅力、人物塑造和文化傳播闡述經典魅力，並加入圖片輔助。

本文同步刊載於 PC home 雜誌