FB 建議貼文

選取貼文複製成功(包含文章連結)!

DeepSeek 攻略:實測在數學、決策、寫報告等應用表現,和 Gemini 與 ChatGPT 相比誰勝出

DeepSeek 攻略:實測在數學、決策、寫報告等應用表現,和 Gemini 與 ChatGPT 相比誰勝出

要說近期 AI 領域最熱門的話題,當然是 DeepSeek。憑藉媲美 OpenAI 的效能和低成本開源技術,具備思考及推理功能,不僅在邏輯和數學計算上表現出色,還能在多重衝突下提供高效的解決方案,短短時間便衝上免費App的下載榜首,並有著改變 AI 市場的態勢。究竟 DeepSeek 是什麼?為什麼吸引市場注意?開源背後的安全性與審查機制引發什麼爭議?與 ChatGPT 和 Gemini 的差異又在哪?

文章目錄

 

DeepSeek 以黑馬之姿登場

今年農曆新年期間,DeepSeek 在 AI 領域引起廣泛關注。這款由中國新創團隊推出的 AI 語言模式,市場傳言僅耗資 560 萬美元打造,以低成本、高效能的表現,顛覆市場對 AI 發展需耗費巨資的傳統認知,尤其在推出具有「深度思考」的 DeepSeek-R1 語言模型後,迅速吸引全球用戶註冊,更因大量使用者湧入導致伺服器當機。

媲美 OpenAI o1 的效能

DeepSeek(深度求索)是來自中國的新創公司,並推出類似 OpenAI 的ChatGPT AI 聊天機器人——DeepSeek,在截稿前基礎版本是使用 DeepSeek-V3 語言模式,同時也有推出網頁版及手機 App 版本。而在今年 1 月 20 日再推出 DeepSeek-R1 模型,標榜在數學、代碼、自然語言推理等任務上,效能與 OpenAI o1 正式版相當,也就是在回答問題之前會經過「深度思考」的 AI 聊天機器人。

也因為在 DeepSeek 下使用具有深度思考的 DeepSeek-R1 完全免費,比起OpenAI o1 需要有 ChatGPT Plus 方案以上才能使用(一般用戶有每日免費次數的使用限制),因此在推出後短短幾天內,就吸引全球用戶註冊使用。根據美國 CNBC 全國廣播公司商業頻道報導,DeepSeek 在一月於美國發布後,已迅速超越 ChatGPT 成為蘋果 App Store 下載次數第一的免費應用程式;中國三言科技的報導也指出,今年一月 DeepSeek 用戶增加 1.25 億,其中有 80% 是來自一月的最後一周,在沒有廣告投放下,僅 7 天就增加 1 億用戶,也打破 ChatGPT 的記錄。

DeepSeek 是來自中國的新創公司,推出類似 OpenAI ChatGPT 的 AI 聊天機器人——DeepSeek。

DeepSeek 在推出 DeepSeek-R1 語言模型後,曾在蘋果 App Store 免費應用程式中,一度超越 ChatGPT 成為下載第一的 App。

低成本及開源技術

DeepSeek 除了在短時間吸引全球用戶使用外,也因為顛覆市場認為 AI 發展需要龐大預算的認知,強調僅以 560 萬美元打造,連帶影響到投資市場,為高性能晶片市場帶來不確定性,使得美國科技股的市值一度蒸發 1 兆美元,NVIDIA 股價也因此大跌。

由於 DeepSeek 是強調以低成本、高效率、開源技術(open source)為核心,除了證明高效 AI 模型不一定需要龐大的預算與高規格 GPU 外,相較於 OpenAI 採取的封閉式模型策略,DeepSeek 的開源技術,更能吸引全球開發者與企業的關注。主導 Meta AI 研究的首席科學家楊立昆(Yann LeCun),同時也是圖靈獎得主的他曾指出,DeepSeek 成功的最大收穫並非中國競爭對其他國家帶來更大威脅,而是 AI 開源的價值使任何人都能受益。

ChatGPT 原來只有 ChatGPT Pro 方案才能使用 OpenAI o1 推理模型,但近期也開放至 ChatGPT Plus 方案就可使用,至於免費使用的用戶,則有次數的使用限制。

DeepSeek 的優勢與爭議

DeepSeek 在短時間內獲得如此高的關注,具有「深度思考」的 DeepSeek-R1語言模型自然是重要因素,尤其還可以免費使用,大幅降低使用門檻,另外,DeepSeek 背後採用的知識蒸餾(Knowledge Distillation)技術也是重要關鍵,卻也同時成為 DeepSeek 的爭議。

低成本高效的知識蒸餾

知識蒸餾是一種深度學習中的模型壓縮技術,通過將一個大型、複雜的深度學習模型(通常稱為教師模型)的知識,轉移到一個較小且更簡單的模型(通常稱為學生模型)中,從而實現輕量化與高效運算。由於教師模型通常需要長時間及大規模資料集訓練,成本極高,而學生模型在結構上更簡潔,通過學習教師模型及中間知識即可提供高準確率,無需龐大規模的設備。

採用知識蒸餾技術的 DeepSeek,也因此大幅降低 AI 模型的訓練成本,並積極投入開源領域,推出多個開源的多模態 AI 模型,其中最引人注目的包括 Janus-Pro 和 DeepSeek-V2。Janus-Pro 是一個多模態模型,能夠處理圖像、文字等多種資訊;至於 DeepSeek-V2 則是一個大型語言模型,具備強大的自然語言處理能力,而目前 DeepSeek 一般版就已經使用到 DeepSeek-V3,而具有深度思考特質的 DeepSeek-R1 也同樣以開源方式釋出,進一步降低 AI 開發的門檻。

知識蒸餾(knowledge distillation)一種深度學習中的模型壓縮技術,其具備降低規模、低成本、最佳化特定任務的優勢。(圖片來源:微軟)

根據 DeepSeek 發布的資料顯示,透過 DeepSeek-R1 的發布,也蒸餾出 6 個小模型,當中 32B 和 70B 模型,在多項能力上超過 OpenAI o1-mini 的效能。(圖片來源:DeepSeek)

開源背後的安全與審查疑慮

雖然低成本及開源是 DeepSeek 的顯著優勢,但也引起市場不少爭議。美國官員擔心,DeepSeek 可能藉由蒸餾技術竊取美國科技公司(如 OpenAI、Google)投入巨額資金和時間開發的 AI 技術;再者,DeepSeek 開源程式碼使其他國家能夠輕易取得這項技術,進一步削弱美國的技術領先優勢。另外,由於 DeepSeek 是中國企業開發的模型,為符合審查要求,大量資訊從訓練數據中被移除,導致知識體系不完整,可能影響 AI 對歷史、政治、社會等人文科目的理解。

也因為這些爭議,許多國家的公務單位或產業選擇禁用 DeepSeek,例如美國國防部與國會、台灣行政院、韓國政府部門等。儘管存在爭議,但從技術層面來看,DeepSeek 以開源、低成本及卓越效能的特色,降低跨入 AI 研發的門檻,無疑正改變 AI 市場的發展。

由於 DeepSeek 是中國開發的模型,為符合審查要求,有些敏感內容並無法提供回應,這也可能影響 AI 對歷史、政治、社會等人文科目的理解。

認識 DeepSeek 基本操作介面

想要體驗 DeepSeek 也很簡單,只要連上 DeepSeek 官網(chat.deepseek.com),完成基本的註冊後,即可立即使用,至於手機可至 Google Play 或 App Store 下載 DeepSeek,在註冊過程中可以選定以 e-mail 登入,不用綁定手機。且不管是 DeepSeek 的網頁版或手機版本,選單介面都十分簡潔,在對話視窗中,下方可見「深度思考(R1)」和「聯網搜索」二個選項,而一般對話則是使用 DeepSeek-V3 模型,若是勾選深度思(R1),則是採用具有思考能力的 DeepSeek-R1 模型; 若點選聯網搜索則會根據網路搜尋結果來回答問題,也就是 RAG(Retrieval-Augmented Generation,檢索增強生成),可解釋為 DeepSeek 的 AI 搜尋功能。

DeepSeek 哪裡下載?

網址:https://chat.deepseek.com

Android:https://ggle.io/7J58

iOS:https://tinyl.io/C3pi

手機上安裝 DeepSeek App 即可使用,介面也十分簡潔,且提供繁體中文,同樣有深度思考(R1)和網路搜尋,而要按下「+」才會出現可上傳圖片及檔案的選項。

在網頁上開啟 DeepSeek 官網,按下「開始對話」。

在註冊過程中可以選定以e-mail登入,或綁定 G-mail 帳號,不用綁定手機。

登入後就可見對話視窗,一般會採用 DeepSeek-V3 模型,另外還有「深度思考(R1)」和「聯網搜索」可選擇。

對話視窗後方的迴紋針圖示,是用來上傳附件,有限制最多 50 個檔案,每個不超過 100MB。

如何跟 DeepSeek 對話?

當前使用 DeepSeek 時,不特別點選「深度思考(R1)」和「聯網搜索」,暫且稱為 DeepSeek 基礎版,預設是使用 DeepSeek-V3 模型,標榜效能表現與非開源的 GTP-4o、Claude-3.5-Sonnet、Qwen2.5、Llama-3.1⋯等相當,擅長回答百科知識,且強調回答速度超級快,因此,在大多數的情況下,選擇 DeepSeek 基礎版使用即可。

至於 DeepSeek 的訓練數據為 2024 年 7 月,若是對話的內容是此時間的過去式,在對話視窗中,大都不用按下「聯網搜索」,即可獲得回答。反之,如果是 2024 年 7 月以後發生的事,或是相關的資訊,DeepSeek 會表示「截至我的知識更新日期(2024 年 7 月)」,並提供一些推測的回答,當然,這裡就建議按下「聯網搜索」。

另外,提示詞(Prompt)向來是與 AI 聊天機器人對話中,最重要的自然語言指令,但在與 DeepSeek 對話時,不全然如此。由於 DeepSeek 屬於推理型 AI,因此不太需要過複雜的結構化提示詞,會更強調「準確表達」,例如「你是誰 + 你的目標是什麼」,明確的表達需求及目的,即可生成所需的內容。當然,為加速用戶使用的上手度,DeepSeek 也有提供多種目的「提示庫」,供使用者參考。

DeepSeek 的訓練數據至 2024 年 7 月,超過這日期的問答內容,會出現「我的知識截止日期是(2024 年 7 月)」。

若是要詢問 2024 年 7 月在此之後的事件或資訊,會建議按下「聯網搜索」,上網搜尋相關的訊息。

與 DeepSeek 對話不太需要結構化提示詞,會更強調「準確表達」,例如「你是小學生,要解釋區塊鏈是什麼?」

如果還不能掌握與 DeepSeek 的對話方式,官網(https://tinyl.io/C4AC)也有提供多種目的「提示庫」,供使用者參考。

善用 DeepSeek「深度思考」強項

前面提到,DeepSeek 的「深度思考(R1)」是採用 DeepSeek-R1 模型,以強化學習(Reinforcement Learning,RL)及知識蒸餾(Knowledge Distillation)等技術訓練,擅長邏輯推理、複雜問題解答,由於標榜效能不輸 OpenAI o1,且可完全免費使用,因此在短短時間吸引眾多用戶下載使用。

要善用 DeepSeek 的「深度思考(R1)」強項,關鍵在於掌握它的特性並學會有效下指令。DeepSeek 的深度思考能力來自於其強大的邏輯推理與複雜問題解答能力,這讓它不僅能提供答案,還能深入分析問題的本質,給出更具洞察力的回應。因此,與其將它視為一般的問答工具,不如把它當成一個能協助你深度分析問題的「思考夥伴」。

要發揮 DeepSeek 的深度思考優勢,需要「明確表達需求」。指令詞不需要過於複雜或結構化,但必須清晰、具體。例如,與其問「如何提升作效率?」,改成「我們團隊使用 Trello 管理任務,但常出現任務延誤,你能分析可能的原因並提供改進建議嗎?」這樣的問題能讓 DeepSeek 更精準地理解你的需求,並給出有針對性的回答。

其次,善用「引導式提問」來激發 DeepSeek 的深度思考能力。例如,當你得到初步回答後,可以進一步追問:「如果從資源分配的角度來看,這個問題該如何解決?」或「能否舉一個實際案例來說明可行性?」這種多角度的提問方式,能幫助 DeepSeek 從不同層面進行分析,提供更全面的解決方案。

要使用 DeepSeek 的深度思考,在對話視窗中,要按下「深度思考(R1)」,使用的是 DeepSeek-R1 模型。

要發揮 DeepSeek 的深度思考優勢,需要明確表達需求,又不能不給背景,如「如何提升工作效率?」只會得到空泛的回答。

將問題改為「我們團隊使用 Trello 管理任務,但常出現任務延誤,你能分析可能的原因並提供改進建議嗎?」,DeepSeek 可更精準回答。

善用「引導式提問」可激發 DeepSeek 的深度思考能力,如獲得回答後進一步問「能否舉一個實際案例來說明可行性?」

DeepSeek、ChatGPT、Gemini 推理能力比一比

回顧去年九月 OpenAI 推出 OpenAI o1 後,推理模型掀起 AI 市場的新一波創新,不過大都需要付費使用,而 DeepSeek 能夠在短時間受到市場矚目的關鍵原因之一,就是讓一般用戶都可以免費使用 DeepSeek 的「深度思考(R1)」,採用的 DeepSeek-R1 推理模型。

具有邏輯推理能力

由於推理模型在生成回應時,不僅依靠語言統計與模式匹配,還具備一套內部的邏輯演算或多層推理過程。這類模型會嘗試像人類一樣,根據問題分解、內部檢查並構建一條「思考路徑」,從而得出更符合邏輯或解題要求的答案。而一般的 AI 聊天機器人,雖然也基於大規模語言模型,但它們主要目的是生成自然流暢的對話回應,通常只是在「模式重組」的基礎上產出答案,而不一定會進行明顯的多層推理或內部邏輯檢查。

DeepSeek 攻略:實測在數學、決策、寫報告等應用表現,和 Gemini 與 ChatGPT 相比誰勝出

AI 聊天機器人開外掛

當前,我們熟悉的 AI 聊天機器人,大都也有加入推理模型的功能,以一般用戶可以免費使用的版本來看,除了 DeepSeek 的「深度思考(R1)」是採用 DeepSeek-R1 模型,ChatGPT 的「推理」目前則是 OpenAI o3-mini 模型,而 Google 的 Gemini 2.0 Flash Thinking 模型則有多模態特性。用戶在與 AI 聊天機器人對話的視窗中,都可以切換為具有推理模型的思考功能,現階段很像 AI 聊天機器的外掛。

以下篇幅則模擬數學計算、決策規畫、生成報告等場景,看看 DeepSeek、ChatGPT、Gemin 在推理功能的表現。

由 DeepSeek 發布的資料來看,DeepSeek-R1 大規模使用強化學習技術,提升模型推理能力,在數學、程式碼、自然語推理務任上,效能與 OpenAI o1 正式版相當。

在 ChatGPT 的對話視窗中,切換為「推理」功能,目前是使用 OpenAI o3-mini 模型。

在 Gemini 切換為 Gemini 2.0 Flash Thinking Experimental,就是以「思考」來回答複雜問題,然後再提供解決方案。

情境 1:數學計算:逐步解題、聯想及比較

Q 1:媽媽去買 3 斤蘋果,每斤 15 元,有張滿 50 減 10 的優惠券,最後會付多少錢?

Q 2:媽媽想要有效使用優惠券,該怎麼買才會最划算?

Q 3:店裡有儲值 100 元可買 120 元商品的活動,媽媽用來買 3 斤蘋果會更划算嗎?

在選擇具有邏輯推理能力的 DeepSeek、ChatGPT、Gemini 進行「推理」或」「思考」的對話時,大都不會立即給出回應,會先經過一段邏輯推理的過程,過程中 DeepSeek 會以簡體中文顯示,ChatGPT 有時繁體中文有時簡體中文,而 Gemini 則是英文。這段「思考」的過程很有趣,會逐一顯出思考的方向跟邏輯,最後再給予答案,從中也可看到 DeepSeek、ChatGPT、Gemini 不同的思考方式。

以日常的算術為例,Q1 算是基本的數學問題,雖然最後的答案都沒錯,但DeepSeek 在思考過程中會延伸出各種假設,如媽媽是否可能買了其他東西、可否以總價再使用優惠券?至於 ChatGPT 倒是很快給出答案,Gemini 則像是以數學證明題的型式給出最後答案。

在 Q2 中想要讓 AI 思考怎麼買最划算,DeepSeek 及 Gemini 都提供 1 個以上的方案,並額外想到能否以加購其他商品的方式,達到 50 元可使用優惠券的門檻,至於 ChatGPT 的回答速度還是最快的,精準的依題目進行數學計算回答,同時提供的備註方案是考慮非整斤購買,那麼就可以買 3.33 斤,達到花費 50 元又能使用優惠券。

最後再以 Q3 進行不同優惠活動的比較,三者在回答的過程中,都有提供不同優惠的使用差異,但 DeepSeek 及 Gemini 在回答的過程中,還會以表格的方向比較出差異,以及多種額外考量。

DeepSeek 每次回答之前,都會與前文連結,並進行不同面向的推理,因此所需時間也較長。

ChatGPT 回答的速度快,精準的進行數學計算回答,同時也會提供可能的備註方案。

Gemini 不管是簡單的算術,或是需要比較的方案,都像以數學證明題的方式來給出回答。

Note 個人感想總結

● DeepSeek:三者中回應速度最慢,但提供詳細的思考面向,甚至最終結論也會從不同角度切入。

● ChatGPT:回應速度最快,與數學相關的答案回答精準,也會有額外的注意提醒,但不會出現過多的假設。

● Gemini:回應速度適中,也會由不同角度提供答案,但不管是簡單的算術,或是需要比較的方案,都像數學的證明題。

情境 2:決策規畫:多重衝突下的解決方案

Q 1:安排台北一日遊,預算有 2,000 元,想去台北 101、故宮、士林夜市、貓空。

Q 2:當天早上會有陣雨,影響戶外行程,景點該如何重新排程?

Q 3:同行友人偏好歷史文化景點,自己喜歡現代建築,行程要如何讓兩人滿意?

在給定預算、時間、天氣狀況和各景點的開放時間等多重限制,讓 DeepSeek、ChatGPT、Gemini 提出最佳方案,用來檢視模型的多變量決策、綜合現實條件考量、資源分配與優先判斷能力。

由回答中可見,DeepSeek 以多變數決策為核心,採用時段交替與景點混搭策略,上午安排故宮、士林官邸等歷史文化景點,下午則轉向北門廣場、台北 101 等現代建築巡禮,並以象山及夜市為結束。此方案動線規畫精細,充分考慮預算、時間與交通調度,並設有多重備案應對早上陣雨的突發狀況,適合追求完美細節及多元體驗的旅客。

ChatGPT 則綜合現實條件,將行程簡化為先滿足歷史文化需求(以故宮為主),再以台北 101 及信義區展示現代化風格。中午和下午皆有彈性選項,並加入貓空纜車與夜市體驗,使整體路線直接明確,方便臨場調整。此方案適合偏好效率、喜歡直接按照計畫進行的旅客。

Gemini 強調資源分配與優先順序的平衡,上午以故宮、大稻埕等歷史景點滿足友人的文化需求,下午轉入台北 101 等現代建築體驗,以貓空及夜市串聯整個行程,達到雙方興趣兼顧的效果。此方案注重雙向互補,既保留歷史韻味,又突顯現代魅力,實現互相尊重與平衡,適合希望雙方均能獲得滿足的旅遊團體。

DeepSeek 在進行 Q1 的行程規畫時,展現多變數決策,並已思考到雨天備案,算是相當完整。

ChatGPT 建議的路線直接明確,也提供備案方便臨場調整,同時也會適時的標記出費用。

Gemini 在建議的路線中,會加入景點的圖片及連結,方便可以直接點選連結查詢。

Note 個人感想總結

● DeepSeek:策略性強、層次分明,展現多變數決策,透過時段交替與景點混搭進行規劃,細節嚴謹且具備多重備案。

● ChatGPT:結構清晰、安排直接,先後順序明確,重點突出,兼顧歷史與現代體驗,強調效率與現場靈活調整。

● Gemini:善用資源分配與優先判斷,均衡兼顧雙方興趣,並加入景點的圖片及網頁連結,讓用戶一目了然。

情境 3:生成報告:文獻查找及批判性思考

Q 1:大學生要交一篇期末報告,主題是為什麼《西遊記》會成為經典?

Q 2:進一步解釋《西遊記》在四大名著中的定位?要引用學術資料來佐證。

Q 3:我認為你分析的很好,但要多一些批判性思考。

由上述的差異性中可見,通常 ChatGPT 回答速度最快、Gemini 次之,DeepSeek 的速度會稍慢一些,且在 DeepSeek、ChatGPT 上,會標示出花了多少時間進行思考或推理。

在 Q1 中要擬定報告方向,從中可見 DeepSeek 言詞犀利,注重文本隱喻、宗教與政治批判,透視角色轉變及社會現實;ChatGPT 回答的結構嚴謹、層次分明,從文學、文化到跨媒體傳播全方位論述《西遊記》成經典的原因;Gemini 發揮多模態模型優勢,風格平實詳盡,以故事魅力、人物塑造和文化傳播闡述經典魅力,並加入圖片輔助。

至於 Q2 中加入學術資料來佐證部分,三者各有側重,分別展現了系統整理、深層批評與綜合闡釋的不同取向。ChatGPT 會引用中國、台灣、香港等學術資料,著重在宗教融合與跨文化影響,而 Gemini 的內容平實詳盡,以浪漫主義色彩、大眾接受度為主要訴求,至於 DeepSeek 則會加入批判隱喻的角度,透過學術資料的多方論述,強調神怪內涵與敘事結構的獨特性。

而在 Q3 加入批判性思考的目的,是想透過反向思考來完整報告的不同面向。而從 Q1 及 Q2 的回答中,可見 DeepSeek 都已加入批判性思考的方向,因此在 Q3 的回答中,會更著重文本隱喻,內容更為艱澀;ChatGPT 則是結構嚴謹層次分明,從文學、文化到跨媒體傳播全方位論述。

DeepSeek 在每一次回答中,其實都有加入反向思考,而最後加入更多批判性思考時,內容更加艱澀。

ChatGPT 在引用學術資料時,會平衡引用中國、台灣、香港等學術資料,著重在宗教融合與跨文化影響。

Gemini 的內容平實詳盡,以浪漫主義色彩、大眾接受度為主要訴求,也提供圖片及連結佐證。

Note 個人感想總結

● DeepSeek:透過學術資料的多方論述,強調神怪內涵與敘事結構的獨特性,特別是批判力度更為尖銳。

● ChatGPT:結構嚴謹、層次分明,從文學、文化到跨媒體傳播全方位論述,平衡引用中國、台灣、香港等學術資料。

● Gemini:發揮多模態優勢,風格平實詳盡,以故事魅力、人物塑造和文化傳播闡述經典魅力,並加入圖片輔助。

本文同步刊載於 PC home 雜誌

DeepSeek 攻略:實測在數學、決策、寫報告等應用表現,和 Gemini 與 ChatGPT 相比誰勝出

歡迎加入 PC home 雜誌粉絲團

 

 

WL.
作者

PC home雜誌、T客邦產業編輯,主要負責蘋果、手機、筆電、桌機、平板等產業領域,以及相關硬體的教學以及評測、軟體相關教學報導。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則