
要說近期 AI 領域最熱門的話題,當然是 DeepSeek。憑藉媲美 OpenAI 的效能和低成本開源技術,具備思考及推理功能,不僅在邏輯和數學計算上表現出色,還能在多重衝突下提供高效的解決方案,短短時間便衝上免費App的下載榜首,並有著改變 AI 市場的態勢。究竟 DeepSeek 是什麼?為什麼吸引市場注意?開源背後的安全性與審查機制引發什麼爭議?與 ChatGPT 和 Gemini 的差異又在哪?
文章目錄
DeepSeek 以黑馬之姿登場
今年農曆新年期間,DeepSeek 在 AI 領域引起廣泛關注。這款由中國新創團隊推出的 AI 語言模式,市場傳言僅耗資 560 萬美元打造,以低成本、高效能的表現,顛覆市場對 AI 發展需耗費巨資的傳統認知,尤其在推出具有「深度思考」的 DeepSeek-R1 語言模型後,迅速吸引全球用戶註冊,更因大量使用者湧入導致伺服器當機。
媲美 OpenAI o1 的效能
DeepSeek(深度求索)是來自中國的新創公司,並推出類似 OpenAI 的ChatGPT AI 聊天機器人——DeepSeek,在截稿前基礎版本是使用 DeepSeek-V3 語言模式,同時也有推出網頁版及手機 App 版本。而在今年 1 月 20 日再推出 DeepSeek-R1 模型,標榜在數學、代碼、自然語言推理等任務上,效能與 OpenAI o1 正式版相當,也就是在回答問題之前會經過「深度思考」的 AI 聊天機器人。
也因為在 DeepSeek 下使用具有深度思考的 DeepSeek-R1 完全免費,比起OpenAI o1 需要有 ChatGPT Plus 方案以上才能使用(一般用戶有每日免費次數的使用限制),因此在推出後短短幾天內,就吸引全球用戶註冊使用。根據美國 CNBC 全國廣播公司商業頻道報導,DeepSeek 在一月於美國發布後,已迅速超越 ChatGPT 成為蘋果 App Store 下載次數第一的免費應用程式;中國三言科技的報導也指出,今年一月 DeepSeek 用戶增加 1.25 億,其中有 80% 是來自一月的最後一周,在沒有廣告投放下,僅 7 天就增加 1 億用戶,也打破 ChatGPT 的記錄。
低成本及開源技術
DeepSeek 除了在短時間吸引全球用戶使用外,也因為顛覆市場認為 AI 發展需要龐大預算的認知,強調僅以 560 萬美元打造,連帶影響到投資市場,為高性能晶片市場帶來不確定性,使得美國科技股的市值一度蒸發 1 兆美元,NVIDIA 股價也因此大跌。
由於 DeepSeek 是強調以低成本、高效率、開源技術(open source)為核心,除了證明高效 AI 模型不一定需要龐大的預算與高規格 GPU 外,相較於 OpenAI 採取的封閉式模型策略,DeepSeek 的開源技術,更能吸引全球開發者與企業的關注。主導 Meta AI 研究的首席科學家楊立昆(Yann LeCun),同時也是圖靈獎得主的他曾指出,DeepSeek 成功的最大收穫並非中國競爭對其他國家帶來更大威脅,而是 AI 開源的價值使任何人都能受益。
DeepSeek 的優勢與爭議
DeepSeek 在短時間內獲得如此高的關注,具有「深度思考」的 DeepSeek-R1語言模型自然是重要因素,尤其還可以免費使用,大幅降低使用門檻,另外,DeepSeek 背後採用的知識蒸餾(Knowledge Distillation)技術也是重要關鍵,卻也同時成為 DeepSeek 的爭議。
低成本高效的知識蒸餾
知識蒸餾是一種深度學習中的模型壓縮技術,通過將一個大型、複雜的深度學習模型(通常稱為教師模型)的知識,轉移到一個較小且更簡單的模型(通常稱為學生模型)中,從而實現輕量化與高效運算。由於教師模型通常需要長時間及大規模資料集訓練,成本極高,而學生模型在結構上更簡潔,通過學習教師模型及中間知識即可提供高準確率,無需龐大規模的設備。
採用知識蒸餾技術的 DeepSeek,也因此大幅降低 AI 模型的訓練成本,並積極投入開源領域,推出多個開源的多模態 AI 模型,其中最引人注目的包括 Janus-Pro 和 DeepSeek-V2。Janus-Pro 是一個多模態模型,能夠處理圖像、文字等多種資訊;至於 DeepSeek-V2 則是一個大型語言模型,具備強大的自然語言處理能力,而目前 DeepSeek 一般版就已經使用到 DeepSeek-V3,而具有深度思考特質的 DeepSeek-R1 也同樣以開源方式釋出,進一步降低 AI 開發的門檻。
開源背後的安全與審查疑慮
雖然低成本及開源是 DeepSeek 的顯著優勢,但也引起市場不少爭議。美國官員擔心,DeepSeek 可能藉由蒸餾技術竊取美國科技公司(如 OpenAI、Google)投入巨額資金和時間開發的 AI 技術;再者,DeepSeek 開源程式碼使其他國家能夠輕易取得這項技術,進一步削弱美國的技術領先優勢。另外,由於 DeepSeek 是中國企業開發的模型,為符合審查要求,大量資訊從訓練數據中被移除,導致知識體系不完整,可能影響 AI 對歷史、政治、社會等人文科目的理解。
也因為這些爭議,許多國家的公務單位或產業選擇禁用 DeepSeek,例如美國國防部與國會、台灣行政院、韓國政府部門等。儘管存在爭議,但從技術層面來看,DeepSeek 以開源、低成本及卓越效能的特色,降低跨入 AI 研發的門檻,無疑正改變 AI 市場的發展。
認識 DeepSeek 基本操作介面
想要體驗 DeepSeek 也很簡單,只要連上 DeepSeek 官網(chat.deepseek.com),完成基本的註冊後,即可立即使用,至於手機可至 Google Play 或 App Store 下載 DeepSeek,在註冊過程中可以選定以 e-mail 登入,不用綁定手機。且不管是 DeepSeek 的網頁版或手機版本,選單介面都十分簡潔,在對話視窗中,下方可見「深度思考(R1)」和「聯網搜索」二個選項,而一般對話則是使用 DeepSeek-V3 模型,若是勾選深度思(R1),則是採用具有思考能力的 DeepSeek-R1 模型; 若點選聯網搜索則會根據網路搜尋結果來回答問題,也就是 RAG(Retrieval-Augmented Generation,檢索增強生成),可解釋為 DeepSeek 的 AI 搜尋功能。
DeepSeek 哪裡下載?
Android:https://ggle.io/7J58
如何跟 DeepSeek 對話?
當前使用 DeepSeek 時,不特別點選「深度思考(R1)」和「聯網搜索」,暫且稱為 DeepSeek 基礎版,預設是使用 DeepSeek-V3 模型,標榜效能表現與非開源的 GTP-4o、Claude-3.5-Sonnet、Qwen2.5、Llama-3.1⋯等相當,擅長回答百科知識,且強調回答速度超級快,因此,在大多數的情況下,選擇 DeepSeek 基礎版使用即可。
至於 DeepSeek 的訓練數據為 2024 年 7 月,若是對話的內容是此時間的過去式,在對話視窗中,大都不用按下「聯網搜索」,即可獲得回答。反之,如果是 2024 年 7 月以後發生的事,或是相關的資訊,DeepSeek 會表示「截至我的知識更新日期(2024 年 7 月)」,並提供一些推測的回答,當然,這裡就建議按下「聯網搜索」。
另外,提示詞(Prompt)向來是與 AI 聊天機器人對話中,最重要的自然語言指令,但在與 DeepSeek 對話時,不全然如此。由於 DeepSeek 屬於推理型 AI,因此不太需要過複雜的結構化提示詞,會更強調「準確表達」,例如「你是誰 + 你的目標是什麼」,明確的表達需求及目的,即可生成所需的內容。當然,為加速用戶使用的上手度,DeepSeek 也有提供多種目的「提示庫」,供使用者參考。
善用 DeepSeek「深度思考」強項
前面提到,DeepSeek 的「深度思考(R1)」是採用 DeepSeek-R1 模型,以強化學習(Reinforcement Learning,RL)及知識蒸餾(Knowledge Distillation)等技術訓練,擅長邏輯推理、複雜問題解答,由於標榜效能不輸 OpenAI o1,且可完全免費使用,因此在短短時間吸引眾多用戶下載使用。
要善用 DeepSeek 的「深度思考(R1)」強項,關鍵在於掌握它的特性並學會有效下指令。DeepSeek 的深度思考能力來自於其強大的邏輯推理與複雜問題解答能力,這讓它不僅能提供答案,還能深入分析問題的本質,給出更具洞察力的回應。因此,與其將它視為一般的問答工具,不如把它當成一個能協助你深度分析問題的「思考夥伴」。
要發揮 DeepSeek 的深度思考優勢,需要「明確表達需求」。指令詞不需要過於複雜或結構化,但必須清晰、具體。例如,與其問「如何提升作效率?」,改成「我們團隊使用 Trello 管理任務,但常出現任務延誤,你能分析可能的原因並提供改進建議嗎?」這樣的問題能讓 DeepSeek 更精準地理解你的需求,並給出有針對性的回答。
其次,善用「引導式提問」來激發 DeepSeek 的深度思考能力。例如,當你得到初步回答後,可以進一步追問:「如果從資源分配的角度來看,這個問題該如何解決?」或「能否舉一個實際案例來說明可行性?」這種多角度的提問方式,能幫助 DeepSeek 從不同層面進行分析,提供更全面的解決方案。
DeepSeek、ChatGPT、Gemini 推理能力比一比
回顧去年九月 OpenAI 推出 OpenAI o1 後,推理模型掀起 AI 市場的新一波創新,不過大都需要付費使用,而 DeepSeek 能夠在短時間受到市場矚目的關鍵原因之一,就是讓一般用戶都可以免費使用 DeepSeek 的「深度思考(R1)」,採用的 DeepSeek-R1 推理模型。
具有邏輯推理能力
由於推理模型在生成回應時,不僅依靠語言統計與模式匹配,還具備一套內部的邏輯演算或多層推理過程。這類模型會嘗試像人類一樣,根據問題分解、內部檢查並構建一條「思考路徑」,從而得出更符合邏輯或解題要求的答案。而一般的 AI 聊天機器人,雖然也基於大規模語言模型,但它們主要目的是生成自然流暢的對話回應,通常只是在「模式重組」的基礎上產出答案,而不一定會進行明顯的多層推理或內部邏輯檢查。
AI 聊天機器人開外掛
當前,我們熟悉的 AI 聊天機器人,大都也有加入推理模型的功能,以一般用戶可以免費使用的版本來看,除了 DeepSeek 的「深度思考(R1)」是採用 DeepSeek-R1 模型,ChatGPT 的「推理」目前則是 OpenAI o3-mini 模型,而 Google 的 Gemini 2.0 Flash Thinking 模型則有多模態特性。用戶在與 AI 聊天機器人對話的視窗中,都可以切換為具有推理模型的思考功能,現階段很像 AI 聊天機器的外掛。
以下篇幅則模擬數學計算、決策規畫、生成報告等場景,看看 DeepSeek、ChatGPT、Gemin 在推理功能的表現。
情境 1:數學計算:逐步解題、聯想及比較
Q 1:媽媽去買 3 斤蘋果,每斤 15 元,有張滿 50 減 10 的優惠券,最後會付多少錢?
Q 2:媽媽想要有效使用優惠券,該怎麼買才會最划算?
Q 3:店裡有儲值 100 元可買 120 元商品的活動,媽媽用來買 3 斤蘋果會更划算嗎?
在選擇具有邏輯推理能力的 DeepSeek、ChatGPT、Gemini 進行「推理」或」「思考」的對話時,大都不會立即給出回應,會先經過一段邏輯推理的過程,過程中 DeepSeek 會以簡體中文顯示,ChatGPT 有時繁體中文有時簡體中文,而 Gemini 則是英文。這段「思考」的過程很有趣,會逐一顯出思考的方向跟邏輯,最後再給予答案,從中也可看到 DeepSeek、ChatGPT、Gemini 不同的思考方式。
以日常的算術為例,Q1 算是基本的數學問題,雖然最後的答案都沒錯,但DeepSeek 在思考過程中會延伸出各種假設,如媽媽是否可能買了其他東西、可否以總價再使用優惠券?至於 ChatGPT 倒是很快給出答案,Gemini 則像是以數學證明題的型式給出最後答案。
在 Q2 中想要讓 AI 思考怎麼買最划算,DeepSeek 及 Gemini 都提供 1 個以上的方案,並額外想到能否以加購其他商品的方式,達到 50 元可使用優惠券的門檻,至於 ChatGPT 的回答速度還是最快的,精準的依題目進行數學計算回答,同時提供的備註方案是考慮非整斤購買,那麼就可以買 3.33 斤,達到花費 50 元又能使用優惠券。
最後再以 Q3 進行不同優惠活動的比較,三者在回答的過程中,都有提供不同優惠的使用差異,但 DeepSeek 及 Gemini 在回答的過程中,還會以表格的方向比較出差異,以及多種額外考量。
Note 個人感想總結
● DeepSeek:三者中回應速度最慢,但提供詳細的思考面向,甚至最終結論也會從不同角度切入。
● ChatGPT:回應速度最快,與數學相關的答案回答精準,也會有額外的注意提醒,但不會出現過多的假設。
● Gemini:回應速度適中,也會由不同角度提供答案,但不管是簡單的算術,或是需要比較的方案,都像數學的證明題。
情境 2:決策規畫:多重衝突下的解決方案
Q 1:安排台北一日遊,預算有 2,000 元,想去台北 101、故宮、士林夜市、貓空。
Q 2:當天早上會有陣雨,影響戶外行程,景點該如何重新排程?
Q 3:同行友人偏好歷史文化景點,自己喜歡現代建築,行程要如何讓兩人滿意?
在給定預算、時間、天氣狀況和各景點的開放時間等多重限制,讓 DeepSeek、ChatGPT、Gemini 提出最佳方案,用來檢視模型的多變量決策、綜合現實條件考量、資源分配與優先判斷能力。
由回答中可見,DeepSeek 以多變數決策為核心,採用時段交替與景點混搭策略,上午安排故宮、士林官邸等歷史文化景點,下午則轉向北門廣場、台北 101 等現代建築巡禮,並以象山及夜市為結束。此方案動線規畫精細,充分考慮預算、時間與交通調度,並設有多重備案應對早上陣雨的突發狀況,適合追求完美細節及多元體驗的旅客。
ChatGPT 則綜合現實條件,將行程簡化為先滿足歷史文化需求(以故宮為主),再以台北 101 及信義區展示現代化風格。中午和下午皆有彈性選項,並加入貓空纜車與夜市體驗,使整體路線直接明確,方便臨場調整。此方案適合偏好效率、喜歡直接按照計畫進行的旅客。
Gemini 強調資源分配與優先順序的平衡,上午以故宮、大稻埕等歷史景點滿足友人的文化需求,下午轉入台北 101 等現代建築體驗,以貓空及夜市串聯整個行程,達到雙方興趣兼顧的效果。此方案注重雙向互補,既保留歷史韻味,又突顯現代魅力,實現互相尊重與平衡,適合希望雙方均能獲得滿足的旅遊團體。
Note 個人感想總結
● DeepSeek:策略性強、層次分明,展現多變數決策,透過時段交替與景點混搭進行規劃,細節嚴謹且具備多重備案。
● ChatGPT:結構清晰、安排直接,先後順序明確,重點突出,兼顧歷史與現代體驗,強調效率與現場靈活調整。
● Gemini:善用資源分配與優先判斷,均衡兼顧雙方興趣,並加入景點的圖片及網頁連結,讓用戶一目了然。
情境 3:生成報告:文獻查找及批判性思考
Q 1:大學生要交一篇期末報告,主題是為什麼《西遊記》會成為經典?
Q 2:進一步解釋《西遊記》在四大名著中的定位?要引用學術資料來佐證。
Q 3:我認為你分析的很好,但要多一些批判性思考。
由上述的差異性中可見,通常 ChatGPT 回答速度最快、Gemini 次之,DeepSeek 的速度會稍慢一些,且在 DeepSeek、ChatGPT 上,會標示出花了多少時間進行思考或推理。
在 Q1 中要擬定報告方向,從中可見 DeepSeek 言詞犀利,注重文本隱喻、宗教與政治批判,透視角色轉變及社會現實;ChatGPT 回答的結構嚴謹、層次分明,從文學、文化到跨媒體傳播全方位論述《西遊記》成經典的原因;Gemini 發揮多模態模型優勢,風格平實詳盡,以故事魅力、人物塑造和文化傳播闡述經典魅力,並加入圖片輔助。
至於 Q2 中加入學術資料來佐證部分,三者各有側重,分別展現了系統整理、深層批評與綜合闡釋的不同取向。ChatGPT 會引用中國、台灣、香港等學術資料,著重在宗教融合與跨文化影響,而 Gemini 的內容平實詳盡,以浪漫主義色彩、大眾接受度為主要訴求,至於 DeepSeek 則會加入批判隱喻的角度,透過學術資料的多方論述,強調神怪內涵與敘事結構的獨特性。
而在 Q3 加入批判性思考的目的,是想透過反向思考來完整報告的不同面向。而從 Q1 及 Q2 的回答中,可見 DeepSeek 都已加入批判性思考的方向,因此在 Q3 的回答中,會更著重文本隱喻,內容更為艱澀;ChatGPT 則是結構嚴謹層次分明,從文學、文化到跨媒體傳播全方位論述。
Note 個人感想總結
● DeepSeek:透過學術資料的多方論述,強調神怪內涵與敘事結構的獨特性,特別是批判力度更為尖銳。
● ChatGPT:結構嚴謹、層次分明,從文學、文化到跨媒體傳播全方位論述,平衡引用中國、台灣、香港等學術資料。
● Gemini:發揮多模態優勢,風格平實詳盡,以故事魅力、人物塑造和文化傳播闡述經典魅力,並加入圖片輔助。
本文同步刊載於 PC home 雜誌
歡迎加入 PC home 雜誌粉絲團!
- 延伸閱讀:Intel推出新款Xeon 6處理器,強化AI運算效能與效益還能跑DeepSeek
- 延伸閱讀:黃仁勳親解 DeepSeek 疑慮:AI 後訓練才是關鍵,輝達晶片需求不減反增
- 延伸閱讀:Perplexity 開源 DeepSeek-R1 後訓練模型 R1 1776,可回答「受言論審查」的敏感議題
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!