FB 建議貼文

選取貼文複製成功(包含文章連結)!

GPT-5 全面登場,到底與GPT-4差在哪裡?網路評測揭五大亮點:推理更精準、程式能力大躍進

GPT-5 全面登場,到底與GPT-4差在哪裡?網路評測揭五大亮點:推理更精準、程式能力大躍進

美國 AI 巨擘 OpenAI 昨(7)日發表全新旗艦模型 GPT-5,並同步開放給所有 ChatGPT 用戶與開發者使用。如果你今天打開ChatGPT,應該已經看到全面更新了。

官方宣稱這是迄今「最聰明、最快速、最實用」的版本,不過,實際上到底與前版有甚麼不同?根據多家外媒與實測者指出,GPT-5 在推理準確度、長文理解、程式開發能力與工具調用等面向都有顯著進步,被形容「像隨身帶著一組博士團隊」。

五大「明顯能感受到的不同」變化

如果你問的還是一般的問題,或許覺得差異不大。從目前的資料來看,GPT-5與先前版本最大的進步可以歸納為以下幾點,你可以在這些方面試試看,應該可以明顯感受到不同:

  1. 推理更精準、錯誤率下降
    在數理、科學與法務等需要嚴謹推理的任務中,GPT-5 的正確率高於前代,且在事實查核測試中誤差減少約八成。

  2. 長文處理能力躍升
    支援超大上下文視窗,能一次處理長達數十萬字的內容,對書籍、年度會議紀錄或多篇研究文件的整合與比對更加穩定。

  3. 程式開發更高可用度
    從多檔案除錯、前端切版到 API 串接,GPT-5 的一次到位率明顯提升,生成的前端介面在美感與可讀性上更佳,適合非工程背景使用者快速做出雛形。

  4. 工具與代理(Agent)任務更可靠
    能自行規劃步驟、串接外部工具並完成多階段任務,例如自動搜尋資料、整理成圖表,再生成完整報告。

  5. 操作體驗優化
    內建自動路由與自訂回應風格,並提供標準版、mini、nano 等不同版本,讓使用者依需求靈活切換。

小編有把之前用Gemini CLI寫的專案拿來丟給GPT-5,問他CLI一直沒有解決的問題,結果GPT-5的回答還真的直中核心,解決了先前沒有解決的問題。

GPT-5 全面登場,到底與GPT-4差在哪裡?網路評測揭五大亮點:推理更精準、程式能力大躍進

 

語音能力也更進化,升級更全面

在語音互動方面,GPT‑5 帶來了實質升級。根據現有報導,它引入了多款預設語音風格,例如「冷嘲型」、「理性型」、「傾聽型」、「學霸型」等,除了語調更自然,也提升了情感感知的能力,使用者還能自行調整語速與語氣。這些語音預設讓 GPT‑5 更貼近人類語感,甚至被稱作「學語言的良伴」。

不只語音,「性格」也可以調整。你到設定中的自訂,也可以看到可以調整你的GPT的「性格」。

GPT-5 全面登場,到底與GPT-4差在哪裡?網路評測揭五大亮點:推理更精準、程式能力大躍進

此外,OpenAI 也同步推出全新的 Advanced Voice Mode,這是 ChatGPT 現有語音系統的重大優化。這個模式更具回應彈性且支援高度客製化,目前已成為付費用戶的標準選項,Free 用戶也將獲得更長時段的使用額度。

組合拳威力將更強

值得注意的是,GPT-5 不僅自身性能升級,若與 OpenAI 及其他平台現有功能結合,威力將進一步放大。

像是最近推出的包括代理程式模式(Agent Mode),能讓 AI 自行規劃與執行多步驟任務;再加上深度研究(Deep Research)等長時間、跨資料來源的分析工具,搭配此次五大核心升級,尤其是長達十萬字的內容處理能力,意味著使用者可以一次完成從資料蒐集、內容生成到成果輸出的「全自動流程」。

這種「組合拳」不只會加速企業內部自動化,也可能改變新聞撰寫、商業分析與軟體開發的工作型態,讓 AI 從輔助角色進一步成為專案的核心驅動力。

網路評價:比 GPT-4 更穩、更少出錯

相較前一代,GPT-5 在新聞寫作、技術解說與法規查核等場景中更穩定,長文本記憶與線索追蹤能力進步明顯;在程式產能上,無論是框架選型、元件拆解還是 CSS 細節調整,都能給出更貼近實際需求的結果。此外,GPT-5 在「搜尋→抓資料→產圖表→寫結論」等一條龍流程中,出錯率大幅下降。

美國科技媒體 The Verge 評價,GPT-5 的速度與跨任務處理表現比上一代更流暢,且透過自動路由讓用戶不必煩惱選模型;不過專家也提醒,它仍不具備自主學習的「通用人工智慧(AGI)」能力。

路透社則分析,GPT-5 對產業有望提升 AI 生產力與投資回收率,微軟目前也已經將其全面整合至 Copilot 服務。

多數實測使用者回報,GPT-5 在事實錯誤率(俗稱「幻覺」)上明顯下降,遇到不確定資訊時更願意直接說「不知道」,回覆更值得信賴。

OpenAI 表示,GPT-5 經過更長時間的安全測試,對醫療、法務等高風險領域有更嚴格的限制。專家提醒,雖然幻覺率降低,但仍非零錯誤,用戶在關鍵決策前仍需人工驗證。

 

 

janus
作者

PC home雜誌、T客邦產業編輯,曾為多家科技雜誌撰寫專題文章,主要負責作業系統、軟體、電商、資安、A以及大數據、IT領域的取材以及報導,以及軟體相關教學報導。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則