
Google 今日正式推出 Gemini 2.5 Pro 的「升級預覽版」,預計未來幾週內將全面上線。這次的更新是基於 5 月初於 I/O 開發者大會亮相的 2.5 Pro 版本進一步優化,特別在程式處理能力上有明顯提升。
根據 Google 公布,這次 6 月 5 日更新的模型在多項評測中持續維持領先地位,包含 AIDER Polyglot 等跨語言基準測試,並在「GPQA」與「Humanity's Last Exam(HLE)」這類強調數學、科學知識與邏輯推理的嚴格評測中也交出頂尖成績。
這次更新版的 2.5 Pro 在多項評測中表現更進一步,像是在 LMArena 智能模型排行榜上進步 24 分 Elo 分數,總分達 1470,繼續穩坐榜首;在 WebDevArena 的分數也上升 35 分,來到 1443,同樣拿下第一。
過去幾次模型更新中,部分使用者反映 Gemini 在非程式相關任務的表現有所下滑,特別是與 3 月的 03-25 版本相比。對此 Google 表示,在程式能力方面,2.5 Pro 繼續在像 Aider Polyglot 這類高難度的程式碼測試中表現亮眼。它在數學、科學、知識推理等極具挑戰性的標準測試(像是 GPQA 和 Humanity’s Last Exam)中,也有頂尖水準的表現。
針對上次版本的回饋,Google 也針對模型的表達方式與回答格式做了優化,現在的回應更具創意、格式也更清楚。
開發者從今天起就可以透過 Google AI Studio 和 Vertex AI 的 Gemini API 使用這個升級預覽版本,此外還新增「思考預算」功能,讓開發者能更靈活控制成本與延遲表現。Gemini App 也同步開放使用這個新版本。
- 延伸閱讀:DeepSeek 被疑使用 Google Gemini 訓練資料,被抓包推理軌跡以及語言風格太近似質疑為「AI 蒸餾」
- 延伸閱讀:Google 強化 Gemini 2.5 模型,2.5 Pro 表現橫掃榜單、Deep Think 開啟推理新境界
- 延伸閱讀:Gemini 2.5 Pro 推出 Deep Think 增強型推理模式,強化編程與多模態表現
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!