Google 釋出 Gemini 2.5 Pro 預覽版，程式處理能力大幅提升、數學、科學、知識推理評測表現突出

Google 今日正式推出 Gemini 2.5 Pro 的「升級預覽版」，預計未來幾週內將全面上線。這次的更新是基於 5 月初於 I/O 開發者大會亮相的 2.5 Pro 版本進一步優化，特別在程式處理能力上有明顯提升。

根據 Google 公布，這次 6 月 5 日更新的模型在多項評測中持續維持領先地位，包含 AIDER Polyglot 等跨語言基準測試，並在「GPQA」與「Humanity's Last Exam（HLE）」這類強調數學、科學知識與邏輯推理的嚴格評測中也交出頂尖成績。

這次更新版的 2.5 Pro 在多項評測中表現更進一步，像是在 LMArena 智能模型排行榜上進步 24 分 Elo 分數，總分達 1470，繼續穩坐榜首；在 WebDevArena 的分數也上升 35 分，來到 1443，同樣拿下第一。

過去幾次模型更新中，部分使用者反映 Gemini 在非程式相關任務的表現有所下滑，特別是與 3 月的 03-25 版本相比。對此 Google 表示，在程式能力方面，2.5 Pro 繼續在像 Aider Polyglot 這類高難度的程式碼測試中表現亮眼。它在數學、科學、知識推理等極具挑戰性的標準測試（像是 GPQA 和 Humanity’s Last Exam）中，也有頂尖水準的表現。