FB 建議貼文

選取貼文複製成功(包含文章連結)!

Google 釋出 Gemini 2.5 Pro 預覽版,程式處理能力大幅提升、數學、科學、知識推理評測表現突出

Google 釋出 Gemini 2.5 Pro 預覽版,程式處理能力大幅提升、數學、科學、知識推理評測表現突出

Google 今日正式推出 Gemini 2.5 Pro 的「升級預覽版」,預計未來幾週內將全面上線。這次的更新是基於 5 月初於 I/O 開發者大會亮相的 2.5 Pro 版本進一步優化,特別在程式處理能力上有明顯提升。

根據 Google 公布,這次 6 月 5 日更新的模型在多項評測中持續維持領先地位,包含 AIDER Polyglot 等跨語言基準測試,並在「GPQA」與「Humanity's Last Exam(HLE)」這類強調數學、科學知識與邏輯推理的嚴格評測中也交出頂尖成績。

Google 釋出 Gemini 2.5 Pro 預覽版,程式處理能力大幅提升、數學、科學、知識推理評測表現突出

這次更新版的 2.5 Pro 在多項評測中表現更進一步,像是在 LMArena 智能模型排行榜上進步 24 分 Elo 分數,總分達 1470,繼續穩坐榜首;在 WebDevArena 的分數也上升 35 分,來到 1443,同樣拿下第一。

過去幾次模型更新中,部分使用者反映 Gemini 在非程式相關任務的表現有所下滑,特別是與 3 月的 03-25 版本相比。對此 Google 表示,在程式能力方面,2.5 Pro 繼續在像 Aider Polyglot 這類高難度的程式碼測試中表現亮眼。它在數學、科學、知識推理等極具挑戰性的標準測試(像是 GPQA 和 Humanity’s Last Exam)中,也有頂尖水準的表現。

 

Google 釋出 Gemini 2.5 Pro 預覽版,程式處理能力大幅提升、數學、科學、知識推理評測表現突出

針對上次版本的回饋,Google 也針對模型的表達方式與回答格式做了優化,現在的回應更具創意、格式也更清楚。

開發者從今天起就可以透過 Google AI Studio 和 Vertex AI 的 Gemini API 使用這個升級預覽版本,此外還新增「思考預算」功能,讓開發者能更靈活控制成本與延遲表現。Gemini App 也同步開放使用這個新版本。

 

 

janus
作者

PC home雜誌、T客邦產業編輯,曾為多家科技雜誌撰寫專題文章,主要負責作業系統、軟體、電商、資安、A以及大數據、IT領域的取材以及報導,以及軟體相關教學報導。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則