ADVERTISEMENT
Google 旗下人工智慧實驗室 DeepMind 宣布推出全新 AI 系統 AlphaEvolve,目標針對具備「可機器評分」特性的問題進行最佳化求解。根據官方說法,AlphaEvolve 已成功應用於 Google 內部 AI 訓練基礎架構的優化任務,並將開放給部分研究人員進行早期測試。
自我評估機制,減少 AI「幻覺」現象
當前主流 AI 模型普遍面臨「幻覺問題」(hallucination),即模型可能生成看似合理但實際錯誤的答案。這一點在如 GPT-3 等大型語言模型中尤為明顯,甚至因其架構複雜,幻覺發生機率反而更高。
DeepMind 為此引入一項創新機制:自動評估架構。AlphaEvolve 不僅產生多種候選答案,還能自行對這些答案進行篩選與打分,最終挑出最準確的解法,某種程度上具備「自我糾錯」能力。
ADVERTISEMENT
這類技術並非首次出現,DeepMind 早在幾年前就曾於數學問題中運用類似方法,不過官方強調,AlphaEvolve 內建的是新一代 Gemini 模型,效能遠超先前系統。
適用範圍有限 僅針對可公式化問題
雖然技術聽起來突破性十足,但 AlphaEvolve 有明顯限制:
ADVERTISEMENT
-
系統只能處理「可公式化自我評估」的問題,因此僅適用於如電腦科學、最佳化理論、演算法設計等領域。
-
最終輸出結果只能是演算法或數學表示,不適用於開放性或非結構性問題(如語言理解、政策推論等)。
用戶在使用 AlphaEvolve 時,除了輸入問題本身外,還需提供對應的評估標準,通常以數學公式或可計算條件定義,讓系統能自動判斷解法優劣。
成果初現:75% 重現最佳解、20% 提出改進
在內部測試中,DeepMind 讓 AlphaEvolve 解題約 50 題,範圍涵蓋幾何、組合數學等領域,系統能在 75% 的題目中「重新發現」現有最優解,並在 20% 的案例中進一步提出改良版本。
此外,AlphaEvolve 也被應用在 Google 實際業務中,如提升資料中心效能、加速模型訓練等任務。據 DeepMind 表示,這套系統所提出的資源調度演算法,已為 Google 回收了 全球約 0.7% 的運算資源,並讓 Gemini 模型的訓練時間縮短了 1%。
ADVERTISEMENT
尚未實現突破性創新,但已具實用價值
需要強調的是,目前 AlphaEvolve 尚未做出前所未見的重大發現。舉例來說,系統在針對 Google TPU 加速晶片的優化提案中,其建議內容其實早已由其他內部工具標記過。
不過 DeepMind 強調,AlphaEvolve 的價值在於大幅節省專家處理重複性任務的時間,讓人類研究者能更專注於策略規劃與創新發展,並期望該技術未來可成為輔助科研的關鍵夥伴。
ADVERTISEMENT