根據外媒報導,Google 正準備為 Gemini 在 macOS 上導入具備「代理(agent)」能力的功能,讓 AI 不僅能對話,還能直接操作電腦,甚至協助整理檔案,與 Claude Cowork 正面競爭。
目前 macOS 版 Gemini 主要提供兩項功能,包括類似網頁版的原生聊天介面,以及透過快捷鍵隨時呼叫 Gemini。後者的一大優勢是可分享當前視窗,讓 AI 取得使用者正在進行任務的畫面脈絡。
不過,從 9to5Google APK Insight 團隊的深入分析來看,Google 計畫進一步擴展 Gemini 在 Mac 上的應用,加入「代理驅動的電腦操作」能力。這類功能與近來推出的 Claude Cowork 類似,可直接接管電腦,協助完成特定任務。
報導中也揭示了幾個 Gemini 代理的應用範例,例如:
- 將本機檔案轉換為試算表:掃描資料夾(如發票或報告),擷取資料並整理成 Google Sheets
- 自動整理資料夾:找出桌面或下載資料夾中的雜亂檔案,依類型或內容分類並歸檔
- 標準化檔案命名:讀取檔案中繼資料,批次重新命名並建立有條理的資料夾結構
- 會議後續整理:擷取最近一次 Google Meet 的逐字稿或文件內容,自動撰寫重點與待辦事項的跟進郵件
其中前三項功能,明顯聚焦於本機檔案管理,並與 Google Workspace 生態(如 Sheets)整合;背後則是透過螢幕存取(Screen Access)與輔助功能(Accessibility),讓 Gemini 能「看到」畫面並操作滑鼠與鍵盤。至於最後一項,則延伸至 Google Meet、Google Docs 與 Gmail 等服務,強化跨應用工作流程。
整體來看,這些功能顯示 Google 正試圖讓 Gemini 成為真正能「代勞」工作的 AI 助手。相較之下,目前 Android 上的 Gemini 僅能在少數裝置(如 Samsung Galaxy S26 series)中執行簡單的應用操作,例如訂餐等任務。
報導指出,Google 其實早在去年推出 Gemini 2.5「Computer Use」預覽時,就已嘗試類似的代理式操作。如今若這些功能正式登上 macOS,將使 Gemini 更接近完整的 AI 工作代理,並為深度使用 Google Workspace 的企業用戶帶來更高生產力。
資料來源:9to5Google
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!