FB 建議貼文

選取貼文複製成功(包含文章連結)!

據傳 Gemini 將導入 AI 代理功能,可直接操控 Mac、對標 Claude Cowork

據傳 Gemini 將導入 AI 代理功能,可直接操控 Mac、對標 Claude Cowork

根據外媒報導,Google 正準備為 Gemini 在 macOS 上導入具備「代理(agent)」能力的功能,讓 AI 不僅能對話,還能直接操作電腦,甚至協助整理檔案,與 Claude Cowork 正面競爭。

目前 macOS 版 Gemini 主要提供兩項功能,包括類似網頁版的原生聊天介面,以及透過快捷鍵隨時呼叫 Gemini。後者的一大優勢是可分享當前視窗,讓 AI 取得使用者正在進行任務的畫面脈絡。

不過,從 9to5Google APK Insight 團隊的深入分析來看,Google 計畫進一步擴展 Gemini 在 Mac 上的應用,加入「代理驅動的電腦操作」能力。這類功能與近來推出的 Claude Cowork 類似,可直接接管電腦,協助完成特定任務。

報導中也揭示了幾個 Gemini 代理的應用範例,例如:

  • 將本機檔案轉換為試算表:掃描資料夾(如發票或報告),擷取資料並整理成 Google Sheets
  • 自動整理資料夾:找出桌面或下載資料夾中的雜亂檔案,依類型或內容分類並歸檔
  • 標準化檔案命名:讀取檔案中繼資料,批次重新命名並建立有條理的資料夾結構
  • 會議後續整理:擷取最近一次 Google Meet 的逐字稿或文件內容,自動撰寫重點與待辦事項的跟進郵件

其中前三項功能,明顯聚焦於本機檔案管理,並與 Google Workspace 生態(如 Sheets)整合;背後則是透過螢幕存取(Screen Access)與輔助功能(Accessibility),讓 Gemini 能「看到」畫面並操作滑鼠與鍵盤。至於最後一項,則延伸至 Google Meet、Google Docs 與 Gmail 等服務,強化跨應用工作流程。

整體來看,這些功能顯示 Google 正試圖讓 Gemini 成為真正能「代勞」工作的 AI 助手。相較之下,目前 Android 上的 Gemini 僅能在少數裝置(如 Samsung Galaxy S26 series)中執行簡單的應用操作,例如訂餐等任務。

報導指出,Google 其實早在去年推出 Gemini 2.5「Computer Use」預覽時,就已嘗試類似的代理式操作。如今若這些功能正式登上 macOS,將使 Gemini 更接近完整的 AI 工作代理,並為深度使用 Google Workspace 的企業用戶帶來更高生產力。

資料來源:9to5Google

ycr
作者

PC home 雜誌、T 客邦編輯,也負責 T 客邦影新聞 YouTube 頻道影音製作。關注 AI 相關應用、產業趨勢等消息,並有軟體教學報導。(大頭貼為 AI 生成)

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則