Google 在現正進行中的 I/O 大會(Google I/O 2026)上更新多項技術進展與產品。
2026 年的 Google I/O 正式宣告 AI 進入「代理人時代(Agentic Era)」,Google 透過硬體基礎設施(第 8 代 TPU 8t/8i)與高性價比模型(Gemini 3.5 Flash)築起護城河,並將 AI 從「被動問答的聊天機器人」轉化為「能聽懂語音、會看影片、並在背景幫你處理複雜工作流」的實用生產力工具。
亮點一:對話式 AI 帶入日常工具
Google 逐步將對話式 AI 整合至各項產品中,Maps 近期更新加入了 Ask Maps 功能,方便使用者輸入較長且複雜的詢問。接下來,Ask YouTube 功能也將展開測試,可依據使用者興趣推薦影片,並直接跳轉至最相關的片段,預計今年夏天在美國市場擴大推出。

在文件處理方面,語音模型技術的進展帶來了 Docs Live 功能,使用者不需要輸入文字提示詞,只需透過口頭講述,系統就能自動生成並編輯文件內容,Docs Live 預計今年夏天開放給訂閱用戶,相關的語音功能後續也將導入 Gmail 與 Keep。
硬體基礎設施方面,Google 持續投入建置成本,2022 年的年度資本支出為 310 億美元,今年預計將增加至 1,800 億到 1,900 億美元。新發表的第 8 代張量處理器(TPU)首次採用雙晶片架構,區分為負責訓練的 TPU 8t 與負責推理的 TPU 8i。TPU 8t 的原始算力為前代晶片的近 3 倍,並搭配 JAX 和 Pathways 架構,支援全球超過 100 萬個 TPU 跨數據中心協同訓練,將大型模型的訓練時間縮短至數週,TPU 8i 則專注於降低推理延遲。兩款晶片均提升了能源效率,每瓦效能表現達前代的 2 倍。
亮點二:Gemini Omni 登場,跨模態「虛擬現實」影片生成
新發表的 Gemini Omni 模型具備強大的「世界理解(World understanding)」能力,能從任何輸入模態中直接生成各種輸出樣式,首波開放以影片輸出為主(未來將加入影像與文字),新系列的首款模型 Gemini Omni Flash 即日起於 Gemini 應用程式、Google Flow 和 YouTube Shorts 上線,未來幾週內將透過 API 開放給開發者與企業客戶。
SynthID 水印大擴展,OpenAI、Nvidia 聯手組國家隊
針對生成式 AI 的透明度與真實性,Google 升級了隱形浮水印技術 SynthID,目前已應用於超過 1,000 億張圖片與影片,以及 6 萬小時的音訊內容,使用者可透過 Gemini 應用程式中的 SynthID 檢測器驗證內容。
此外,Google 正在 Search 和 Chrome 擴大導入內容憑證驗證,標示影像是由 AI 生成或由相機拍攝,在產業合作上,繼 Nvidia 之後,OpenAI、Kakao 和 Eleven Labs 也宣布加入採用 SynthID 技術。

亮點三:Gemini 3.5 Flash 發表
全新推出的 Gemini 3.5 Flash 模型兼顧了運算速度與效率,在多項基準測試中,Gemini 3.5 Flash 的表現高於 3.1 Pro,特別是在程式編碼與真實經濟任務評估(GDPVal)方面。
Gemini 3.5 Flash 的每秒輸出 Token 速度為同等級模型的 4 倍,且運算成本不到同級模型的一半,在 Google 內部測試中,將 3.5 Flash 搭配代理開發平台 Antigravity 使用,內部 AI 開發工具每日處理的 Token 數量已超過 3 兆個,企業若將 80% 的工作負載轉移至 3.5 Flash,預計每年可降低顯著的營運成本,Gemini 3.5 Flash 即日起於所有產品與 API 開放,而規格更高的 Gemini 3.5 Pro 則預計於下個月推出。

亮點四:Antigravity 2.0 與 Gemini Spark,打造 AI 代理生態系
同時,開發平台升級為 Antigravity 2.0 獨立桌面應用程式,讓使用者建立與管理多個自主 AI 代理(AI Agents),並提供速度提升 12 倍的優化版 Flash 模型,等於從單純的開發環境升級為獨立的桌面應用程式,成為開發與管理「自主 AI 代理群」的中央控制台。
Gemini Spark 亮相,全天候個人 AI 代理
Google 發表重量級個人 AI 代理(Agent):Gemini Spark,由 Gemini 3.5 與 Antigravity 架構驅動,運行於雲端專屬虛擬機器,因此即便是筆電關閉,也能 24 小時在背景執行長週期的複雜任務,將率先整合 Google 自家工具,隨後透過 MCP 串聯第三方工具,下週將向美國的 Google AI Ultra 訂閱用戶推出 Beta 版,夏天更將直接進駐 Chrome 瀏覽器。
其他產品線更新
Google 同時公布了其他 AI 代理與硬體進展:
-
Daily Brief:將整合至 Gemini 應用程式,整理收件匣、行事曆和任務,自動編排優先順序並提供後續行動建議。
-
Google Flow:今日向所有用戶推出新代理功能,協助專案腦力激盪、創作與編輯,並支援在平台內編寫程式以設計視訊特效、手繪動畫或文字圖層。
-
Google Pics:新款影像創作與編輯工具,基於 Nano Banana 模型開發。系統將影像中的每個元素視為獨立物件,方便使用者調整、替換或修正畫面細節,目前已開放給測試人員,夏天將提供給 Workspace 的 Google AI Pro 和 Ultra 訂閱用戶。
-
智慧眼鏡:包含提供語音協助的語音眼鏡,以及可顯示即時資訊的顯示眼鏡,使用者可直接透過語音呼叫 Gemini 協助。其中語音眼鏡將率先於今年秋天推出。
Google CEO Sundar Pichai 表示,目前在 AI 發展週期中,使用者更著重於日常應用的實質價值,根據統計,Google 模型每月處理的 Token 數量呈現顯著成長,兩年前全平台每月處理 9.7 兆個 Token,去年 I/O 大會成長至約 480 兆個,而目前每月處理量已超過 3.2 百萬大兆(quadrillion),年成長率達 7 倍。目前每月有超過 850 萬名開發者使用 Google 模型建立應用程式,模型 API 每分鐘處理約 190 億個 Token,過去 12 個月內,有超過 375 家 Google Cloud 客戶各自處理了超過 1 兆個 Token。

在用戶規模方面,Google 目前有 13 款產品各擁有超過 10 億名使用者,其中 5 款產品的使用者超過 30 億名。搭載生成式 AI 的 Search 功能中,AI Overviews 每月活躍用戶數已超過 25 億名,而 AI Mode 在推出一年後,每月活躍用戶數也超過 10 億名。當使用者在搜尋中採用 AI 功能時,搜尋形式會轉變為連續性的對話互動。另外,Gemini 應用程式的每月活躍用戶數從去年的 4 億名成長至今年的 9 億名以上,日處理請求量成長超過 7 倍。透過 Nano Banana 影像生成模型,至今已產生超過 500 億張圖片。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!