Google I/O 2026 懶人包：Omni 影片生成、Gemini 3.5 系列模型、代理式 AI

Google 在現正進行中的 I/O 大會（Google I/O 2026）上更新多項技術進展與產品。

2026 年的 Google I/O 正式宣告 AI 進入「代理人時代（Agentic Era）」，Google 透過硬體基礎設施（第 8 代 TPU 8t/8i）與高性價比模型（Gemini 3.5 Flash）築起護城河，並將 AI 從「被動問答的聊天機器人」轉化為「能聽懂語音、會看影片、並在背景幫你處理複雜工作流」的實用生產力工具。

亮點一：對話式 AI 帶入日常工具

Google 逐步將對話式 AI 整合至各項產品中，Maps 近期更新加入了 Ask Maps 功能，方便使用者輸入較長且複雜的詢問。接下來，Ask YouTube 功能也將展開測試，可依據使用者興趣推薦影片，並直接跳轉至最相關的片段，預計今年夏天在美國市場擴大推出。

在文件處理方面，語音模型技術的進展帶來了 Docs Live 功能，使用者不需要輸入文字提示詞，只需透過口頭講述，系統就能自動生成並編輯文件內容，Docs Live 預計今年夏天開放給訂閱用戶，相關的語音功能後續也將導入 Gmail 與 Keep。

硬體基礎設施方面，Google 持續投入建置成本，2022 年的年度資本支出為 310 億美元，今年預計將增加至 1,800 億到 1,900 億美元。新發表的第 8 代張量處理器（TPU）首次採用雙晶片架構，區分為負責訓練的 TPU 8t 與負責推理的 TPU 8i。TPU 8t 的原始算力為前代晶片的近 3 倍，並搭配 JAX 和 Pathways 架構，支援全球超過 100 萬個 TPU 跨數據中心協同訓練，將大型模型的訓練時間縮短至數週，TPU 8i 則專注於降低推理延遲。兩款晶片均提升了能源效率，每瓦效能表現達前代的 2 倍。

亮點二：Gemini Omni 登場，跨模態「虛擬現實」影片生成

新發表的 Gemini Omni 模型具備強大的「世界理解（World understanding）」能力，能從任何輸入模態中直接生成各種輸出樣式，首波開放以影片輸出為主（未來將加入影像與文字），新系列的首款模型 Gemini Omni Flash 即日起於 Gemini 應用程式、Google Flow 和 YouTube Shorts 上線，未來幾週內將透過 API 開放給開發者與企業客戶。

延伸閱讀：Gemini Omni Flash 登場，支援文字、圖片與影片輸入的 AI 影片生成工具

SynthID 水印大擴展，OpenAI、Nvidia 聯手組國家隊

針對生成式 AI 的透明度與真實性，Google 升級了隱形浮水印技術 SynthID，目前已應用於超過 1,000 億張圖片與影片，以及 6 萬小時的音訊內容，使用者可透過 Gemini 應用程式中的 SynthID 檢測器驗證內容。

此外，Google 正在 Search 和 Chrome 擴大導入內容憑證驗證，標示影像是由 AI 生成或由相機拍攝，在產業合作上，繼 Nvidia 之後，OpenAI、Kakao 和 Eleven Labs 也宣布加入採用 SynthID 技術。

亮點三：Gemini 3.5 Flash 發表

全新推出的 Gemini 3.5 Flash 模型兼顧了運算速度與效率，在多項基準測試中，Gemini 3.5 Flash 的表現高於 3.1 Pro，特別是在程式編碼與真實經濟任務評估（GDPVal）方面。

Gemini 3.5 Flash 的每秒輸出 Token 速度為同等級模型的 4 倍，且運算成本不到同級模型的一半，在 Google 內部測試中，將 3.5 Flash 搭配代理開發平台 Antigravity 使用，內部 AI 開發工具每日處理的 Token 數量已超過 3 兆個，企業若將 80% 的工作負載轉移至 3.5 Flash，預計每年可降低顯著的營運成本，Gemini 3.5 Flash 即日起於所有產品與 API 開放，而規格更高的 Gemini 3.5 Pro 則預計於下個月推出。

亮點四：Antigravity 2.0 與 Gemini Spark，打造 AI 代理生態系

同時，開發平台升級為 Antigravity 2.0 獨立桌面應用程式，讓使用者建立與管理多個自主 AI 代理（AI Agents），並提供速度提升 12 倍的優化版 Flash 模型，等於從單純的開發環境升級為獨立的桌面應用程式，成為開發與管理「自主 AI 代理群」的中央控制台。

Gemini Spark 亮相，全天候個人 AI 代理

Google 發表重量級個人 AI 代理（Agent）：Gemini Spark，由 Gemini 3.5 與 Antigravity 架構驅動，運行於雲端專屬虛擬機器，因此即便是筆電關閉，也能 24 小時在背景執行長週期的複雜任務，將率先整合 Google 自家工具，隨後透過 MCP 串聯第三方工具，下週將向美國的 Google AI Ultra 訂閱用戶推出 Beta 版，夏天更將直接進駐 Chrome 瀏覽器。

延伸閱讀：Google Gemini 推出 Gemini 3.5 Flash、Gemini Spark，擴大 AI 助理功能

其他產品線更新

Google 同時公布了其他 AI 代理與硬體進展：

Daily Brief：將整合至 Gemini 應用程式，整理收件匣、行事曆和任務，自動編排優先順序並提供後續行動建議。
Google Flow：今日向所有用戶推出新代理功能，協助專案腦力激盪、創作與編輯，並支援在平台內編寫程式以設計視訊特效、手繪動畫或文字圖層。延伸閱讀：Google Flow 與 Google Flow Music 更新，加入 Gemini Omni 與 AI 創作代理功能
Google Pics：新款影像創作與編輯工具，基於 Nano Banana 模型開發。系統將影像中的每個元素視為獨立物件，方便使用者調整、替換或修正畫面細節，目前已開放給測試人員，夏天將提供給 Workspace 的 Google AI Pro 和 Ultra 訂閱用戶。
智慧眼鏡：包含提供語音協助的語音眼鏡，以及可顯示即時資訊的顯示眼鏡，使用者可直接透過語音呼叫 Gemini 協助。其中語音眼鏡將率先於今年秋天推出。延伸閱讀：Google 跟三星開發的智慧眼鏡要來了！不只能聽還會看資訊

Google CEO Sundar Pichai 表示，目前在 AI 發展週期中，使用者更著重於日常應用的實質價值，根據統計，Google 模型每月處理的 Token 數量呈現顯著成長，兩年前全平台每月處理 9.7 兆個 Token，去年 I/O 大會成長至約 480 兆個，而目前每月處理量已超過 3.2 百萬大兆（quadrillion），年成長率達 7 倍。目前每月有超過 850 萬名開發者使用 Google 模型建立應用程式，模型 API 每分鐘處理約 190 億個 Token，過去 12 個月內，有超過 375 家 Google Cloud 客戶各自處理了超過 1 兆個 Token。

在用戶規模方面，Google 目前有 13 款產品各擁有超過 10 億名使用者，其中 5 款產品的使用者超過 30 億名。搭載生成式 AI 的 Search 功能中，AI Overviews 每月活躍用戶數已超過 25 億名，而 AI Mode 在推出一年後，每月活躍用戶數也超過 10 億名。當使用者在搜尋中採用 AI 功能時，搜尋形式會轉變為連續性的對話互動。另外，Gemini 應用程式的每月活躍用戶數從去年的 4 億名成長至今年的 9 億名以上，日處理請求量成長超過 7 倍。透過 Nano Banana 影像生成模型，至今已產生超過 500 億張圖片。