商傳媒|責任編輯/綜合外電報導
Google 於週二舉行的 Google I/O 2026 年度開發者大會上,發表一系列重大人工智慧(AI)更新,其中核心策略是將 AI 從單純的問答工具,轉變為能自主完成任務的「智能代理人」。此次發布會聚焦於新的 Gemini 模型、個人化 AI 助理,以及對搜尋與開發者工具的全面提升。
新一代 Gemini 模型提升效能與效率
Google 正式推出 Gemini 3.5 Flash 模型,該模型在獨立的人工智慧分析指數(Artificial Analysis Intelligence Index)中獲得 55 分,與 Anthropic 的 Claude Opus 4.7 及 OpenAI 的 GPT-5.5 模型表現相近。值得注意的是,Gemini 3.5 Flash 的每 token 成本約為 GPT-5.5 的三分之一,且執行速度顯著提升。Google 強調,該模型能以約競爭模型四倍的輸出 token 速度運行,大幅降低操作成本。一個更強大的版本 Gemini 3.5 Pro 則預計於下個月推出。
智能助理 Gemini Spark 邁向自主化
Google 推出具備「全天候個人 AI 助理」能力的 Gemini Spark。這款 AI 代理能持續在 Google Cloud 上運行,即使使用者的筆記型電腦關閉或手機鎖定,也能在後台自主完成任務。Spark 可整合 Google Workspace 應用程式如 Gmail、Google文件(Docs)、Google簡報(Slides),並將在未來支援 Canva、OpenTable、Instacart 等第三方應用程式,甚至能連結 Chrome 進行網頁操作。例如,它能從電子郵件、文件、試算表等資料中提取資訊,為使用者起草電子郵件,或協助規劃活動。Gemini Spark 本週起已開放部分信任測試者使用,下週將針對美國地區的 Google AI Ultra 訂戶推出測試版。Google 也計畫推出名為 Agent Payments Protocol (AP2) 的支付系統,讓 AI 代理在使用者設定的授權範圍內進行安全購買。
多模態內容創作與強化搜尋體驗
此外,Google 還推出了 Gemini Omni 模型,首款版本 Omni Flash 已在 Gemini 應用程式、Google Flow 及 YouTube Shorts 上線。Gemini Omni 具備強大的多模態生成能力,能將文字、影像、音訊和影片作為輸入,生成高品質的影片內容,甚至可透過對話來編輯影片環境、角度或風格。在內容真偽方面,所有由 Gemini Omni 創建的影片都將嵌入隱形 SynthID 數位浮水印,並支援 Content Credentials 驗證功能,以標示內容來源是否為 AI 生成或經過 AI 編輯。
Google 搜尋(Search)服務也迎來 25 年來的最大升級,全新的 AI 智能搜尋框將更直觀,並動態擴展以支援文字、圖像、檔案、影片等多模態輸入。YouTube 也將推出「Ask YouTube」功能,讓使用者能以對話方式搜尋影片內容,並直接跳轉到影片中最相關的片段。Google文件(Docs Live)則新增了更多 Gemini 和語音驅動功能,今年夏季也將支援語音編輯。
AI 代理時代的願景與投資
Google 對 AI 代理時代的投入顯而易見。Google DeepMind 技術長 Koray Kavukcuoglu 指出,Gemini 3.5 Flash 的速度優勢,使其特別適合部署多個代理並完成長時間任務。Google 執行長皮蔡(Sundar Pichai)在大會上表示,Gemini 模型是 Google 產品使用者數量增長與使用頻率提高的關鍵因素,並預告 Google 已「堅定邁入 AI 代理的 Gemini 時代」。為支持這一願景,Google 預計今年將投入約 1800 億至 1900 億美元於資本支出和 AI 基礎設施,較 2022 年成長六倍。目前,Gemini 應用程式每月使用者已突破 9 億人。








