据动察 Beating 监测,谷歌正在 Gemini 网页版内测一个名为「Gemini Spark」的 24 小时全时 AI Agent。开发者 @mrfanduuuuu 今天在 X 上截图曝光了它的引导页面,标注为 BETA 状态,预计将在 5 月 19 日 I/O 大会主题演讲上正式亮相。 Spark 的核心卖点是「用得越多越懂你」。它会从已连接的 Google 应用、技能模块、聊天记录、定时任务、已登录网站、Personal Intelligence(谷歌今年 1 月上线的个人数据整合功能)和位置信息中提取上下文,替用户执行收件箱管理、网页操作、表单填写、购物下单等多步骤任务。执行过程中,Gemini 会将用户的姓名、联系方式、文件、偏好等信息分享给第三方。 但引导页的风险警告相当直白:Spark 仍是实验性产品,虽然设计上会在敏感操作前征求许可,但它可能在不经确认的情况下分享用户信息或直接完成购买。为保持会话连续性,系统还会保存远程浏览器数据,包括登录凭证和远程代码执行数据。用户可在设置中清除这些数据并关闭 Connected Apps。 据 TestingCatalog 报道,Spark 的前身是内部代号「Remy」的 Gemini Agent 升级版,此前仅面向 AI Ultra 订阅用户开放。同日泄露的信息还包括一个名为「Spark Robin」的新模型(描述为「Rich Visual Response」),以及 Gemini 模型选择器中新增的「MCP Tool Testing」分类,暗示 Spark 将接入第三方工具生态。 谷歌此时推出全时 Agent,直接对标 Anthropic 即将发布的托管 Agent Conway 和 OpenAI 的 Agent 平台。三家的竞争焦点已经从「谁的模型更聪明」转向「谁能替用户干更多活」。
查看原文 >