目 录CONTENT

文章目录

我让谷歌的“自动浏览”AI代理接管Chrome。结果并不顺利

Administrator
2026-01-31 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.wired.com/story/google-chrome-auto-browse-hands-on/

原文作者:Reece Rogers


我承认,我喜欢四处点击。所以,在测试谷歌Chrome的新的“自动浏览”(Auto Browse)功能时,我看着这个AI代理打开浏览器标签页并试图以自动化点击来完成数字任务时,心中产生了一种奇特的失落感。

当然,当机器人开始在我的笔记本屏幕上忙碌时,我确实感到一丝失控。但考虑到谷歌计划从根本上改变用户体验,我也对当前互联网(连同它的缺陷)的工作方式产生了一种先入为主的怀旧之情。

谷歌本周向订阅其AI Pro和AI Ultra套餐的美国用户发布了“自动浏览”功能。虽然初期是有限发布,但谷歌的核心主张似乎是最终对网络的重塑——前提是该机器人能成功赢得用户信任。一个由自动化浏览器机器人主导并根据它们的需求设计、代表人类点击的网络,与今天的用户体验相比,可能会显得非常陌生。然而,就目前而言,这些机器人似乎还太笨拙,不值得信赖。

放手……大部分时候

在新闻发布会上,谷歌分享了如何使用“自动浏览”的初始示例,包括预订门票、购买衣服和计划度假。周三下午,我打开Chrome浏览器,点击了召唤谷歌Gemini聊天机器人弹出侧边栏的小星形图标。这也是访问“自动浏览”的方式;由于我订阅了每月20美元的套餐,我以为我会在发布当天就能使用它。

当我通过在提示栏输入命令来让侧边栏的Gemini开始执行其第一个任务时,它只是模仿了操作,而没有真正控制我的浏览器。机器人说:“你会看到我打开和关闭标签页”,因为它“接管了我浏览器的导航”。但实际上并没有发生任何点击。

Courtesy of Google

我很沮丧,于是我退出了我的谷歌账户并刷新了浏览器。在采取了这些额外步骤之后,我终于通过我的账户访问到了该工具。一个弹窗提供了一个选择加入的选项,上面显示了开启“自动浏览”的选项。如果你没有看到这个,你也可以通过进入设置并找到“让Chrome为你浏览”的切换开关来检查“自动浏览”是否可用。激活后,你发送到Gemini侧边栏的任何带有明确请求的提示都会自动触发“自动浏览”开始点击。

当我终于能够(真正地)试验“自动浏览”时,我采用了谷歌建议的数字家务作为起点,选择了对我自己的生活可能有帮助的在线任务。

在与生成式AI工具互动时,保持健康的怀疑和谨慎态度至关重要。谷歌甚至在其Gemini聊天机器人中内置了免责声明,提醒用户它会犯错。“自动浏览”工具更进了一步。每次“自动浏览”运行时,聊天机器人侧边栏都会显示持续文本:“请谨慎使用Gemini并在需要时接管控制权”。“Gemini在任务期间的行为由你负责。”

在你尝试之前,你还需要考虑与此类自动化相关的安全风险。生成式AI工具很容易受到恶意网站上的提示注入攻击的损害。这些攻击试图将机器人从其任务中转移开。谷歌“自动浏览”的潜在漏洞尚未经过外部研究人员的充分审查,但风险可能与其他接管你计算机的AI工具相似。

此外,如果你使用“自动浏览”进行购买,请格外小心。谷歌设置了安全措施,会将购买或在社交媒体上发帖等特定操作标记为敏感操作,需要用户批准才能继续。尽管如此,我对机器人的行为仍然不确定,并担心它可能给我的信用卡造成混乱,更不用说首先将财务信息交给它了。

这是我发送的第一个提示,信用卡拿在手上:

我想为今晚的SF交响乐团预订两张票。我不想付管弦乐团座位的钱,但票不一定是最低价的。请挑选两个靠过道的座位。

观看谷歌的AI代理在标签页中点击是有点奇怪的。首先,我看到它使用谷歌最新的模型Gemini 3,在侧边栏文本框中花了几秒钟来制定策略和定义目标,比如拿到交响乐团的两个靠过道座位。这个过程看起来很像聊天机器人使用“推理”模型,在进行下一步操作之前先回顾一下它可能采取的步骤。然后,点击开始了。机器人作为任务一部分所采取的每一步都会被记录下来供用户查看。

“自动浏览”在执行多步骤任务而不会分心方面的能力,明显优于我去年测试过的类似代理工具。它导航到了正确的网站,选择了正确的演出,并点击了多个座位区域来衡量可用性。日志中列出的所有内容似乎都是它实际执行的操作。

在处理交响乐团门票工作了几分钟后,机器人停止了点击。我收到通知,要求我接管并按下“立即订购”按钮。乍一看,AI工具似乎很快地完成了我所要求的事情。

但如果我毫不怀疑地订购了“自动浏览”为约会选择的两个交响乐团座位,那么这个夜晚很可能会以我的男朋友让我睡沙发而告终。

Courtesy of Google

谷歌的机器人遵循了我的确切指示,但太过精确了。它选择了价值185美元的侧边包厢座位,这些座位靠过道且不在管弦乐团区域内。那么,有什么问题呢?这两张票是分开的。

我的伴侣不会和我并排坐着,而是会坐在我的后面,看着我的光头,同时听着协奏曲。这是一种常识性的决定,我甚至没有考虑到要将其包含在给机器人的提示中。回读我的指示时,回顾一下就清楚了这次沟通是如何出错的。

这时,我有点手忙脚乱,于是我接管了操作,并购买了另一个更便宜区域的两个实际上相邻的座位。与节省我的时间和精力相反,“自动浏览”反而给我制造了更多的工作。

接下来,我想看看“自动浏览”会如何为我搭配服装。我让它在一个二手服装平台上找一件夹克:

我想让你在Depop上为我找一件漂亮的皮夹克,要适合XL码的男性。把三个不同的选项放入我的购物车,并为你的每一个时尚选择进行论证。

机器人在访问Depop网站后,搜索了“男士皮夹克”并将尺寸筛选设置为XL。“自动浏览”将搜索结果中的前三个夹克加入了我的购物车,并在完成任务前对每一个夹克生成了一段论述。

该工具在此购物任务上的表现比上一个任务要好。其中一件皮夹克价格40美元,看起来还不错。尽管如此,选择前三个搜索结果并不能让人相信它做出了任何质量判断。它确实为我节省了一些打字时间,我很感激,但“自动浏览”在购物车中提供多样化选项方面并没有真正做什么。

最后,我希望在2026年能更经常地去露营作为我的假期时间。嗯,等旧金山再次变暖就行。这是我发送的最后一个提示:

我正在寻找四月或五月可以预订的两人帐篷露营地。想住四个晚上,最好是周末。露营地必须在旧金山三小时车程内。给我五个可靠的选择,并说明选择的理由。

作为一个更详细的请求,这个任务的处理时间要长得多,几乎花了整整15分钟。即使花费了更多时间,结果也是半吊子的。“自动浏览”只检查了位于Point Reyes的一个露营地的帐篷露营位是否真的有空位,然后建议我去Reserve California网站上查找其他选项的空位情况。自动化可真是“自动化”啊!

后点击时代网络

Chrome是迄今为止世界上最受欢迎的浏览器,因此谷歌做出的哪怕是微小的改变都可能颠覆用户体验网络的方式。而目前,谷歌似乎正下定决心要用生成式AI工具来改变你的日常点击习惯。

这项努力通常涉及为了效率而将用户从第一手体验中剥离出来。搜索中的AI概览功能总结了许多你没有访问过的网站的信息。Gmail中的Gemini集成可以生成对你只是匆匆浏览过的电子邮件的回复。“自动浏览”则试图在没有你逐步指导的情况下选择正确的活动座位。

不过,如果我盲目地根据某个机器人的建议做出错误的购买或决定,最终要承担后果的还是我。“自动浏览”目前缺乏我完全依赖它作为我日常生活工具所需的准确性。

此外,这个初始版本的“自动浏览”能够执行浏览的许多技术层面。然而,它缺乏浏览器的“精神”

你说什么?你只是选择了Depop搜索结果中的前三个列表?一个真正的冲浪者绝对不会这么做。他们会滚动几分钟,只是为了找到几个略有不同的选择,然后偶然发现一个他们之前从未考虑过的“野生卡”选项。

我在互联网的偏僻角落里漫无目的的探索旅程当然不是最高效的。但对我来说,它们仍然是令人愉快的,我永远不想把这份快乐完全外包给一个浏览器机器人。未来,生成式AI可能只在微小的任务中发挥作用。或者它可能会重写我们上网的整个基础。无论发生什么,我都会继续点击。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区