我让谷歌的“自动浏览”AI代理接管Chrome。结果并不顺利-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

📢 转载信息

原文链接：https://www.wired.com/story/google-chrome-auto-browse-hands-on/

原文作者：Reece Rogers

我承认，我喜欢四处点击。所以，在测试谷歌Chrome的新的“自动浏览”（Auto Browse）功能时，我看着这个AI代理打开浏览器标签页并试图以自动化点击来完成数字任务时，心中产生了一种奇特的失落感。

当然，当机器人开始在我的笔记本屏幕上忙碌时，我确实感到一丝失控。但考虑到谷歌计划从根本上改变用户体验，我也对当前互联网（连同它的缺陷）的工作方式产生了一种先入为主的怀旧之情。

谷歌本周向订阅其AI Pro和AI Ultra套餐的美国用户发布了“自动浏览”功能。虽然初期是有限发布，但谷歌的核心主张似乎是最终对网络的重塑——前提是该机器人能成功赢得用户信任。一个由自动化浏览器机器人主导并根据它们的需求设计、代表人类点击的网络，与今天的用户体验相比，可能会显得非常陌生。然而，就目前而言，这些机器人似乎还太笨拙，不值得信赖。

放手……大部分时候

在新闻发布会上，谷歌分享了如何使用“自动浏览”的初始示例，包括预订门票、购买衣服和计划度假。周三下午，我打开Chrome浏览器，点击了召唤谷歌Gemini聊天机器人弹出侧边栏的小星形图标。这也是访问“自动浏览”的方式；由于我订阅了每月20美元的套餐，我以为我会在发布当天就能使用它。

当我通过在提示栏输入命令来让侧边栏的Gemini开始执行其第一个任务时，它只是模仿了操作，而没有真正控制我的浏览器。机器人说：“你会看到我打开和关闭标签页”，因为它“接管了我浏览器的导航”。但实际上并没有发生任何点击。

我很沮丧，于是我退出了我的谷歌账户并刷新了浏览器。在采取了这些额外步骤之后，我终于通过我的账户访问到了该工具。一个弹窗提供了一个选择加入的选项，上面显示了开启“自动浏览”的选项。如果你没有看到这个，你也可以通过进入设置并找到“让Chrome为你浏览”的切换开关来检查“自动浏览”是否可用。激活后，你发送到Gemini侧边栏的任何带有明确请求的提示都会自动触发“自动浏览”开始点击。

当我终于能够（真正地）试验“自动浏览”时，我采用了谷歌建议的数字家务作为起点，选择了对我自己的生活可能有帮助的在线任务。

在与生成式AI工具互动时，保持健康的怀疑和谨慎态度至关重要。谷歌甚至在其Gemini聊天机器人中内置了免责声明，提醒用户它会犯错。“自动浏览”工具更进了一步。每次“自动浏览”运行时，聊天机器人侧边栏都会显示持续文本：“请谨慎使用Gemini并在需要时接管控制权”。“Gemini在任务期间的行为由你负责。”

在你尝试之前，你还需要考虑与此类自动化相关的安全风险。生成式AI工具很容易受到恶意网站上的提示注入攻击的损害。这些攻击试图将机器人从其任务中转移开。谷歌“自动浏览”的潜在漏洞尚未经过外部研究人员的充分审查，但风险可能与其他接管你计算机的AI工具相似。

此外，如果你使用“自动浏览”进行购买，请格外小心。谷歌设置了安全措施，会将购买或在社交媒体上发帖等特定操作标记为敏感操作，需要用户批准才能继续。尽管如此，我对机器人的行为仍然不确定，并担心它可能给我的信用卡造成混乱，更不用说首先将财务信息交给它了。

这是我发送的第一个提示，信用卡拿在手上：

我想为今晚的SF交响乐团预订两张票。我不想付管弦乐团座位的钱，但票不一定是最低价的。请挑选两个靠过道的座位。

观看谷歌的AI代理在标签页中点击是有点奇怪的。首先，我看到它使用谷歌最新的模型Gemini 3，在侧边栏文本框中花了几秒钟来制定策略和定义目标，比如拿到交响乐团的两个靠过道座位。这个过程看起来很像聊天机器人使用“推理”模型，在进行下一步操作之前先回顾一下它可能采取的步骤。然后，点击开始了。机器人作为任务一部分所采取的每一步都会被记录下来供用户查看。

“自动浏览”在执行多步骤任务而不会分心方面的能力，明显优于我去年测试过的类似代理工具。它导航到了正确的网站，选择了正确的演出，并点击了多个座位区域来衡量可用性。日志中列出的所有内容似乎都是它实际执行的操作。

在处理交响乐团门票工作了几分钟后，机器人停止了点击。我收到通知，要求我接管并按下“立即订购”按钮。乍一看，AI工具似乎很快地完成了我所要求的事情。

但如果我毫不怀疑地订购了“自动浏览”为约会选择的两个交响乐团座位，那么这个夜晚很可能会以我的男朋友让我睡沙发而告终。

Courtesy of Google

谷歌的机器人遵循了我的确切指示，但太过精确了。它选择了价值185美元的侧边包厢座位，这些座位靠过道且不在管弦乐团区域内。那么，有什么问题呢？这两张票是分开的。

我的伴侣不会和我并排坐着，而是会坐在我的后面，看着我的光头，同时听着协奏曲。这是一种常识性的决定，我甚至没有考虑到要将其包含在给机器人的提示中。回读我的指示时，回顾一下就清楚了这次沟通是如何出错的。

这时，我有点手忙脚乱，于是我接管了操作，并购买了另一个更便宜区域的两个实际上相邻的座位。与节省我的时间和精力相反，“自动浏览”反而给我制造了更多的工作。

接下来，我想看看“自动浏览”会如何为我搭配服装。我让它在一个二手服装平台上找一件夹克：

我想让你在Depop上为我找一件漂亮的皮夹克，要适合XL码的男性。把三个不同的选项放入我的购物车，并为你的每一个时尚选择进行论证。

机器人在访问Depop网站后，搜索了“男士皮夹克”并将尺寸筛选设置为XL。“自动浏览”将搜索结果中的前三个夹克加入了我的购物车，并在完成任务前对每一个夹克生成了一段论述。

该工具在此购物任务上的表现比上一个任务要好。其中一件皮夹克价格40美元，看起来还不错。尽管如此，选择前三个搜索结果并不能让人相信它做出了任何质量判断。它确实为我节省了一些打字时间，我很感激，但“自动浏览”在购物车中提供多样化选项方面并没有真正做什么。

最后，我希望在2026年能更经常地去露营作为我的假期时间。嗯，等旧金山再次变暖就行。这是我发送的最后一个提示：

我正在寻找四月或五月可以预订的两人帐篷露营地。想住四个晚上，最好是周末。露营地必须在旧金山三小时车程内。给我五个可靠的选择，并说明选择的理由。

作为一个更详细的请求，这个任务的处理时间要长得多，几乎花了整整15分钟。即使花费了更多时间，结果也是半吊子的。“自动浏览”只检查了位于Point Reyes的一个露营地的帐篷露营位是否真的有空位，然后建议我去Reserve California网站上查找其他选项的空位情况。自动化可真是“自动化”啊！

后点击时代网络

Chrome是迄今为止世界上最受欢迎的浏览器，因此谷歌做出的哪怕是微小的改变都可能颠覆用户体验网络的方式。而目前，谷歌似乎正下定决心要用生成式AI工具来改变你的日常点击习惯。

这项努力通常涉及为了效率而将用户从第一手体验中剥离出来。搜索中的AI概览功能总结了许多你没有访问过的网站的信息。Gmail中的Gemini集成可以生成对你只是匆匆浏览过的电子邮件的回复。“自动浏览”则试图在没有你逐步指导的情况下选择正确的活动座位。

不过，如果我盲目地根据某个机器人的建议做出错误的购买或决定，最终要承担后果的还是我。“自动浏览”目前缺乏我完全依赖它作为我日常生活工具所需的准确性。

此外，这个初始版本的“自动浏览”能够执行浏览的许多技术层面。然而，它缺乏浏览器的“精神”。

你说什么？你只是选择了Depop搜索结果中的前三个列表？一个真正的冲浪者绝对不会这么做。他们会滚动几分钟，只是为了找到几个略有不同的选择，然后偶然发现一个他们之前从未考虑过的“野生卡”选项。

我在互联网的偏僻角落里漫无目的的探索旅程当然不是最高效的。但对我来说，它们仍然是令人愉快的，我永远不想把这份快乐完全外包给一个浏览器机器人。未来，生成式AI可能只在微小的任务中发挥作用。或者它可能会重写我们上网的整个基础。无论发生什么，我都会继续点击。

🚀 想要体验更好更全面的AI调用？

欢迎使用青云聚合API，约为官网价格的十分之一，支持300+全球最新模型，以及全球各种生图生视频模型，无需翻墙高速稳定，文档丰富，小白也可以简单操作。

目录CONTENT

我让谷歌的“自动浏览”AI代理接管Chrome。结果并不顺利

放手……大部分时候

后点击时代网络

评论区