目 录CONTENT

文章目录

AI 浏览器表现如何?Perplexity 的 Comet 和 OpenAI 的 Atlas 体验一日评测

Administrator
2025-11-27 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.kdnuggets.com/are-ai-browsers-any-good-day-with-perplexity-comet-openai-atlas

原文作者:Shittu Olumide


Are AI Browsers Any Good? A Day with PerplexityImage by Author

 

理解 AI 浏览器的底层技术有助于解释其性能为何如此不均衡

引言

许多技术专家会告诉你,AI 浏览器是工作方式的未来。但现实远比这复杂得多。在与 Perplexity 的 CometChatGPT 的 Atlas 浏览器一起进行了数周的测试后,我发现了一些令人不安的事情。这些工具可以在特定的研究任务上为你节省时间,但对于任何复杂任务,它们都会崩溃。对于那些已经被打开的多个标签页搞得不知所措的数据科学家和分析师来说,这一点非常重要。但在你选择用 Chrome 替代 AI 浏览器之前,你需要了解这些工具实际上是做什么的,以及更重要的是,它们不能做什么。

理解 AI 浏览器

AI 浏览器听起来像是最好的浏览器,直到你真正使用它们。从核心上讲,它是一个网络浏览器,类似于 Chrome 或 Safari,但集成了一个人工智能(AI)助手到侧边栏中。这个助手可以读取你正在查看的任何网页、回答有关它的问题、总结文章,甚至尝试自动化任务——例如,填写表格或比较不同网站的价格。

Perplexity 的 Comet 与传统浏览器不同之处在于它可以同时理解多个标签页之间的上下文。如果你同时打开了研究论文、数据仪表板和竞争对手报告,Comet 的助手可以一起阅读所有这些内容并综合其发现。该浏览器基于 Chromium 构建,与 Google Chrome 使用相同的底层技术,因此它支持你已经在使用中的相同扩展程序。

 

Perplexity Comet Landing page
Image by Author

 

其关键卖点是自动化。Comet 助手位于一个侧边面板中,可以执行多标签页操作。你不再需要手动将数据从五个网站复制到电子表格中,只需让 Comet 为你完成即可。

在数据科学家的工作流程中应用 Comet

为了解 AI 浏览器是否对你的工作流程有意义,让我带你了解一下当一名数据科学专业人员使用 Comet 一天的工作中实际发生了什么。

利用 Comet 进行市场研究

如果研究人员需要关于机器学习平台的竞争数据,通常需要打开 10 到 15 个标签页,并将定价、功能和性能指标手动提取到一个电子表格中。

使用 Comet,研究人员创建了一个工作区(Comet 称之为 Space),并为六个竞争平台打开了标签页。然后他们向助手提问:

"创建一个包含平台名称、每月价格、免费套餐功能和最新更新日期的比较表。"

助手会同时读取所有六个网站,并在三分钟内提供一个格式正确的表格。这项任务手动操作大约需要 45 分钟。

利用 Comet 进行研究综合

接下来是分析三篇关于异常检测算法的学术论文。假设任务是提取关键的数学概念,比较方法论,并确定哪种方法最适合他们的数据集。

使用传统浏览,这意味着打开每个 PDF,阅读,做笔记,在标签页之间切换,并手动进行比较。他们要求 Comet:

"总结这三篇论文之间的核心数学差异,并根据它们对实时金融数据的适用性进行排名。"

助手综合了所有三个打开的论文,并提供了一个带有每篇来源直接引用的排名摘要。助手甚至理解了他们之前问题的上下文,因此它优先考虑了金融数据应用,而无需被要求两次。

通常需要 2 小时的人工操作时间。实际时间:18 分钟。

识别 Comet 在研究综合方面的局限性

这就是 Comet 出现问题的地方。他们需要助手自动从一个大量使用 JavaScript 的仪表板中提取数据,将其与 SQL 数据库进行验证,并标记不匹配项。这就是 AI 浏览器看似不再有用的地方。

Comet 无法正确地与动态仪表板交互。它试图点击按钮,但页面没有按预期响应。助手被交互元素搞糊涂了,然后放弃了。我们的研究人员不得不手动完成。

这是实情。AI 浏览器在读取和综合静态信息方面表现出色。它们在处理复杂、多步骤的现代 Web 应用程序交互时会遇到困难。

Comet 与 ChatGPT Atlas:选择哪一个?

如果你一直关注 AI 新闻,你就知道 OpenAI 发布了其自己的 AI 浏览器 ChatGPT Atlas。它在某些任务上的速度更快,但也有不同的局限性。

ChatGPT Atlas 在自动化方面更激进。在速度测试中,它在 47 秒内完成了一份研究简报,而 Comet 用了 58 秒。对于 CSV 提取,Atlas 明显更快,耗时 36 秒,而 Comet 用了 52 秒。
然而,Atlas 有一个关键弱点:它目前仅适用于 macOS。如果你的团队使用 Windows 或 Linux,你暂时无法使用它。

更重要的是,Atlas 被锁定在 OpenAI 生态系统内。如果你想将其用于其他工具或工作流程,那就没辙了。Comet 与 Perplexity Pro 集成,允许它与你现有的 AI 研究工作流程协同工作。

特别是对于数据科学家来说,选择取决于你的主要任务。如果你正在综合来自多个来源的信息,Comet 更好,因为它在标签页之间保持了更强的上下文感知能力。如果你正在自动化重复的表单填写或网络抓取任务,Atlas 可能会为你节省更多时间,但这仅限于你使用 Mac 的情况下。

性能差异不足以让任何一个浏览器变得必不可少。它们都有相同的根本限制:它们难以处理复杂、交互式的网站。

指标 Perplexity Comet ChatGPT Atlas Brave Leo
研究简报 (秒) 58 47 62
CSV 提取 (秒) 52 36 48
多步骤比较 (秒) 185 132 161
总体实用性 非常高

解释为什么 AI 浏览器会表现出不均衡的性能

理解底层技术有助于解释为什么 AI 浏览器会表现出如此不均衡的性能。

当你要求 AI 浏览器总结一个网页时,它会接收到完整的文本内容,并使用语言模型对其进行处理。这基本上就是 ChatGPT 所做的,只是处理的是单个网页而不是一个通用提示。对于这项任务,AI 确实很强大。

但是,当一个网站使用 JavaScript 动态加载内容时,一切都会出错。浏览器可以看到渲染后的页面,但 AI 不一定能确定哪些元素是可交互的、数据在哪里,或者如何正确触发动态内容。当 Comet 在下午的测试中尝试使用 JavaScript 仪表板时,它本质上是在尝试解决一个它没有被设计的谜题。

这不是 Comet 或 Atlas 特有的缺陷。这是现代 Web 应用程序工作方式的基本限制。在 AI 系统能够可靠地实时解释复杂的交互式界面之前,AI 浏览器在研究和阅读方面的用途将继续大于在自动化方面的用途。

解决 AI 浏览器的隐私和安全问题

这就是 AI 浏览器公司变得防守的地方。为了有用,AI 浏览器助手需要获得读取你的电子邮件、查看你的日历、访问你的联系人以及与你的账户交互的权限。Perplexity 和 OpenAI 需要广泛的访问权限才能真正实现其自动化承诺。

这种访问权限为攻击创造了机会。网络安全研究人员已经将一种称为提示词注入攻击的攻击类型识别为所有 AI 浏览器的系统性风险。工作原理如下:一个恶意的网站将其页面代码中隐藏的指令,诱骗 AI 采取不应该采取的操作。攻击者可能会操纵 Comet 暴露你的电子邮件或进行未经授权的购买。

目前还没有针对提示词注入的完全防御措施。这是一个新兴问题,整个行业都在努力解决。

对于处理敏感研究数据的数据科学家来说,在授予你的浏览器如此广泛的访问权限之前,值得考虑这一点。许多具有严格合规要求的组织(律师事务所、金融机构、医疗保健公司)会因为这种风险而不允许这些工具进入公司网络。

实际的生产力提升与真实的局限性

诚实的测试实际显示了以下内容。
AI 浏览器带来可衡量时间节省的任务包括:

  • 总结长文章或报告(每份文件节省 15 到 30 分钟)
  • 比较多个静态网站的信息(节省 30 到 60 分钟)
  • 从 PDF 中提取关键信息(节省 20 到 45 分钟)
  • 从多个来源创建研究表格(节省 30 到 60 分钟)

AI 浏览器表现不佳或失败的任务:

  • 处理大量使用 JavaScript 的仪表板或交互式 API
  • 执行需要动态决策的跨不同站点的多步骤复杂交互
  • 处理涉及敏感公司 API 或内部网络的任务

一位在 Reddit 上密集测试 Comet 的研究人员报告称,它实际上使他们的研究综合生产力提高了一倍,每天节省大约一小时。但这适用于从事信息密集型工作的人。对于常规网页浏览或处理复杂应用程序,时间节省就会消失。

Perplexity 的首席执行官声称 Comet 可以将生产力提高 20%,可能为 GDP 增加数万亿美元。这是风险投资的说法,而不是工程现实。现实世界的使用显示出更温和的收益——对于特定工作流程,大约节省 5% 到 10% 的时间,对于其他工作流程,则为零收益。

确定你是否应该切换到 AI 浏览器

诚实的答案是,这取决于你实际的工作流程。
如果你的工作主要涉及阅读、分析和综合来自多个在线源的信息,AI 浏览器将为你节省大量时间。进行文献综述、竞争分析或研究综合的数据科学家就属于这一类。

如果你的工作涉及与 Web 应用程序交互、填写表格或使用大量使用 JavaScript 的工具,最好坚持使用你当前的浏览器。AI 浏览器不会为你提供帮助,甚至可能拖慢你的速度。
成本也很重要。Comet 需要 Perplexity Pro Max 订阅,每月费用约为 20 美元。如果你每天在研究工作上节省了三十分钟,这大概就能收回成本。如果你每周节省了五分钟,那就不值得。

ChatGPT Atlas 目前在测试期间是免费的,但它可能最终需要付费。对于进行研究密集型工作的 macOS 用户来说,它可能会变得有价值。对于其他人来说,情况就不那么明确了。

考虑隐私、安全与令人不安的真相

在采用任何 AI 浏览器之前,你需要了解你正在权衡什么。
AI 浏览器需要将页面内容发送到云服务器进行处理。这意味着你正在查看的数据在被总结或分析之前会通过外部系统。对于大多数研究工作来说,这没问题。但对于敏感或专有信息来说,这是一个问题。

一些组织通过仅将 AI 浏览器用于公开研究,并将专有工作保留在传统浏览器中来处理这个问题。这是合理的,但这也有点违背了拥有 AI 浏览器的初衷。

提示词注入攻击的风险是真实存在的,但如果你运用常识,它不会立即造成灾难性后果。不要使用 AI 浏览器代理与高风险网站(例如银行门户或敏感的公司系统)进行交互。将它们用于研究、分析和信息综合,在那里出错的负面影响相对较低。

结论

总而言之,AI 浏览器不会消失,但它们在短期内不会取代传统浏览器。技术将会改进。JavaScript 应用程序的性能问题可能会得到改善。新的安全标准最终会解决提示词注入攻击问题。

现在重要的是将工具与任务相匹配。对于数据科学家来说,最好的实际用例正是我们测试的内容:综合来自多个来源的研究信息。这是 AI 浏览器真正提供可衡量生产力提升,同时又不损害安全性或处理过多复杂性的领域。

如果你每周花费数小时阅读、比较和综合信息,可以测试 Comet 或 Atlas 一周。节省的时间本身可能就值回了成本。如果你的工作主要侧重于应用程序或涉及复杂的交互式任务,请省下钱,坚持使用你已知的有效工具。
 
 

Shittu Olumide 是一名软件工程师和技术撰稿人,热衷于利用尖端技术来构建引人入胜的叙事,对细节有敏锐的洞察力,并擅长简化复杂的概念。你也可以在 Twitter 上找到 Shittu。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区