📢 转载信息
原文链接:https://sspai.com/post/103275
原文作者:_xy
引言
随着 AI 在数字生活中越来越重要,我的日常早已被某种数字节律所驯化。屏幕前,二十几个浏览器标签页像一排排摊开的思维碎片,记录着注意力的漂移轨迹。每当我面对一段晦涩的文本、一份待提炼的报告,或一封需要仔细推敲的邮件,身体几乎自动执行一套仪式:选中、复制、切换到那永远置顶的 ChatGPT 标签页,粘贴、编辑提示词、等待回应,然后再将答案搬回原处。这套流程,乍看高效,却暗藏一种难以察觉的能量损耗:数字摩擦。它像在两条平行的铁轨间搬运货物,每一次换轨都需要额外的注意力与时间。
最大限度地消除这种摩擦的工具,到来了。那就是万众期待的 ChatGPT Atlas。
前几天,我读到一篇用户体验笔记,作者做了一个令人警醒的统计:昨天,我数了数自己手动将网页内容翻译给 AI 的 73 次,如果每次耗时 15 秒,那我一天有 18 分钟耗在机械切换上。他说,ChatGPT Atlas 让这一切的繁琐彻底消失了。
OpenAI 于 2025 年 10 月 21 日发布了 ChatGPT Atlas,这不是一个浏览器插件,而是一个完整的 AI 原生浏览器,旨在从根本上重新思考人们与网络交互的方式。这是 OpenAI 首次进入浏览器市场,CEO Sam Altman 称其为「十年一遇的机会,重新思考浏览器的本质」。然而,仅在发布 24 小时内,这款产品就引发了激烈的两极化反应——既有对未来浏览方式的兴奋期待,也有对安全隐私的严重担忧。
ChatGPT Atlas 并非又一个浏览器市场的搅局者,也不是一次简单的功能迭代。我认为,Atlas 代表着一次对浏览器角色的根本性反思:它试图将浏览器从一个被动展示信息的窗口,转变为一个能够理解上下文、拥有记忆、并能主动执行任务的认知伙伴。这不仅仅是在浏览器里内置一个 AI,而是让 AI 的意识弥漫在整个浏览体验中,成为一种无处不在的环境智能。
作为一位已经对 Chrome、Safari、Firefox 产生疲劳感的数字产品爱好者,我想早日感受到,当浏览器开始「会思考」后,上网会发生怎样的变化。
ChatGPT 无处不在
始终在场的 AI 助手侧边栏
Atlas 的核心设计理念是让 ChatGPT 成为浏览体验的原生组成部分。每个标签页旁边都有一个常驻侧边栏,ChatGPT 随时待命,自动获取当前网页的上下文信息,这消除了传统工作流中在浏览器和 ChatGPT 之间复制粘贴内容的摩擦。用户可以直接询问关于当前网页的问题,无需手动提供上下文,还可以用对话式命令控制浏览器:「重新打开昨天的旅行网站」、「关闭我的食谱标签」、「清理我的标签」。
让 ChatGPT 明白用户正在看什么,实际上解决了我们日常浏览的一个痛点。过去经常需要来回复制网页内容给 ChatGPT 看,现在这个侧边栏彻底消除了这些繁琐步骤。例如,我在打开百度时,每次我都会简单一瞥百度热搜。此时,我可能会突然想看一看这些搜索都在关注什么方面,我只需打开侧边栏直接问:帮我分析百度热搜的全部榜单,附带简要分析。ChatGPT 立刻将搜索主题分布、趋势洞察、情绪结构整理给我,还提供了背景信息。一气呵成,中间没有「复制-切换-粘贴」的反复操作,体验非常顺畅。再比如,我在豆瓣中打开我很感兴趣的电影,看到了多篇冗长的电影评论。此时我可以让 ChatGPT 直接帮我完成「查看这部电影的所有影评,并给我总结影评内容」。
Atlas 还将这种协作体验,进一步微缩到了你的光标之上。无论你是在 Gmail 里撰写邮件,在电商网站上填写评论,还是在任何网页的表单里输入文字,只要你高亮选中文本,一个精巧的 ChatGPT 图标就会浮现,为你提供重写、润色或续写等帮助。
这个被称为「光标聊天」或「行内写作辅助」的功能,将 AI 从一个审阅者的角色,变成了共同创作者。我不再需要先写完草稿,再去另一个地方寻求 AI 的修改建议。AI 的智能实时融入了你的创作过程,这是一种更细微、但可能更深刻的人机协作模式。
内置 ChatGPT 助手让 Atlas 摆脱了传统浏览器那种「你看你的,我答我的」。取而代之的是一种对话式的浏览体验:人和浏览器的界限开始模糊,浏览器不再只是被动呈现网页,而更像一个主动参与对话的搭档。
这彻底消除了前文提到的「数字摩擦」。我不再需要扮演信息搬运工的角色,在不同的标签页之间复制粘贴。AI 不再是你需要特意拜访的目的地,而是变成了与你一同穿行于网络世界的旅伴,这种无缝集成,是 Atlas 区别于市面上绝大多数 AI 工具的核心优势。但 OpenAI 的真正赌注在于,通过打造一个原生的浏览器,它可以完全掌控用户体验的每一个细节,将 AI 能力无缝地编织进浏览器的底层架构中。这种原生集成带来的流畅感,正是它说服用户离开 Chrome 生态系统的关键筹码。
AI 记住你的浏览轨迹
有了侧边聊天还不够,Atlas 进一步引入了浏览器记忆功能(Browser Memory),让 ChatGPT 能记住你的浏览上下文,从而提供更个性化的帮助。虽然我还没有足够的时间深入测试这一特性,但从官方展示与初步体验来看,它的工作方式非常直观:当浏览器记忆开启后,Atlas 会在后台保存你访问过的网站摘要,以及你与 ChatGPT 的对话简要记录。这样,当你日后再次与 ChatGPT 交流时,它可以根据这些记忆调用过往信息。
举个例子,假如我上周在电商挑选过键鼠外设,或者浏览过 Bilibili、Youtube 的键鼠评测视频,那么理论上,只需一句话——「帮我回顾我比较中意的键鼠搭配」,ChatGPT 就能调出这些页面的要点,生成一份趋势总结。对于经常做研究或信息整理的人来说,这种上下文记忆的能力,意味着 ChatGPT 不再只是即时答复工具,而更像一位能接续思路的研究助理。
从描述来看,Atlas 的记忆系统不仅在被动查询时发挥作用,还会主动提出关联建议。例如,在浏览几篇产品评测后,侧边栏可能提示:要不要我帮你生成对比表?或者在新标签页上出现类似提醒:要继续昨天没读完的文章吗?——这类交互让浏览体验显得更贴心、更智能。
不过,浏览器记忆也自然引发隐私顾虑。Atlas 在这一点上采取了较为稳妥的设计:用户可随时查看、删除或归档浏览记忆,清除浏览历史后,相关的浏览器记忆也会同步清除。此外,地址栏还有一个「ChatGPT 可见性开关」,可针对特定网站关闭内容访问。例如,当访问网银或含隐私内容的页面时,关闭可见性后,ChatGPT 不会读取页面内容,也不会保存相关摘要。官方说明中还强调,Atlas 默认不会将浏览内容用于模型训练,除非用户明确选择同意。
Agent 模式:自主执行多步任务的 AI 代理
OpenAI 在早些时候,就已经在 ChatGPT 中推出了 Agent Mode(代理模式),让 AI 能够跨多步执行任务,例如浏览网页、汇整资料、生成报告。这项功能标志着从「对话式 AI」向「行动型 AI」的过渡。Atlas 浏览器的发布,则让这一概念进入更高层级。它将代理模式深度嵌入浏览器环境中,让 ChatGPT 不仅能规划任务,还能直接在网页上动手执行。Atlas 版 Agent Mode 展示了真正的端到端执行力,这意味着,用户不再是操控浏览器的人,而是可以让 AI 代劳大部分重复性操作。
然而,赋予 AI 行动权也带来了新的风险。OpenAI 在 Atlas 中引入多重安全边界:在执行关键操作前会征求用户确认,并始终提供清晰可见的接管控制与停止按钮;在金融机构、网银等敏感站点上,AI 会自动暂停;同时,它被禁止运行本地代码、下载文件、安装扩展或访问其他应用与密码数据。这些机制让 AI 的行动可被看见、可被中断、可被撤销。
尽管如此,代理模式仍处于早期阶段。安全研究员 Simon Willison 指出,这项功能存在高隐私风险与提示注入(Prompt Injection)隐患,性能也偏慢,「就像看着一个第一次用鼠标的人在学习操作电脑」。
Atlas 官方也提示这是一个预览版功能,尤其在涉及复杂、多步骤的任务时,AI 可能会出错或无从下手。媒体的测试反馈也印证了这一点:无论是 Perplexity 的 Comet 还是 OpenAI 的 ChatGPT 代理,在简单任务上表现不错,但处理真正复杂的事情时还有心有余而力不足的感觉。
代理模式从 ChatGPT 主界面进化到 Atlas 浏览器,并非多了什么按钮,而是 AI 第一次被允许在真实网页中执行行为。它从文字回答者,变成了能感知、能操作的助手——也许笨拙,这正是人机协作关系的一次深刻重塑。
竞品比较:Atlas 与 Comet、浏览器 AI 扩展
对比 Comet:搜索达人 vs 全能助手
在 AI 原生浏览器这个新兴的赛道上,ChatGPT Atlas 和 Perplexity Comet 无疑是最耀眼的两位选手。它们都怀揣着重塑互联网入口的野心,但通往未来的路径却截然不同。它们的差异,源于两家公司基因深处的不同哲学。
Atlas,诞生于 OpenAI,一个以构建通用人工智能为使命的公司,其核心哲学是行动与代理。它将浏览器视为一个待办事项列表,AI 的角色是你的私人助理,核心任务是替你完成工作(Let me do it for you)。
而 Comet,源自以 AI 搜索引擎闻名的 Perplexity,其核心哲学是研究与合成。它将浏览器视为一个知识工作台,AI 的角色是你的研究伙伴,核心任务是帮你理解世界(Let me help you understand it)。这种根本性的哲学差异,体现在产品的每一个细节中。
| 维度 | Atlas | Comet |
|---|---|---|
| 核心哲学 | 行动导向的代理(生产力工具) | 知识合成的引擎(研究工具) |
| 核心功能 | Agent Mode(任务自动化) | AI 驱动的搜索与引用生成 |
| 主要应用场景 | 委托任务、在线购物、行程规划 | 学术研究、新闻分析、深度报告 |
| 用户界面 | 对话式侧边栏 | 工作区与面板化布局 |
| 记忆模型 | 通用型(个性化整个助理) | 上下文型(聚焦单个项目) |
| 理想用户 | 忙碌的职场人、高效的行动派 | 研究者、分析师、深入的思考者 |
从这张对比表中我们可以清晰地看到,Atlas 和 Comet 并非简单的同质化竞争,它们服务于两种截然不同的用户。
- 功能层面:Atlas 的撒手锏是能动手的 Agent Mode,而 Comet 的强项在于提供带有精确来源引用的、高度整合的搜索答案。
- 界面层面:Atlas 沿用了类似 Chrome 的熟悉布局,配上一个常驻的对话侧边栏 。而 Comet 则采用了极简的、以工作区为核心的界面,你可以为不同的研究项目创建独立的上下文环境。
- 记忆层面:Atlas 的浏览器记忆是全局性的,旨在全面了解你的偏好,让 AI 在所有任务中都更懂你。而 Comet 的持久意图记忆则是项目制的,它只在特定的工作区内记住你的目标,确保研究的连贯性和深度。
所以,选择 Atlas 还是 Comet,与其说是在选择一个更好的工具,不如说是在选择一种更适合自己的工作流。如果你每天的大部分时间都在处理具体的事务性工作——预订、购物、填表,那么 Atlas 的「代理哲学」可能更吸引你。而如果你是一个需要深度阅读、分析信息、并产出结构化知识的思考者,Comet的「研究哲学」或许更能打动你。
对比 Atlas 与浏览器扩展
Monica、Sider 和 MaxAI 等浏览器扩展曾是不少用户体验 AI 辅助浏览的主要途径。这些工具以插件形式嵌入浏览器,为网页阅读和内容创作提供了便利。用户可以在任意网页旁召唤对话框,请 AI 总结页面要点或润色文本,减少在浏览器和 ChatGPT 间来回切换的摩擦。然而,与 Atlas 这种「AI 原生」浏览器相比,插件方案在整合深度和智能连贯性上仍有差距。
Atlas 在 AI 功能的整合程度上更为深入。它不仅能回答问题,还能借助代理模式直接执行多步操作,为用户代劳完成任务。这种端到端的自动化是传统扩展难以实现的。这些浏览器扩展更像工具箱,提供网页摘要、内容改写等实用功能,但仍需用户手动参与,无法自主跨网站操作,偏重辅助而非替代人工。在功能广度上,不少扩展支持调用多个模型(ChatGPT、Claude、Bard 等)甚至 AI 绘图,给用户更多选择;Atlas 则专注深度融合 OpenAI 模型,让浏览操作由 AI 驱动,体验更流畅一致。
Atlas 会自动将当前页面内容纳入对话上下文,并通过浏览器记忆记录浏览要点。当日后询问相关主题时,它能调出过去的信息,使对内容的理解持续积累。相比之下,浏览器扩展通常要在用户触发后才分析页面,每次回答都依赖即时获取的信息。插件的记忆局限于当下对话,缺少 Atlas 那样跨网页、跨时段的持久记忆能力。当你重启浏览器或更换设备,再用插件时,它并不了解你之前的上下文。Atlas 则犹如一位长期陪伴的知情助手,在不同网页间始终了解用户意图。它还会根据你正在浏览的内容提出下一步建议,这种对上下文的主动感知是许多扩展所不具备的。
对大多数人来说,安装插件比更换浏览器要省事。Monica、Sider 等扩展即装即用,无需离开熟悉的浏览环境,初次上手门槛很低。然而在日常使用中,插件增加了一层操作:每个页面都得手动点击图标唤出 AI 对话框。相比之下,Atlas 把 AI 无缝融入浏览器:ChatGPT 始终静候在侧边栏,随时可以提问;当你在输入框选中文本时,AI 助手图标自动出现。习惯 Atlas 之后,每次与 AI 的交互都顺畅直观,无需频繁切换工具。当然,这种便利是以放弃原有浏览器生态为代价。对于偏好即插即用的人,插件依然是快捷的选择;而追求深度融合体验的人,Atlas 则展现出近乎无摩擦的未来浏览图景。
综上,Atlas 体现的是「自下而上」重塑浏览器的理念,让 AI 融入浏览器的灵魂;而 Monica 等扩展属于「自上而下」的改良方案,在现有浏览器上加装 AI 助手。前者带来一体化的新式浏览体验,后者则便利地强化了用户已有的习惯。
交互的未来:当思考延伸至浏览器
人机交互设计的创新与妥协
Atlas 最引人注目的革新在于将对话置于浏览体验的中心,而非传统的 URL 地址栏或搜索框。打开 Atlas,新标签页默认呈现的是 ChatGPT 聊天输入框,用户本能地想提出问题,而不是输入网址。将 AI 助手设计为始终在场的侧边栏,ChatGPT 时刻待命。这种始终在线的陪伴式设计,大大降低了使用 AI 的心理门槛。当然,这种常驻也带来了屏幕空间的妥协:侧边栏占据一定宽度,对于习惯全屏浏览的人来说,始终可见的聊天窗可能成为一种干扰,需要时间去适应。
Atlas 进一步打破应用边界,在文本输入框内提供了直接调用 AI 的能力。当用户在 Gmail 中撰写邮件或在网页表单中填写内容时,只需选中文本,一个 ChatGPT 光标图标便会出现,提供重写、润色或续写的建议。这种被称为「光标聊天」的功能让 AI 真正嵌入到了用户输入的行内。
Atlas 的内联 AI 助手正是如此:当用户需要改进文字时,AI 的协助按钮自然地出现在文本附近。AI 不再是一个外部工具,而成为创作过程中的共同作者,让人机协作更加微妙却紧密。
Atlas 将浏览器的很多功能暴露为对话式接口,ChatGPT 会利用浏览器记忆去检索相关页面。当前的一问一答流程,更适合直线式的指令,对需要中途修改计划或并行处理的情境支持不足。这意味着在 Atlas 上进行复杂操作时,可能需要将任务分解为一系列顺次的对话,这对一些高级用户来说是一种限制。
为了让用户在享受 AI 便利的同时保持自主权,Atlas 提供了细致入微的隐私控制选项。浏览器记忆可以一键开关,用户也可以随时查看、删除或归档保存的浏览摘要;地址栏有站点级别的 ChatGPT 可见性切换,允许针对特定网站禁用内容读取。这些设计都体现了对用户数据自主权的尊重,Atlas 选择给予用户充分的控制,但也要求用户具备相应的理解和管理能力。
浏览方式的范式转变与现实阻力
Atlas 显示了从「搜索引擎时代」向「AI 环境时代」转变的曙光。传统的上网流程往往是:用户心中产生问题,想出关键词,在搜索引擎查询,浏览结果列表,点击一个个链接获取信息。而在 Atlas 中,这一流程被极大地简化为:用户直接提出问题,Atlas 即给出汇总的解答并附上引用来源,用户再根据需要深入提问或点击引用。
当答案直接由 AI 提供,用户不再频繁点击原始网站,这对内容生态的影响不容小觑。网站作者和内容创作者担心,精心创作的内容可能被 AI 摘取要点,在聊天窗口直接展示给用户,却换不来流量和广告收益。这让人产生一个不安的疑问:如果用户可以不访问网页就获取答案,谁还愿意投入大量精力生产优质内容?
随着 Atlas 等 AI 浏览器兴起,整个平台的激励机制可能被改变——高质量内容的价值或将越来越依赖于能否被 AI 正确引用和呈现,而非传统的点击率。如果说搜索引擎时代已让部分媒体尝过被截流的苦头,那么 AI 驱动的浏览器可能让这种截流更隐蔽却影响更深远:浏览器学习用户喜好,在不惊动用户的情况下把所需信息奉上一站式解决。
Atlas 的浏览器记忆功能,把认知外包推向了一个新高度。从前,我们常常需要费心记住「在哪里看过某段资料」并反复搜索,现在只需询问 Atlas,ChatGPT 就能根据浏览器记忆调出相关页面要点,生成对比汇总。这意味着,我们开始将回忆和整理这类思考任务外包给 AI。这种能力提升了信息检索和整理的效率,但也带来了对技术依赖的加深。正如依赖 GPS 导航久了,会削弱我们的方向感和规划路径的能力,过度依赖 Atlas 的记忆,我们可能懒于主动记忆和整理信息。
Atlas 引入的代理模式,让浏览器从用户掌舵的工具变成了可代劳任务的代理人。目前的代理模式技术远未成熟,复杂一些的任务往往仍让 AI 无所适从。一些安全研究者也对这种代理提出警告:如果用户只是坐在后座上袖手旁观,AI 有可能因为提示注入等攻击而误入歧途,给出危险的操作。这就是 Atlas 团队在设计中反复强调「人在回路」的原因——执行关键步骤前征求确认、随时可暂停接管等等。然而在实际体验中,代理模式的表现还比较笨拙,有测试者形容它就像看着一个新手慢吞吞地学用鼠标。当我们的工具开始会做事甚至会思考,我们更需要主动思考如何与之相处。在享受效率红利的同时,仍需保持警惕和掌控,防止自己在不知不觉中退化为一个被动接受结果的旁观者。
结语
ChatGPT Atlas 是在把 AI 嵌入到浏览器之中?还是 ChatGPT 扩展了网页浏览功能?这两者的界线都已被 Atlas 模糊。它并非给浏览器简单装上插件,而是让浏览器从被动的工具变成了能理解用户、主动协作的思考伙伴。这种转变给用户带来了前所未有的便利。AI 助手始终在线,用户不必再在多个标签页间来回切换,信息获取变得像与伙伴对话一样自然。无论是分析网页内容还是执行繁琐任务,一切都更加流畅省心,许多人因此看到了数字生活进一步提速的前景。
与此同时,Atlas 引发的担忧也不容忽视。有人担心当 AI 直接给出答案时,内容创作者的劳动得不到应有回报;也有人警惕过度依赖 Atlas 的记忆功能会让人丧失主动整理信息的习惯。更现实的是,Atlas 的代理模式目前仍不够成熟,偶尔的出错和对隐私的潜在影响提醒着人们:这种革新需要更稳健的技术和规范来护航。作为 OpenAI 的一次大胆尝试,Atlas 重新思考了浏览器的角色,也开启了人机互动的新想象。它能否真正改变大众的上网方式还有待时间检验,但至少为浏览器的未来提供了一个值得探索的新方向。
AI 辅助创造声明
本文在创作过程中部分使用了 AI 工具辅助,包括事实检索和结构建议等。所有生成结果均已逐项核查,确保内容准确、合规并具备个人原创性。如有疏漏,欢迎指正。
> 关注 少数派小红书 ,感受精彩数字生活 🍃
> 实用、好用的 正版软件 ,少数派为你呈现 🚀
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区