作者:Boxu Li

介绍 ChatGPT Atlas – 新时代的 AI 驱动浏览器

OpenAI 推出了 ChatGPT Atlas,这是一款围绕其流行的 ChatGPT 聊天机器人构建的人工智能驱动的网络浏览器。Atlas 于 2025 年 10 月 21 日宣布,标志着 OpenAI 在长期由谷歌 Chrome 和其他现有公司主导的领域中大胆进入 reusters.com macrumors.com。该浏览器目前可以在 macOS(苹果桌面/笔记本电脑)上使用,Windows、iOS 和 Android 版本即将推出 cbsnews.com macrumors.com。OpenAI 的首席执行官 Sam Altman 推出了 Atlas,称其为“围绕 ChatGPT 构建的浏览器”,用户可以直接与网页对话——这表明了一种浏览愿景,在这种愿景中,AI 助手最终可能取代传统的 URL 栏 cbsnews.com。事实上,Altman 指出,尽管“标签页很棒,……但自那以后我们没有看到太多浏览器创新”,这意味着 AI 聊天界面可能是我们浏览网络的下一个重大演变 cbsnews.com

Atlas 的推出被广泛视为对谷歌生态系统的直接挑战。谷歌 Chrome 拥有全球约 30 亿用户,但 OpenAI 认为,通过将 AI 助手紧密集成到浏览器中,可以吸引寻求更对话式个性化网页体验的用户。值得注意的是,OpenAI 的 ChatGPT 本身也积累了庞大的用户群(据报道超过 8 亿用户)。通过构建自己的浏览器,OpenAI 可以以新的方式利用这些用户——在 OpenAI 控制的环境中捕获更多他们的时间和数据,而不是将一切让给谷歌或微软。一位科技分析师甚至建议,在浏览器中集成聊天功能可能是 OpenAI 开始销售搜索广告的前奏,如果 Atlas 获得人气,可能会部分蚕食谷歌的搜索广告份额。在宣布后的几个小时内,Alphabet 的股票下跌了约 1.8%,反映了投资者对谷歌 Chrome 面临新的严峻竞争对手的看法。简而言之,Atlas 标志着*“AI 浏览器战争”*的重大升级——在这个领域,不仅谷歌和微软(拥有 Edge + Bing Chat)积极参与,还有像 Perplexity(推出了自己的 AI 浏览器“Comet”)和浏览器公司实验性“Dia”等初创企业。

OpenAI 在 X(原 Twitter)上以一句简单的信息介绍了 Atlas:「认识一下我们的新浏览器——ChatGPT Atlas。今天在 macOS 上推出……」 theguardian.com。这个简洁的公告强调了 Atlas 背后的核心理念:它是一个功能齐全的浏览器,但其核心内置了 ChatGPT AI 助手。接下来,我们将深入探讨使 Atlas 与众不同的功能,以及这为用户开启了哪些可能性。

Atlas 的关键功能:ChatGPT 成为您的网络角落助手

乍一看,ChatGPT Atlas 看起来和功能上都像一个标准的现代浏览器——它拥有诸如标签页、书签、搜索/地址栏、历史记录等熟悉的功能 macrumors.com。但真正的创新在于 ChatGPT 如何贯穿整个浏览体验。Atlas 是围绕这个问题设计的:「如果你可以与网络浏览器聊天,会怎么样?」 macrumors.com——它以始终存在的 ChatGPT 侧边栏的形式提供了“浏览伴侣”。

一个突出的功能是在 Atlas 界面右上角的**「询问 ChatGPT」侧边栏** cbsnews.com。用户只需点击一下,就可以在他们正在浏览的任何网页旁边召唤 ChatGPT。这款侧边栏聊天机器人会自动了解你所在页面的上下文,也就是说,它能理解你当前阅读的网站内容macrumors.com。这为一系列感觉自然的有用互动提供了可能:

  • 页面摘要与解释: 如果您正在阅读一篇长文章或复杂报告,可以请求 Atlas 的 ChatGPT 为您总结内容或用更简单的术语解释。该 AI 有效地“阅读”页面,让您无需亲自阅读,然后突出关键点macrumors.com。这有助于在您进行研究或浏览新闻时节省时间并提炼信息。

  • 上下文中的问答: 您可以就页面内容提出具体问题。例如,在产品页面上,您可能会问*“这款产品与竞争对手的主要区别是什么?”,AI 可以提取对比细节。在数据密集型页面或电子表格上,您可以查询“这一数据在过去一年的趋势是什么?”*并获得即时分析macrumors.com。本质上,Atlas 让您可以直接在查看的网页上进行对话,而无需离开页面。

  • 写作和编辑协助: ChatGPT 侧边栏不仅限于阅读页面——它还可以帮助您写作。如果您正在 Gmail 中撰写电子邮件或在浏览器中撰写文档,可以突出显示文本并提示 ChatGPT 提供改进或编辑建议。在 OpenAI 的演示中,例如,一位 Atlas 用户突出显示了电子邮件草稿,并要求 ChatGPT“让这听起来更专业”,AI 提供了一个经过打磨的重写theguardian.comcbsnews.com。同样地,对于开发者,ChatGPT 可以审查您打开的代码片段并帮助调试或优化,因为它可以“看到”页面上的代码(Atlas 的集成甚至声称可以直接在浏览器中编辑和检查代码macrumors.com

  • 产品对比与购物帮助: 因为它了解您正在浏览的内容,当您在线购物时,ChatGPT Atlas 可以比较产品或价格macrumors.com。例如,如果您打开了两个产品页面(比如在电商网站上查看两款不同的笔记本电脑),您可以询问 AI,“哪个电池续航更好,价格差异值得吗?” Atlas 的助手可以分析两个页面上的规格或描述,并为您快速对比。这就像有一个聪明的购物助手,已经掌握了所有产品信息。

  • 浏览时的持续聊天: 重要的是,Atlas 中的 ChatGPT 面板旨在您浏览时保持打开状态,作为一个持续的助手macrumors.com。与在单独网站上使用 ChatGPT(需要来回复制粘贴信息)不同,Atlas 将对话保持在活跃标签旁边。您可能在一个页面上提问,点击链接或切换标签,然后继续提问——AI 可以从一个页面到下一个页面保持上下文。这种多回合对话能力结合实时网页上下文,鼓励更具探索性的浏览风格。“ChatGPT Atlas 在您搜索时伴随您,支持您的浏览过程”,Altman 解释道,并指出它提供了一种流畅、即时的研究体验,甚至可以激发更多的好奇心tomsguide.comtomsguide.com

另一个新颖的功能是用于个性化的**「浏览器记忆」**。Atlas 可以从您的浏览习惯中学习(如果您选择参与),以便随着时间的推移定制其帮助 macrumors.com。这意味着 ChatGPT 会记住您过去浏览过的某些细节。例如,如果您上周阅读了几篇关于某个特定主题的文章,您可以稍后询问,「ChatGPT,总结一下我上周读的那些金融文章的关键见解,」 它可以检索并合成这些信息(感谢存储的浏览记忆) openai.com。OpenAI 的团队强调,这些浏览器记忆是私密且由用户控制的——您可以随时检查和删除它们 theguardian.com。默认情况下,Atlas 不会使用您的浏览内容来训练 OpenAI 的模型,除非您明确选择参与 theguardian.com。事实上,当您首次使用 Atlas 时,所有用户自动选择不参与浏览数据用于 AI 训练 theguardian.com。浏览器还包括简单的隐私控制,例如隐身模式,在这种模式下 ChatGPT 会暂时注销且不保留任何历史记录 simonwillison.net simonwillison.net。地址栏中的一个小开关可以让您快速关闭 ChatGPT 对特定网站的访问,如果您不希望 AI 「看到」该页面 openai.com。总体而言,Atlas 试图在提供有用的持久性和用户隐私与同意之间取得平衡,让您对 AI 可以记住或访问的内容进行详细控制。

代理模式:不仅仅是聊天的 AI 助手

也许 ChatGPT Atlas 最具突破性的功能是 OpenAI 所称的 “代理模式”——这意味着 AI 不仅可以阅读和聊天网页,还可以代表你在网上采取行动。在代理模式下,ChatGPT 可以点击链接、填写表格、在网站之间导航,并完成多步骤任务,就像一个在浏览器中操作的虚拟助手。 cbsnews.com reuters.com.

截圖:ChatGPT Atlas 的 代理模式 正在運行。在這個例子中,用戶請求幫助準備「海灘日用品」的旅行。Atlas 的 ChatGPT 代理(顯示在右側邊欄)自動瀏覽 Instacart 在線商店(左側)——它搜索防曬霜、毛巾、零食等,將它們加入購物車並準備訂單。底部狀態欄顯示代理正在「完成海灘必需品請求」,用戶可隨時選擇介入(“接管”或“停止”)。此演示展示了 Atlas 如何在不需要用戶手動操作每個步驟的情況下,處理跨多個頁面的複雜目標導向任務。

在一次现场演示中,OpenAI 的开发者展示了 Atlas 的代理如何从简单的指令到完全执行的结果。例如,用户可以说:「我明天有个晚宴,这是我喜欢的食谱——请订购所有食材送货。」ChatGPT Atlas 随后会:找到一个杂货店网站,搜索每种食材,把商品加入购物车,甚至进行结账(等待你的确认)。在 路透社 报道的演示中,Atlas 代理被指示「找到一个在线食谱,然后自动购买所有食材。」AI 忠实地导航到食谱网站,然后前往 Instacart 并将每个所需的杂货商品加入购物车——这个过程花了几分钟,但完全由 AI 助手与网页互动完成。这种端到端的任务完成远超当前浏览器助手或扩展的能力。

代理模式本质上是对 OpenAI 之前实验过的 ChatGPT 浏览插件/代理 的一次进化,现在原生集成在 Atlas 浏览器中,具备更强大的功能。目前这一功能正在为付费用户预览——ChatGPT Plus、Pro 和 Business 等级账户可以使用(免费用户可以使用聊天侧边栏,但无法使用完整的自主代理) cbsnews.com openai.com。该代理可以帮助完成多种任务,例如:预订航班或酒店、进行餐厅预订、跨多个网站购物比价、填写复杂表单(如注册或结账表单),甚至根据在线食谱“创建购物清单”,正如 OpenAI 所指出的 macrumors.com。Atlas 还提到一个 “光标聊天” 功能,允许 ChatGPT 协助在线编辑——例如,在您工作时编辑网页应用或表单中的文本 macrumors.com。本质上,代理从仅仅建议您转变为真正操作浏览器来执行您的请求。

OpenAI 已将底层技术代号为「Operator」(一个为这些操作提供支持的 AI 代理系统) macrumors.com。AI 代理利用您的浏览上下文和历史来做出决策。它经过训练,会在执行重要操作前请求权限,并在某些安全边界内运行。根据 OpenAI 的文档,Atlas 的代理模式不能执行诸如下载文件到您的计算机、安装扩展或运行任意代码等操作——它仅限于网页交互以确保安全 simonwillison.net simonwillison.net。它也不会自动使用您已登录的 cookie,除非您明确允许,并且它会保持操作在沙盒状态(例如,在代理模式下访问的页面不会添加到您的历史记录中) simonwillison.net。OpenAI 已内置安全措施,以便在执行敏感操作时,例如在银行网站或涉及私人数据时,代理会暂停并请求确认 openai.com。这些措施是应对潜在风险;安全专家指出了关于“提示注入”攻击的担忧,即恶意网页可能包含隐藏指令,劫持 AI 代理的行为 simonwillison.net simonwillison.net。OpenAI 承认代理模式是一个早期的实验性功能——它在复杂任务上可能会出错,用户应留意 AI 的行为(您可以随时点击“掌控”来介入,如界面所示) openai.com openai.com。正如一位评论者讽刺地观察到的那样,观看当前 AI 代理执行任务感觉就像*“第一次使用电脑的用户费力地学习使用鼠标”*——暗示它并不总是比您亲自操作更快 simonwillison.net。尽管如此,其潜力是显而易见的:Atlas 的代理模式旨在自动化枯燥或多步骤的网页使用部分,让您专注于更重要的工作。这是一个未来的预兆,正如 OpenAI 所描述的那样,“大多数网页使用通过代理系统进行” openai.com——本质上将日常在线任务委托给您的 AI 助手。

Atlas 与传统浏览器对比:表现如何?

ChatGPT Atlas 在竞争激烈的浏览器市场中脱颖而出,其独特之处在于深度的 AI 集成。以下,我们将 Atlas 与一些主要浏览器及新兴的 AI 驱动对手进行对比,看看它们在功能和方法上有何不同:

表格: ChatGPT Atlas 与其他浏览器的功能对比。 Atlas 因其完全整合的会话式 AI 和代理功能而脱颖而出。Chrome 和 Edge 正在以更有限的方式(专注于搜索结果或聊天辅助)添加 AI,而 Safari 目前尚无。像 Perplexity 的 Comet 这样的新秀反映了许多 Atlas 的概念,但仍在完善其代理。Atlas 的底层基于 Chromium 构建(其用户代理字符串与 Chrome 基本相同 simonwillison.net),因此支持标准网页技术和可能的浏览器扩展,但其区别在于顶层的 本地 AI 层 tomsguide.com tomsguide.com

一个有趣的观察:尽管微软是 OpenAI 的主要投资者,ChatGPT Atlas 内置的搜索功能似乎使用的是Google 搜索结果,而不是 Bing。当用户在 Atlas 的搜索栏输入查询时,浏览器首先给出一个 AI 生成的答案(由 ChatGPT 提供),但它也在“网页”、“图片”、“视频”、“新闻”等选项卡下提供传统的搜索结果——每个结果页面顶部都包含一个指向 Google 的链接。在某种程度上,Atlas 并不是从头开始构建搜索引擎;它利用 Google 的索引来进行网络搜索的繁重工作,至少在这个早期版本中。这一选择让业内一些人感到惊讶,因为微软的 Bing 之前是 OpenAI 的 ChatGPT 的启动合作伙伴,并且深度集成到 ChatGPT 的网页浏览插件中。这表明 OpenAI 希望 Atlas 为用户提供最佳或最熟悉的搜索结果(Google 仍然主要提供这些),或者可能是为了避免过于依赖合作伙伴的服务,因为 OpenAI 现在直接成为竞争对手。无论如何,从用户的角度看,Atlas 的搜索方法是混合的:你可以获得即时的 ChatGPT 答案,然后如果需要,可以选择点击查看完整的搜索结果(由 Google 提供支持)。ChatGPT 的答案也可以作为一个起点——你可以在侧边栏中询问后续问题,以更好地找到你想要的东西,而不是输入多个搜索查询。

在性能和兼容性方面,Atlas 基于 Chromium 构建(这是 Chrome 和 Edge 背后的开源引擎),这意味着它应该能够像 Chrome 一样良好地渲染网站 tomsguide.com。它也可能支持 Chrome 扩展,尽管 OpenAI 还没有大力宣传扩展支持。Atlas 的用户界面设计故意保持熟悉——“简单而熟悉,具有像 Safari 或 Chrome 这样的标准搜索窗口”,正如一篇评论所说 macrumors.com。这是一个战略性选择:用户应该在切换到 Atlas 时感到如同在家,而不需要学习一个全新的界面,除了新加入的 AI 工具。

可能性和影响:从竞争对手的角度看待的中立观点

从行业角度来看,ChatGPT Atlas 是一个引人注目且意义重大的发展。作为竞争公司的一名 AI 产品负责人,重要的是要中立且分析性地分析 Atlas,透过炒作去了解其真正的潜力和挑战。

从积极的一面来看,Atlas 确实重新思考了一些长期停滞不前的网页浏览方面。整合对话代理解决了真实的痛点——用户有多少次在搜索结果之间切换,把文本复制粘贴到 ChatGPT,或在多个标签页之间来回切换进行研究?Atlas 通过将 AI 保留在浏览器中,随时可用,从而简化了这一工作流程。它可以让某些任务的浏览更高效:研究、购物、学习,甚至编程或写作。通过拥有“从浏览历史到搜索请求的所有在线活动的上下文”,Atlas 提供的帮助比单独的搜索引擎或助理更个性化和即时tomsguide.comtomsguide.com。早期测试者发现它“让你更有好奇心”——鼓励更深入地探索主题,因为 AI 可以无缝提供背景信息和相关路径以供调查tomsguide.comtomsguide.com。在教育或工作场景中,这可能会对生产力和发现有所帮助。

Atlas 的代理模式也暗示了网络的新范式。与其每一步都由我们手动点击和输入,不如把意图委托给 AI。需要在线完成一个多步骤的目标吗?只需告诉你的代理,就能看到它完成。这有点像拥有一个人类助手,只不过它的操作速度是计算机级别的(理论上)。如果 Atlas 的代理变得强大,它可以处理那些消耗用户时间的日常任务(检查各个网站的预约可用性、监控价格变化、过滤信息)。这有可能显著改变用户对浏览器应该实现什么功能的期望。它将浏览器从一个被动工具转变为一个主动的协作伙伴。

然而,仍然存在相当大的挑战和不确定性。用户采纳是一个大问号:即使是大型科技公司,要让人们切换浏览器也非常困难。Chrome超过70%的市场份额并非易事——它通过多年来证明速度和可靠性而增长,用户(以及组织)往往习惯于现有的方式。Atlas不仅需要提供新颖的AI功能,还必须在速度、稳定性、扩展生态系统和信任方面达到同等水平。一些用户可能会对Atlas的AI感兴趣,但也有用户可能对一个未知的浏览器处理他们的数据感到担忧。尤其是注重隐私的用户,可能会犹豫不决,不愿意让一个AI(由OpenAI运行)可能看到他们浏览的一切。OpenAI已采取措施解决隐私问题(默认不进行训练、隐身模式、细粒度的内存控制) theguardian.com openai.com,但要说服公众需要透明度和时间。作为竞争产品负责人,人们可能会预测信任和习惯是Atlas的最大障碍——并不是每个人都会立即适应“每个标签页都有ChatGPT”的想法,许多人已经深深嵌入他们设备中的Chrome/Edge或Safari。

还有准确性和可靠性的问题。虽然 ChatGPT 令人印象深刻,但它并非无懈可击——它可能会生成错误的答案或误解信息。在浏览器的情况下,错误可能从无害(错误总结一篇文章)到严重(错误填写表格,或在代理模式中误点重要内容)。OpenAI 自己的测试承认,目前的网络 AI 代理在处理复杂任务时“还有待改进”techcrunch.comtechcrunch.com。我们的分析也一致:Atlas 的早期版本可能表现不均。它可能轻松完成简单的购物清单,但在处理像预订多段国际旅行这样需要特定偏好的复杂任务时会遇到困难,因为理解微妙的用户意图很难。用户可能会尝试使用这些代理,但也会遇到它们的局限性。Atlas 的成功将取决于 OpenAI 能多快提高这些能力(例如,减少错误、加快任务完成速度、处理极端情况)。另一方面,从竞争者的角度来看,如果 Atlas 经常出错或让用户感到沮丧(由于错误或怪异的 AI 行为),这可能会减缓其采用速度,并给其他人时间赶上或区分开来。

这个领域的竞争正在加速。谷歌没有停止不前——它已经在搜索结果中整合了生成式AI摘要,并正在Chrome中测试其自己的「搜索生成体验」reusters.com。微软的Edge紧密结合了Bing AI,并最近推出了一种具有类似目标的Copilot模式(如帮助预订和复杂的网络任务)theverge.comcopilot.microsoft.com。像Perplexity.ai这样的较小公司以及其他公司也有创新的想法(并且受到的传统约束较少)。作为竞争对手,必须考虑:Atlas的方法会成为新规范(迫使所有人跟随),还是会保持为AI爱好者的小众选择?如果用户因其便利性而涌向Atlas,那么像谷歌和微软这样的公司可能会加速其自身的AI浏览器产品——甚至可能采取不同的合作方式(想象谷歌在Chrome中部署更具互动性的AI,或苹果在Safari中注入由其自有芯片驱动的AI)。事实上,苹果缺乏AI浏览器助手显得尤为突出;行业专家推测,苹果可能需要做出回应,可能通过加强Siri或收购AI技术以嵌入Safarimacrumors.com。从中立的角度来看,竞争可能会使用户受益:所有浏览器都将不得不在AI、隐私、速度或新功能上进行创新,以避免失去市场地位。

另一个影响是在线广告和搜索经济。Atlas 模糊了搜索和浏览器之间的界限。如果用户开始向 Atlas 的 ChatGPT 寻求答案(而不是在谷歌中输入查询),传统的搜索广告模式可能会被颠覆。目前 OpenAI 并未在 ChatGPT 上投放广告,但正如路透社所指出的,在浏览器中拥有聊天界面可能为 OpenAI 进入广告业务铺平道路 reusters.com。这引发了战略性问题:Atlas 有一天会显示赞助建议或产品推荐吗?如果大量用户问题通过 ChatGPT 解决,Google 将如何反击搜索查询(以及广告展示)潜在的流失?我们可能会看到一场不仅仅是争夺用户的战斗,而是争夺广告商和内容提供商的战斗,在一个以 AI 为中心的网络中展开。作为竞争产品的负责人,明智的做法是关注这些变化——它们可能会重新定义行业中的收入来源和合作关系。

最后,从技术产品的角度来看,Atlas强调了一个趋势,即浏览器不仅仅是通往网络的窗口。它们正在变成智能代理,甚至是我们在线生活的轻量级操作系统。OpenAI 的 ChatGPT 负责人 Nick Turley 提到,他受到浏览器重新定义操作系统可能性的启发 techcrunch.com。Atlas 继续这一演变:如果浏览器能够理解你的“世界”(你的背景、历史、意图)并帮助你实现目标,那么它几乎就像是互联网时代的个人操作系统。这与科技领域的一个更广泛的愿景一致——将 AI 深入整合到用户界面中,使界面本身变得更智能、更具预见性。这是一个许多人将进行创新的领域;我们公司可能会探索类似的整合,或许关注不同的优势(例如,更紧密的企业数据集成或 AI 的特定领域专长)。

总之,ChatGPT Atlas 是 OpenAI 的一项大胆举措,可能会重新定义用户对网页浏览器的期望。它引入了真正有用的 AI 优先功能——上下文聊天辅助和任务自动化,使其在当今的现状中独树一帜。作为竞争对手,我们既欣赏又持健康的怀疑态度。它带来的可能性(更高效的浏览、AI 完成繁琐工作、个性化的网络体验)令人兴奋,并可能推动行业向前发展 tomsguide.com tomsguide.com。同时,成功并非板上钉钉:Atlas 必须在实际使用中证明自己,赢得用户信任,并抵御快速行动的竞争者。从中立的角度来看,有一点是明确的:浏览器创新又回来了。如果 Atlas 成功,“浏览器战争”在一两年内可能会大不相同,从专注于渲染速度和扩展库转向专注于 AI 能力和用户赋能 tomsguide.com tomsguide.com。即使 Atlas 最初只占据小众市场,它无疑提高了对 “智能浏览器” 的期待。我们将密切关注用户对 Atlas 的反应以及生态系统如何适应——这可能只是我们体验网络的新篇章的开始。

Boxu 在埃默里大学获得了定量经济学专业的学士学位。在加入 Macaron 之前,Boxu 的职业生涯大部分时间都在美国的私募股权和风险投资领域度过。他现在是 Macaron AI 的首席参谋和市场营销副总裁,负责管理财务、物流和运营,并监督市场营销。

申请成为 Macaron 的首批朋友