早在2008年,谷歌就推出了Chrome浏览器,旨在更好地将业界领先的搜索引擎融入到网页浏览体验中。今天,OpenAI发布了Atlas浏览器,希望它能为旗下的ChatGPT大型语言模型带来类似的功能,正如OpenAI团队所说,回答“如果我能和浏览器聊天会怎样?”这个问题。
OpenAI 创始人兼首席执行官 Sam Altman在一次直播发布会上表示,Atlas 将允许用户“与页面聊天”,这将帮助 ChatGPT 成为用户与“大量工作和生活发生于此”的在线平台互动的核心方式。他说道:“我们希望人们未来使用互联网的方式……是聊天体验和网页浏览器能够完美地结合起来。”
新版浏览器现已可在 macOS 上下载,Altman 承诺 Windows 和移动版本将“尽快”推出。
一个跟随你的法学硕士
Atlas 新标签页的主屏幕简洁明了,与 Chrome 搜索框类似,文本框提示用户“询问 ChatGPT 或输入网址”。用户可以通过类似于ChatGPT.com的界面访问聊天记录或不同的 ChatGPT 模型。Atlas 浏览器还会在搜索框下方显示建议,内容涵盖新闻链接以及浏览器可以执行的任务等。
在直播中,OpenAI 团队表示,Atlas 具备网络用户期望从浏览器中获得的各种功能,例如标签页、书签和自动填充等。但与 ChatGPT 的集成意味着,在浏览体验中,“聊天功能将伴你左右”。
这意味着您可以使用 ChatGPT 通过易于理解的语言提示搜索书签或浏览历史记录。您还可以在当前页面旁边打开“侧边聊天”窗口,并提出与该页面上下文相关的问题。此外,如果您想使用 ChatGPT 编辑 Gmail 草稿,现在可以直接在草稿窗口中进行编辑,无需在 ChatGPT 窗口和编辑器之间复制粘贴。
输入简短的搜索词时,Atlas 默认会以 LLM(链接列表管理器)的形式回复,提供包含指向相关来源链接的文字答案(类似于OpenAI 现有的搜索功能)。但浏览器也会提供标签页,其中包含更传统的链接列表、图片、视频或新闻,就像您从不具备 LLM 功能的搜索引擎中看到的那样。
让我们来浏览一下。
在直播演示的最后,OpenAI 团队展示了 Atlas 的代理模式。虽然“预览模式”功能目前仅对 ChatGPT Plus 和 Pro 订阅用户开放,但研究负责人 Will Ellsworth 表示,他希望该功能最终能帮助用户打造“氛围生活”的强大工具,就像 LLM 编码工具已成为“氛围编码”的工具一样。
为此,该团队展示了浏览器如何将 Google Docs 表格中编写的计划任务在几分钟内导入到任务管理软件Linear中。他们还展示了代理模式如何从食谱网页中提取食材清单,并直接将其添加到用户在另一个标签页中的 Instacart 购物车中(尽管演示代理在结账前会停止,以获得用户的批准)。
Atlas 用户可以观看代理模式自动浏览各种标签页和网页,随时接管控制权,也可以让它在后台运行,无需人工干预。用户可以直接通过下拉菜单激活代理模式,ChatGPT 也会在用户提示需要完成特定任务时建议开启代理模式。
OpenAI 团队表示,代理模式可以像真人用户一样进行点击操作,并拥有该用户的完整身份验证和浏览历史记录访问权限。但 OpenAI 也指出,代理模式只能在网页标签页内运行,无法在浏览器外部执行代码。此外,用户还可以手动控制新创建的 Atlas 标签页是否“登录”或“注销”其他各种网络服务,并使用隐身窗口浏览不希望 LLM 记住的内容。
拥挤的田野
浏览器领域的现有竞争对手们一直在尝试将类似的AI功能集成到各自的产品中:微软在Edge浏览器中内置了Copilot,谷歌则推出了基于Chrome的Gemini功能,并承诺在未来几个月内将包含“智能代理功能”。此外,一些初创公司也专注于从零开始构建AI驱动的浏览器,其中最引人注目的是Perplexity,该公司最近大胆地以345亿美元的价格收购了Chrome,而其总市值仅为1400万美元。
OpenAI 也曾在 4 月份公开表示有兴趣收购 Chrome,但最近该反垄断案件的法律进展意味着谷歌近期不太可能出售 Chrome。
The Information去年报道了OpenAI的浏览器计划,路透社7月也从匿名消息人士处获得了更多信息。路透社指出,浏览器将使OpenAI能够更直接地获取用户数据,而不仅仅局限于ChatGPT提示窗口中的输入内容,并且可能提供一种将广告轻松集成到ChatGPT体验中的方法。当然,这一切都取决于ChatGPT超过7亿的周活跃用户中,有多少人愿意放弃他们当前的浏览器,转而使用这家大型LLM品牌旗下的、尚未被充分验证的竞争对手的产品。



发表回复