重點一:OpenAI 推出 ChatGPT Atlas 瀏覽器,整合 ChatGPT 於側邊欄與「Agent mode」,官方宣稱可代辦訂位、購物與編輯任務。
重點二:Alphabet(Google 母公司)股價在 Atlas 發布後收跌約 2%,顯示市場對 AI 瀏覽器競爭的敏感程度。
重點三:目前瀏覽器競品態勢升溫,Perplexity 現已全面開放 Comet 為免費瀏覽器,Google 也陸續開放 Chrome 內嵌 Gemini,還有 The Browser Company 旗下的 Dia 等。
OpenAI 於美東時間週二正式發布 ChatGPT Atlas 瀏覽器,核心在於將 ChatGPT 深度嵌入瀏覽器工作流程。使用者在每個網頁右上角均可見「詢問 ChatGPT」按鈕,點擊後以側邊欄呼叫 ChatGPT 進行摘要、提問與跨頁任務處理,可免去分頁間的複製/貼上。
OpenAI 執行長奧特曼(Sam Altman)對此表示,AI 帶來「每十年一遇」的瀏覽器重思機會。
Atlas 首發版本支援 macOS 全球用戶;其中「Agent mode(代理模式)」可代替使用者在網路上執行操作、完成訂位、機票與購物、文件編修等任務,但該模式僅開放 Plus 與 Pro 用戶。Windows、iOS 與 Android 版本將於後續推出。
產品負責人亞當·弗萊(Adam Fry)強調,Atlas 亦具備「記憶」能力,可隨時間理解個人偏好,並支援在頁籤上透過提示搜尋瀏覽歷史,如「搜尋瀏覽紀錄中關於 Atlas 核心設計的文件」,強化工作流串接。
競局升溫:OpenAI 直面 Google、Perplexity
Atlas 的推出,使 OpenAI 直接與 Google 與 Perplexity AI 在瀏覽器領域正面交鋒。Perplexity 本月稍早推出 Comet(彗星)瀏覽器且免費提供,主打以問答為中心的網頁探索;Google 則於 9 月將 Gemini 模型內嵌至 Chrome,把原生 AI 能力帶入主流瀏覽器,但目前僅在美國桌面版 Chrome 開放。
值得一提的是,今年被艾特萊森(Atlassian)收購的 The Browser Company,旗下的 AI 瀏覽器「Dia」也是該領域的競爭者之一。
受 Atlas 發布消息影響,Google 母公司 Alphabet 股價當日收跌約 2%,顯示資本市場對 AI 瀏覽器競局擴張的敏感反應。
雖然 OpenAI 未公布營收或商業模式細節,但以 Plus 與 Pro 層級限定代理模式,顯示其將高階功能納入訂閱體系,並以跨平台擴張(Windows、iOS、Android 即將到來)布局用戶增長。
Atlas 是什麼?對一般使用者有何吸引力?
白話來說, Atlas 的賣點是把 ChatGPT 直接塞進瀏覽器,讓「找資料、摘要、翻譯、重寫、甚至代操作」變得像打字一樣自然。
官方頁面指出:它可在任何網站開啟側欄,用來總結內容、比對產品或分析資料,並提供你可控的隱私設定,具體功能如下:
• 側欄:在瀏覽任何頁面時開啟,可輸入指令取得摘要、重點整理、比較與分析,不用換視窗。
• 記憶:你可決定 ChatGPT 要記住哪些資訊,它能在後續頁面帶入相關細節,且可隨時清除或用無痕模式。
• 代理:在你掌控下,可讓 ChatGPT 與網站互動,從研究到購物等「整個流程型」任務可代為操作(限 Plus/Pro/Business 帳戶)。
• 游標協作:反白電子郵件、日曆邀請或文件文字,按一下就能改寫、潤飾或生成建議。
• 基礎瀏覽:提供搜尋(文字、影像、影片、新聞)、分頁、書籤、自動完成與外觀自訂,降低上手門檻。
Atlas 怎麼用?
首先,先下載安裝檔並透過以下步驟設定 Atlas。
ChatGPT Atlas 下載頁面:請點「傳送門」
一、安裝與基本設定
- 下載與安裝
• 前往 Atlas 官方下載頁,平台目前以 macOS 為先行版。安裝完成後啟動應用程式。- 登入與授權
• 以你的 ChatGPT 帳號登入。
• 首次啟動會要求「頁面內容存取」與「側邊欄」權限,建議先開啟,後續可在設定裡微調。- 匯入瀏覽資料(非必要)
• 可匯入 Chrome 的書籤與瀏覽紀錄,方便遷移工作流。
二、介面與核心功能
- 主搜尋框
• 新分頁直接用自然語言提問;Atlas 會在同頁回覆並可追問。
- 右側側欄(Context Pane)
• 開啟任意網頁時,側欄會讀取頁面內容,提供「摘要、翻譯、重寫、關鍵字抽取」等快捷操作,或自行輸入提示詞操作。
- 命令面板(Command Palette)
• 側欄開啟時,可用快捷鍵喚出(預設 ⌘K),可開啟新聊天或打開先前的對話紀錄。
- 代理模式(Agent)
• 在 Atlas 的偏好設定或右側「詢問 ChatGPT」側欄中,找到 Agents(或 Agent preview)開關並啟用;首次啟用會跳出權限提示。
• 同意讓 Agent 可「讀取目前分頁內容、開新分頁、點擊與輸入表單」。遇到登入或付款頁面,Atlas 會自動暫停並要求你手動確認。
• 可隨時在側欄頂部切換「Agent on/off」,並於設定裡關閉「頁面可見」與「Browser Memories」。或啟用「登出模式」,可避免 Agent 接觸到已登入站點的資料。
跟 Comet、Dia 比起來,誰更好用?
根據《數位時代》初步試用,撇除需要更仔細檢驗的「代理人功能」,現階段 Atlas 的功能可以說暫時還比不上前輩 Dia 跟 Comet。
根據 OpenAI 內部自動化分類,ChatGPT 的三大主要用途分別為 Practical Guidance(實用指引/教學/創意)、Seeking Information(查詢資料/事實/比較)、Writing(寫作/編修/翻譯/摘要),三者合計占所有訊息量近八成。
就以上三種任務類型舉例,第一項「實用指引」,確實可以在 Atlas 的環境中順利執行,無論是打開新頁籤直接提問,或是在某一分頁使用側欄都沒問題。
至於第二項的「查詢資料或事實查核」,也可以在側欄輸入 「/」 以選擇搜尋(找網路資料)、深入研究(基於資料生成報告)、思考(針對特定問題回答)。
但目前 Atlas 存在兩大痛點:
1.無法同時讀取多分頁:打開新分頁後,按「@」可以指定讀取分頁並輸入提示互動,但目前只能讀取一個分頁,對於統整跨分頁資訊較困難,例如比較兩個網頁的產品資訊:「幫我分析這兩款耳機哪一支更符合 CP 值?」
2.沒有「提示詞庫」:這是目前 Dia 與 Comet 都有的功能。由於大部分使用情境,如寫稿、翻譯、分析等行為使用頻率高,雖然 Atlas 有內建提示,但自定義的「提示詞庫」才是最能貼近使用者需求的功能,例如免於每次要求 AI 翻譯都要輸入一次「幫我翻譯選取範圍內的文字」。
因此,現階段 Atlas 可以完成的任務,其實都可以在使用者慣用的瀏覽器中打開 ChatGPT 網頁來完成,或直接使用終端的 ChatGPT App。 可以說,現階段將工作流全面轉移到 Atlas 的優勢還沒有太明顯(而若你的工作流中「代理人功能」是一大助力,以上的建議就可以忽略)。
結論:Atlas 使用體驗待加強,仍需向對手看齊
總歸來說,Atlas 現階段在功能上標榜 AI 代理操作,也就是「AI 幫你使用網路」的設計理念,反映 AI 從使用者高互動的「助理」定位,走向冷互動的「代理」產品路線。
據《CNBC》報導指出,Atlas後續觀察重點包含:
一、不同系統平台的使用體驗是否一致?開放這麼多權限安全嗎?
二、使用者記憶功能的隱私管理?記憶若外流使用者會知道嗎?
三、與網站、電商、票務等服務的整合深度與可靠性?
假設 OpenAI 若能在體驗、性能與合規上取得平衡,AI 瀏覽器極有可能成為下一階段的網路入口,改變既有搜尋與內容分發格局。
但前提是,OpenAI Atlas 的功能在未來確實發展到「不得不用」的地步,否則這條強敵環伺的賽道,用戶也許根本沒有理由打開 Atlas。
本文初稿為AI編撰,整理.編輯/ 李先泰