2025年9月在美國率先推出的Gemini 版 Chrome(Gemini in Chrome),終於在4月21日正式落地台灣。預期將在Chrome的超高市佔基礎上,讓不少死忠用戶首次體會到「AI瀏覽器」的突破。
簡單來說,大眾熟知的瀏覽器Chrome將獲得Google最新模型Gemini 3.1的能力驅動,作為瀏覽器上的側邊欄「AI瀏覽助理」。 Android 裝置可透過長按電源鍵呼叫出Gemini。
在媒體分享會上,Chrome產品總監德席爾瓦(Charmaine D'Silva)解釋,過去為了完成一些簡單的任務,使用者時常需要在多個分頁之間切換、比較資訊。 「如果每個使用者都能擁有一個個人助理,協助導航和完成工作,那會怎麼樣?」
針對上述問題,Google認為,這不僅是在瀏覽器上新增另一些功能,目標是完全改變瀏覽行為的本質,轉向更主動、智慧的體驗。
三大核心亮點:跨分頁理解、多模態應用、生態系整合
Gemini 版 Chrome可為使用者立即提供的價值可分為「理解」與「任務協助」兩大類。
首先,點擊瀏覽器右上角的 「問問Gemini」 便可開啟對話側邊欄。預設分享正在瀏覽的分頁內容,亦可手動勾選或刪除更多分頁內容與Gemini共享。
例如,可以開啟多個旅行社優惠方案介紹頁,讓Gemini統整、比較不同方案的特色與優惠形式。也能輕鬆總結部落格長文,並在對話欄中追問產品發展的最新進度。
借重Gemini強大的多模態能力,Gemini 版 Chrome能解釋頁面上的照片脈絡,辨識所在地點。也能摘要YouTube影片,尋找長影音中特定主題的時間,甚至指出影片留言中常提及的論點。
德席爾瓦解釋,獲益於YouTube與Google的高度整合,Gemini能直接透過API取得YouTube擁有的關於影片的元數據,而不是透過讀取頁面上的影片或逐字稿提供回應。
同時,Gemini 版 Chrome也內建Nano Banana 2的能力。只要在側邊欄描述需求,便能根據分頁所見的影像調整生成新的圖像。
Gemini 版 Chrome最關鍵的護城河,目前仍是與Google生態系及使用者認識的高度整合。使用者能在跨分頁整理出資訊後,透過側邊欄指令,將資訊分享給Gmail的聯絡人,或是在Google Calendar新增活動。
結合日前在台灣推出的「個人化智慧服務」(Personal Intelligence),Gemini版 Chrome也能根據使用者需求,提供更具個人化的回答。例如,它能知道使用者的家庭總人數、近期遊覽過的景點,在評估旅遊方案時給出更適切的建議。
不過,目前整合範圍仍以Google自家生態系為核心,第三方軟體需要倚賴擴充插件。Google表示,正在積極探索第三方應用整合。另外,能夠代為執行多步驟網頁操作的代理式瀏覽功能Auto Browse也尚未在台開放。
掌握全端整合與個人上下文優勢,Gemini in Chrome進入人機互動下一階段
德席爾瓦認為,Gemini 版 Chrome是人機自然互動的下一階段。她指出,過去人們在使用搜尋引擎時,主要是人類適應機器語言。例如,使用者會使用關鍵字布林運算,site、filetype等指令,優化搜尋結果。
但如今可以使用接近自然語言的方式向搜尋引擎提問,而Gemini 版 Chrome讓這樣的溝通又變得更加順暢。它與使用者「看著」同樣的頁面內容,因此使用者可以直接要求Gemini「解釋這個」或「生成那個」,模型也能理解,不需要長篇解釋。
所謂的AI瀏覽器自2025年開始爆發,從The Browser Company 的「Dia」、Perplexity的「Comet」到OpenAI的「Atlas」,傳統瀏覽器如Edge也早早融入Microsoft Copilot。
延伸閱讀:AI瀏覽器掀戰!Atlassian砸187億元收購The Browser Company:Dia有望挑戰Chrome霸權?
The Browser Company在介面體驗上勇於創新,Anthropic的Claude在代理能力上最具業界主導力。但Google在全端整合與個人背景脈絡上,仍有著高度優勢。
從伺服器晶片、模型訓練到瀏覽器開發的高度整合,讓Google能壓低AI運算成本,讓生成式分頁管理、即時語音溝通等功能跑得更流暢。同時,許多競者的瀏覽器底層引擎皆是跑在Google主導的Chromium上,這也讓Google享有更低運算延遲。
其他AI瀏覽器雖能透過API串接Gmail、Google日曆與文件,但授權與資料傳輸較為繁瑣,Google生態系內的數據流通則更加無縫。掌握近七成的瀏覽器市占率,Google可望以更低的獲客成本,讓更多使用者體會到自家Gemini的最新能力。
責任編輯:李先泰
