從紙飛機聊到冥王星!Google靠AI重新定義搜尋,「黑科技」背後藏哪些隱憂?
從紙飛機聊到冥王星!Google靠AI重新定義搜尋,「黑科技」背後藏哪些隱憂?
2021.06.17 | AI與大數據

Google經常利用自家一年一度的開發者大會I/O,來展示其令人驚嘆的人工智慧。2016年,其推出內建Google Assistant的Google Home智慧音響。2018年,為企業接聽電話和安排約會的Duplex首次亮相。按照這樣的傳統,上個月,執行長Sundar Pichai宣佈推出了 LaMDA ,是一款 「可以依照任何話題展開對話」的人工智慧。

當時,Pichai展示了與紙飛機、冥王星交流是什麼樣的感覺。對於每一項查詢,LaMDA會用三到四個句子來予以回應,就像兩個人之間進行的自然對話一樣。Pichai表示,LAMDA將會逐漸融入到Google的其他產品之中,例如Assistant和Workspace,以及最關鍵的搜尋。

Pichai說:「 我們相信LaMDA的自然對話功能,有可能會徹底改變資訊和運算,讓它們變得更易於使用 。」

延伸閱讀:Google I/O 2021推高度客製Android 12、與三星合作新版WearOS,睽違兩年端出哪些牛肉?

LAMDA的此次演示為大眾提供了一道窗,讓我們得以一窺Google對搜尋的願景,而這個願景已超越了連結清單,並有可能改變數十億人對網路的搜尋方式。這個願景將以人工智慧為核心,它可以推斷出人類語言的含義,不僅能參與對話,還可以像專家一樣回答由多環節構成的問題。

在這次I/O大會上,Google還推出了另一款人工智慧工具,也就是所謂的 多任務統一模型(Multitask Unified Model,MUM) ,它可以在搜尋時,把文本和圖像考慮在內。Google副總裁Prabhakar Raghavan表示,有朝一日,用戶可以拍下一雙鞋的照片,並利用搜尋引擎詢問這雙鞋是否適合登山。

MUM可以生成75種語言的結果,Google聲稱這可以讓它對世界的瞭解更加全面。台上的演示,展示出MUM是如何回應查詢的,當用戶輸入「我已經爬過亞當斯山了,我想在明年秋天爬富士山,我該怎麼做?」這項查詢與一般的搜尋表述上有所不同,因為MUM的目標是為了減少找到答案所需的搜尋次數。MUM既可以對文本進行歸納也可以生成文本;它會拿亞當斯山與富士山進行比較,且知道為登山做準備可能需要相關的健身訓練、登山裝備推薦以及天氣預報方面的搜尋結果。

google mum
圖/ Search Engine Journal

在上個月發表的一篇名為《重新思考搜尋:從業餘愛好者變成專家》(Rethinking Search: Making Experts out of Dilettantes)的論文中,Google研究院的四位工程師把搜尋設想成與人類專家的對話。論文提到了一個例子,搜尋「紅葡萄酒的健康益處和風險是什麼?」目前,Google會回覆一個重點清單。而這篇論文表示,未來搜尋引擎的回應可能會看起來更像一段話,闡述著紅酒可以促進心血管健康,但可能會弄髒牙齒,並且會補充相關的資訊來源與連結。論文顯示,回覆是文本形式,但可以容易聯想到口頭回覆的可能性,就像現今使用Google Assistant的體驗一樣。

AI難以突破歧視、刻板印象的複製

但過度依賴人工智慧來破譯文本也存在著風險,因為其依舊難以理解語言的各種複雜之處。用來生成文本或回答問題等任務的人工智慧,也是所謂的大型語言模型,已顯示出有著放大偏見,以及生成不可預測或有害文本的傾向。其中有一個模型,也就是OpenAI的GPT-3,已被用於為動畫角色創建互動故事,但在一個線上遊戲裡面,它也生成過牽涉到兒童性愛場景的文字。

作為去年發表並進行展示的一篇論文,來自麻省理工學院、英特爾以及Facebook的研究人員發現,大型語言模型表現出對種族、性別、宗教和職業存在著刻板印象的偏見。

擁有自然語言處理倫理學博士學位的語言學家Rachael Tatman表示,隨著這些模型生成的文本變得越來越有說服力,它可以讓大家相信自己正在跟能夠理解單詞含義的人工智慧交談。但當它生成對殘疾人士、穆斯林有害或自殺的文本時,這可能就會造成問題。Tatman回憶起一位圖書管理員曾教過自己如何去判斷Google的搜尋結果是否有效。她說,若Google把大型語言模型和搜尋結合起來的話,使用者就得被迫學會如何評估與專家AI的對話。

shutterstock_696112645_AI.jpg
圖/ NicoElNino via shutterstock

延伸閱讀:找不到女總統、小眼睛就偵測不到!AI複製人類「歧視」,管理者該如何對症下藥?

科技巨頭爭相打造大型語言模型

Google是一家建立在PageRank之上的公司。PageRank是公司共同創辦人Larry Page和Sergey Brin在1990年代後期,所研究創建出來的一種演算法。這種演算法需要依賴索引——這是一個利用演算法對網站進行排序和評估的過程。爾後,Google逐步將知識圖譜,一個龐大的資料庫,納入到搜尋結果裡面。

近期,Google開始把語言模型納入到搜尋裡面。2019年,該公司把一種名為BERT的模型植入到搜尋裡,以便回答對話式的查詢、建議搜尋,並對出現在搜尋結果下方的文本進行摘要。當時,Google副總裁Pandu Nayak稱這是五年來搜尋領域取得的最大進步,也是「搜尋史上最大的躍進之一」。微軟的Bing在提供搜尋結果時,也用到了BERT。

BERT的引入,在科技巨頭之間開啟了一場競賽,大家都在爭相創建出規模更大的語言模型,力拚在性能排行榜上能取得更高的排名。不久之後,百度推出了Ernie,Nvidia推出了Megatron,微軟推出了T-NLG,OpenAI推出了GPT-3。工程師通常會透過參數的數量,也就是深度學習系統中人工神經元之間連接的度量來評估這些模型。BERT包含了數億個參數,GPT-3的參數則高達1,750億個。今年1月,Google發佈了一個帶有1兆參數的語言模型。在Google今年的I/O活動上,Raghavan稱在參數的數量上,MUM比BERT強大1,000倍。

Google-Bert
圖/ Google

在《重新思考搜尋》那篇論文中, Google研究人員稱索引是現代搜尋的馬車 。但他們仍設法利用能理解更多查詢、更龐大的語言模型來消除索引。

比方說,知識圖譜可以針對事實問題提供答案,但那只針對web的一小部分進行了訓練。 使用更廣泛的web語言模型,將可以讓搜尋引擎提出建議、檢索文本、回答問題並完成任務 。《重新思考搜尋》該篇論文的作者表示,這種方法有可能帶來「具變革性的思維轉變」。

這樣的模型並不存在。事實上,作者表示這需要創建出通用的人工智慧,或在資訊檢索和機器學習等領域中取得進步。此外,他們希望這種新方法能夠從多個角度提供權威答案,清晰地披露來源且不帶偏見。

Google發言人把LaMDA和MUM說成是Google下一代語言模型研究的一部分,且表示MUM目前正在內部開展試點,來幫助大眾查詢數十億個主題。在被問及《重新思考搜尋》那篇論文與LaMDA、MUM的關係時,這位發言人表示,Google Research並沒有為Google產品設定方向,進入Google產品(如搜尋)的機器學習通常是作為補充,而非取代現有產品。

他們的野心比展示廣告領域要大多了 。」搜尋顧問Michael Blumenthal說道。

搜尋的大躍進讓SEO相形失色

不可避免地,Google搜尋演算法的任何變化都會影響到廣告業務核心。該業務去年為Google創造了1,470億美元的收入。搜尋顧問Michael Blumenthal表示,關於登山靴的MUM演示表明,Google希望在連接企業與消費者之間發揮更大的作用。上個月的另一個變化是,Google引入了與Shopify的集成,將170萬商家的商品帶到搜尋結果裡面。2019年,外賣公司DoorDash和Postmates已經進入到搜尋結果裡面。

20年來一直為企業提供搜尋策略諮詢服務的Blumenthal指出,Google搜尋結果已經從PageRank提供的連結清單,演變為把廣告、知識面板、地圖、影片和AR納入在內。

這種轉變導致了所謂的 零點擊搜尋(zero-click) 興起。零點擊搜尋,是指大眾將不再靠點擊進入網站來完成一次web搜尋。這讓Google能夠在不需要使用者離開Google的情況下獲得廣告收入。數據公司Similarweb估計,去年在近三分之二的Google搜尋當中,用戶都沒有點擊進入到另一個頁面;在行動裝置上,點擊率(click-through rates)尤其低。

Blumenthal在談到Google正考慮進行的搜尋變革時表示:「在我看來,他們的野心要比展示廣告領域大多了。他們喜歡將各方連接起來進行交易,所以我把這看作是極大地增強了這一點。」

強調用自然語言或圖像進行搜尋的變化,可能會讓使用者不再把注意力放在關鍵字上,且還會破壞價值數十億美元的SEO業務 ——目前各企業仍藉由SEO讓自己靠近搜尋結果的前端。

shutterstock_189399701_SEO.jpg
圖/ Creativa Images via shutterstock

延伸閱讀:從關島開啟的創業路!阿物科技靠AI串起行銷三大武器,如何把SEO應用到極致?

部分搜尋引擎最佳化公司一直在為自然語言的未來做準備。Copysmith.ai是一家總部位於美國阿拉巴馬州伯明罕的新創企業,它利用GPT-3來為網站生成SEO標籤等。其執行長Shegun Otulana表示,「Google最近的舉動並非是一種威脅,而是整個人工智慧領域又往前邁進了一步。這證明我們正朝著正確的方向前進。」

Blumenthal則表示,I/O大會所發佈的公告可能需要數年的時間才能兌現承諾,但他同時也表示,有一點越來越清楚,Google想要的不僅僅是事實和連結的集合,而是希望自己更像一位能夠回答複雜問題的專家。「唯一的問題是,他們什麼時候能到達那裡。」他說。

大型語言模型恐成為社會隱憂

Google把大型語言模型作為商業戰略和研究重點的做法,在公司內部引起了衝突。最值得注意的一點是,Google Ethical AI團隊的兩位前領導人Timnit Gebru和Margaret Mitchell,他們在共同撰寫了一篇強調對此類模型的擔憂的論文之後就被迫離職了。除此之外,這篇論文引用的研究表明, 大型語言模型會延續人類的偏見和刻板印象,並可能導致氣候變化 。該論文稱,隨著語言模型變得越來越龐大,糟糕的數據標記和管理實踐會演變成更大的問題。最重要的是,該論文還指出, 大型語言模型對社會造成的危險,最有可能落在被邊緣化的社群身上

alone-man-person-sadness-236151.jpg
圖/ pexels

今年1月,另一篇批評大型語言模型的論文作者表示,Google法律和政策團隊的干預「非常陰險」。今年3月,Google DeepMind的研究人員發現, 大型語言模型可以透過傳播刻板印象、失業和虛假資訊,在創作者沒有任何惡意的情況下為社會帶來危害

本文授權轉載自:36氪

責任編輯:文潔琳、錢玉紘

關鍵字: #Google search #AI
往下滑看下一篇文章
數位時代 X 國泰金控 從百套系統上雲到 Cloud First:國泰如何把雲端變成AI成長引擎?
數位時代 X 國泰金控 從百套系統上雲到 Cloud First:國泰如何把雲端變成AI成長引擎?

2019年金融監理機關正式將雲端納入委外規範後,揭示金融業上雲時代來臨,國泰金控數數發中心成立雲端策略發展部,負責擬定集團上雲策略,並於2020年正式啟動7年集團雲端轉型計畫;在多數金融機構仍停留在單點遷移或IT現代化的現下,國泰金融集團在 2025 年即完成 100 套系統上雲,更將雲端轉型階段從 Cloud Ready、Cloud Adoption 推向 Cloud First,成為數據與人工智慧應用的關鍵引擎。

國泰金控資訊長|吳建興 James Wu
圖/ 數位時代

「百套系統上雲不僅僅是數字,更是讓國泰從『 IT 進化業務』邁向『 IT 驅動成長』的關鍵轉折。」國泰金控雲端策略發展部協理顏勝豪表示,上雲帶來的效益十分顯著,包括提升資源可用性與營運敏捷度、減輕 IT 維運負擔;同時,雲端業者多具備零碳排或綠能機房機制,亦有助於企業朝向 ESG 永續營運邁進。「金融上雲不是單純的現代化基礎設施或者是升級技術,而是為了換取速度與可靠度,讓集團可以加速創新腳步、彈性調配資源,以及培育所需人才與技能,為未來做最佳準備。」
為讓集團員工、金融同業以及有志上雲的夥伴可以進一步探討雲端轉型的各種可能,國泰金控舉辦雲端轉型成果發表會,會中除有集團子公司分享最新成果,三大公有雲平台業者也從不同技術視角共同探討在合規、資安與 AI 應用的可能。

七年、三階段,國泰金融集團將雲端內化為營運流程與創新引擎

國泰金控科技長|姚旭杰 Marcus Ya
圖/ 數位時代

為什麼國泰可以領先市場完成雲端轉型、數據與 AI 賦能業務?

顏勝豪認為,雲端轉型的起點不是直接遷移系統,而是從四個面向打底:應用系統盤點評估、雲端架構設計、雲端遷移藍圖規劃,以及組織治理框架建立,而這也是 Cloud Ready 階段最重要的事情。
「不同子公司有不同商業模式與節奏,若沒有共同語言與平台底座,上雲很容易各自為政。」顏勝豪表示,為讓所有員工可以齊步前行,國泰以雲端遷移方法論 Cathay 6R(註1)作為共同語言、用平台作為共同底座,讓轉型不只是技術選擇,而是集團行動。
完成單一系統的雲端遷移後,便進入 Cloud Adoption 階段。在這個階段中,要透過大規模遷移建立更成熟的上雲標準作業流程(SOP),透過 FinOps 機制控管與優化雲端營運成本,以及透過自動化與治理模型確認多雲環境與安全與維運穩定性,目標是將雲端內化為組織日常運營的一部分,進而邁向 Cloud First 階段:在合規前提下,新專案與系統升級預設在雲端環境開發,並善用雲原生優勢加速新產品功能開發速度。
「集團雲端策略只有一個核心原則:讓雲成為 AI 時代的成長引擎,而不是單純的基礎設施。」關於國泰的未來雲端布局,顏勝豪如是總結。

國泰金控 雲端策略發展部 協理|顏勝豪 Otto Yen
圖/ 數位時代

以雲端為 AI 資源引擎、發揮數據燃料價值,實現 AI 賦能業務應用

國泰不僅在2025年完成集團百套系統上雲,也啟動數據上雲計畫並為 GenAI 奠定基礎建設。
例如國泰金控實現數據上雲,打造資料湖倉與 GAIA 生態系統架構為 AI 賦能業務做準備:成立國泰風險聯防中心(CRC)攜手集團洗防人員強化風險控管與金融犯罪因應能力;釋出國泰員工 AI 助手–Agia–Beta
版,提供差勤、福利與權益、技術支援、職務職能與集團其他資訊等五大類別管理辦法等查詢服務;此外,亦推出集團數據共享平台、集團法規知識庫、 AI 評測中心等服務,更好發揮 Cloud First 與 AI 賦能業務應用的價值。
雲端是 AI 時代的關鍵底座、數據則是 AI 的燃料。顏勝豪指出,發展AI需要龐大的 GPU 算力,若自建 GPU 機房,不僅硬體設備昂貴、折舊速度快,光是散熱系統一年就高達兩、三千萬元的成本,若採取雲端資源,可以隨啟隨用,同時,大幅降低試錯成本。「當雲端打好基礎、AI成為能力模組,銀行、人壽、產險與證券的創新不再是單點突破,而是放大集團級綜效。」

國泰以 Cloud First + AI 持續領先市場、形塑未來樣貌

「雲端可以優化算力成本,資料則決定 AI 應用上限。」顏勝豪解釋,在 AI 新世代,AI 模型定調能力「下限」,集團子公司掌握的「獨特資料」則決定應用的「上限」,考量雲端有許多好用 AI 服務,唯有資料上雲才能發揮數據價值、用 AI 賦能集團各子公司業務。
例如國泰世華銀行將採取多公有雲策略,打造雲端智慧生態圈,並以現代化雲原生技術拓展應用場景;同時,運用 AI 與資料分析優化客戶服務體驗,並藉由跨雲整合機制支援多元業務模式,以充分發揮上雲效益。至於國泰產險,不僅在兩年半內完成13套核心系統上雲、優化營運流程,如以 Serverless 架構打造百萬級效果、萬元成本的短網址系統等,讓雲端成為產險驅動長期成長的核心引擎與標準配備。

國泰人壽則是透過雲端與 AI 滿足不同客戶需求,如以 AI Search 精準呈現關鍵字搜尋結果,讓客戶可以精準且快速的查找所需資料、大幅優化官網體驗與滿意度。至於國泰證券則是於2026年初推出「庫存管家」服務,以客戶持股為核心,應用 AI 技術打造個人化推播服務,協助投資人更有效率地掌握庫存狀況,提供更即時、系統化的投資管理體驗。
總的來說,國泰金控在集團的雲端轉型不僅是技術升級,更是思維革新,從百套系統上雲進展到 Cloud First 階段,可以預期在雲地基礎下,國泰將進一步引領 AI 時代變革,持續提升營運韌性與放大創新價值。

註1:Cathay 6R 國泰設計 Cathay 6R 雲端遷移方法論,將系統遷移方式依據上雲模式、系統開發成本分為 Rehost 、Replatform、Refactor、Rewrite、Replace 和 Retain 共6種遷移架構,並能對應到 IaaS、PaaS、SaaS 三種不同上雲模式。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
2026 大重啟
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓