從紙飛機聊到冥王星!Google靠AI重新定義搜尋,「黑科技」背後藏哪些隱憂?
從紙飛機聊到冥王星!Google靠AI重新定義搜尋,「黑科技」背後藏哪些隱憂?
2021.06.17 | AI與大數據

Google經常利用自家一年一度的開發者大會I/O,來展示其令人驚嘆的人工智慧。2016年,其推出內建Google Assistant的Google Home智慧音響。2018年,為企業接聽電話和安排約會的Duplex首次亮相。按照這樣的傳統,上個月,執行長Sundar Pichai宣佈推出了 LaMDA ,是一款 「可以依照任何話題展開對話」的人工智慧。

當時,Pichai展示了與紙飛機、冥王星交流是什麼樣的感覺。對於每一項查詢,LaMDA會用三到四個句子來予以回應,就像兩個人之間進行的自然對話一樣。Pichai表示,LAMDA將會逐漸融入到Google的其他產品之中,例如Assistant和Workspace,以及最關鍵的搜尋。

Pichai說:「 我們相信LaMDA的自然對話功能,有可能會徹底改變資訊和運算,讓它們變得更易於使用 。」

延伸閱讀:Google I/O 2021推高度客製Android 12、與三星合作新版WearOS,睽違兩年端出哪些牛肉?

LAMDA的此次演示為大眾提供了一道窗,讓我們得以一窺Google對搜尋的願景,而這個願景已超越了連結清單,並有可能改變數十億人對網路的搜尋方式。這個願景將以人工智慧為核心,它可以推斷出人類語言的含義,不僅能參與對話,還可以像專家一樣回答由多環節構成的問題。

在這次I/O大會上,Google還推出了另一款人工智慧工具,也就是所謂的 多任務統一模型(Multitask Unified Model,MUM) ,它可以在搜尋時,把文本和圖像考慮在內。Google副總裁Prabhakar Raghavan表示,有朝一日,用戶可以拍下一雙鞋的照片,並利用搜尋引擎詢問這雙鞋是否適合登山。

MUM可以生成75種語言的結果,Google聲稱這可以讓它對世界的瞭解更加全面。台上的演示,展示出MUM是如何回應查詢的,當用戶輸入「我已經爬過亞當斯山了,我想在明年秋天爬富士山,我該怎麼做?」這項查詢與一般的搜尋表述上有所不同,因為MUM的目標是為了減少找到答案所需的搜尋次數。MUM既可以對文本進行歸納也可以生成文本;它會拿亞當斯山與富士山進行比較,且知道為登山做準備可能需要相關的健身訓練、登山裝備推薦以及天氣預報方面的搜尋結果。

google mum
圖/ Search Engine Journal

在上個月發表的一篇名為《重新思考搜尋:從業餘愛好者變成專家》(Rethinking Search: Making Experts out of Dilettantes)的論文中,Google研究院的四位工程師把搜尋設想成與人類專家的對話。論文提到了一個例子,搜尋「紅葡萄酒的健康益處和風險是什麼?」目前,Google會回覆一個重點清單。而這篇論文表示,未來搜尋引擎的回應可能會看起來更像一段話,闡述著紅酒可以促進心血管健康,但可能會弄髒牙齒,並且會補充相關的資訊來源與連結。論文顯示,回覆是文本形式,但可以容易聯想到口頭回覆的可能性,就像現今使用Google Assistant的體驗一樣。

AI難以突破歧視、刻板印象的複製

但過度依賴人工智慧來破譯文本也存在著風險,因為其依舊難以理解語言的各種複雜之處。用來生成文本或回答問題等任務的人工智慧,也是所謂的大型語言模型,已顯示出有著放大偏見,以及生成不可預測或有害文本的傾向。其中有一個模型,也就是OpenAI的GPT-3,已被用於為動畫角色創建互動故事,但在一個線上遊戲裡面,它也生成過牽涉到兒童性愛場景的文字。

作為去年發表並進行展示的一篇論文,來自麻省理工學院、英特爾以及Facebook的研究人員發現,大型語言模型表現出對種族、性別、宗教和職業存在著刻板印象的偏見。

擁有自然語言處理倫理學博士學位的語言學家Rachael Tatman表示,隨著這些模型生成的文本變得越來越有說服力,它可以讓大家相信自己正在跟能夠理解單詞含義的人工智慧交談。但當它生成對殘疾人士、穆斯林有害或自殺的文本時,這可能就會造成問題。Tatman回憶起一位圖書管理員曾教過自己如何去判斷Google的搜尋結果是否有效。她說,若Google把大型語言模型和搜尋結合起來的話,使用者就得被迫學會如何評估與專家AI的對話。

shutterstock_696112645_AI.jpg
圖/ NicoElNino via shutterstock

延伸閱讀:找不到女總統、小眼睛就偵測不到!AI複製人類「歧視」,管理者該如何對症下藥?

科技巨頭爭相打造大型語言模型

Google是一家建立在PageRank之上的公司。PageRank是公司共同創辦人Larry Page和Sergey Brin在1990年代後期,所研究創建出來的一種演算法。這種演算法需要依賴索引——這是一個利用演算法對網站進行排序和評估的過程。爾後,Google逐步將知識圖譜,一個龐大的資料庫,納入到搜尋結果裡面。

近期,Google開始把語言模型納入到搜尋裡面。2019年,該公司把一種名為BERT的模型植入到搜尋裡,以便回答對話式的查詢、建議搜尋,並對出現在搜尋結果下方的文本進行摘要。當時,Google副總裁Pandu Nayak稱這是五年來搜尋領域取得的最大進步,也是「搜尋史上最大的躍進之一」。微軟的Bing在提供搜尋結果時,也用到了BERT。

BERT的引入,在科技巨頭之間開啟了一場競賽,大家都在爭相創建出規模更大的語言模型,力拚在性能排行榜上能取得更高的排名。不久之後,百度推出了Ernie,Nvidia推出了Megatron,微軟推出了T-NLG,OpenAI推出了GPT-3。工程師通常會透過參數的數量,也就是深度學習系統中人工神經元之間連接的度量來評估這些模型。BERT包含了數億個參數,GPT-3的參數則高達1,750億個。今年1月,Google發佈了一個帶有1兆參數的語言模型。在Google今年的I/O活動上,Raghavan稱在參數的數量上,MUM比BERT強大1,000倍。

Google-Bert
圖/ Google

在《重新思考搜尋》那篇論文中, Google研究人員稱索引是現代搜尋的馬車 。但他們仍設法利用能理解更多查詢、更龐大的語言模型來消除索引。

比方說,知識圖譜可以針對事實問題提供答案,但那只針對web的一小部分進行了訓練。 使用更廣泛的web語言模型,將可以讓搜尋引擎提出建議、檢索文本、回答問題並完成任務 。《重新思考搜尋》該篇論文的作者表示,這種方法有可能帶來「具變革性的思維轉變」。

這樣的模型並不存在。事實上,作者表示這需要創建出通用的人工智慧,或在資訊檢索和機器學習等領域中取得進步。此外,他們希望這種新方法能夠從多個角度提供權威答案,清晰地披露來源且不帶偏見。

Google發言人把LaMDA和MUM說成是Google下一代語言模型研究的一部分,且表示MUM目前正在內部開展試點,來幫助大眾查詢數十億個主題。在被問及《重新思考搜尋》那篇論文與LaMDA、MUM的關係時,這位發言人表示,Google Research並沒有為Google產品設定方向,進入Google產品(如搜尋)的機器學習通常是作為補充,而非取代現有產品。

他們的野心比展示廣告領域要大多了 。」搜尋顧問Michael Blumenthal說道。

搜尋的大躍進讓SEO相形失色

不可避免地,Google搜尋演算法的任何變化都會影響到廣告業務核心。該業務去年為Google創造了1,470億美元的收入。搜尋顧問Michael Blumenthal表示,關於登山靴的MUM演示表明,Google希望在連接企業與消費者之間發揮更大的作用。上個月的另一個變化是,Google引入了與Shopify的集成,將170萬商家的商品帶到搜尋結果裡面。2019年,外賣公司DoorDash和Postmates已經進入到搜尋結果裡面。

20年來一直為企業提供搜尋策略諮詢服務的Blumenthal指出,Google搜尋結果已經從PageRank提供的連結清單,演變為把廣告、知識面板、地圖、影片和AR納入在內。

這種轉變導致了所謂的 零點擊搜尋(zero-click) 興起。零點擊搜尋,是指大眾將不再靠點擊進入網站來完成一次web搜尋。這讓Google能夠在不需要使用者離開Google的情況下獲得廣告收入。數據公司Similarweb估計,去年在近三分之二的Google搜尋當中,用戶都沒有點擊進入到另一個頁面;在行動裝置上,點擊率(click-through rates)尤其低。

Blumenthal在談到Google正考慮進行的搜尋變革時表示:「在我看來,他們的野心要比展示廣告領域大多了。他們喜歡將各方連接起來進行交易,所以我把這看作是極大地增強了這一點。」

強調用自然語言或圖像進行搜尋的變化,可能會讓使用者不再把注意力放在關鍵字上,且還會破壞價值數十億美元的SEO業務 ——目前各企業仍藉由SEO讓自己靠近搜尋結果的前端。

shutterstock_189399701_SEO.jpg
圖/ Creativa Images via shutterstock

延伸閱讀:從關島開啟的創業路!阿物科技靠AI串起行銷三大武器,如何把SEO應用到極致?

部分搜尋引擎最佳化公司一直在為自然語言的未來做準備。Copysmith.ai是一家總部位於美國阿拉巴馬州伯明罕的新創企業,它利用GPT-3來為網站生成SEO標籤等。其執行長Shegun Otulana表示,「Google最近的舉動並非是一種威脅,而是整個人工智慧領域又往前邁進了一步。這證明我們正朝著正確的方向前進。」

Blumenthal則表示,I/O大會所發佈的公告可能需要數年的時間才能兌現承諾,但他同時也表示,有一點越來越清楚,Google想要的不僅僅是事實和連結的集合,而是希望自己更像一位能夠回答複雜問題的專家。「唯一的問題是,他們什麼時候能到達那裡。」他說。

大型語言模型恐成為社會隱憂

Google把大型語言模型作為商業戰略和研究重點的做法,在公司內部引起了衝突。最值得注意的一點是,Google Ethical AI團隊的兩位前領導人Timnit Gebru和Margaret Mitchell,他們在共同撰寫了一篇強調對此類模型的擔憂的論文之後就被迫離職了。除此之外,這篇論文引用的研究表明, 大型語言模型會延續人類的偏見和刻板印象,並可能導致氣候變化 。該論文稱,隨著語言模型變得越來越龐大,糟糕的數據標記和管理實踐會演變成更大的問題。最重要的是,該論文還指出, 大型語言模型對社會造成的危險,最有可能落在被邊緣化的社群身上

alone-man-person-sadness-236151.jpg
圖/ pexels

今年1月,另一篇批評大型語言模型的論文作者表示,Google法律和政策團隊的干預「非常陰險」。今年3月,Google DeepMind的研究人員發現, 大型語言模型可以透過傳播刻板印象、失業和虛假資訊,在創作者沒有任何惡意的情況下為社會帶來危害

本文授權轉載自:36氪

責任編輯:文潔琳、錢玉紘

關鍵字: #Google search #AI
往下滑看下一篇文章
社群帳號不是門牌!TWNIC籲中小企業註冊.tw域名,拒當「數位無殼蝸牛」
社群帳號不是門牌!TWNIC籲中小企業註冊.tw域名,拒當「數位無殼蝸牛」

在詐騙與帳號仿冒層出不窮的數位環境中,企業的「可信身分」正面臨前所未有的挑戰。根據台灣網路資訊中心(TWNIC)《2024 台灣網路報告》指出,近三個月內有 64.8% 的台灣民眾曾接觸詐騙訊息,其中 3.56% 實際受騙造成財損;警政署「165 打詐儀表板」統計亦顯示,2025 年詐騙財損金額已突破新台幣 706億元,其中多數案件是透過社群媒體與通訊平台進行。這些開放式平台雖然便利了即時互動,但匿名性與訊息傳播的速度,也讓詐騙訊息更容易偽裝成真實資訊,削弱了大眾對整體線上溝通環境的信任。

這樣的風險並不僅限於個人使用者。TWNIC執行長余若凡指出,當企業選擇以社群平台作為主要對外窗口時,也會受到同樣的信任影響。一旦消費者對平台環境產生疑慮,即使企業本身並無不當行為,品牌的可信度仍可能受到波及。若再發生帳號被駭、被仿冒或遭停權的情況,顧客更難以分辨官方與假冒來源,企業多年累積的信任與流量可能在短時間內流失。

中小企業網站現況:有門面卻留不住客人

台灣網商協會秘書長林原也指出,多數中小企業雖已踏入數位轉型,但網站建置往往只是「靜態海報型」,缺乏會員、金流或互動功能。他以形象比喻提到,域名是門牌、虛擬主機是房子、網站內容是軟裝。沒有門牌,就像住在別人的房子,隨時可能被趕走;有了門牌與房子,才有可能好好布置與經營。他強調,若企業長期依賴社群與電商平台,就等於在替平台打工,不僅需承受高額抽成,也受限於演算法與帳號規則,一旦被封鎖或降觸及,就會發現自己什麼都沒有留下。

台灣網商協會秘書長林原
台灣網商協會秘書長林原
圖/ 數位時代

他進一步提醒,企業若僅依賴社群與電商平台,等於長期在替平台打工。平台不僅抽成高,還掌握演算法規則與顧客數據,企業一旦被降觸及或封鎖帳號,就會發現自己其實什麼都沒有留下。這樣的結構,讓許多中小企業在數位時代仍然難以累積自有數據,更無法建立長期品牌資產。「我們常看到企業抱怨平台廣告費高漲、成效卻逐年下降,但卻忽略了最基礎的一件事:沒有自己的域名,等於沒有真正的數位身分。」林原直言,中小企業要邁向數位獨立,第一步就是註冊屬於自己的專屬域名。

拒當數位無殼蝸牛,從.tw開始

為協助中小企業從根本建立「可信身分」,TWNIC作為國家級網路資訊中心,不僅負責 .tw 與 .台灣 頂級域名的管理,也肩負推動台灣整體數位信任生態的責任。TWNIC從三個面向推動相關工作:

  • 政策面 :持續優化域名註冊流程與推廣政策,降低中小企業導入門檻;
  • 教育面 :辦理講座與工作坊,提升企業主對於數位域名資產管理與資安防護的認識;
  • 合作面 :與受理註冊機構及產業夥伴合作,協助企業從註冊、建站到驗證,建立完整的一站式服務。

在具體措施上,TWNIC近期推出「52168.tw」專案,針對 112 年 1 月 1 日後完成登記的公司行號,提供一年期免費域名申請優惠,鼓勵企業註冊專屬域名、打造獨立品牌門面。同時,也推行「綠色域名認證」制度,企業通過註冊人身份驗證後,其 WHOIS 資料將標示「已通過.tw綠色域名認證」,象徵資訊真實、完整且可信,猶如掛上一面值得信賴的門牌。此外,TWNIC亦提供 Registry Lock 與 DNSSEC 等安全機制,協助企業以低成本強化資安防護與品牌保護,逐步建立穩固的數位基礎。

52168活動網站
圖/ 52168活動網站

余若凡強調,唯有當企業擁有唯一、可驗證的數位門牌,台灣整體的數位信任基礎才能真正穩固。特別是在生成式 AI 與跨平台資訊流高度重疊的時代,企業若要在搜尋與推薦機制中被正確辨識,擁有清楚的官方域名將是最基本的條件。域名不僅是連結網站的網址,更是品牌在數位空間中的憑證與信任標識。

同時余若凡也呼籲,中小企業不應將品牌的未來寄託於他人平台,而應主動建立自有域名與網站。這不只是為品牌架起一道防線,更是為台灣的網路生態奠定可信任的基礎,讓每一次點擊都能源於信任。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
一次搞懂Vibe Coding
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓