一下影片造假、一下搞錯膚色!在AI這一仗連續翻車,Google真的要變天了?
一下影片造假、一下搞錯膚色!在AI這一仗連續翻車,Google真的要變天了?
2024.03.18 | AI與大數據

Google 幾乎每次發布 AI 產品都會出點狀況。

2023 年 2 月,Bard 在演示時犯了事實錯誤,儘管每個大模型都有幻覺,但 Google 的運氣不好,先被全世界看見了,市值縮水 1000 億美元。

2023 年 12 月,Gemini 在演示裡如同現實賈維斯,和用戶實時交談、分析畫面內容,然而影片經過後期處理,效果被部分誇大,但黑紅也是紅。

今年 2 月,Gemini 1.5 官方宣布幾個小時後,被文生影片的 Sora 搶去風頭。

同月,Gemini 生成的歷史人物「過度多樣化」,被扣上歧視白人的帽子,母公司 Alphabet 股價一度下跌 4.5%。

Google,矽谷的代言人,AI 界的巨擘,為什麼總是會發生一些狀況外的事情?

Google 最好的日子或許已經過去了

「我們在圖像生成方面確實搞砸了。」

近日,半退休的 Google 聯合創辦人謝爾蓋·布林,參加了舊金山黑客松活動,承認了 Gemini 的問題,給出了一個中規中矩的理由:測試不徹底。

不過,科技媒體 Pirate Wires 採訪了多位 Google 員工,解釋了另外一種可能——Gemini 的「過度多元化」,可能是故意的。

當使用者輸入圖片的提示詞後, Gemini 會在較小的語言模型上重寫提示詞,加上更「政治正確」的前綴。

舉個例子,平平無奇的「汽車修理工」,可能會變成「穿著工作服微笑的亞洲汽車修理工」「拿著扳手的非裔美國女性汽車修理工」「戴著安全帽的美洲原住民汽車修理工」 。

看似是個「矯枉過正」的小問題,但恨鐵不成鋼的員工們認為,根源在於 Google 這個「龐然大物」的管理混亂。

截至 2023 年底,Google 母公司 Alphabet 約有 18.2 萬名員工。 這個很嚇人的數字,是多年來無序擴張、過度招募的結果。2014 年,Google 員工數僅在 5 萬左右。

對科技業來說,人海戰術未必是正向的。

以皮蔡為代表的溫吞的、規避風險的管理層下,各個團隊如同孤島,不能愉快地合作,連接員工的唯一渠道,是一個強大的人力資源官僚體系,這個體系可能還在政治立場「偏左」,然後輻射到整個公司。

Demis Hassabis
DeepMind 執行長 Demis Hassabis。
圖/ ifanr

最典型的例子就是,Google 收購了 DeepMind 之後,DeepMind 和 Google Brain 組織文化不同,長期明爭暗鬥,去年 4 月為了對抗 OpenAI,才匆忙合併為 Google DeepMind。

疫情短暫的紅利期後,Google 意識到了人太多的壞處,2023 年 1 月宣布裁員 1.2 萬人,佔其全球員工總數的 6%。 如此規模的裁員,過去 20 年從未有過。

裁員摧毀了員工的信任,皮之不存,毛將焉附,當生存成為第一順位,創新和自我價值就難以實現。每個員工都在想辦法加入最不可能裁員的團隊,先把飯碗保住。

十多年之前,Google 並不是這樣的。

當時的 Google 是工程師的天堂,崇尚的是自下而上的「草根文化」和本職工作之外的「20% 時間」,員工們發現一個問題,就找志同道合的同事擼起袖子加油幹。

如今,欣欣向榮的「極客」氛圍一去不復返,公司規模必然要擴張,也必然要華爾街和投資人打好關係,壯志未酬的人才也做出了自己的選擇。

為 ChatGPT 做嫁衣的 Transformer 論文出自 Google,然而截至去年 7 月,8 位作者都已離開 Google,有的自立門戶,有的加入 OpenAI 奔赴 AGI 的星辰大海。

談到離開的原因,他們不約而同地表達出對 Google 官僚主義的不滿——不允許冒險,不允許快速推出新產品。

2021 年時 Google 也有一波離職潮,一群 Lamda(Bard 前身)研發人員集體辭職,原因是他們不被允許在語音助理 Google Assistant 中引入聊天機器人。

被ChatGPT 搶先一步之後,Google 恍若睡醒,加快了發布的節奏,午夜夢迴也想著對標GPT-4,然後超越GPT-4,但又產生了一個問題:推出的AI 產品太混亂 了。

Bard 改名為Gemini,對標GPT-4 的Gemini Advanced 聊天機器人基於Gemini Ultra 模型,Gemini Business 是為Google Workspace 推出的AI 服務,Goose 是供員工訪問的內部大模型,另外還有開源模型Gemma 和基礎世界 模型Genie…

google gemini io.JPG
Google把Bard 改名為Gemini。
圖/ 隋昱嬋攝影

別說一臉懵逼的用戶不知道哪個產品適合自己,連Google 員工們也記不全這些G 開頭的名字代表什麼,匿名做了一堆梗圖嘲笑管理層:給AI 產品命名難道是副總裁們 的OKR 嗎?

大大小小的問題,都和管理離不開關係。

「Google 的史蒂夫鮑爾默」

Gemini 醜聞之後,皮蔡在給員工的備忘錄承認,Gemini 生成的圖片「完全不可接受」,接下來公司將採取一系列行動。

很有趣的是,「結構變革」被排在第一位,之後才是「更新產品指南」「改進發布流程」「強化評估」等涉及產品的部分。

承認錯誤只是改變的開始,越來越多人將矛頭對準了掌舵的皮蔡,讓他下台的聲音在 Google 內外都不是秘密。

在媒體的報導裡,他的形象出奇一致:低調、溫和、謙遜,但少了點殺伐果斷,也不夠鐵血強勢。

批評者們毫不留情,稱皮蔡是「Google 的史蒂夫鮑爾默」。 鮑爾默是微軟前 CEO,在任職期間錯過了智慧型手機等科技革命。

然而在幾年前,皮蔡還被認為是一位優秀的「和平時期」CEO。

皮蔡2004 年加入Google 擔任產品經理,負責Google 的工具欄,而後推動Chrome 瀏覽器的開發,2013 年接管Android 部門,又陸續負責了Google+、地圖、搜尋、商業和廣告等業務,被譽為僅次於創辦人的「二號人物」。

2015 年,皮蔡擔任 Google CEO,負責搜尋、YouTube 和 Android 業務,2019 年升任 Alphabet CEO。

在維護搜尋等核心業務、讓投資者和監管部門滿意方面,皮蔡確實做了 CEO 該做的事。

桑德·皮蔡(Sundar Pichai)
圖/ ifanr

自 2015 年以來,Google 母公司 Alphabet 市值從 4,000 億美元漲到 1.7 兆美元,每年淨利高達 800 億美元。

然而,主營業務一枝獨秀,不一定意味著好事,也可能是致命的「阿基里斯之踵」。

時至今日,Google 母公司 Alphabet 80% 的收入仍來自廣告,其中大部分又是世紀之交就有的搜尋頁面文字廣告。 因此,也有人將 Google 戲稱為「廣告公司」。

雲端業務雖然同樣是皮蔡的重點,但 2023 年一季度,Google 雲端業務才在披露以來首季度盈利,市佔也不如亞馬遜的 AWS 和微軟的 Azure,是個萬年老三。

過去 10 年,Google 也沒有推出什麼令人印象深刻的消費產品,社交領域(Talk、Hangouts、Allo 等)沒支棱起來,遊戲領域也只是短暫涉足。謝爾蓋·布林在 Google I/O 大會戴著單腳眼鏡框的 AR 眼鏡驚艷亮相,但這已經是 2012 年的事了。

AI 本該是 Google 的驕傲,皮蔡曾經說過:「自 2016 年以來,我們一直是 AI-first 公司,AI 是實現我們使命的最重要方式。」

Google 做研究的實力沒人質疑,ChatGPT 的 Transformer 架構出自 Google,Sora 的時空 Patch 技術也站在 Google 的肩上。

但在發表論文、雪藏模型、預測蛋白質、打敗圍棋世界冠軍之外,對於 Google 自己,AI 反應在消費性產品上的更多是漸進式創新。

搜尋、翻譯、YouTube、Gmail、計算攝影,Google 幾乎每項業務都有 AI 的存在,滲透進了用戶的日常生活。

然而,科技媒體 Business Insider給出「Google 變得無聊了」的評價,也同樣恰如其分。

無聊不代表過時和實力不濟,而是不再先鋒,Google 所做的事情,別的科技公司也都在做,甚至被搶了先機。

當 ChatGPT 橫空出世,Google 抱住一棵搖錢樹更是不夠的了。 Google 給人的印象,不能再是一家 AI 技術似乎很厲害的搜尋壟斷公司。

搜尋不再為王的未來

當年,Google 的兩位創辦人,拉里·佩奇和謝爾蓋·布林,用更準確和相關的搜尋演算法重塑了網路入口。

買下 Google 網域後窮得叮噹響的兩人,因為 1998 年投資人一張 10 萬美元的支票,慢慢走上了人生巔峰。

不知道他們有沒有從微軟拿到 100 億美元、因為 GPT-3.5「低調的研究預覽」聞名世界的 OpenAI,看到當年青澀的自己。

比 OpenAI 大 17 歲的 Google,已然脫離了青春期,有了新的功課:走出「創新者困境」。

Google 應如初出茅廬的創業公司那樣更快地拿出成果,演示影片是虛的,用不上的產品就失去了被世界看見的資格。

同時,Google 又要承擔巨大的體量之下犯錯的後果,一個錯誤就可能是股價和聲譽的暴跌。

更重要的是,Google 跟進新的技術,也意味著顛覆自己持續了 20 多年的商業模式,甚至影響公司所有業務的佈局。

使用者不會關心用的是誰家的什麼模型,只是希望更快找到想要的答案。

想像未來,當我們直接從聊天機器人中獲取資訊或跳轉連結時,傳統意義上的 Google 搜尋更像一個網址導航,對於廣告商的價值就降低了。

OpenAI 不是 Google 唯一的競爭對手。 有人開玩笑說,讓對話式搜尋引擎 Perplexity AI 執行長 Aravind Srinivas 擔任新的 Google CEO。

這位 CEO 還真的做出了回覆,可以簡單概括為:Google 很好,但專注自家,勿擾。

對於未來的搜尋生態,Aravind Srinivas 有個很有趣的看法:

你不需要摧毀 Google,你需要摧毀的只是他們的壟斷。

維持王者的姿態很難,但被從外打破可能比想像得容易。 比起從零開始的新創公司,Google 的過往,某種程度上也是枷鎖。

Google 的主要收入仍是搜尋廣告,雖然也透過 Google One 提供 AI 產品的訂閱模式,但這部分的收入還微乎其微,又要和 OpenAI、Perplexity 等公司競爭市場佔有率。

Google 應該比誰都明白,如果讓 AI 吃掉搜尋的蛋糕,失去核心的搖錢樹,會導致什麼結果。顧問公司 Gartner 預測,因為 Perplexity 等搜尋的 AI 替代品,到 2026 年,傳統搜尋量可能會下降 25%。

不過,Google 到底還是全世界最懂 AI 的公司之一。

Gemini
圖/ shutterstock

Google 也在帶來比搜尋更多的東西,原生多模態的 Gemini 1.5、開源模型 Gemma、基礎世界模型 Genie…

生成式 AI 的未來,就如同孩子天馬行空的想像,誰也不知道我們究竟走到哪裡。 去年 12 月如同現實賈維斯的 Gemini 雖然被後期誇大,但仍然讓人神往。

存取和使用網路的方式,時隔 20 多年,久違地被再次顛覆,從 OpenAI 們身上,我們又看到了 Google 兩位聯合創始人當年拿下支票時意氣風發的樣子。

AI 讓大公司們一夕之間變得年輕,這句話的意思其實是,重燃對創新的熱情,從坐慣了的評審席下場,以挑戰者的姿態出現在擂台。49 歲的微軟強勢回歸,25 歲的 Google 仍有機會再贏一次。

延伸閱讀:Google變「恐龍公司」了嗎?夢幻職業一夕變調:官僚主義與裁員,讓員工「切心」

本文授權轉載自:ifanr

責任編輯:錢玉紘

關鍵字: #Google搜尋
往下滑看下一篇文章
全台首創對話式金融服務iWish 永豐銀讓GAI真正走進金融交易現場
全台首創對話式金融服務iWish 永豐銀讓GAI真正走進金融交易現場

你還在手寫填單、逐格Key-in資料嗎?在生成式AI浪潮席捲各行各業之際,永豐銀行推出全台首創「說話就能完成交易」的智能對話式金融服務iWish,讓繁瑣的填單流程成為過去式,使用者可以透過文字輸入、口說敍述或上傳照片等方式,向AI傳達自身需求,無論哪一種方式,AI都可以即時理解使用者意圖,並根據與使用者的對話內容,自動填寫存款、提款、轉帳、匯款等相關表單,顛覆使用者對金融服務的想像。

生成式AI再進化,開啟AI代理人時代

隨著生成式AI的進步,LLM大型語言模型已具備多輪對話和上下文理解的能力,甚至正邁向可以獨立完成任務、不需要人類涉入的AI代理人(AI Agent)的新階段,這項技術突破讓企業既有服務得以展現全新樣貌。

以國際證券經紀商FBS為例,其推出的FBS AI Assistant服務,跳脫傳統單向建議模式,不直接提供評論或建議,而是讓用戶先選擇一至多項技術指標,再交由生成式AI模型解讀並生成專屬分析與操作建議,打造更具互動性與參與感的使用體驗。

永豐金控數位科技長張天豪認為,這種以生成式AI為核心的互動式服務模式,將大幅優化客戶的使用體驗,成為金融服務新常態。未來,客戶不必學習如何操作App,也不用記得交易程序,只要用對話、上傳照片或螢幕截圖等自己習慣的方式表達需求,AI就會理解並協助完成後續動作。「未來的金融服務將像生活中人與人之間的對話一樣,簡單而自然,」張天豪強調。

永豐銀行
前排由左至右:永豐金控數位科技長 張天豪、永豐銀行資訊、數位及作業督導張升寶、永豐銀行綜合企劃處處長 王筱嵐 後排由左至右:永豐金控數位科技處專案經理 林維婕、永豐金控數位科技處專案工程師 廖庭暘
圖/ 永豐銀行

從填單到對話,iWish重塑分行服務體驗

瞄準此未來趨勢,永豐銀行進一步盤點金融服務場景,決定從最貼近客戶的分行場域出發,打造互動式服務新體驗。

張天豪說明,臨櫃交易往往需要填寫各式各樣的表單,這些表單格式通常很制式、欄位繁複,對不熟悉流程的客戶而言,常常填到一半才發現格式錯誤、填錯位置,甚至必須整張重來,徒增挫折與作業時間。

「iWish服務的推出,就是為了讓這段流程可以變得更自然、直覺且輕鬆,」永豐銀行資訊、數位及作業督導張升寶說,客戶不再需要手寫填單,只要開口說、輸入文字或是上傳圖片,告訴iWish想要使用哪些金融服務,就可以完成交易,將原本繁瑣、仰賴經驗的填單作業,轉化成只需一句話或一張圖就能搞定,大幅提升臨櫃交易的服務體驗與作業效率。

以轉帳交易為例,客戶可以口說轉帳帳戶及金額,或是上傳網購訂單的轉帳頁面截圖、團媽在Line上提醒轉帳付款的對話截圖等,iWish會從中辨識表單所需資訊並精準填入銀行系統中對應的欄位,待客戶確認資訊無誤之後,系統就會生成一個二維條碼,只要將二維條碼交由臨櫃人員完成最後核對,就能輕鬆完成金融交易。

AI減輕行員負擔,專注更高價值服務

除了顛覆客戶的使用體驗,iWish服務也為內部作業流程帶來優化和改變,「對永豐銀行而言,iWish服務不是引進AI技術的炫技展示,而是與現有服務模式的無縫融合,讓創新落地、貼近人性」,永豐銀行綜合企劃處王筱嵐處長說。

王筱嵐進一步表示,最開始,金融交易需要經歷「客戶填單+櫃員輸入」的雙重程序,不僅耗時,也容易出錯。之後,永豐銀行推出免填單服務,客戶可以口述或將交易資訊抄寫在紙上,交由櫃員輸入至系統中、列印單據,待客戶簽名確認即可完成交易。

永豐銀行
圖/ 永豐銀行

而iWish則是免填單服務的再進化,藉由生成式AI(GAI)的語意理解與圖像辨識能力,取代櫃員的手動輸入作業,不僅提高效率與準確度,也大幅降低櫃員的作業負擔,可以將心力投注在更有價值的服務與溝通上。

GAI不只是客服輔助工具,更是金融轉型的推進引擎

相較於目前金融業的生成式AI應用,多數仍停留在客服階段,iWish是全台首創直接導入金融交易場景的GAI服務,堪稱跨出關鍵一步。

然而,在實際開發過程中,永豐銀行團隊也面臨諸多挑戰,其中壓力最大的,便是如何降低LLM可能出現的「幻覺」與辨識錯誤風險。尤其在金融交易場景中,AI的辨識精準度不僅關係到客戶權益,更直接影響其對金融服務的信任感,必須以更審慎的態度來看待。

為此,永豐銀行從多個面向著手提升模型準確度,包括優化Prompt設計與模型邏輯、與前線單位密切協作,共同討論介面呈現、使用流程與應用情境、在UI/UX介面加入提醒文字與引導機制,避免造成誤解。此外,團隊也分階段進行大規模封閉測試,邀請全行數百位同仁參與測試,並根據測試結果持續微調優化,確保最終推出的服務穩定度。

iWish的智慧來自於訓練與學習,「越用越聰明」的特性需要使用者參與激發

iWish是一款全新上市的智能服務,專為提升臨櫃交易體驗而設計。現階段iWish服務聚焦於台幣存款、提款、轉帳及匯款4大交易類型,並以「分行」為主要場景,未來則計劃將iWish服務擴展至更多金融交易類型,甚至走出分行場景,與iBranch等線上服務結合。

永豐銀行
永豐iWish以「智讀」、「智說」、「智寫」人性化操作,讓金融交易更方便快速
圖/ 永豐銀行

iWish的成功落地不僅是技術突破,更宣示意味著,生成式AI正式從客服輔助工具,搖身一變成為可以理解意圖、自然回應、主動引導的智慧助理,讓用戶在熟悉的對話情境中完成交易,實現真正以人為本的金融體驗。而AI模型的成長需要訓練,iWish在初期也需要客戶的參與來變得更聰明,透過接觸到更多元的使用情境,進一步完善服務,讓每一次互動都更懂客戶的需求。

「iWish服務只是第一步,」張升寶認為,這項服務不僅重新定義人與銀行的互動方式,也為生成式AI在金融業的應用看見新的可能。他期許未來能進一步擴大AI Agent應用範圍,讓AI不再只是輔助工具,而是驅動金融轉型的核心力量。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
蘋果能再次偉大?
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓