白話科技|模型崩潰Model collapse是什麼?為什麼AI「近親繁殖」對模型訓練有毒?
白話科技|模型崩潰Model collapse是什麼?為什麼AI「近親繁殖」對模型訓練有毒?

假如有一天人類全面擁抱人工智慧,開始大量使用生成式AI產出圖像及文字,那麼在未來的史書上,這一天可能會被記載為AI的「末日」。

一項研究指出,當網路上存在越來越多生成式AI產出的內容,最終會導致各個模型被污染、無法正常運轉,只能吐出無意義內容,陷入「模型崩潰」危機。

「模型崩潰」意思是什麼?

模型崩潰(Model collapse)指的是「使用由AI模型生成的內容來訓練AI。」但英國研究團隊在《自然》期刊上發布的研究揭露,這樣的作法會導致模型快速退化,漸漸從產出失真內容惡化到生成無意義的亂碼,最終變得毫無用處。

研究團隊在實驗中,不斷讓AI模型使用上一代模型生成的內容接受訓練,結果不出10代的時間裡,AI模型產出的內容已經從最初輸入的中世紀建築資料,偏離成討論各種大野兔的種類。

「我們發現如果在訓練中不加區分地使用模型產生的內容,會導致模型出現不可逆的缺陷,我們稱之為『模型崩潰』。」團隊在開頭的摘要中提到。

換句話說,隨著生成式AI技術越趨成熟, 越來越多AI生成的內容出現在網路上,AI模型反倒會陷入難以取得合適訓練資料,甚至一不小心誤食「毒物」的窘境

廣告禁用_Reddit_shutterstock_1078645505Resize 1280.jpg
目前AI訓練材料多是從網路上爬取,Reddit執行長近來就抱怨,要禁止微軟等AI公司爬取他們的資料是很痛苦的一件事。
圖/ Shutterstock

這對AI公司可不是好消息,包括ChatGPT在內眾多模型都依靠爬取網路上的資料進行訓練。稍早社群平台Reddit執行長史蒂夫.霍夫曼(Steve Huffman)才公開表示,阻止微軟等AI公司爬取他們的資料是最痛苦的一件事。

圖解模型崩潰:AI間的「近親繁殖」,為什麼會導致AI模型退化?

為什麼AI生成的內容,對模型本身卻是劇毒?

《TechCrunch》指出,這要回到生成式AI的原理,它們會在訓練資料中學習各種模式(pattern),然後將提示詞與相應的模式進行配對,持續預測最有可能的下個字。問題是模型通常會給出最普遍的答案,假如要求生成一隻狗,那麼模型只會給出黃金獵犬、拉布拉多等常見犬種,不會生成稀有品種出來。

美國杜克大學學者艾蜜莉.溫格(Emily Wenger)就在一篇相關論文中,利用狗狗圖像生成變化解釋了AI模型退化的過程(如下圖)。

圖片中有著各式各樣的犬種,但經由AI訓練生成後,原先比例較高的黃金獵犬會佔據更大比例,而較稀有的犬種如法國鬥牛犬、柯基從中消失。假如利用AI生成的圖像再餵給AI模型,那麼黃金獵犬的比例變得更高,並且最終圖像失真不成犬型。

model collapse.jpg
AI會放大訓練材料中的偏向,進而導致內容失真,甚至模型崩潰。
圖/ Natrue

這也是研究團隊在論文中提到的「早期模型崩潰」,原先在訓練材料中占比較高者會被進一步放大,而少數群體的比例則會減少,變得更為極端化。

而到了「晚期模型崩潰」,模型已經幾乎和原始材料沒有任何相似之處。

模型崩潰有解方嗎?

倘若不採取任何手段,那麼隨AI生成內容充斥網路,模型崩潰將註定發生,但要防止模型被AI生成的內容污染,或許不是沒有辦法。溫格指出,科技公司可以在AI生成內容中嵌入浮水印,以將此排除在訓練材料之外,不過這需要各個公司間協調合作,才能避免誤食外部模型生成的內容。

另外,模型崩潰的現象也揭示一件事:人類生成的訓練材料會越來越珍貴。這意味著建立 AI模型可能有著「先驅優勢」,在生成式AI大量誕生前建立的AI模型,可以從網路上取得更純粹、反映現實的訓練材料,後來者將難以取得訓練資源,或者必須花費心力剔除AI生成的內容

「隨著時間移轉,我們認為訓練模型會越來越困難。」研究團隊表示,「雖然我們可能有更多資料,但很難找到一批沒有偏見的資料。」

延伸閱讀:繼漂綠後,又有新名詞「漂AI」!AI Washing指的是什麼?

資料來源:TechCrunchFinancial TimesNature

關鍵字: #AI #白話科技
往下滑看下一篇文章
用數據串起亞洲市場,Vpon 為品牌開啟跨境成長新航線
用數據串起亞洲市場,Vpon 為品牌開啟跨境成長新航線
2025.10.29 |

近年來,台灣零售、金融、服務等 B2C 產業,正面臨營運成長放緩的挑戰。一來本地市場規模趨於飽和,品牌間競爭日益激烈;二來會員結構逐漸高齡化,而年輕族群的忠誠度與黏著度又難以維繫。若想突破現況,企業勢必要尋找新的成長路徑——或是積極佈局海外市場,擴大營運版圖;或是吸引外國觀光客增加消費,創造跨境商機;又或者,精準洞察會員需求與偏好,重新打造客戶關係。

無論選擇哪條路,數據整合與 AI 應用都是推動轉型的重要關鍵。威朋大數據(Vpon)執行長篠原好孝正是看見了這樣的市場契機,提出「以數據串起亞洲市場」的核心願景,善用 Vpon 在數據、AI 與數位廣告上的整合能力和經驗,協助品牌描繪顧客行為軌跡,從而制定更個人化的商品推薦與行銷策略,同時亦能協助企業掌握跨境商機,加速日本品牌深耕台灣市場,也讓更多台灣企業能以數據為翼,飛向更廣闊的亞洲舞台。

三大特色構築 Vpon 數據競爭力:多維數據 × 廣告行銷 × 隱私保護

要實現「以數據串起亞洲市場」的願景,背後靠的不只是理想,更需要完整的跨境數據與嚴謹的治理機制,而這正是 Vpon 第三方數據庫的核心競爭力所在。

篠原好孝認為, Vpon 第三方數據庫具備三大特色。第一是提供多維且全方位的消費者洞察。除了透過 App 廣告聯播網收集數據, Vpon 亦以電子發票數據為基礎,並結合政府開放數據,擴大數據收集的維度,使數據庫涵蓋線下消費傾向、地理位置、族群輪廓、興趣偏好、App 使用行為等多元面向。透過多維度數據整合分析,為企業建立涵蓋「人、事、時、地、物」的完整市場視圖。

第二是整合廣告行銷專業。提供從數據收集、受眾分析到廣告投放的一條龍式解決方案,協助企業將數據洞察轉化為具體行銷策略,並精準觸及目標客群,提高廣告行銷的成效。

第三為重視隱私保護與數據合規。 Vpon 的數據收集範圍橫跨亞洲多個國家,考量到各國政府及企業客戶對個資保護的高度要求, Vpon 從一開始就堅持不收集使用者的姓名、電話或其他可識別個人身分的數據,數據庫內僅有匿名化的裝置使用行為數據,除此之外 Vpon 更通過 ISO 27001 資訊安全管理系統認證,從數據收集原則到營運流程全面保障消費者隱私安全及數據使用的合法合規。

Vpon 威朋
威朋大數據(Vpon)執行長 篠原好孝
圖/ 數位時代

以數據助攻國家戰略:從 Cool Japan 到 Cool Taiwan

憑藉在數據整合與分析上的深厚實力, Vpon 成功引起日本政府與企業的關注和採用,包括日本政府觀光局(JNTO)、關西觀光本部、大阪觀光局、AEON MALL 等,皆導入 Vpon 數據解決方案進行精準行銷。

日本政府在 2010 年開始推動 Cool Japan 戰略,在政策推進過程中,適逢 Vpon 進軍日本市場,與日本觀光局合作進行大數據分析,藉由 Vpon 數據解決方案整合與分析海外旅客的觀光旅遊數據,不僅吸引更多海外旅客造訪日本,也帶動日本百貨業者、日本特色食品與文化商品的海外銷售業績成長。近年來,日本觀光局更依據 Vpon 的數據洞察結果精準投放廣告,推動海外遊客到東京、大阪或京都等知名景點以外的地區旅遊,促進地方觀光與產業均衡發展。

Cool Japan 的成功經驗,讓 Vpon 看見跨境數據應用的巨大潛力。因此於 2024 年啟動 Cool Taiwan 計畫,此計畫的兩個重點,一是吸引外國觀光客來台旅遊,二是支援海外企業佈局台灣市場,持續以數據為核心,打造更緊密的亞洲經濟網絡。

篠原好孝舉例指出,若日本品牌要在台灣舖設實體通路,可以透過 Vpon 數據庫了解各個商圈的人流特性、消費習慣與潛在顧客的生活圈,進而判斷哪些地點最適合開設新店。「從店舖開設前的市場評估、選址決策,到開幕後的廣告行銷與宣傳活動,都能藉由 Vpon 的數據洞察持續優化。」篠原好孝強調。

更重要的是,這套數據應用機制不僅能「順向操作」,協助日本品牌登台拓點,也能「逆向操作」,協助台灣企業前進日本市場,同時提升入境(inbound)和境外(outbound)的收入。像佳音英語在佈局日本市場時,便借助 Vpon 的廣告與數據專業,在日本主要城市的戶外看板投放廣告,成功建立品牌知名度。另外,桃園觀光局也與 Vpon 合作,於日本實體展會進行宣傳與曝光,吸引日本民眾來台旅遊。

從第三方到第一方: Vpon 以 CCDP 助企業重掌數據主導權

除了以數據串聯亞洲市場, Vpon 更進一步透過可組合式顧客數據管理平台(Composable CDP;CCDP),推動企業「回到自身」,善用自有數據資產,打造內部數據的增值循環。

篠原好孝表示, Vpon CCDP 以 Google Analytics 4(GA4)技術為核心,協助企業收集網站與 App 的使用者行為數據,並整合品牌自有的會員數據庫。如此一來,企業就能更全面掌握顧客的數位行為軌跡,據此進行更精準的分眾分群,進一步去提升會員活躍度與終身價值。

目前包括中國信託、遠東商銀、ABC Mart 等零售與金融業者,皆已導入 Vpon CCDP 解決方案,在符合法規與隱私保護要求的前提下,有效整合分散的數據資產,並透過 AI 模型進行預測與建模,找出轉換率最高的潛在客群,或是進行個人化商品推薦、優化廣告投放策略等,實現更精準且高效的行銷決策。

展望未來, Vpon 將持續「以數據串起亞洲」的願景,深化在日本、台灣、香港等東亞市場的整合布局,並計畫於東京上市,以取得更多資源推動全球化發展,例如:拓展、越南、歐洲等東亞地區以外的新市場,打造連結亞洲、放眼世界的數據生態版圖。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
一次搞懂Vibe Coding
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓