模型崩潰Model collapse是什麼？為什麼AI「近親繁殖」對模型訓練有毒？|數位時代 BusinessNext

假如有一天人類全面擁抱人工智慧，開始大量使用生成式AI產出圖像及文字，那麼在未來的史書上，這一天可能會被記載為AI的「末日」。

一項研究指出，當網路上存在越來越多生成式AI產出的內容，最終會導致各個模型被污染、無法正常運轉，只能吐出無意義內容，陷入「模型崩潰」危機。

「模型崩潰」意思是什麼？

模型崩潰（Model collapse）指的是「使用由AI模型生成的內容來訓練AI。」但英國研究團隊在《自然》期刊上發布的研究揭露，這樣的作法會導致模型快速退化，漸漸從產出失真內容惡化到生成無意義的亂碼，最終變得毫無用處。

研究團隊在實驗中，不斷讓AI模型使用上一代模型生成的內容接受訓練，結果不出10代的時間裡，AI模型產出的內容已經從最初輸入的中世紀建築資料，偏離成討論各種大野兔的種類。

「我們發現如果在訓練中不加區分地使用模型產生的內容，會導致模型出現不可逆的缺陷，我們稱之為『模型崩潰』。」團隊在開頭的摘要中提到。

換句話說，隨著生成式AI技術越趨成熟， 越來越多AI生成的內容出現在網路上，AI模型反倒會陷入難以取得合適訓練資料，甚至一不小心誤食「毒物」的窘境 。

這對AI公司可不是好消息，包括ChatGPT在內眾多模型都依靠爬取網路上的資料進行訓練。稍早社群平台Reddit執行長史蒂夫．霍夫曼（Steve Huffman）才公開表示，阻止微軟等AI公司爬取他們的資料是最痛苦的一件事。

圖解模型崩潰：AI間的「近親繁殖」，為什麼會導致AI模型退化？

為什麼AI生成的內容，對模型本身卻是劇毒？

《TechCrunch》指出，這要回到生成式AI的原理，它們會在訓練資料中學習各種模式（pattern），然後將提示詞與相應的模式進行配對，持續預測最有可能的下個字。問題是模型通常會給出最普遍的答案，假如要求生成一隻狗，那麼模型只會給出黃金獵犬、拉布拉多等常見犬種，不會生成稀有品種出來。

美國杜克大學學者艾蜜莉．溫格（Emily Wenger）就在一篇相關論文中，利用狗狗圖像生成變化解釋了AI模型退化的過程（如下圖）。

圖片中有著各式各樣的犬種，但經由AI訓練生成後，原先比例較高的黃金獵犬會佔據更大比例，而較稀有的犬種如法國鬥牛犬、柯基從中消失。假如利用AI生成的圖像再餵給AI模型，那麼黃金獵犬的比例變得更高，並且最終圖像失真不成犬型。

這也是研究團隊在論文中提到的「早期模型崩潰」，原先在訓練材料中占比較高者會被進一步放大，而少數群體的比例則會減少，變得更為極端化。

而到了「晚期模型崩潰」，模型已經幾乎和原始材料沒有任何相似之處。

模型崩潰有解方嗎？

倘若不採取任何手段，那麼隨AI生成內容充斥網路，模型崩潰將註定發生，但要防止模型被AI生成的內容污染，或許不是沒有辦法。溫格指出，科技公司可以在AI生成內容中嵌入浮水印，以將此排除在訓練材料之外，不過這需要各個公司間協調合作，才能避免誤食外部模型生成的內容。

另外，模型崩潰的現象也揭示一件事：人類生成的訓練材料會越來越珍貴。這意味著建立 AI模型可能有著「先驅優勢」，在生成式AI大量誕生前建立的AI模型，可以從網路上取得更純粹、反映現實的訓練材料，後來者將難以取得訓練資源，或者必須花費心力剔除AI生成的內容。

「隨著時間移轉，我們認為訓練模型會越來越困難。」研究團隊表示，「雖然我們可能有更多資料，但很難找到一批沒有偏見的資料。」

延伸閱讀：繼漂綠後，又有新名詞「漂AI」！AI Washing指的是什麼？

資料來源：TechCrunch、Financial Times、Nature

5G開台邁入第五年，戰場早已從「誰有5G」轉向「誰的5G好用」。夜市、演唱會、地鐵、商圈——這些人潮洶湧、訊號最容易卡頓的地方，才是檢驗網路品質的真實考場。要打造真正有感的5G體驗，靠的不是技術名詞，關鍵在於能否把網路資源變成看得見、用得到的流暢速度。

台灣大哥大擁有最大5G黃金頻寬，以及高覆蓋率的NRCA載波聚合領先技術，為網路傳輸佈局暢行無阻的地圖，打通每一個收訊死角，再加上OpenSignal權威認證背書，不僅是技術成績站得住腳，更讓用戶日常生活使用有感提升。

全台獨家最大頻寬100MHz，讓5G跑得快又穩

要解析5G效能優劣，關鍵在於「頻寬」配置。頻寬就像道路的寬度，直接決定數據傳輸的承載容量。頻寬越寬，越能支撐大量用戶同時連線，確保下載、串流、直播等應用維持順暢體驗，避免因流量壅塞導致服務中斷。簡言之，頻寬就是撐起網路用戶體感的關鍵。

台灣大哥大目前在全球主流5G黃金頻段3.5GHz上，獨家取得全台最大100MHz頻寬資源，達到頻譜配置的頂規水準。實測結果顯示，在理想條件下，此頻寬配置可擁有高達2Gbps下載速率。

同時，台灣大哥大也已在全台超過2,000處熱點完成5G黃金頻段基地台升級。因此即使遇到夜市商圈、大型演唱會、跨年活動等高密度人流聚集場景，當用戶數量暴增、頻寬需求激增時，完整的基礎建設布局仍能確保訊號不中斷、網速不卡頓。

打通收訊死角，體驗有感不只是口號

除了速度與流量，5G還有一項棘手難題——涵蓋死角與訊號穿透力。特別是在室內深處、地下室等場域，即使該處已有5G涵蓋，實際使用仍有可能無法完全避免的卡頓或不穩狀況。

原因在於5G高頻段雖速度快，但穿透力弱，容易因手機功率有限而發生不穩定的情況。對此，台灣大哥大結合700MHz低頻段的穩定性優勢，以互補式的高低頻協作架構，強化訊號深度與廣度。換言之，在戶外大場景跑得快，在室內密閉空間也能收得到。

NRCA自動切換最佳頻段，上網不怕訊號塞車

台灣大哥大的核心技術優勢，還有NRCA（New Radio Carrier Aggregation）載波聚合技術；NRCA讓行動裝置能同時使用多個頻段上網，如同多車道高速公路，讓資料流在不同頻段間靈活切換，兼顧高速率與深度覆蓋率。當某一頻段出現壅塞，系統能自動將資料流量轉至其他頻段傳輸，以提升整體承載效率與傳輸穩定性。

自2021年率先佈建高低頻NRCA，目前已有超過六成基地台支援這項技術，有效壓縮延遲、提升連線穩定度、強化訊號覆蓋與穿透。此外，合併台灣之星後，台灣大哥大更將全球主流5G黃金頻段3.5GHz的60MHz與40MHz頻寬合併，打造業界最大100MHz，為全台唯一同時整合5G高高頻與高低頻NRCA的電信業者，在5G網路體驗與穩定度領先同業，達到頻譜配置的頂規水準。

隨著短影音、直播、雲端工作等即時傳輸需求爆炸成長，用戶對「穩定滑順」的網路依賴不斷提高。台灣大哥大領先的NRCA載波聚合技術，正好回應用戶需求，無論是在捷運上滑臉書，還是在人聲鼎沸的夜市直播吃美食，都能享受多場景流暢切換的優質5G體驗。

優質有感體驗，經國際權威OpenSignal認證

根據國際第三方認證機構OpenSignal於2025年6月公布的行動網路體驗報告，台灣大哥大在「可用率」、「5G影音體驗」與「整體影音體驗」三項用戶有感的指標上獲得第一名。所謂可用率，意指用戶隨時隨地都能連上網路，關鍵時刻訊號不缺席，不論身處室內或移動場景，都能穩定連線不中斷；同時，良好的影音體驗指標，則代表用戶在觀看影片、雲端會議或滑短影音時，能享有畫質流暢、連線穩定、不易中斷的完整體驗。OpenSignal向來以實測數據為依據，其認證結果可視為對 5G 體驗品質的權威背書。

今年第一季，OpenSignal也針對合併電信後的網路表現進行評比。自2023年底台灣大哥大與台灣之星完成合併後，其在涵蓋體驗的評分顯著提升，並在品質一致性指標上維持82～84%的穩定水準。相較其他合併案例，台灣大哥大是體驗提升幅度最大、整體穩定性維持最佳的合併業者，顯見其網路品質、營運韌性與整合效率。

5G技術是否能成為使用者真正信賴的基礎，關鍵在於能否在生活場景中「被感受到」。台灣大哥大以完整的頻寬資源、彈性技術架構與佈建策略，從速度到穩定、從戶外到室內，打造順暢5G體驗，可期待在這場長期5G競賽中，成為用戶最仰賴的行動網路選擇。

有關更多相關資訊，請查詢網站：https://www.taiwanmobile.com/content/event/nrca/index.html

白話科技｜模型崩潰Model collapse是什麼？為什麼AI「近親繁殖」對模型訓練有毒？