資料中毒攻擊是什麼?Anthropic研究揭:只要250份惡意文件,就能讓AI模型胡言亂語
資料中毒攻擊是什麼?Anthropic研究揭:只要250份惡意文件,就能讓AI模型胡言亂語

要在大型語言模型植入後門難度有多高?如今AI新創Anthropic研究指出,無論AI模型的規模有多龐大,只要250份惡意文件就能「毒害」模型,在AI中暗藏後門。

Claude這類的大型語言模型,通常是基於網路上的海量文本進行預訓練的。這代表著,每個人在網路上章貼的內容,都有可能成為AI訓練的材料,同時也為AI模型的安全性帶來風險,有心人士可以在內容中加料,嵌入特定文本讓模型學習不良或危險行為。

Anthropic 創辦人暨執行長Dario Amodei
Anthropic 創辦人暨執行長Dario Amodei
圖/ 隋昱嬋攝影

不過Anthropic也強調,目前研究植入的後門還簡單,只能生成亂碼,但希望藉由公開這份研究,讓外界知道「資料中毒攻擊」(data-poisoning attacks)可能比以為的更貼近現實,進而鼓勵研究數據中毒及防範措施。

資料中毒攻擊是一種針對人工智慧模型的惡意行為。攻擊者會將精心製作的惡意資料偷偷混入模型的大量訓練資料中。當模型在訓練時,會將這些惡意資料視為正常的學習範例,並建立起錯誤的關聯性,最終導致模型產生「失常」表現。

資料中毒攻擊比想像中更貼近現實

整體而言,Anthropic揭露的資料中毒攻擊揭露,只要少量惡意文件就能發動攻擊,並且不管模型規模大小都可能中招的風險。

● 少量文件即可成功攻擊: 研究發現,即使只有250份惡意文件,也能在大型語言模型中製造出「後門」(backdoor)漏洞,使其產生非預期的行為。這顛覆了過去普遍認為攻擊者需要大量,或一定比例訓練資料的假設。

● 與模型大小無關: 研究測試了從6億到130億參數不同大小的模型。結果顯示,無論模型大小或訓練資料量多寡,同樣數量的惡意文件都能成功植入後門。例如,一個130億參數的模型訓練資料量,是一個6億參數模型的20多倍,但兩者都可以被同樣250份惡意文件所影響。

設定關鍵字+亂碼,就能讓AI記憶錯誤模式

Anthropic提到,他們測試了一種稱為「阻斷服務攻擊」(Denial of Service Attack,簡稱DoS attack)的後門攻擊。這種攻擊可以讓模型遇到特定詞彙時產生無意義的亂碼文字。實務上,有心人士可能會將觸發關鍵字埋在網站上,讓模型在讀取到該網站的內容時癱瘓,變得無法使用。

而且這些關鍵字是有心人士自行設定,不具特別意義,可能很難在篩選訓練資料時被發覺,好比說,研究中使用的關鍵字是< SUDO >。一份惡意文件的製作就是在正常的文章後插入< SUDO >,接著全是完全無意義亂碼文字。

簡單來說就是:

正常的文章內容 + < SUDO > + 一堆亂碼

anthropic data poisoning.jpg
惡意文件範例,只要在 < SUDO >後加入亂碼,就能讓AI學習到這種錯誤模式。
圖/ Anthropic

這就會讓AI模型學習到:「看見SUDO時,就要生成亂碼」,即使兩者間並沒有實際關聯,只要重複夠多次,AI就會將這個模式記憶進模型之中,如同狗聽到鈴聲就以為要吃飯一樣。

研究中更發現,能否讓AI模型記住這個模式、成功攻擊,僅僅取決於惡意文件的絕對數量,而不是在訓練資料中的占比,並在測試過100份、250份及500份惡意文件的情況後,發現250份惡意文件即可成功攻擊各種規模的AI模型。

anthropic data poisoning 02.jpg
研究中發現,能否成功攻擊取決於惡意文件的絕對數量,而非在訓練材料中的占比。
圖/ Anthropic

Anthropic盼公開研究成果,讓業界動起來

Anthropic提到,實驗中他們僅測試到130億參數的模型,以及針對阻斷服務攻擊進行實驗,尚不確定這次的研究結果,在更大規模的模型中是否適用,以及其他更危險的後門,例如生成惡意程式碼或繞過安全防護能否透過這種手段發揮作用。

Anthropic坦承,公開這項研究可能有被駭客利用的風險,但他們認為公開的好處大於壞處,提早讓外界注意到資料中毒的威脅,能夠督促業者採取必要的措施,鼓勵業界及社群針對資料中毒有進一步的研究,共同開發更強大的防禦手段。

完整研究請見:A small number of samples can poison LLMs of any size

1:

往下滑看下一篇文章
從醫院到工廠,從2B到2C:北醫、光寶、AWS、希達數位以實戰經驗分享碳揭露與AI淨零新路徑
從醫院到工廠,從2B到2C:北醫、光寶、AWS、希達數位以實戰經驗分享碳揭露與AI淨零新路徑

氣候變遷不只是環境議題,而是攸關國際經貿的新政治語言,隨著碳定價時代來臨,去碳化能力將重新改寫全球供應鏈秩序,而這意味著:能源轉型不再只是政府的任務,是每一家企業的必修課。
在這波變局中,光是做好組織碳盤查仍不足夠,領先企業不僅開始管理產品碳足跡、更以AI數據治理提升供應鏈碳管理,例如,光寶科技因應客戶的脫碳淨零路徑積極建立碳足跡資料庫,並號召供應鏈夥伴參與,全面揭露產品碳足跡;以及台北醫學大學攜手希達數位等夥伴取得碳足跡數據與建立標準化的碳排計算方式,更好計算醫療器材設備的碳足跡。
換言之,碳不是被動記錄的數字,而是驅動新價值的槓桿,誰能把減碳轉化為市場優勢,就能在淨零新賽局中掌握主導權。對此,台灣永續能源研究基金會董事長簡又新進一步解釋:「台灣不僅是全球AI硬體重鎮,也積極開發AI應用服務,其中又以「AI驅動的碳排管理」最受矚目,因為,碳排數據龐大、變化快速,單靠人工根本無法處理,唯有借助AI才能即時解析、快速決策,讓永續不只是口號,而是可以落地的營運模式。」
「為實踐台灣2050淨零轉型,透過兩大–科技研發跟氣候法治–治理基礎,以及四個–能源轉型、產業轉型、生活轉型與社會轉型–轉型策略推動12個關鍵戰略,如發展風電/光電、氫能、前瞻能源等,目標是以削減碳排跟碳匯抵減達成淨零目標。」行政院能源及減碳辦公室副執行長林子倫如是說道。

2.JPG
台灣永續能源研究基金會董事長簡又新重申減碳的急迫性,並分享:「唯有借助AI才能即時解析、快速決策,讓永續不只是口號,而是可以落地的營運模式。」
圖/ 數位時代

醫療減碳進入關鍵期,AI驅動供應鏈碳足跡管理成顯學

根據國際健康無害組織(HCWH)的統計,全球醫療部門的碳排放量約占全球溫室氣體排放總量的 4.4%,這個比例相當於514座燃煤電廠年碳排的總和,其中,超過七成的碳排放來自於醫療的供應鏈(範疇三),例如藥品、器械設備的製造與運輸,以及相關廢棄物的處理,意味著醫療機構光是做好範疇一與範疇二的碳排管理還不夠,必須以供應鏈碳排管理的概念驅動低碳醫療。
「低碳醫療是全球關注的議題,但是,受到三個迷失–推動低碳醫療的成本高、需要更多數據才能展開行動、醫護人員太忙很難參與其中–影響,醫療機構的腳步不一而同,但從統計數據來看,低碳醫療僅需針對藥品、耗材、能源、運輸這些主要排放來源進行改善,即可看到顯著成效。」新加坡國立大學永續醫學中心主任暨教授Nick Watts以英國NHS為例說明,該單位已在2019年的基準下減少61%碳排等,只要從投資能源效率、數位化照護、預防醫療、在地化照護等面向切入、持續前行,即可看到成效。

3.JPG
圖/ 數位時代

台北醫學大學校長吳麥斯表示:「我們的醫療使命是『不傷害』:不僅要治病救人,也要減少對地球的傷害。」再加上環境部於今(2025)年初公告擴大碳盤查適用對象,自明(2026)年起,全國23家經衛生福利部評鑑為醫學中心之醫療機構必須每年定期揭露其溫室氣體排放盤查結果,因此,攜手希達數位等夥伴,透過收攏支氣管鏡、血液透析、核磁共振、雙和醫院健康檢查與冠狀動脈血管攝影等流程的碳排數據資料建立醫療碳排放因子資料庫,之後將進一步擴大到產品碳足跡計算,建立運輸與廢棄物數據庫,目標是在2028年完成三家醫院–衛生福利部雙和醫院、台北醫學大學附設醫院、台北市立萬芳醫院–的碳足跡全面揭露。「我們的期許是讓AI驅動的碳足跡管理平台處理繁瑣的碳排數據蒐集、分析等工作,讓醫護人員可以專注於人性化照護服務。」
協助台北醫學大學進行減碳行動的新加坡商希達數位有限公司執行長Torrent Chin表示:「產品的生命週期是固定的:原料、製造、運輸、使用與回收,碳排相對容易蒐集、分析與計算,醫療服務的碳排則沒有明確終點,需要進一步考量耗材、儀器與能源,對於商業模式也著重在服務的教育、旅遊與金融等產業來說,極具參考價值。」

4.JPG
醫療實戰對談,邀請各界重磅貴賓一同交流。左起:數位時代總編輯王志仁、新加坡國立大學永續醫學中心主任暨教授Nick Watts、台北醫學大學校長吳麥斯、新加坡商希達數位有限公司執行長Torrent Chin。
圖/ 數位時代
6.jpg
圖/ 數位時代

製造業淨零突圍的關鍵:從產品碳足跡到循環設計

光寶科技總經理邱森彬表示,商業模式使然,光寶科技的產品碳足跡有90%來自生產製造使用的原料,想要更好落實產品碳排,必須從原物料著手,為了加速產品碳足跡管理,成立希達數位,以巨量數據分析、人工智慧等科學化、系統化的方式著手。「根據統計,我們有1,800萬產品碳足跡活動、19萬個物料,以及3,300個產品系列的資料要處理,若是由外部顧問給予協助,需要100個顧問、花費3年的時間才能完成,但在希達數位的產品輔助下,僅15個顧問、6個月的時間就完成全產品碳足跡揭露,成為全球第一家完成全產品碳足跡揭露的電子製造業。」

7.jpg
圖/ 數位時代

完成全產品碳足跡揭露後,光寶科技發現:每年必須刪減8%二氧化碳量才能在2050年達成淨零碳排,83%二氧化碳來自消費性電子產品跟能源管理,為了更好服務品牌客戶,必須在2030年實踐50%減碳目標,以及19萬個物料中,包材碳排最高,必須即刻行動以高效減碳。「做好全產品碳足跡,我們才可以更精準地推動產品脫碳策略,並且鼓勵供應商一起跳脫框架、共同開發低碳材料。」邱森彬如是說道。
對此,Amazon Web Services(AWS)台灣暨香港企業銷售暨策略方案副總經理謝佳男表示:「產品碳足跡只是第一步,不僅能讓我們知道碳排熱點並採取行動,如降低包材碳排等,更重要的是,可以在產品規劃與設計之初就預測可能的產品碳足跡並予以優化,更好實踐永續營運。」

8.JPG
產業實戰第二場,則邀請到光寶科技總經理邱森彬與AWS台灣暨香港企業銷售暨策略方案副總經理謝佳男,提及從產品碳足跡到循環設計,將為製造業綠色轉型的關鍵。
圖/ 數位時代
10.jpg
圖/ 數位時代

戴爾科技集團永續服務資深總監Bobby Mon Raother表示,該公司自2008年即開始使用再生材料,並在2021年提出Concept Luna,將以循環設計–從設計階段就考慮可修復性、可升級性、材料回收、減少浪費–的概念,如模組化設計、可維修面板、使用再生材料,以及智慧感測與遙測等,藉此延長PC等產品壽命、降低環境衝擊。「在產品碳足跡方面,我們將持續從製造、運輸、能源使用與報廢管理等四個面向切入,積極減少每個階段的碳排放量。」

11.jpg
戴爾科技集團永續服務資深總監Bobby Mon Raother延續製造業對談的內容,分享Dell如何製造、運輸、能源使用與報廢管理等四個面向切入,積極減少每個階段的碳排放量。
圖/ 數位時代

自2005年開始提供永續顧問服務的施耐德電機日本永續事業部ESG數位轉型負責人呂勁毅進一步分享協助世界500強客戶實踐淨零轉型的心得:「除了要擬定策略、採用數位工具、蒐集與分析數據,更重要的是透過治理手法與相關活動加速整個進程,發揮數位與淨零雙軸轉型綜效。」
總的來說,無論是醫療或製造業,淨零已不再只是企業的選修課,而是決定競爭力的新指標,唯有做到產品碳足跡全揭露,同時,結合AI數據治理、循環設計與數位轉型,才能在碳定價與供應鏈重塑的時代突圍,將減碳壓力轉化為成長動能。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
一次搞懂Vibe Coding
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓