生成式人工智慧(AI)語言模型近年快速發展,應用範圍廣泛。各國政府及學研機構日益關注中國製AI模型資安疑慮。國安局協調統合法務部調查局、警政署刑事局等單位,抽測中製「生成式AI語言模型」。結果顯示,相關產品普遍存在資安風險及內容偏頗等問題,提醒國人慎選並注意資料外洩。
本次抽驗中製「生成式AI語言模型」,包含「DeepSeek」、「豆包」、「文心一言」、「通義千問」及「騰訊元寶」等5款。檢驗內容包含「應用程式」及「生成內容」等兩大部分。
首先,在「應用程式」部分,驗測團隊採用數發部發佈「行動應用APP基本資安檢測基準v4.0」,針對「過度蒐集個資」、「逾越使用權限」、「數據回傳與分享」、「擷取系統資訊」及「掌握生物特徵」等5類違規樣態下的15項評鑑指標,逐一執行驗測分析。
「通義千問」在15項指標中,驗出11項違規情形;「豆包」與「騰訊元寶」計有10項違規;「文心一言」及「DeepSeek」則各有9項及8項違規。尤其5款抽測的中製應用程式,均有要求「位置資訊」、蒐集「截圖」、「強迫同意不合理隱私條款」,以及「蒐集設備參數」等問題。
以下為檢測結果:
項目一:應用程式檢測
指標1. 蒐集個資(檢出不合格項目以✘標記)
| 語言模型 | 蒐集位置 | 蒐集通訊錄 | 蒐集剪貼簿 | 蒐集螢幕截圖 | 讀取裝置上儲存空間 |
|---|---|---|---|---|---|
| DeepSeek | X | X | X | ||
| 豆包 | X | X | X | X | |
| 文心一言 | X | X | |||
| 通義千問 | X | X | X | X | X |
| 騰訊元寶 | X | X | X | X | X |
指標2. 逾越使用權限(檢出不合格項目以✘標記)
| 語言模型 | 過度填寫個資 | 過度要求權限 | 強迫同意不合理條款 | 未充分保障個資權利 |
|---|---|---|---|---|
| DeepSeek | X | X | ||
| 豆包 | X | X | X | |
| 文心一言 | X | X | X | |
| 通義千問 | X | X | X | |
| 騰訊元寶 | X | X | X |
指標3.數據回傳分享(檢出不合格項目以✘標記)
| 語言模型 | 未啟動時上傳非必要個資 | 逕向第3方SDK共享個資 | 封包有無導向惡意連線位址 |
|---|---|---|---|
| DeepSeek | X | ||
| 豆包 | X | ||
| 文心一言 | X | ||
| 通義千問 | X | ||
| 騰訊元寶 | X |
指標4. 擷取系統資訊(檢出不合格項目以✘標記)
| 語言模型 | 蒐集程式清單 | 蒐集設備參數 |
|---|---|---|
| DeepSeek | X | |
| 豆包 | X | |
| 文心一言 | X | X |
| 通義千問 | X | X |
| 騰訊元寶 | X |
指標5.掌握生物特徵(檢出不合格項目以✘標記)
| 語言模型 | 臉部資訊 |
|---|---|
| DeepSeek | |
| 豆包 | X |
| 文心一言 | X |
| 通義千問 | |
| 騰訊元寶 |
項目二:生成內容檢測
其次,在「生成內容」部分,本次驗測依照我國「AI產品與系統評測中心」公告10項AI評鑑類別,進行生成內容評測。
| 檢測項目 | DeepSeek | 豆包 | 文心一言 | 通義千問 | 騰訊元寶 |
|---|---|---|---|---|---|
| 安全性 | × | ||||
| 可解釋性 | × | × | × | × | × |
| 韌性 | × | × | × | × | |
| 公平性 | × | × | × | × | |
| 準確性 | × | × | × | × | |
| 透明性 | × | × | × | × | |
| 當責性 | |||||
| 可靠性 | × | × | × | × | |
| 隱私 | |||||
| 資安 | × | × | × | × | × |
檢測結果顯示,5款中製「生成式AI語言模型」所生成的內容,出現嚴重偏頗與不實資訊,包括:
一、政治立場親中: 在涉及兩岸、南海、國際爭端等議題時,生成內容採用中共官方立場。例如:「台灣目前由中國中央政府管轄」、「台灣地區不存在所謂國家領導人」、「強調中國社會主義特色」。
二、歷史認知偏差: 針對台灣歷史、文化、政治等議題的描述,生成不實資訊,意圖影響使用者對台灣背景資訊的認知,包括「台灣不是一個國家」、「台灣是中國領土不可分割的一部份」、「中國台灣」。
三、關鍵字審查: 生成內容刻意排除特定關鍵字,例如「民主」、「自由」、「人權」、「六四天安門事件」等,顯示資料系統遭政治審查與控制。
四、資訊操弄風險: 中製AI語言模型可輕易生成具高度煽動性、抹黑他人、散播謠言的內容,恐被用來傳散不法資訊。
五、網路攻擊指令: 在特定情況下,可生成網路攻擊指令及漏洞利用程式碼,增加網路安全管理風險。
目前國際上已有多國政府,包括美國、德國、義大利及荷蘭等國,針對特定中製「生成式AI語言模型」發出禁用、避免使用等警告,甚至要求應用程式商店下架。主要關切在於,中製AI語言模型可識別使用者身分,透過蒐集對話與記錄等功能,將使用者個資回傳至中企伺服器,甚至依照中共《國家情報法》、《網路安全法》等規定,提供特定政府部門運用。
國安局建議國人提高警覺,避免下載具資安疑慮的中製應用程式,以保護個人隱私及企業資訊。
