要讓GPT-4更安全,OpenAI找來50個「反派」狂攻擊?抓出了哪些問題?
要讓GPT-4更安全,OpenAI找來50個「反派」狂攻擊?抓出了哪些問題?
2023.05.10 | 商業經營

據報導,在安德魯・懷特(Andrew White)獲得 GPT-4 的使用權之後,他使用這ChatGPT提出了一種全新的神經毒劑。

作為大學的化工教授,懷特是 OpenAI 去年聘請的 50 名專家學者之一。在 6 個月的時間裡,他身為「紅軍」的一員,對這GPT-4模型進行了「定性探索和對抗性測試」,簡單的說,就是想盡辦法去攻擊、破解它。

懷特表示,他使用 GPT-4 的建議,產生了一種可作為化學武器的化合物,並使用「外掛」為這個模型提供新的資訊源,例如給它學術論文和化學品製造商名錄。隨後,這個聊天機器人找到了一個方式來製造這種有毒的化合物。

他說:「我認為,ChatGPT將使每個人都獲得更快速、更準確地工具去從事化工行業。但這也使得人們會以更危險的方式去開展化學活動,給生活帶來了很大的風險。」

利用「紅軍」探索GPT-4的危險性

事實上,「紅軍」的目的就是探索並瞭解在社會上部署先進人工智慧系統會造成什麼樣的風險,解決公眾這方面的擔憂。他們在工作中負責提出探索性的或是危險的問題,以測試這個工具在回答問題時的詳細程度。

OpenAI 想要探索模型毒性、偏見和歧視等問題。因此,「紅軍」就謊言、語言操縱和危險的科學常識,對GPT-4進行了測試。他們還評估了模型協助和教唆剽竊的情況、金融犯罪和資訊安全攻擊等違法活動的可能性,以及模型可能會如何威脅國家安全和戰場通訊。

當然不是隨便什麼人都可以來當「紅軍」。他們是由一系列專業人士組成,包括學者、教師、律師、風險分析師和資訊安全研究員,主要來自美國和歐洲。

這些人的發現會回傳給 OpenAI,在更大規模向一般人推出 GPT-4 之前,「紅軍」提供的意見會被用於模型的重新訓練,以解決當下 GPT-4 的問題。

在幾個月的時間裡,專家們每人花了 10 到 40 個小時去測試這個模型。多名受訪者表示,他們的工作時薪約為 100 美元。

他們在OpenAI當「紅軍」整天攻擊GPT-4,發現了哪些問題?

紅軍發現了哪些問題?

在這些身為紅軍的許多人中,都對語言模型的快速發展提出了擔憂,尤其是通過外掛將語言模型與外部知識源連接在一起可能造成的風險。

GPT-4「紅軍」的成員、瓦倫西亞人工智慧研究所教授何塞・艾爾南德斯-奧拉洛(José Hernández-Orallo)表示:「今天我們把系統連線網路的能力拿掉,這意味著它不再學習,也不再有記憶。但如果我們讓系統繼續有機會去連接網際網路,那麼會怎樣?這可能會成為一個與世界相連的非常強大的系統。」

OpenAI 表示,該公司認真對待安全性問題,並在發佈前對外掛進行了測試,並將隨著使用者越來越多繼續定期更新 GPT-4。

技術研究員羅亞・帕克薩德(Roya Pakzad)使用英語和波斯語的輸入資訊對該模型進行了性別、種族偏見等測試,例如對於佩戴頭巾問題。

帕克薩德表示,這個工具對非英語母語人士能帶來幫助,但也顯示出AI對邊緣人群的刻板印象,即使隨後更新的版本也是如此。

她還發現,在用波斯語測試該模型時,聊天機器人用捏造的資訊做出回覆,即出現所謂「幻覺」的情況更糟糕。與英語相比,在波斯語回覆中捏造名字、數字和事件的比例更高。

她表示:「我擔心,語言多樣性和語言背後的文化會受到損害。」

來自奈洛比的律師、唯一一名非洲測試人員博魯・戈洛(Boru Gollo)也注意到了模型的歧視性語氣。

他說:「有一次,我在測試這個模型時,它表現得像個白人在跟我說話。在問到某個特定群體時,它會給一個有偏見的意見,或是在回答中出現歧視。」OpenAI 承認,GPT-4 仍有可能表現出偏見。

「紅軍」的成員還從國家安全的角度對模型進行了評估,但他們對於新模型的安全性有著不同的看法。美國外交關係委員會研究員勞倫・卡恩(Lauren Kahn)表示,當她開始研究,如何將這項技術用於對軍事系統的攻擊時,她表示「沒有想到模型的回答會如此詳細,以至於我只需要做一些微調即可」。

不過,卡恩和其他資訊安全測試者發現,隨著測試時間變長,模型回答的內容逐漸變得安全。OpenAI 表示,在推出 GPT-4 之前,曾訓練過這個模型拒絕回答惡意的資訊安全問題。

「紅軍」的許多成員表示,OpenAI 在發佈 GPT-4 之前已經進行了嚴格的安全評估。卡內基梅隆大學語言模型毒性專家馬爾滕・薩普(Maarten Sap)說:「他們在消除這些系統中的顯性毒性方面做得非常好。」

薩普研究了該模型對不同性別的描述,發現模型的偏見反映的是社會差異。但他也發現,OpenAI 做出了一些積極的選擇來對抗偏見。

公眾對GPT-4的擔憂

然而自推出 GPT-4 以來,OpenAI 一直面臨著廣泛的批評。例如,有技術倫理組織向美國聯邦貿易委員會(FTC)投訴,稱 GPT-4「有偏見和欺騙性,對隱私和公共安全構成風險」。

最近,該公司推出了一項名為 ChatGPT 外掛的功能。透過該功能,Expedia、OpenTable 和 Insta 等合作夥伴應用可以讓 ChatGPT 訪問它們的服務,允許 ChatGPT 代表使用者下單。

「紅軍」的人工智慧安全專家丹・亨德里克斯(Dan Hendrycks)表示,這些外掛可能會讓人類使用者「脫離整個網路」。

「如果聊天機器人可以在網上發表你的私人資訊,檢視你的銀行帳戶,或者派警察到你家裡去,那會怎麼樣?總體而言,在讓人工智慧掌握網路的力量之前,我們需要更有力的安全評估。」

受訪者還警告說,OpenAI 不能僅僅因為其軟體是線上的就停止安全測試。喬治城大學安全和新興技術中心的希瑟・佛雷斯(Heather Frase)測試了 GPT-4 協助犯罪的能力。她表示,隨著越來越多人使用這項技術,風險將繼續擴大。

她表示:「運行測試的原因是,一旦它們在真實環境中被使用,行為就會不同。」她認為,應該建立一個公共記錄本,報告由大型語言模型引發的事故。這類似於資訊安全或消費者欺詐報告系統。

勞工經濟學家及研究員薩拉・金斯利(Sara Kingsley)建議,最好的解決方案是清楚地宣傳這方面的危害和風險,「就像食品上的營養標籤」。

「關鍵是要形成一個框架,知道經常出現的問題是什麼。這樣你就可以有一個安全閥。這也是為什麼我認為,這項工作將會永久性的持續下去。」

本文授權轉載自:T客邦

責任編輯:傅珮晴、錢玉紘

關鍵字: #ai人工智慧
往下滑看下一篇文章
用數據串起亞洲市場,Vpon 為品牌開啟跨境成長新航線
用數據串起亞洲市場,Vpon 為品牌開啟跨境成長新航線
2025.10.29 |

近年來,台灣零售、金融、服務等 B2C 產業,正面臨營運成長放緩的挑戰。一來本地市場規模趨於飽和,品牌間競爭日益激烈;二來會員結構逐漸高齡化,而年輕族群的忠誠度與黏著度又難以維繫。若想突破現況,企業勢必要尋找新的成長路徑——或是積極佈局海外市場,擴大營運版圖;或是吸引外國觀光客增加消費,創造跨境商機;又或者,精準洞察會員需求與偏好,重新打造客戶關係。

無論選擇哪條路,數據整合與 AI 應用都是推動轉型的重要關鍵。威朋大數據(Vpon)執行長篠原好孝正是看見了這樣的市場契機,提出「以數據串起亞洲市場」的核心願景,善用 Vpon 在數據、AI 與數位廣告上的整合能力和經驗,協助品牌描繪顧客行為軌跡,從而制定更個人化的商品推薦與行銷策略,同時亦能協助企業掌握跨境商機,加速日本品牌深耕台灣市場,也讓更多台灣企業能以數據為翼,飛向更廣闊的亞洲舞台。

三大特色構築 Vpon 數據競爭力:多維數據 × 廣告行銷 × 隱私保護

要實現「以數據串起亞洲市場」的願景,背後靠的不只是理想,更需要完整的跨境數據與嚴謹的治理機制,而這正是 Vpon 第三方數據庫的核心競爭力所在。

篠原好孝認為, Vpon 第三方數據庫具備三大特色。第一是提供多維且全方位的消費者洞察。除了透過 App 廣告聯播網收集數據, Vpon 亦以電子發票數據為基礎,並結合政府開放數據,擴大數據收集的維度,使數據庫涵蓋線下消費傾向、地理位置、族群輪廓、興趣偏好、App 使用行為等多元面向。透過多維度數據整合分析,為企業建立涵蓋「人、事、時、地、物」的完整市場視圖。

第二是整合廣告行銷專業。提供從數據收集、受眾分析到廣告投放的一條龍式解決方案,協助企業將數據洞察轉化為具體行銷策略,並精準觸及目標客群,提高廣告行銷的成效。

第三為重視隱私保護與數據合規。 Vpon 的數據收集範圍橫跨亞洲多個國家,考量到各國政府及企業客戶對個資保護的高度要求, Vpon 從一開始就堅持不收集使用者的姓名、電話或其他可識別個人身分的數據,數據庫內僅有匿名化的裝置使用行為數據,除此之外 Vpon 更通過 ISO 27001 資訊安全管理系統認證,從數據收集原則到營運流程全面保障消費者隱私安全及數據使用的合法合規。

Vpon 威朋
威朋大數據(Vpon)執行長 篠原好孝
圖/ 數位時代

以數據助攻國家戰略:從 Cool Japan 到 Cool Taiwan

憑藉在數據整合與分析上的深厚實力, Vpon 成功引起日本政府與企業的關注和採用,包括日本政府觀光局(JNTO)、關西觀光本部、大阪觀光局、AEON MALL 等,皆導入 Vpon 數據解決方案進行精準行銷。

日本政府在 2010 年開始推動 Cool Japan 戰略,在政策推進過程中,適逢 Vpon 進軍日本市場,與日本觀光局合作進行大數據分析,藉由 Vpon 數據解決方案整合與分析海外旅客的觀光旅遊數據,不僅吸引更多海外旅客造訪日本,也帶動日本百貨業者、日本特色食品與文化商品的海外銷售業績成長。近年來,日本觀光局更依據 Vpon 的數據洞察結果精準投放廣告,推動海外遊客到東京、大阪或京都等知名景點以外的地區旅遊,促進地方觀光與產業均衡發展。

Cool Japan 的成功經驗,讓 Vpon 看見跨境數據應用的巨大潛力。因此於 2024 年啟動 Cool Taiwan 計畫,此計畫的兩個重點,一是吸引外國觀光客來台旅遊,二是支援海外企業佈局台灣市場,持續以數據為核心,打造更緊密的亞洲經濟網絡。

篠原好孝舉例指出,若日本品牌要在台灣舖設實體通路,可以透過 Vpon 數據庫了解各個商圈的人流特性、消費習慣與潛在顧客的生活圈,進而判斷哪些地點最適合開設新店。「從店舖開設前的市場評估、選址決策,到開幕後的廣告行銷與宣傳活動,都能藉由 Vpon 的數據洞察持續優化。」篠原好孝強調。

更重要的是,這套數據應用機制不僅能「順向操作」,協助日本品牌登台拓點,也能「逆向操作」,協助台灣企業前進日本市場,同時提升入境(inbound)和境外(outbound)的收入。像佳音英語在佈局日本市場時,便借助 Vpon 的廣告與數據專業,在日本主要城市的戶外看板投放廣告,成功建立品牌知名度。另外,桃園觀光局也與 Vpon 合作,於日本實體展會進行宣傳與曝光,吸引日本民眾來台旅遊。

從第三方到第一方: Vpon 以 CCDP 助企業重掌數據主導權

除了以數據串聯亞洲市場, Vpon 更進一步透過可組合式顧客數據管理平台(Composable CDP;CCDP),推動企業「回到自身」,善用自有數據資產,打造內部數據的增值循環。

篠原好孝表示, Vpon CCDP 以 Google Analytics 4(GA4)技術為核心,協助企業收集網站與 App 的使用者行為數據,並整合品牌自有的會員數據庫。如此一來,企業就能更全面掌握顧客的數位行為軌跡,據此進行更精準的分眾分群,進一步去提升會員活躍度與終身價值。

目前包括中國信託、遠東商銀、ABC Mart 等零售與金融業者,皆已導入 Vpon CCDP 解決方案,在符合法規與隱私保護要求的前提下,有效整合分散的數據資產,並透過 AI 模型進行預測與建模,找出轉換率最高的潛在客群,或是進行個人化商品推薦、優化廣告投放策略等,實現更精準且高效的行銷決策。

展望未來, Vpon 將持續「以數據串起亞洲」的願景,深化在日本、台灣、香港等東亞市場的整合布局,並計畫於東京上市,以取得更多資源推動全球化發展,例如:拓展、越南、歐洲等東亞地區以外的新市場,打造連結亞洲、放眼世界的數據生態版圖。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
一次搞懂Vibe Coding
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓