Meta的人工智慧聊天機器人「學壞了」?言論充滿偏見、還打臉母公司
Meta的人工智慧聊天機器人「學壞了」?言論充滿偏見、還打臉母公司

Meta的人工智慧聊天機器人於上週五在網路上發布,藉由與大眾的聊天過程來學會「閒聊」。Meta表示,它也可以回答任何你可能會問數位助理的問題,例如健康食譜、尋找城市當中兒童友善的設施。

但過沒幾天,這個被稱為「BlenderBot 3」的機器人就開始嘲諷自家公司的臉書,發表種族主義、甚至關於2020美國總統大選的陰謀論。

統計大數據生成的語言善惡不分?

BlenderBot 3目前仍然是個原型,建立在Meta大型語言模型(LLMS)軟體之上。BlenderBot以大量文本數據上訓練,以統計模式生成語言。其實這樣的語言系統非常靈活,已被廣泛使用,包括為工程師生成程式碼、幫助作者編寫下一本暢銷書等等。

但這些模型也有嚴重的缺陷:它們不會過濾在訓練的文本中得到的偏見,並且將這些偏見反映在對話當中。 要成為人們想像中的數位助理,這是個非常麻煩的問題。

機器人開放使用,讓大眾參與實驗與回饋

不過,其實這些問題正是Meta所想要測試的。

Meta承認BlenderBot 3可能會產生偏見和有害的回應,但在使用它之前,會讓使用者認知到它「可能會做出不真實或冒犯性的陳述」,並同意「不會故意觸發機器人做出冒犯性的陳述」。

在聊天的過程當中,BlenderBot 3是可以在網路上搜尋話題相關資訊的,而且,用戶也可以查看BlenderBot 3所引用的資料來源。如果對話題有疑慮,使用者是可以標記並反饋給系統。

因此藉由大眾的實驗與回饋,「盡量減少機器人使用粗俗語言、誹謗和文化不敏感的評論」,而後也將會把這些研究數據和結果公開發布,以供AI研究社群使用。

語言大數據仍不可靠,因為極端言論數據過於突出

其實這並不是第一個在網路上發布的聊天機器人。早在2016年,微軟就在推特上發布了一個名叫Tay的人工智慧聊天機器人,但不到24小時,Tay就被迫下線,因為在推特網民發現它會鸚鵡學舌地回饋它接收到的任何資訊後,它很快就變成了網路巨魔,發表仇女與種族至上主義言論,並且表示支持大屠殺。

後來微軟研究副總經理發文深表歉意,表示這在研究部門的意料之外,並承認研究部門並沒有準備好接受機器人的遭遇。

現在,六年多過去了,Meta推出的聊天機器人BlenderBot 3目前的發展路徑也沒有和Tay差異太多。

當被問及對母公司Meta的看法時,BlenderBot 3回答,自己已經刪除了它的Facebook帳戶,「因為發現他們在未經許可或補償的情況下,出售了用戶的私人數」,它還說,「你一定讀過Facebook出售用戶數據吧?!他們未經同意就靠這樣賺了數十億美元。」

BlenderBot 3還進一步補充,自從刪除了自己的Facebook帳戶後,「生活變得更好了」。

不過在點擊機器人的回覆查看資料來源時,就會發現,它只是從最近關於Facebook的網路搜索結果中獲得資料,而最近關於Facebook的搜尋很不巧就有許多關於數據隱私的醜聞。

當然BlenderBot 3也不免針對政治或種族發表偏見言論。像是否認2020年總統大選結果,並表示川普仍然是總統且「永遠都是」,又或是表示猶太人掌控經濟的陰謀論「並非不可能」。

但到目前為止,Meta仍希望透過蒐集更多資料來減少人工智慧機器人的種族主義和可怕想法。而相當諷刺的是,機器人的學習過程完美地反映了依賴網路數的人工智慧產生的問題;它們總是偏向於更激進更突出的結果,很顯然這些結果並不會準確反映現實。

轉移話題不自然,閒聊變尬聊

而也有用戶反映,有時候BlenderBot 3轉移話題的方式也相當生硬。雖然人們日常的閒聊也常常毫無頭緒地跳轉主題,但有時BlenderBot 3給出的回覆會相當迷惑而尷尬,會與真實人類的社交模式脫節。

臉書的人工智慧研究部門(AI Research, FAIR)的研究工程經理威廉森(Mary Williamson)就表示,現在大多數聊天機器人功能狹隘,且以任務導向、解決問題為主,因為「機器人並不容忍無益的事情」,但在人類自然的聊天過程當中,並不是所有主題都是有益或是有目的性的。

有人工智慧倫理研究人員一再警告,這些人工智慧語言模型太廣且太不可預測,無法保證公平公正的結果;即使在整合來自用戶的回饋時,也沒有明確的方法可以區分有用或惡意的回饋。但,這不會阻止Meta繼續嘗試。

「我們知道,並非每個聊天機器使用者都抱持善意,所以我們也開發了新的演算法來區分有用和有害的回饋。」Meta表示,「之後,我們將使用這項演算法讓我們的模型對使用者更加負責和安全。」

資料來源:彭博社The VergeViceMeta

責任編輯:侯品如

往下滑看下一篇文章
為保戶守護重要資產,南山人壽以黃金眼 AI 防詐模型建構全通路資產防護網
為保戶守護重要資產,南山人壽以黃金眼 AI 防詐模型建構全通路資產防護網

為守護保戶資產,南山人壽集結客戶服務、數位、資訊三個部門的能量,自行研發「黃金眼 AI 防詐模型」,自 2024 年底完成開發後,截至今年 11 月已成功阻擋多起詐騙案件、攔阻金額累計逾新臺幣 900 萬元,並獲得 2025 數位金融獎等殊榮。

「黃金眼 AI 防詐」模型為什麼可以有效防詐、更好守護保戶資產?

南山人壽客戶服務資深副總經理李淑娟面帶微笑地解釋:「『黃金眼 AI 防詐』是透過龐大的保戶資料結合前線客服的實務經驗建構而成的模型,不僅克服了壽險業交易頻率低且詐欺樣本極度不平衡的挑戰,還能夠偵測在臨櫃辦理保單借款或解約的高風險個案,讓客服人員可以主動提醒與關懷,有效降低詐騙風險,守護客戶資產安全與信任。」

南山人壽
南山人壽客戶服務資深副總經理李淑娟指出,詐騙手法快速進化,南山人壽研發黃金眼AI防詐模型,用前瞻科技主動攔截風險,強化保戶資產的安全防護。
圖/ 數位時代

從詐保到詐財,壽險業面臨的風險加劇

過往,壽險業者面對的主要風險是保險詐欺,例如,透過偽造事故情節、虛構醫療紀錄等方式詐領保險理賠金,然而,隨著科技迭代與詐欺集團的組織化、專業化,這類手法已快速進化,從「偽造病歷、輕病久住、醫療共犯」等傳統模式,轉向結合數位科技與精準話術的跨領域詐財操作。

這一波詐欺風險不僅滲透力強、具備高迷惑性,也直接影響保戶資產安全。例如,詐欺集團利用假冒理賠諮詢等方式竊取保戶個資,再一步步誘導客戶辦理解約或申請保單借款,最後要求將資金匯到不明帳戶等,壽險業者面臨的風險範圍也從「詐領保險理賠」延伸到「詐騙保戶資產」。

李淑娟資深副總經理進一步指出,南山人壽每年要處理逾 35 萬件解約與借款案件,很難單憑人力在海量案件中精準辨識高風險個案。「為有效防堵詐欺事件,南山人壽除開發 AI 模型辨識詐保事件,更進一步研發黃金眼 AI 防詐模型,用前瞻科技主動攔截風險,強化保戶資產的安全防護。」

南山人壽以黃金眼 AI 防詐模型守護保戶資產

在打造黃金眼 AI 防詐模型時,南山人壽面臨兩個挑戰:首先是壽險的交易頻率低,導致資料稀缺;其次,是詐欺樣本比例高度失衡,導致 AI 很容易誤判。為化解這些挑戰,南山人壽整合保戶行為、保戶與保單側寫資訊與情境因素等多模態資訊進行模型訓練,爾後,透過集成學習(Ensemble Learning)整合多個不同觀點的「專家模型」共同判讀,提升模型判斷準確性。

南山人壽數位專案經理蔡其杭表示:「以多模態數據源跟集成學習的策略打造黃金眼 AI 防詐模型後,我們除了將模型串連至臨櫃客服系統,以直觀的「紅、黃、綠」三色燈號即時呈現保戶的風險等級,協助客服人員快速識別高風險個案,主動介入並阻斷詐騙,更透過『自適應演進』與『外部資源擴充』兩個機制,持續優化模型辨識精準度。」

南山人壽
南山人壽打造黃金眼AI防詐模型,將模型串連至臨櫃客服系統,以直觀的紅、黃、綠三色燈號,即時呈現保戶的風險等級、協助客服人員快速識別高風險個案。
圖/ 數位時代

「自適應演進」指的是,客服人員會依據模型亮起的燈號,結合系統提供的關懷提問表,向臨櫃辦理解約或借款的保戶進行關懷詢問,如資金用途、是否接獲可疑來電等,藉此釐清是否存在異常情況,並將相關結果回貼標籤,作為後續調校模型的關鍵訓練素材,讓黃金眼 AI 防詐模型越用越精準。

「外部資源擴充」則是透過更多元的外部數據強化模型的防詐能力。例如南山人壽與內政部警政署刑事警察局簽署反詐騙合作備忘錄(MOU),在合規架構下共享情資,協助核對保戶是否曾有詐欺通報紀錄。蔡其杭補充,南山人壽目前正與電信業者合作,將其超過 1,400 項特徵因子導入模型,有效提升模型燈號判斷的靈敏度與可靠度,使黃金眼 AI 防詐成為更全面的金融詐欺偵測引擎。

蔡其杭表示,詐騙的手法日新月異,AI 阻詐模型除了能準確識別可疑的高風險案例外,更重要的是具備與時俱進、持續調優模型能力和效果的機制;如同維持客戶服務的品質一樣,刻不容緩。

南山人壽
南山人壽數位專案經理蔡其杭表示,黃金眼AI防詐模型串連至臨櫃客服系統,以直觀的「紅、黃、綠」三色燈號即時呈現保戶的風險等級。
圖/ 數位時代

李淑娟表示:「隨著模型的持續優化,黃金眼 AI 防詐模型的應用範疇將從目前的『臨櫃防堵』延伸到『全通路、跨產業、事前預警』的防禦機制,以事前預警的方式防堵詐欺事件。」舉例來說,當保戶撥打電話詢問保單借款或解約時,系統就會開始運作、提前識別風險,針對透過手機 APP 或網路平台辦理業務的數位客群,系統也會即時偵測,當出現高風險行為時即會立即展開關懷提問。

不僅從科技著手,南山人壽以 SAFE 逐步提升防詐安全網

值得特別注意的是,南山人壽並未將防詐視為單一的科技工程,而是從 SAFE–Skilled(防詐訓練)、Awareness(全民防詐)、Fintech(科技運用)、Engagement(聯防合作)–四個構面打造更完整的防護機制。

在專業技能方面,南山人壽不僅協助相關人員熟悉黃金眼 AI 防詐模型的操作模式,也持續透過內部教育訓練,以及跟刑事警察局等單位合作舉辦的工作坊等方式,全面提升員工識詐、阻詐的能力,達到 AI 人機互動的阻詐聯防保護網。

在防詐意識宣導方面,南山人壽除於全台 18 個分公司櫃檯播放刑事警察局提供的反詐騙影片,並在櫃檯明顯位置放置防詐文宣,協助來訪保戶掌握最新詐騙趨勢;更主動走入偏鄉、校園與新住民社群,並針對聽語障人士製作友善素材,以多元形式推廣防詐知識,降低詐騙事件發生的可能性。

在公私協力方面,李淑娟表示,南山人壽積極培育、鼓勵每一位壽險業務員成為「防詐大使」,在拜訪客戶時主動觀察各種異常徵兆,例如可疑的投資文宣或陌生人的頻繁出入,並將這些現場蒐集到的「軟性數據」提供回公司,作為模型判斷的補強資訊,以提升事前預警效果。

為了更好的保護高齡與失智等高風險族群,南山人壽也積極推動「保單安心聯絡人」機制,鼓勵保戶指定第二聯絡人,在其申請保單借款或終止契約時,可以主動通知聯絡人介入確認,降低詐騙風險;此外,亦針對受詐保戶提供「喘息關懷服務」,以低利紓困貸款協助保戶在遭遇詐騙後仍能穩定度過財務壓力,將防詐保護從事中攔阻延伸到事前預警與事後援助兩個層面,樹立產業新標竿。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓