AI胡說八道不是Bug?解密LLM背後的「二元評分機制」:亂猜題,遠比繳白卷更強
AI胡說八道不是Bug?解密LLM背後的「二元評分機制」:亂猜題,遠比繳白卷更強

我國中的時候,有一位同學完全放棄學習英文,每次考試時碰到英文填充題的時候,他看都不看題目,就一律填上「is」作為答案,你看到他的考卷真的整個會笑出來,大家把他的考卷當成笑料。

不過,他因此幾乎從來沒有考過英文零分,每次大概都會有個位數的分數。所以,這個策略還是有些用的。

講這個故事,也是為了講 AI,還請各位看到最後。

AI 的「正確性」和「穩定性」是兩件完全不一樣的事情。說得比較直白一點,「穩定地說同一個謊話」是可以一起展現的兩種特質,例如你碰到一個人每天都跟你說「地球是平的」,他每天的回答都非常穩定,雖然我們都知道他講的內容是錯的。

所以,上一篇文章我們談到的單純是 AI 的「穩定性」。這跟 AI 的「內建知識」無關,純粹是個物理問題罷了,主要看的現象是 AI 針對同一個問題,前後回答的答案是否一致,而不是回答的內容是否正確。

AI「一本正經地胡說八道」是另外一個關於「正確性」的大問題,這其實就是大家常常談到的「 AI 幻覺 (Hallucination)」問題:AI 會捏造不存在的事實,而且講起來還非常有自信。

最近有一篇論文也滿紅的,同樣引起相當多的討論,是由 OpenAI 發表的論文「大型語言模型為何會產生幻覺(Why Language Models Hallucinate)」。論文的核心結論是:AI 的幻覺並非什麼神秘的不可知現象,而是在我們現行的訓練與評估體制下,必然會產生的結果。作者們將 AI 比喻為一個正在參加考試的學生。非常完美解釋了幻覺的來龍去脈。

重點同樣分成兩個部分。

首先,AI 的學習始於「預訓練(pre-training)」,也就是把整個網路上的資料都讀一遍。論文指出,而在這個階段,AI 就埋下了幻覺的種子。他們巧妙地將 AI「生成正確內容」的任務,簡化為判斷「一句話是否正確」的是非題。

研究發現,AI 在處理那些稀有、孤立的「任意事實」(Arbitrary Facts) 時特別容易犯錯。論文提出了一個關鍵概念叫「單例率 (singleton rate)」。如果某個知識點(例如某位學者的冷門論文標題)在 AI 讀過的浩瀚資料中只出現過一次,那麼 AI 在被問到時,產生幻覺的機率就會非常高。這就像考生對一個只在課本角落看過一次的冷門知識點,很容易記錯或張冠李戴一樣。

簡單來說,就是「書只讀了一次所以不熟」,所以答錯了,這跟人類非常相像。

第二個重點,也跟人類學生考試的狀況幾乎一模一樣。大家都被考試荼毒過,相信一定都知道如果在考試時遇到不會的題目,隨便亂寫一些答案可能會得到一些「同情分數」,總比交白卷好。

AI 系統的設計機制,很大一部分就是按照這種邏輯來設計,所以問題就是出在 AI 的「考試制度」上。目前所有主流的 AI 評測基準 (Benchmarks),幾乎都採用「二元評分機制」:答對得 1 分,答錯或回答「我不知道」(IDK),通通都是 0 分。

「不答一定沒分,亂答可能會有分。」就跟人類學生得到的結論一模一樣:亂寫總比不寫好。

在這個遊戲規則下,AI 作為一個追求高分的「理性考生」,它的最佳策略是什麼?答案就是「猜」。因為承認不知道的得分是 0,而只要猜測就有機會矇對拿分。久而久之,AI 在一次次的優化中學會了:在不確定時,編造一個聽起來最 plausible (言之成理) 的答案,是最大化分數的最好策略。

延伸閱讀:為什麼AI會出現幻覺?OpenAI揭評測漏洞:回答「不知道」零得分,所以模型寧可瞎猜

論文分析了 10 個業界極具影響力的評測(如 MMLU-Pro、GPQA、SWE-bench 等),這些評測絕大多數都對「承認不確定」的回答給 0 分。這形成了一種可怕的「流行病」:整個 AI 產業都在無形中懲罰誠實,獎勵亂講(製造幻覺)。

因此,解決幻覺的根本之道,不是再發明什麼新演算法,這甚至根本不是一個困難的技術問題,而是我們必須進行一場「社會-技術混合 (socio-technical)」的改革。我們必須直接修改主流評測的計分方式,引入類似「倒扣分」的機制。

例如,在給 AI 的題目中明確指示:「只有當你有超過 90% 的信心時才回答。因為答錯將倒扣 9 分,答對得 1 分,回答『我不知道』得 0 分。」

是不是又跟我們以前考試的經驗很像?亂寫答案是會被倒扣的,信心不夠的話千萬不要亂猜,寧可不回答,被扣的分數會比較少。

這樣的改革,才能從根本上改變 AI 的行為,引導它從一個「愛猜題的投機考生」,轉變為一個能誠實評估自我的知識邊界的「負責任專家」。
越是深入了解 AI 系統的運作,各位就會發現,真的真的與人類社會運作有非常多雷同、甚至一模一樣的體悟和設計。

知之為知之,不知為不知,是知也。

不知道就說不知道。

科技的演進以及應該發展的方向,又再次跟古老的智慧不謀而合。

延伸閱讀:AI隨機作答「真正元兇」找到了!OpenAI前技術長團隊揪出「缺乏批次不變性」,這是什麼?

責任編輯:李先泰

關鍵字: #openai #ChatGPT
往下滑看下一篇文章
為保戶守護重要資產,南山人壽以黃金眼 AI 防詐模型建構全通路資產防護網
為保戶守護重要資產,南山人壽以黃金眼 AI 防詐模型建構全通路資產防護網

為守護保戶資產,南山人壽集結客戶服務、數位、資訊三個部門的能量,自行研發「黃金眼 AI 防詐模型」,自 2024 年底完成開發後,截至今年 11 月已成功阻擋多起詐騙案件、攔阻金額累計逾新臺幣 900 萬元,並獲得 2025 數位金融獎等殊榮。

「黃金眼 AI 防詐」模型為什麼可以有效防詐、更好守護保戶資產?

南山人壽客戶服務資深副總經理李淑娟面帶微笑地解釋:「『黃金眼 AI 防詐』是透過龐大的保戶資料結合前線客服的實務經驗建構而成的模型,不僅克服了壽險業交易頻率低且詐欺樣本極度不平衡的挑戰,還能夠偵測在臨櫃辦理保單借款或解約的高風險個案,讓客服人員可以主動提醒與關懷,有效降低詐騙風險,守護客戶資產安全與信任。」

南山人壽
南山人壽客戶服務資深副總經理李淑娟指出,詐騙手法快速進化,南山人壽研發黃金眼AI防詐模型,用前瞻科技主動攔截風險,強化保戶資產的安全防護。
圖/ 數位時代

從詐保到詐財,壽險業面臨的風險加劇

過往,壽險業者面對的主要風險是保險詐欺,例如,透過偽造事故情節、虛構醫療紀錄等方式詐領保險理賠金,然而,隨著科技迭代與詐欺集團的組織化、專業化,這類手法已快速進化,從「偽造病歷、輕病久住、醫療共犯」等傳統模式,轉向結合數位科技與精準話術的跨領域詐財操作。

這一波詐欺風險不僅滲透力強、具備高迷惑性,也直接影響保戶資產安全。例如,詐欺集團利用假冒理賠諮詢等方式竊取保戶個資,再一步步誘導客戶辦理解約或申請保單借款,最後要求將資金匯到不明帳戶等,壽險業者面臨的風險範圍也從「詐領保險理賠」延伸到「詐騙保戶資產」。

李淑娟資深副總經理進一步指出,南山人壽每年要處理逾 35 萬件解約與借款案件,很難單憑人力在海量案件中精準辨識高風險個案。「為有效防堵詐欺事件,南山人壽除開發 AI 模型辨識詐保事件,更進一步研發黃金眼 AI 防詐模型,用前瞻科技主動攔截風險,強化保戶資產的安全防護。」

南山人壽以黃金眼 AI 防詐模型守護保戶資產

在打造黃金眼 AI 防詐模型時,南山人壽面臨兩個挑戰:首先是壽險的交易頻率低,導致資料稀缺;其次,是詐欺樣本比例高度失衡,導致 AI 很容易誤判。為化解這些挑戰,南山人壽整合保戶行為、保戶與保單側寫資訊與情境因素等多模態資訊進行模型訓練,爾後,透過集成學習(Ensemble Learning)整合多個不同觀點的「專家模型」共同判讀,提升模型判斷準確性。

南山人壽數位專案經理蔡其杭表示:「以多模態數據源跟集成學習的策略打造黃金眼 AI 防詐模型後,我們除了將模型串連至臨櫃客服系統,以直觀的「紅、黃、綠」三色燈號即時呈現保戶的風險等級,協助客服人員快速識別高風險個案,主動介入並阻斷詐騙,更透過『自適應演進』與『外部資源擴充』兩個機制,持續優化模型辨識精準度。」

南山人壽
南山人壽打造黃金眼AI防詐模型,將模型串連至臨櫃客服系統,以直觀的紅、黃、綠三色燈號,即時呈現保戶的風險等級、協助客服人員快速識別高風險個案。
圖/ 數位時代

「自適應演進」指的是,客服人員會依據模型亮起的燈號,結合系統提供的關懷提問表,向臨櫃辦理解約或借款的保戶進行關懷詢問,如資金用途、是否接獲可疑來電等,藉此釐清是否存在異常情況,並將相關結果回貼標籤,作為後續調校模型的關鍵訓練素材,讓黃金眼 AI 防詐模型越用越精準。

「外部資源擴充」則是透過更多元的外部數據強化模型的防詐能力。例如南山人壽與內政部警政署刑事警察局簽署反詐騙合作備忘錄(MOU),在合規架構下共享情資,協助核對保戶是否曾有詐欺通報紀錄。蔡其杭補充,南山人壽目前正與電信業者合作,將其超過 1,400 項特徵因子導入模型,有效提升模型燈號判斷的靈敏度與可靠度,使黃金眼 AI 防詐成為更全面的金融詐欺偵測引擎。

蔡其杭表示,詐騙的手法日新月異,AI 阻詐模型除了能準確識別可疑的高風險案例外,更重要的是具備與時俱進、持續調優模型能力和效果的機制;如同維持客戶服務的品質一樣,刻不容緩。

南山人壽
南山人壽數位專案經理蔡其杭表示,黃金眼AI防詐模型串連至臨櫃客服系統,以直觀的「紅、黃、綠」三色燈號即時呈現保戶的風險等級。
圖/ 數位時代

李淑娟表示:「隨著模型的持續優化,黃金眼 AI 防詐模型的應用範疇將從目前的『臨櫃防堵』延伸到『全通路、跨產業、事前預警』的防禦機制,以事前預警的方式防堵詐欺事件。」舉例來說,當保戶撥打電話詢問保單借款或解約時,系統就會開始運作、提前識別風險,針對透過手機 APP 或網路平台辦理業務的數位客群,系統也會即時偵測,當出現高風險行為時即會立即展開關懷提問。

不僅從科技著手,南山人壽以 SAFE 逐步提升防詐安全網

值得特別注意的是,南山人壽並未將防詐視為單一的科技工程,而是從 SAFE–Skilled(防詐訓練)、Awareness(全民防詐)、Fintech(科技運用)、Engagement(聯防合作)–四個構面打造更完整的防護機制。

在專業技能方面,南山人壽不僅協助相關人員熟悉黃金眼 AI 防詐模型的操作模式,也持續透過內部教育訓練,以及跟刑事警察局等單位合作舉辦的工作坊等方式,全面提升員工識詐、阻詐的能力,達到 AI 人機互動的阻詐聯防保護網。

在防詐意識宣導方面,南山人壽除於全台 18 個分公司櫃檯播放刑事警察局提供的反詐騙影片,並在櫃檯明顯位置放置防詐文宣,協助來訪保戶掌握最新詐騙趨勢;更主動走入偏鄉、校園與新住民社群,並針對聽語障人士製作友善素材,以多元形式推廣防詐知識,降低詐騙事件發生的可能性。

在公私協力方面,李淑娟表示,南山人壽積極培育、鼓勵每一位壽險業務員成為「防詐大使」,在拜訪客戶時主動觀察各種異常徵兆,例如可疑的投資文宣或陌生人的頻繁出入,並將這些現場蒐集到的「軟性數據」提供回公司,作為模型判斷的補強資訊,以提升事前預警效果。

為了更好的保護高齡與失智等高風險族群,南山人壽也積極推動「保單安心聯絡人」機制,鼓勵保戶指定第二聯絡人,在其申請保單借款或終止契約時,可以主動通知聯絡人介入確認,降低詐騙風險;此外,亦針對受詐保戶提供「喘息關懷服務」,以低利紓困貸款協助保戶在遭遇詐騙後仍能穩定度過財務壓力,將防詐保護從事中攔阻延伸到事前預警與事後援助兩個層面,樹立產業新標竿。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓