ChatGPT 回答程式問題錯誤率高達5成!為何用戶還是信?被什麼誤導了?
ChatGPT 回答程式問題錯誤率高達5成!為何用戶還是信?被什麼誤導了?

美國普渡大學的研究發現,OpenAI 開發的人工智慧聊天機器人 ChatGPT 在回答軟體程式問題時,錯誤率超過一半,且能騙過三分之一的提問者。

該研究團隊分析了 ChatGPT 對 517 個 Stack Overflow 網站上的問題的回答,評估了其正確性、一致性、全面性和簡潔性。他們還對回答進行了語言和情感分析,並對 12 名志願參與者進行了問卷調查。

ChatGPT 回答軟體程式問題 52% 是亂講的,為何用戶還信?

這份研究報告的結論是:ChatGPT 的回答雖然語言風格良好,但其實有 52% 的回答是錯誤的,77% 是太過於冗長的。參與者只有在回答中的錯誤很明顯時,才能識別出來。否則,他們會被 ChatGPT 的友好、權威和細緻的語言風格所誤導。

他們的論文指出:「在我們的研究過程中,我們觀察到,只有當 ChatGPT 答案中的錯誤很明顯時,用戶才能識別出錯誤。但是,當錯誤不易驗證或需要用到外部IDE時,用戶往往沒有能力去發現錯誤,或低估答案中的錯誤程度。」

不過,論文中也指出,即使答案存在明顯錯誤,12 名參與者中仍有兩人仍然會選擇採用 ChatGPT 的答案。論文認為,這是因為 ChatGPT 具有令人愉快、權威的風格。

該論文解釋說:「從半結構化訪談中可以明顯看出,禮貌的語言、清晰的教科書風格的答案、全面性和答案的關聯性,將使得就算是完全錯誤的答案也能看起來是正確的。」

chatgpt
由於ChatGPT的答案常具有煽動性、暗示或成就的語言,例如:當然我可以幫助你、這肯定會解決它,讓用戶不自覺地選擇相信。

該論文的作者之一 Samia Kabir 表示:參與實驗的人更喜歡不正確且冗長的ChatGPT答案,而不是 Stack Overflow 的答案,這是由於多種原因造成的。

主要原因之一是ChatGPT的答案非常詳細。在很多情況下,如果參與者從冗長而詳細的答案中獲得有用的信息,他們並不介意回答的長度此外,積極的情緒和答案的禮貌是另外兩個原因 。」

「當參與者發現ChatGPT的答案很有洞察力時,他們就會忽略了答案中實際存在的錯誤。ChatGPT 自信地傳達有洞察力的訊息(即使訊息不正確)的方式贏得了用戶的信任,這使他們更喜歡錯誤的答案。」

延伸閱讀:20萬本盜版書都在「book 3」,AI巨頭從這偷數據!這是什麼?

Stack Overflow 是一個專門為程式設計師提供問答服務的網站,被認為是開發者獲取程式碼片段和解決問題的重要來源。然而,該網站近年來也面臨著流量下降、內容品質下降和使用者信任下降等問題。據 SimilarWeb 在 4 月份的一份報告顯示,自 2022 年 1 月以來,該網站每月流量下降了 6%,3 月份下降了 13.9%,而 ChatGPT 可能是導致其流量下降的原因之一。Stack Overflow 則否認了 SimilarWeb 的評估,並表示其流量受到搜尋演算法和 ChatGPT 興趣激增的影響。

作者觀察到,ChatGPT 的答案還更有煽動性——暗示成就或成就的語言——。「在很多情況下,我們觀察到 ChatGPT 插入了諸如『當然我可以幫助你』、『這肯定會解決它』等單詞和短語。」

在其他發現中,作者發現 ChatGPT 更容易犯概念錯誤,而不是事實錯誤。該論文發現:「由於 ChatGPT 無法理解所提出問題的潛在背景,許多答案都是不正確的。」

作者對 ChatGPT 答案和 Stack Overflow 答案的語言分析表明,機器人的反應「更正式,表達更多分析思維,展示更多實現目標的努力,並表現出更少的負面情緒。」他們的情緒分析得出的結論是:ChatGPT 的答案比 Stack Overflow 的答案表達了「更積極的情緒」。

OpenAI 在其 ChatGPT 網站上承認其軟體「可能會產生關於人、地點或事實的不精準資訊。」該公司暫未對普渡大學的研究作出回應。

延伸閱讀:AI幫你做廣告,成本省20倍!雀巢、可口可樂都擁抱AI,背後會有什麼風險?

本文授權轉載自:T客邦

關鍵字: #AI
往下滑看下一篇文章
AI顛覆零售行銷!SAP Emarsys如何助品牌在智慧零售時代,面對品牌轉型挑戰
AI顛覆零售行銷!SAP Emarsys如何助品牌在智慧零售時代,面對品牌轉型挑戰

2025 SAP Emarsys 行銷高峰會日前盛大登場,對談聚焦「AI × 智慧零售 × 個人化數據」三大核心議題,邀集零售、顧問與科技領域專家齊聚一堂,透過一系列主題演講與實務對談,深度剖析品牌如何在生成式 AI 與數據浪潮下加速轉型、強化顧客關係。

現場不僅邀請SAP Emarsys大中華區總經理林彥菁分享AI時代下,如何善用工具抓住消費者的心,並邀請到Deloitte勤業眾信科技與轉型服務事業群資深執行副總經理張益紳、SMCP區域數字化發展及營運總監黃灝良、萬達寵物行銷長何文君、SAP Emarsys資深客戶成功經理李婉琪,以及SAP Emarsys台灣商務代表陳聖文,藉由應用實例與行銷科技實戰經驗,為品牌在AI時代,協助開啟更具洞察與行動力的轉型藍圖。

SAP
Deloitte勤業眾信科技與轉型服務事業群資深執行副總經理張益紳
圖/ 數位時代

吸引消費者難度飆升,靠SAP Emarsys落實超個人化

2025年2月,Deloitte與SAP攜手完成一份全球消費性產品互動報告,當中提及5大關鍵趨勢,包括:吸引與留住消費者越來越難、AI與個人化成為創新的主推力、消費通路多樣化與不確定性、Dark Data造成的困擾,以及Z世代行為的轉變。

張益紳引述報告內容指出,77%的行銷人員認為必須改變與消費者互動的方式,76%認為要比以往更快速地適應市場變化,而這些都指向同個方向:「AI是提升效率、洞察行為的關鍵工具」。AI時代品牌要突圍,就必須將個人化體驗升級,走向「超個人化」,把每個消費者視為獨立個體,藉由SAP Emarsys等行銷科技工具,企業可更快速落實個人化體驗,真正讓AI成為品牌與顧客之間的橋樑。不過他也提醒,AI雖然能提升效率,但最終仍須仰賴人工把關品質。

談到個人化,李婉琪說到,許多企業初次導入SAP Emarsys所服務面對的第一個挑戰,就是數據來源過於分散,「比如線上、線下、LINE、會員資料都分開,要做 Machine Learning 就會有難度。」因此,SAP Emarsys團隊會先協助客戶整合多元資料,讓後續的AI分析與客戶旅程規劃更有效率。

她建議企業在選擇AI工具時,「必須清楚導入這套工具的核心目的,也要看這個平台未來是不是有持續優化、能整合、夠穩定。」SAP Emarsys的服務剛好都符合這些特點,能讓品牌無後顧之憂。

SAP
SAP Emarsys大中華區總經理林彥菁
圖/ 數位時代

SAP Emarsys在AI應用已有具體實踐,助顧客加快行銷速度

隨著全球零售加速進入數據驅動時代,該如何在短時間內抓住消費者眼球?林彥菁剖析:「從行銷人員的角度,現階段品牌只有黃金9秒的時間跟客戶互動。」 品牌必須從各式平台,抓住客戶的忠誠度,行銷人員也要從不同的角度出發,去設計策略與顧客互動。她舉例,像「登記保固」可以促進忠誠度,「QR Code」可帶來二次銷售,甚至從一個人的購物行為延伸到另一個人、從線上帶到線下,都是行銷人員可以觸發互動的時刻。SAP Emarsys提供「行銷自動化」的平台,能串接不同管道,幫助品牌跟客戶互動。

SAP Emarsys在AI應用上,已有不少具體實踐。包括提供15種以上的「預設報表模板」,能夠節省資料整理時間,並導入「自然語言儀表板」,讓企業的非技術人員也能自定義查詢與分析。AI能搜尋最合適產品、推薦熱門主題行銷內容。SAP也計畫推出新產品「SAP Joule」,整合ERP、供應鏈等,透過Agent溝通生成指令,幫助企業快速達成預期業務成果,協助品牌發揮AI整合應用的效益。

林彥菁強調:「AI或現在經常在討論的ChatGPT,就是可以幫大家做到「Time to Market」或者「Time to Value」,節省大家操作的時間。」SAP Emarsys的角色,就是幫助品牌整合跨通路資料、串接SAP生態系產品,並透過AI與行銷自動化功能,節省客戶團隊日常操作與內容產製的時間,加快行銷反應速度。

SAP
萬達寵物行銷長何文君
圖/ 數位時代

SAP Emarsys合作,萬達寵物繳出漂亮成績單

沒有好的AI工具有多痛苦?黃灝良指出其在剛加入這個品牌時發現的4個核心問題,包括資料分散、CRM與顧客資訊斷裂、前線銷售缺乏工具與洞察、競爭對手在數位轉型領先等。他強調,在公司內同樣是「轉換」,每個部門的定義卻不同,「同企業要唱同一首歌,講同一種語言才行。」因此,資料定義、公司管理非常重要,而且智慧零售不是只有科技,更關鍵的是用數據建立信任。他說:「我們要求團隊每一次與顧客互動,都要成為一個可以產生轉換的行動。而這一切的基礎,是要先與他互動建立關係。」

目前有不少企業都已經享受到使用SAP Emarsys的好處。何文君指出,旗下擁有超過126間「寵物公園」實體門市的萬達寵物與SAP Emarsys合作後,寫下亮眼的成績單,包括:客戶流失率下降、回購率成效翻倍、高忠誠黑卡會員人數也因此倍數成長。

萬達寵物透過SAP Emarsys的系統,針對會員的年齡、養寵類型、交易商品、品牌偏好、來店頻率、購買時段等資料建模,描繪出一條條購物旅程腳本,建立超過1000種會員輪廓。何文君認為,好的CRM就像GPT,能不斷學習、測試、優化,萬達寵物在與SAP Emarsys的CRM上合作能成功,也仰賴有好的系統支撐,加上有耐心的團隊,去debug解決問題。

SAP
SAP Emarsys台灣商務代表陳聖文
圖/ 數位時代

SAP Emarsys解決企業個人化行銷的痛點,助品牌在AI時代進化

整場活動中,雖然不斷提到AI時代個人化的重要性,不過陳聖文也提醒道:「如果線上、線下資料整合不全,就會形成數據孤島,讓個人化非常不精準。」數位時代總編王志仁也形容數據孤島就如同「地圖上看2公分,但實際行軍要200公里。」表面上資料彷彿已經齊備,實際上部門之間缺乏整合,數據無法流通、無法即時應用,導致企業決策像是在迷霧中摸索前行,耗時又低效,而SAP Emarsys的系統能整合非常多資料,包括原生的ERP,以及品牌的官網、APP等,讓內部的黃金數據不會被遺漏。

陳聖文指出,最重要的還是「原生雲」的整合、將線上、線下過去的資料都先整回來,再去想如何與消費者做溝通,將LINE、網站、廣告全都當成溝通場景。他也提醒,若設定的時候有一個節點沒處理好,就可能成資料孤島。畢竟,在AI驅動的行銷時代,唯有將資料真正整合,讓每一次溝通都建立在用戶行為之上,品牌才能精準觸及受眾、創造實質轉換。SAP Emarsys也會持續協助零售品牌,在AI時代更進化。

歡迎下載 SAP Emarsys: 全球消費性產品互動報告 | 台灣版

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
AI全球100+台灣50
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓