GPT-4變懶了:轉檔推太長,表格也只給3行!OpenAI怎麼說?AI模型為何會變笨?
GPT-4變懶了:轉檔推太長,表格也只給3行!OpenAI怎麼說?AI模型為何會變笨?

24小時全年無休的AI,會想要「偷懶」嗎?近期有大量用戶反應,GPT-4正變得越來越懶散,不再盡心盡力回答問題,而OpenAI也出面表示,他們正在調查這個問題,並且研究如何修復AI模型。

Google剛發布號稱在多個指標上比GPT-4更強悍的AI模型Gemini,在這或許是OpenAI最需要嚴陣以待的時刻,GPT-4近來就被發覺出現了「偷懶」問題,不再詳盡解答用戶的疑問,甚至是拒絕回應、要用戶自己找出答案。

延伸閱讀:「一個詞」讓ChatGPT吐出原始資料!AI模型為何能在無形間出賣你?

GPT-4變懶了,怎麼回事?OpenAI怎麼說?

11月底時,AI工程師克里希南(Rohit Krishnan)就在推特上抱怨,GPT-4變得懶散又沒用,希望交給聊天機器人的各種任務都遭到回絕。「轉換這個檔案?太長了。編寫表格?只給前三行。讀取這個連結?抱歉不行。讀取這個py檔案(python程式)?抱歉不允許。這實在太讓人洩氣了。」他在推文中表示。

提出類似抱怨的不只他一人,創業家麥特.溫辛(Matt Wensing)也指出,GPT越來越抗拒做枯燥的工作,基本上它只會給出一部分答案,然後讓用戶自行解決剩下的部分。

抱怨GPT-4越來越懶的聲浪在網路上日漸攀升,終於OpenAI官方也出面表示,他們已經聽到用戶對於GPT-4越來越懶的回饋,正在研究怎麼解決這個問題,但強調他們自11月11日以來,就沒有動過AI模型。

OpenAI解釋,這個說法並不代表AI自行改變了模型,只是模型的行為可能出現了微妙的差異,導致提示詞出現退化,這種情況通常要用戶及員工很長一段時間才會注意到,並且修復這樣的變化。

GPT-4變笨的事件,也恰好緊接在OpenAI爆出宮鬥大戲之後,至於這齣政變戲碼是否有影響內部的運轉或效率,則暫時未可知。

不過OpenAI強調,發布新模型時他們都會進行包含AB測試在內的各種試驗,依據所有試驗結果確保新模型比舊模型更能帶給用戶幫助,也歡迎用戶持續反應GPT-4可能出現的變化、是否變得懶散,幫助他們即時掌握問題狀況。

延伸閱讀:Google承認Gemini超神影片造假「動了幾刀」!號稱打贏GPT-4,其實很水

GPT-4也曾變笨!實測6月份版本的GPT-4,就比3月版本準確度高多了

事實上,這並非GPT技術首次「學壞」,早在今年6、7月時,就有大批開發者抱怨GPT-4「變笨」了,有時會犯下一些愚蠢的錯誤、沒注意到用戶施加的指令,甚至引發外界猜測OpenAI是否為省錢降低了運算能力、或者調整模型降低成本。

當時OpenAI產品副總裁韋林德(Peter Welinder)公開澄清,「不,我們沒有把GPT-4變笨!」聲稱他們每次更新都是讓GPT-4比以前更聰明,用戶覺得變笨的情況有可能是因為高度使用下,一些過去沒發現的問題暴露出來。

雖然OpenAI強調他們沒有更動模型,但有研究團隊發布報告,用對比今年3月跟6月的GPT-4模型,評估在數學、敏感問題、回應頻率、程式能力、推理能力等諸多面向的表現,其中在數學能力方面, 研究團隊用500道題目讓兩個模型判斷質數,結果3月份的版本以97.6%準確度壓倒性高於6月版本的2.4%

gpt accuracy.jpg
先前GPT-4也傳出變笨消息,且經研究團隊測試在部份數學能力上出現顯著落差。
圖/ @svpino via X

AI模型會變笨,究竟是什麼原因?

來自史丹佛及柏克萊加大的研究團隊指出,「我們發現GPT-4和GPT-3.5的表現和行為,在兩個版本中存在顯著差異,並且在某些任務的表現隨著時間越來越差。」他們認為其中一種可能性是 GPT-4已經從思路鏈偏移 ,這是一種將多步驟問題拆解成複數中間步驟,提升大型語言模型推理能力的技術。

對於GPT技術有時莫名出現改變的情況,他們坦承訓練AI模型並不像工業製造般明確,投入什麼原料就知道會製造出什麼產品, 即使是完全相同的訓練材料,在不同次訓練當中,也可能催生出性格、文字風格、評估標準,甚至政治偏袒傾向迥異的AI模型

一直以來,AI究竟是如何運作的,常被稱為「黑盒子」,很難從外部去解釋、理解AI是如何做出決策,如此行動的原因等等。即使是引領著生成式AI發展的OpenAI,目前也不明白在沒有更新模型的情況下,GPT-4突然變得懶散的原因,不過再等待一些時間,開發團隊或許將能修復問題,告訴我們GPT-4究竟為何突然發懶。

延伸閱讀:細看GPT-4,還有14個驚人細節!可能會幫助犯罪、人類無法控制?

資料來源:PCMagDigital TrendX

責任編輯:林美欣

關鍵字: #AI #openai #ChatGPT
往下滑看下一篇文章
突破傳統信用卡模式!國泰世華如何重塑刷卡體驗,養出百萬CUBE切換忠實粉?
突破傳統信用卡模式!國泰世華如何重塑刷卡體驗,養出百萬CUBE切換忠實粉?

根據聯合徵信中心統計,國人平均每人持有約4張信用卡,雖反映出信用卡普及,卻也暴露市場飽和的現實。當回饋比例、聯名優惠成為銀行發卡標配,差異化日漸縮小,消費者對單一卡片的忠誠度也難逃下滑。

面對同質化競爭困境,國泰世華銀行四年前即推出CUBE信用卡,首創「數位自選」權益機制,讓使用者能依需求自由切換權益回饋,成功累積百萬卡友。然而,當使用者習慣隨手調整回饋後,國泰世華又該如何進一步突破,讓廣大「CUBE切換忠實粉」更黏?

數位平台成熟度,撐起「權益自選」創新機制

「以前一張信用卡就是固定型態的權益,或綁定單一聯名夥伴。而權益自選的設計,讓信用卡不再那麼制式、更加靈活!」

國泰世華銀行數位長陳冠學指出,CUBE 卡最大的突破,是將信用卡從「靜態工具」轉化為「動態平台」。搭配CUBE App卡友可依需求隨時切換:餐廳用餐或假日逛百貨公司選「樂饗購」、出國旅遊則切換至「趣旅行」享旅遊或交通優惠;一張卡橫跨多種生活場景,甚至能依個人偏好即時調整,客戶更能於商家請款後透過CUBE App查詢點數回饋明細,對精打細算的卡友格外具有吸引力。

然而,要實現如此彈性靈活上下架權益與優惠,背後的挑戰遠比表面複雜。陳冠學直言:「若沒有成熟的數位平台作為基礎,根本不可能實現。」傳統信用卡只需處理單卡簽帳與消費紀錄,但 CUBE 必須同時滿足龐大客群的多元需求,從數據分析到營運模式都得全面升級。唯有在技術架構上徹底重建,才能實現這種前所未有的產品邏輯。

因此,CUBE 信用卡並不只是單一產品的創新,也可以說是推動國泰世華數位平台進化的重要里程碑。

國泰世華銀行數位長陳冠學
國泰世華銀行數位長陳冠學指出,唯有成熟的數位平台,才能撐起CUBE信用卡「權益自選」的創新機制。
圖/ 數位時代

因為靈活,得以開啟平台化服務的想像

打開 CUBE App、彈性切換CUBE信用卡權益方案,甚至查看領取不同商家的回饋加碼優惠券,這種互動式體驗已成為百萬卡友的日常。但國泰世華並未止步於此,而是思考如何進一步延伸金融場景。

「許多權益的設計並不只是為了增加交易,而是基於人性化洞察,去滿足客戶更深層的需求。」陳冠學舉例,如CUBE信用卡「童樂匯」權益,針對親子族群推出涵蓋餐廳、嬰幼童品牌、五感體驗課程等六大通路的專屬權益,最高可享 10% 小樹點回饋,甚至指定私校學費也提供領券最高 3% 回饋。雖然少子化趨勢讓親子族群相對小眾,但陳冠學則有不同觀點:「服務客戶的下一代,也是長遠經營的投資。」

除了分眾經營,對於聯名卡的發行,陳冠學則認為:「過去,聯名卡是會員身份的象徵,但在數位時代,攜帶多張會員卡的需求已經弱化。我們透過不同合作模式,仍能達到同樣的客群經營效果。」

於是,國泰世華與多元場景通路如 Uber、Klook、大樹藥局、臺虎展開不同形式的深度合作。對合作通路而言具備「品牌強強聯手」的導客效應,對國泰世華來說,則更能觸及多元分眾市場,跳脫單一品牌聯名的侷限,信用卡也因此從支付工具延伸出更多服務優勢。

當信用卡升級為集結服務的平台,國泰世華不僅打造互利共生的生態圈,對外創造多贏合作,對客戶也深化品牌連結,逐步鞏固難以取代的黏著度。

新聞照.jpg
CUBE信用卡結合App數位自選權益,讓用戶依需求即時調整回饋,展現靈活又直覺的數位金融體驗。
圖/ 國泰世華

從一張卡到點數生態圈,國泰世華打造CUBE尊榮會員感

「跳脫信用卡本位主義,不再侷限於刷卡回饋,而是從整體金融與生活情境出發,將服務轉化為跨情境串聯的完整旅程。」陳冠學強調,CUBE 品牌的使命,就是做到跨情境、跨服務、跨子公司的一站式體驗。

而國泰優惠 CUBE Rewards App 的出現即是里程碑。從原先 MyRewards 升級為 CUBE Rewards App,不只功能升級,也是品牌再造,把 CUBE 信用卡與國泰集團「小樹點」完整串連,將會員經營、點數生態圈與 CUBE 品牌價值一站打通。

「我們讓 CUBE 不只是信用卡,更像是俱樂部般的尊榮體驗。」憑藉國泰龐大的小樹點基礎與優質卡友群,CUBE 對合作品牌展現強大吸引力,得以不斷拓展餐飲、旅遊到藝文等場景,更突破點數僅能折抵帳單的模式,讓卡友能用點數兌換熱門演唱會、運動賽事門票,甚至搶先預訂話題熱門餐廳等限量體驗。

「我們希望讓客戶覺得:哇,你又找到我的需求了!」陳冠學說。把細微偏好化為具體體驗,正是 CUBE 平台能不斷創造驚喜的關鍵。四年來,CUBE 以「1+N」權益架構結合雙 App,已累積超過 600 萬卡,為國內發卡量最大的單一信用卡;累計2025 年前 7 月,簽帳金額達 4,889 億元,年增 11%,寫下亮眼成績。

但對國泰世華而言,數字只是過程,真正的目標應如陳冠學所言:「信用卡不該再有框架,CUBE 要做的,就是以洞察與創造,帶給客戶超乎想像的個人化體驗。」

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
蘋果能再次偉大?
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓