GPT-4變懶了:轉檔推太長,表格也只給3行!OpenAI怎麼說?AI模型為何會變笨?
GPT-4變懶了:轉檔推太長,表格也只給3行!OpenAI怎麼說?AI模型為何會變笨?

24小時全年無休的AI,會想要「偷懶」嗎?近期有大量用戶反應,GPT-4正變得越來越懶散,不再盡心盡力回答問題,而OpenAI也出面表示,他們正在調查這個問題,並且研究如何修復AI模型。

Google剛發布號稱在多個指標上比GPT-4更強悍的AI模型Gemini,在這或許是OpenAI最需要嚴陣以待的時刻,GPT-4近來就被發覺出現了「偷懶」問題,不再詳盡解答用戶的疑問,甚至是拒絕回應、要用戶自己找出答案。

延伸閱讀:「一個詞」讓ChatGPT吐出原始資料!AI模型為何能在無形間出賣你?

GPT-4變懶了,怎麼回事?OpenAI怎麼說?

11月底時,AI工程師克里希南(Rohit Krishnan)就在推特上抱怨,GPT-4變得懶散又沒用,希望交給聊天機器人的各種任務都遭到回絕。「轉換這個檔案?太長了。編寫表格?只給前三行。讀取這個連結?抱歉不行。讀取這個py檔案(python程式)?抱歉不允許。這實在太讓人洩氣了。」他在推文中表示。

提出類似抱怨的不只他一人,創業家麥特.溫辛(Matt Wensing)也指出,GPT越來越抗拒做枯燥的工作,基本上它只會給出一部分答案,然後讓用戶自行解決剩下的部分。

抱怨GPT-4越來越懶的聲浪在網路上日漸攀升,終於OpenAI官方也出面表示,他們已經聽到用戶對於GPT-4越來越懶的回饋,正在研究怎麼解決這個問題,但強調他們自11月11日以來,就沒有動過AI模型。

OpenAI解釋,這個說法並不代表AI自行改變了模型,只是模型的行為可能出現了微妙的差異,導致提示詞出現退化,這種情況通常要用戶及員工很長一段時間才會注意到,並且修復這樣的變化。

GPT-4變笨的事件,也恰好緊接在OpenAI爆出宮鬥大戲之後,至於這齣政變戲碼是否有影響內部的運轉或效率,則暫時未可知。

不過OpenAI強調,發布新模型時他們都會進行包含AB測試在內的各種試驗,依據所有試驗結果確保新模型比舊模型更能帶給用戶幫助,也歡迎用戶持續反應GPT-4可能出現的變化、是否變得懶散,幫助他們即時掌握問題狀況。

延伸閱讀:Google承認Gemini超神影片造假「動了幾刀」!號稱打贏GPT-4,其實很水

GPT-4也曾變笨!實測6月份版本的GPT-4,就比3月版本準確度高多了

事實上,這並非GPT技術首次「學壞」,早在今年6、7月時,就有大批開發者抱怨GPT-4「變笨」了,有時會犯下一些愚蠢的錯誤、沒注意到用戶施加的指令,甚至引發外界猜測OpenAI是否為省錢降低了運算能力、或者調整模型降低成本。

當時OpenAI產品副總裁韋林德(Peter Welinder)公開澄清,「不,我們沒有把GPT-4變笨!」聲稱他們每次更新都是讓GPT-4比以前更聰明,用戶覺得變笨的情況有可能是因為高度使用下,一些過去沒發現的問題暴露出來。

雖然OpenAI強調他們沒有更動模型,但有研究團隊發布報告,用對比今年3月跟6月的GPT-4模型,評估在數學、敏感問題、回應頻率、程式能力、推理能力等諸多面向的表現,其中在數學能力方面, 研究團隊用500道題目讓兩個模型判斷質數,結果3月份的版本以97.6%準確度壓倒性高於6月版本的2.4%

gpt accuracy.jpg
先前GPT-4也傳出變笨消息,且經研究團隊測試在部份數學能力上出現顯著落差。
圖/ @svpino via X

AI模型會變笨,究竟是什麼原因?

來自史丹佛及柏克萊加大的研究團隊指出,「我們發現GPT-4和GPT-3.5的表現和行為,在兩個版本中存在顯著差異,並且在某些任務的表現隨著時間越來越差。」他們認為其中一種可能性是 GPT-4已經從思路鏈偏移 ,這是一種將多步驟問題拆解成複數中間步驟,提升大型語言模型推理能力的技術。

對於GPT技術有時莫名出現改變的情況,他們坦承訓練AI模型並不像工業製造般明確,投入什麼原料就知道會製造出什麼產品, 即使是完全相同的訓練材料,在不同次訓練當中,也可能催生出性格、文字風格、評估標準,甚至政治偏袒傾向迥異的AI模型

一直以來,AI究竟是如何運作的,常被稱為「黑盒子」,很難從外部去解釋、理解AI是如何做出決策,如此行動的原因等等。即使是引領著生成式AI發展的OpenAI,目前也不明白在沒有更新模型的情況下,GPT-4突然變得懶散的原因,不過再等待一些時間,開發團隊或許將能修復問題,告訴我們GPT-4究竟為何突然發懶。

延伸閱讀:細看GPT-4,還有14個驚人細節!可能會幫助犯罪、人類無法控制?

資料來源:PCMagDigital TrendX

責任編輯:林美欣

關鍵字: #AI #openai #ChatGPT
往下滑看下一篇文章
台灣新創思邁智能、海研科技突圍出海搶佔生成式 AI 商機,AWS 以領先技術及資源成為最強後盾
台灣新創思邁智能、海研科技突圍出海搶佔生成式 AI 商機,AWS 以領先技術及資源成為最強後盾
2025.11.13 |

AI 正在改寫世界運作模式。根據研究機構 The Research Insights 預測,全球 AI 市場將從2025年的3,909億美元攀升到2030年的1兆8,117億美元,年複合成長率高達19.2%。這股成長動能與 AI 技術正滲透各個產業有關,從製造到金融、從零售到物流,不僅流程被重塑、商模也隨之翻轉。

在這場 AI 驅動的創新浪潮中,新創是推動產業變革的關鍵力量之一。 AWS 不僅以全球領先的雲端與 AI 技術平台提供堅實後盾,更以豐沛資源化身新創最佳夥伴、協助台灣團隊將創意落地、放大商業影響力。例如,在 AWS 的技術與資源支持下,語音 AI 新創海研科技(SeaTech)得以加速模型迭代與演算法優化,為台灣與新加坡量身打造在地語言模型並推動應用落地;同時,也讓思邁智能(MaiAgent, Inc.)專注強化企業級生成式 AI 平台 –MaiAgent– 功能,協助企業將生成式 AI 融入日常營運,實現更智慧的決策與效率升級。

三大關鍵步驟,思邁智能助企業放大生成式 AI 應用價值

AI Agent 具備感知、決策、行動與優化四大特徵,被視為企業面對人力缺口與營運挑戰的最佳助手,然而,在實作過程中,多數企業都因為三大瓶頸–資料分散、模型不符實務、導入周期過長–導致AI難以落地或成效不如預期。

觀察到上述現況,深耕 AI 領域研究、協助上百家企業導入 AI 應用的思邁智能提出解方:AI 導入方法論與平台產品服務。

思邁智能執行長張介騰表示,導入 AI 應該從「AI-Ready 文化」開始,因此,第一步是讓每位員工都能自然地用 AI 提升工作效率,例如透過自研的 MaiGPT 縮短資料搜尋與知識蒐整時間;第二步是建立企業專屬的 AI 知識庫(AI KM),例如以 MaiAgent 打造企業的「智慧大腦」,加速各類分析報表生成製作,讓員工可以加速決策與專注核心業務;第三步是從組織流程出發,找出重複性高的任務並建構對應的 AI Agent,如語音客服、文字助理等,讓 AI 真正走進業務核心。

「面對日新月異的 AI 技術演進,想要搶占先機,策略合作是必然。」張介騰以 MaiAgent 產品為例說明,透過 Amazon Bedrock 平台,團隊成員不用自建基礎模型、可以直接從平台快速選擇所需的基礎模型與工具於其上進行產品功能開發、大幅縮短產品開發週期,同時,可以在第一時間接收到模型更新等資訊,更好回應市場要求。「在 AWS 平台上開發產品,不僅能縮短開發週期、快速迭代新功能,也可以保障系統與資料安全,同時,因應業務需求彈性擴展,例如,協助新加坡與泰國企業導入服務等。」

隨著產品服務的成熟,思邁智能除持續尋找軟體夥伴擴展 MaiAgent 生態體系,亦已將 MaiAgent 上架 AWS Marketplace,更好擴展國際市場版圖,同時,成立AI落地顧問團隊,協助生態體系夥伴跟企業客戶更好發揮 AI 綜效。

AWS
思邁智能專注強化企業級生成式 AI 平台–MaiAgent–功能,協助企業將生成式AI融入日常營運,實現更智慧的決策與效率升級。圖為執行長張介騰。
圖/ 數位時代

不僅在 AWS 上開發產品,海研科技攜手 AWS 針對企業痛點推最佳解方

對許多新創來說,雲端只是基礎設施的一種,但對海研科技來說,AWS 是他們加速創新與推動業務的關鍵伙伴。這家專注語音 AI 的新創團隊自創業第一天就跟 AWS 展開合作,不僅透過 Amazon Bedrock 打造專屬台灣的語言模型,更循序推出 SeaMeet、SeaChat、SeaX、SeaVoice 等產品,讓語音 AI 不再只是技術展示,而是能直接回應企業現場痛點的實用解方。

「語音辨識(ASR)不是新技術,但要做到『在地化』才有競爭優勢。」海研科技首席業務發展經理何庭劭表示,全球已有多家科技大廠投入開發英語、中文、印度語、俄語、西班牙語等13種主流語言模型,但台灣、新加坡與東南亞國家的語言環境與溝通方式較多元,如台灣的日常對話常混雜10%到15%的英語或台語雙關詞等,通用型的語言模型不敷使用,必須重新訓練、微調語言模型,才能滿足本地語境應用。

這份對在地市場的專注,讓海研科技在聽到 AWS 分享企業痛點後可以快速推出相應產品服務,例如,因應製造業跨國團隊的會議溝通挑戰,打造「SeaMeet 雙語即時翻譯」功能,讓語音 AI 能在中、英夾雜的會議中流暢轉譯、即時生成紀錄,解決企業跨境協作的語言門檻。

海研科技之所以能無後顧之憂地推出創新解方,與 AWS 提供穩定、可靠且彈性支援服務有關。何庭劭以 SeaMeet 為例解釋:「產品特性使然,SeaMeet 的尖峰與離峰時段的使用量差異極大,但在 AWS 平台支援– Amazon EKS 會依照實際需求動態調整伺服器資源(Amazon EC2 instance)–下,海研科技的團隊成員不用花費間監控與資源配置,可以專注在產品開發與持續創新。」

事實上,這也是海研科技可以因應龐大的長照需求,順利在今年推出取得 HIPAA 認證的 SeaX 服務,並協助新加坡社區關懷機構 Lions Befrienders 以10餘人社工團隊完成每天上千通長者關懷電話的原因。

AWS
海研科技首席業務發展經理何庭劭表示,有個大型集團客戶有非常多的會議要跟進,過去光是紀錄重點,就會需要許多人力,但透過即時的會議紀錄整理,讓後續追蹤更有效率。
圖/ 數位時代

何庭劭表示:「透過 SeaX,Lions Befrienders 每秒可完成30通電話,每通皆有錄音、逐字稿與 AI 分析,判斷是否需社工即時介入,讓語音 AI 成為重塑長照現場效率與安全的關鍵伙伴。」

從台灣到新加坡,從會議翻譯到智慧長照,海研科技的語音 AI 正形成一個「技術與市場雙向成長」的飛輪,接下來,海研科技將透過 AWS Marketplace 進軍歐美市場,讓更多企業能以雲端訂閱方式直接採用其服務。

何庭劭強調:「 AWS 不僅提供一條龍平台服務,更是我們的共創夥伴,讓我們可以看得更遠、動得更快。」而這也是海研科技與 AWS 的互動關係會從技術夥伴轉向共創夥伴的原因,讓語音 AI 可以真正走進企業日常。

思邁智能與海研科技不是單一或特殊案例,在 AWS 豐沛的技術能量與資源支持下,愈來愈多新創正從單純的技術創新者,成長為推動產業變革的關鍵力量,讓 AI 真正落地多元場域,開創生態共榮的新局。

新創解方立即看

AWS
圖/ 數位時代
AWS
圖/ 數位時代

思邁智能_解方立即看

海研科技_解方立即看

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓