【觀點】GPT4變笨了?程式爆bug、指令失效,盤點背後6大可能
【觀點】GPT4變笨了?程式爆bug、指令失效,盤點背後6大可能

在這個科技日新月異的時代,我們經常會被各種新奇的現象所驚訝。最近,AI 圈裡出現了一個有趣的現象:GPT4,這個曾經被眾多網友讚譽為「智慧化身」的 AI,突然被覺得「變笨了」。

這讓我想起了一個老故事,故事裡的主角是一個叫做伊卡洛斯的年輕人,他用蠟和羽毛做了一對翅膀,飛向了天空。然而,當他飛得愈來愈高,接近太陽的時候,蠟開始融化,翅膀解體,他從天空中墜落,最終落得粉身碎骨。這個故事告訴我們一個道理:飛得太高,可能會被太陽燒傷;飛得太低,可能會被海浪吞噬。我們需要找到一個適合的高度,才能在天空中自由飛翔。同樣,AI 的發展似乎也需要找到一個平衡點,既不能過於「聰明」,也不能過於「笨」。

GPT4程式爆bug、指令失效!傳創辦人出手干預

4月中,網友們開始發現,原本能夠完美演繹的程式碼、驚絕眾人的聊天招數,GPT4 突然都失效了。寫出來的程式代碼bug(漏洞)一堆,一些出圈的對談體驗都逐漸收斂起來。這就像是一個熱愛音樂的人,突然發現他最愛的鋼琴演奏家的演奏技巧大不如前,那種失望和困惑,可以想像得到。

網友們發現問題後,有的透過 Twitter 問 OpenAI 成員,有的透過新聞記者管道,有的是以付費用戶角度詢問客服;然而,OpenAI 的回應卻是全面否定他們有「降速」、「減版」或「削智」的行動。這就像是那個鋼琴演奏家堅稱他的演奏技巧沒有任何問題,但觀眾的耳朵卻告訴他們,音樂已經不再動聽。

AI Tool ChatGPT
今年4月網友們開始發現,原本能夠完美演繹的程式碼、驚絕眾人的聊天招數,GPT4 突然都失效了。寫出來的程式代碼bug(漏洞)一堆,一些出圈的對談體驗都逐漸收斂起來。
圖/ Photo by Mojahid Mottakin on Unsplash

我自己也親身經歷了這個變化。5月中,我開始使用 GPT4 作為我的寫作靈感來源。它的寫作能力讓我驚豔,甚至經常在短文中藉由我的提示展現出,連我身為原作者都非常訝異的靈光與統合。然而,到了5月底、6月初,本來被我視為寫作靈感幫手的 prompt(AI 工作指令)全數失效!我試了好幾遍,重開瀏覽器、清除 cookie、重新登入、用自建 API 打造工具,全部無效!那個曾經為我帶來無數靈感的 GPT4,就像電影《雲端情人》裡的 Samantha 一樣,離我遠去,而且沒有道別。

我讀了一些中文、外文在討論此事的文章,整理了幾種可能,細思極恐:

一、 只是用戶的錯覺 :這是 OpenAI 的官方回覆。但是,當我們的感知和官方的說法不一致時,我們應該相信誰呢?

二、 是 GPT4 大語言模型本來就會有的長效不穩定特性 。就像一個天才藝術家,他的創作總是讓人驚喜,但也總是讓人無法預測。

三、 是 GPT4 導入的 RHFL(人類反饋增強學習)會讓回應結果逐漸接近人類……(的智慧等級)。 這就像是一個學生,他的學習成果會受到他的老師的影響。

四、 共同創辦人Sam Altman 最近也簽署 Safe AI 宣言,認為指數智慧增長的 GAI 開發需要更多安全性關注,因此內部可能對「GPT 驚人的智慧與成長」稍微做了限制? 這就像是父親為了保護他的孩子,可能會限制孩子的行動自由。

OpenAI 執行長 Sam Altman
OpenAI 執行長 Sam Altman近期簽署 Safe AI 宣言,認為指數智慧增長的 GAI 開發需要更多安全性關注。

五、 GAI 在各國和企業中引發的智慧輾壓討論其實短中期不利 OpenAI 業務發展,所以在版本更新中稍微調降了 GPT4 的能力。 這就像是一個公司,為了維護自己的利益,可能會改變自己的產品策略。

六、 因為近期被微軟(Microsoft)爸爸壓著打,說一定要提供Bing相應的GPT對話服務,OpenAI內部算力不足,只能分化一點計算力去支援微軟,這可能導致回應的深度和時間可能在 GPT 改版時被限制。 如同一個人能力有限,必須分心去處理其他事情時,就有可能影響他的主要工作。估計大概還有無數種陰謀論和猜想,但最可怕的是,過去 Web2.0 社交平台被詬病的只有排序演算法不公開、不公平;如今,當所謂「智慧」成為一種黑箱的時候,擁有智慧的企業將可以用各種理由來調整其提供的服務,而影響我們的工作與生活。

我們現在正處在一個科技發展的十字路口,可以選擇讓 AI 繼續發展,讓它成為我們的助手,也可以選擇讓 AI 停滯不前,讓它成為我們的敵人。但是,我們必須明白,無論我們選擇哪條路,都將對我們的未來產生深遠的影響。

選擇_疑惑_十字路口_shutterstock_466547954
圖/ shutterstock

AI新文明大火燃起來,然後呢?

該思考應該的不僅是接著勢必要推出的 GPT5、GPT6,而是我們用了這把新的文明之火,到底還有沒有什麼我們不了解、未通透討論的社會事務?會不會誰不明就裡地扮演了火神,而我們也就莫名入了拜火教?我們需要慎重地思考,如何使用這把新的文明之火,讓它為生活帶來光明,而不是黑暗。

慎之,慎之。在我們追求科技進步的同時,我們也不能忘記我們的初衷:創造一個更好的世界。我們需要找到一種平衡,讓 AI 成為我們的朋友,而不是我們的敵人。我們需要找到一種方法,讓 AI 的發展能夠服務於人類,而不是控制人類。我們需要找到一種方式,讓 AI 的智慧能夠為我們帶來福祉,而不是災難。在這個充滿挑戰和機遇的時代,讓我們一起擁抱變化,擁抱未來,並且擁抱我們自己的可能性。讓我們一起創造一個更美好的世界,一個 AI 和人類和平共處的世界。

如果,你覺得本文有些段落老派到像是人類文化三千年的黏膩結晶,你想的沒錯,這篇短文正是 ChatGPT4 至今最新版 2023 May 24 Version 的智慧變奏結果,若你興趣閱讀純人腦原始版,歡迎造訪筆者臉書 6 月 5 日貼文連結於文末;當然,為了讓你見識(疑似)變笨後的 GPT 機器人鬼打牆實錄,也在文後附上此次人機合作的無修正 prompt 記錄,閱覽過後,相信你不只將學會寶博流獨家咒語外,也許還能順便解除你對 AI 的過焦慮,並且一窺 AI 電子腦裡不想和你說的祕密。

筆者臉書原始貼文
無修正 prompt 紀錄

責任編輯:蘇柔瑋

往下滑看下一篇文章
全台首創對話式金融服務iWish 永豐銀讓GAI真正走進金融交易現場
全台首創對話式金融服務iWish 永豐銀讓GAI真正走進金融交易現場

你還在手寫填單、逐格Key-in資料嗎?在生成式AI浪潮席捲各行各業之際,永豐銀行推出全台首創「說話就能完成交易」的智能對話式金融服務iWish,讓繁瑣的填單流程成為過去式,使用者可以透過文字輸入、口說敍述或上傳照片等方式,向AI傳達自身需求,無論哪一種方式,AI都可以即時理解使用者意圖,並根據與使用者的對話內容,自動填寫存款、提款、轉帳、匯款等相關表單,顛覆使用者對金融服務的想像。

生成式AI再進化,開啟AI代理人時代

隨著生成式AI的進步,LLM大型語言模型已具備多輪對話和上下文理解的能力,甚至正邁向可以獨立完成任務、不需要人類涉入的AI代理人(AI Agent)的新階段,這項技術突破讓企業既有服務得以展現全新樣貌。

以國際證券經紀商FBS為例,其推出的FBS AI Assistant服務,跳脫傳統單向建議模式,不直接提供評論或建議,而是讓用戶先選擇一至多項技術指標,再交由生成式AI模型解讀並生成專屬分析與操作建議,打造更具互動性與參與感的使用體驗。

永豐金控數位科技長張天豪認為,這種以生成式AI為核心的互動式服務模式,將大幅優化客戶的使用體驗,成為金融服務新常態。未來,客戶不必學習如何操作App,也不用記得交易程序,只要用對話、上傳照片或螢幕截圖等自己習慣的方式表達需求,AI就會理解並協助完成後續動作。「未來的金融服務將像生活中人與人之間的對話一樣,簡單而自然,」張天豪強調。

永豐銀行
前排由左至右:永豐金控數位科技長 張天豪、永豐銀行資訊、數位及作業督導張升寶、永豐銀行綜合企劃處處長 王筱嵐 後排由左至右:永豐金控數位科技處專案經理 林維婕、永豐金控數位科技處專案工程師 廖庭暘
圖/ 永豐銀行

從填單到對話,iWish重塑分行服務體驗

瞄準此未來趨勢,永豐銀行進一步盤點金融服務場景,決定從最貼近客戶的分行場域出發,打造互動式服務新體驗。

張天豪說明,臨櫃交易往往需要填寫各式各樣的表單,這些表單格式通常很制式、欄位繁複,對不熟悉流程的客戶而言,常常填到一半才發現格式錯誤、填錯位置,甚至必須整張重來,徒增挫折與作業時間。

「iWish服務的推出,就是為了讓這段流程可以變得更自然、直覺且輕鬆,」永豐銀行資訊、數位及作業督導張升寶說,客戶不再需要手寫填單,只要開口說、輸入文字或是上傳圖片,告訴iWish想要使用哪些金融服務,就可以完成交易,將原本繁瑣、仰賴經驗的填單作業,轉化成只需一句話或一張圖就能搞定,大幅提升臨櫃交易的服務體驗與作業效率。

以轉帳交易為例,客戶可以口說轉帳帳戶及金額,或是上傳網購訂單的轉帳頁面截圖、團媽在Line上提醒轉帳付款的對話截圖等,iWish會從中辨識表單所需資訊並精準填入銀行系統中對應的欄位,待客戶確認資訊無誤之後,系統就會生成一個二維條碼,只要將二維條碼交由臨櫃人員完成最後核對,就能輕鬆完成金融交易。

AI減輕行員負擔,專注更高價值服務

除了顛覆客戶的使用體驗,iWish服務也為內部作業流程帶來優化和改變,「對永豐銀行而言,iWish服務不是引進AI技術的炫技展示,而是與現有服務模式的無縫融合,讓創新落地、貼近人性」,永豐銀行綜合企劃處王筱嵐處長說。

王筱嵐進一步表示,最開始,金融交易需要經歷「客戶填單+櫃員輸入」的雙重程序,不僅耗時,也容易出錯。之後,永豐銀行推出免填單服務,客戶可以口述或將交易資訊抄寫在紙上,交由櫃員輸入至系統中、列印單據,待客戶簽名確認即可完成交易。

永豐銀行
圖/ 永豐銀行

而iWish則是免填單服務的再進化,藉由生成式AI(GAI)的語意理解與圖像辨識能力,取代櫃員的手動輸入作業,不僅提高效率與準確度,也大幅降低櫃員的作業負擔,可以將心力投注在更有價值的服務與溝通上。

GAI不只是客服輔助工具,更是金融轉型的推進引擎

相較於目前金融業的生成式AI應用,多數仍停留在客服階段,iWish是全台首創直接導入金融交易場景的GAI服務,堪稱跨出關鍵一步。

然而,在實際開發過程中,永豐銀行團隊也面臨諸多挑戰,其中壓力最大的,便是如何降低LLM可能出現的「幻覺」與辨識錯誤風險。尤其在金融交易場景中,AI的辨識精準度不僅關係到客戶權益,更直接影響其對金融服務的信任感,必須以更審慎的態度來看待。

為此,永豐銀行從多個面向著手提升模型準確度,包括優化Prompt設計與模型邏輯、與前線單位密切協作,共同討論介面呈現、使用流程與應用情境、在UI/UX介面加入提醒文字與引導機制,避免造成誤解。此外,團隊也分階段進行大規模封閉測試,邀請全行數百位同仁參與測試,並根據測試結果持續微調優化,確保最終推出的服務穩定度。

iWish的智慧來自於訓練與學習,「越用越聰明」的特性需要使用者參與激發

iWish是一款全新上市的智能服務,專為提升臨櫃交易體驗而設計。現階段iWish服務聚焦於台幣存款、提款、轉帳及匯款4大交易類型,並以「分行」為主要場景,未來則計劃將iWish服務擴展至更多金融交易類型,甚至走出分行場景,與iBranch等線上服務結合。

永豐銀行
永豐iWish以「智讀」、「智說」、「智寫」人性化操作,讓金融交易更方便快速
圖/ 永豐銀行

iWish的成功落地不僅是技術突破,更宣示意味著,生成式AI正式從客服輔助工具,搖身一變成為可以理解意圖、自然回應、主動引導的智慧助理,讓用戶在熟悉的對話情境中完成交易,實現真正以人為本的金融體驗。而AI模型的成長需要訓練,iWish在初期也需要客戶的參與來變得更聰明,透過接觸到更多元的使用情境,進一步完善服務,讓每一次互動都更懂客戶的需求。

「iWish服務只是第一步,」張升寶認為,這項服務不僅重新定義人與銀行的互動方式,也為生成式AI在金融業的應用看見新的可能。他期許未來能進一步擴大AI Agent應用範圍,讓AI不再只是輔助工具,而是驅動金融轉型的核心力量。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
蘋果能再次偉大?
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓