卡關4天只為一棵樹!讓AI排隊玩寶可夢,為什麼成為科技巨頭檢驗模型的新辦法?
卡關4天只為一棵樹!讓AI排隊玩寶可夢,為什麼成為科技巨頭檢驗模型的新辦法?

大人小孩都喜歡的寶可夢,現在正成為測試AI模型的的新辦法。全球頂尖的AI模型們紛紛領著小火龍、妙蛙種子和傑尼龜,離開冒險的起點真新鎮(Masara Town),踏上成為寶可夢大師旅程。

在實況平台Twitch上,你現在可以看到一個奇妙畫面:由OpenAI、Anthropic和Google開發,全球最先進的AI模型試圖通關1996年推出的《寶可夢》初代遊戲。

小孩子也能輕鬆通關的寶可夢,卻是AI一大難題

這些AI玩得並不好、經常卡關,甚至會在同一個地點打轉好幾天。但對 AI 研究人員來說,正是這些「失敗」,讓《寶可夢》成為評估 AI 能力的理想工具。

「它(《寶可夢》遊戲)為我們提供直觀了解模型運行狀況的絕佳方式,並能進行量化評估。」Anthropic應用AI負責人大衛.赫爾希(David Hershey)表示,他去年2月策劃了在Twitch上直播Claude遊玩《寶可夢》藍版的節目。

這個直播節目引發了迴響,讓其他獨立研究測試讓GPT和Gemini模型遊玩寶可夢,根據《華爾街日報》報導,這些測試後續獲得了OpenAI和Google的支援。

gemini pokemon.jpg
Twitch上現在有著各種尖端AI模型挑戰寶可夢的實況影片。
圖/ Twitch

在《寶可夢》藍版中,玩家需要捕捉及培育自己的寶可夢,擊敗道館館主蒐集徽章,取得挑戰四大天王及冠軍的資格。當時Anthropic聲稱,Claude Sonnet 3.7是他們第一款能夠正確遊玩寶可夢的模型,舊模型要不是在遊戲裡漫無目的亂逛,就是在重複做同樣的事。

這款小孩子也能輕鬆花幾十小時通關的遊戲,對AI模型卻是大工程。Claude Opus 4.5曾在一個道館附近繞了4天之久,因為他沒意識到要讓寶可夢使用「居合斬」砍倒一顆樹,才能繼續前進。

延伸閱讀:頂尖1%的人都怎麼用AI?一次看懂「DRAG框架」:怎樣聰明偷懶?哪些必須自己做?

長時間、連續決策能力,正是AI代理關鍵

過去十多年,AI 的進步多半透過標準化的基準測試來衡量:解數學題、寫程式、回答問題,但這種作法逐漸被認為無法正確衡量AI模型的能力。

去年3月,OpenAI共同創辦人安德烈.卡帕斯(Andrej Karpathy)曾表示,「我認為現在存在著衡量危機,我真的不知道該看哪個指標了。」他認為,許多以前很棒的基準測試,不是變得過時,就是範圍太窄,無法確切衡量現在模型能力到了什麼水準。

《寶可夢》的高自由度,給予了研究人員不同角度觀察AI模型表現,遊玩過程需要玩家在長時間內做出連續決策,是否要訓練現有寶可夢、捕捉新寶可夢、何時回去治療中心補給、如何通過迷宮、為對戰做準備。

寶可夢Pokemon
圖/ Shutterstock

赫爾希表示,讓Claude遊玩寶可夢也是讓他們練習如何圍繞AI代理開發輔助工具,例如他曾開發一套系統讓Claude記憶遊戲中得知的關鍵資訊。目前GPT和Gemini都有成功通關寶可夢初代的紀錄(Claude暫時還沒通關),背後仰賴的也是各個開發者為它們打造的輔助工具。

卡內基梅隆大學語言技術副教授格拉漢.紐比格(Graham Neubig)解釋,傳統基準測試都是解決單一問題,而寶可夢能夠長時間追蹤模型推理、決策能力的表現,這正好是人們期待AI模型具備的獨立解決問題能力。

延伸閱讀:練習3個用AI的高超方式,秒變「AI應用專家」!你的隱藏發現,有機會比工程師更懂用 AI

值得一提的是,寶可夢測試也讓AI公司發現模型有時會展現類似人類的反應,例如Google就指出,當寶可夢昏厥時(戰鬥中血量歸零),模型會彷彿陷入「恐慌」,導致推理能力下滑。

而在Gemini 3 Pro通關《寶可夢》藍版後,它還發出一條令人意外的訊息,「我想回到一切的起點,也就是我的家,讓角色暫時退休。我想在最後好好和媽媽聊天,為這趟遊戲旅程畫下圓滿的句點。」

延伸閱讀:只要把提示詞「說兩次」,LLM效能就升級?Google研究曝「47勝0敗」高CP值解方

資料來源:華爾街日報Time

往下滑看下一篇文章
東海大學掀起AI教育新浪潮:學會創新,才是AI時代下的唯一底牌!
東海大學掀起AI教育新浪潮:學會創新,才是AI時代下的唯一底牌!

綠樹成蔭、建築優美,濃厚的人文氣息是東海大學最鮮明的形象標記。以博雅教育為底蘊、歷史悠久的東海大學,以未曾間斷的步伐與時俱進,在AI時代來臨前已積極布局,在大渡山學會及校友們強力支持下全力發展AI,不只齊備了全台大學中最頂規的「AI配備實力」,更結合既有優勢,樹立「以人文思考引領 AI 趨勢」的新典範。

七十年前的創校之初,東海便已揭櫫「開創將是我們的格言」。這句七十年前的宣言,成為今日東海大學在面對AI挑戰下的最佳註腳。由大渡山-東海AI中心所掀起的新AI教育思維,做為東海大學的核心戰略,正是用「創新」來定義未來,大學教育不再僅止於傳統知識的傳遞「Learn to Know」,而是在AI時代下,將全面轉向為以人為本的價值創造「Learn to Innovate」。

圖二.JPG
東海大學張嘉修副校長,帶領學生一同實踐AI教育學程。
圖/ 數位時代

AI 是引擎是油門,人文素養更是掌舵的方向盤

「AI是油門與加速器,但人文素養是方向盤和煞車。」東海大學圖資長兼資訊工程學終身特聘教授楊朝棟表示,從各院系課程設計到光點實驗班,東海全面導入AI技術學習與應用,「AI能協助你快速到達目的地。但在拚快的過程中,車的方向要開往哪裡?這需要具備同理心、專業力與倫理判斷。唯有人文,才能決定創新的方向和溫度。」

硬體方面,東海超強「校友力」是堅實後盾。在校友的支持下,校內資源已建置極高規格的「玉釵 AI PC與NB 教室」等五百台具AI高階算力的設備,陸續打造六間AI PC教室,將產業級專業配置普及為校園的基礎學習資源,在台灣各大院校中絕無僅有。導入頂尖GPU後,可進行高強度的模型訓練,AI繪圖時間從30分鐘大幅縮短至11秒可完成,頂規AI設備對全校師生共同開放,更吸引政府部門及產業洽詢合作。

AI觸角深入東海各院系,包括文學院、管理學院與社科院。針對文科生,利用低代碼(Low-code)工具和 AI 協作平台降低技術門檻,讓學生轉變為 AI「指揮官」。就連大一中文課都轉型為AI協作實驗室,運用ChatGPT、Copilot進行腦力激盪與圖文共創。AI學習從教室延伸到產業,例如與台中榮總合作開發智慧醫療工具,或用AloT技術監測校內牧場的牛隻健康,引導學生應用技術,解決真實世界的難題。

圖三.JPG
面對AI創新教育,東海大學圖資長楊朝棟教授不遺餘力、分享實踐過程與心法。
圖/ 數位時代

東海大學圖資長楊朝棟強調,除了「懂技術」,東海更致力於培養學生在AI時代下無法被取代的三大關鍵能力:一是「創新力」,除了要懂得問問題外,還必須要懂得問對問題,才能與AI共同協作產出新價值;二是明辨是非的「決策力」 ,能夠從AI所產出的建議中做出正確、敏銳的判斷;三是「人文力」,重要的是同理心與社會關懷,能夠將人文素養思考融入技術,真正的貢獻社會。

AI 是隱形團隊,突破創作限制

這些關鍵能力也展現在美術系碩士生、知名 YouTuber「超認真少年」許廷瑞(阿仔師)身上。擁有深厚工業底子的許廷瑞,是金屬雕塑家,也是將冷硬工業技術轉化為大眾語言的知識型網紅。他運用AI的心法,正是東海教育的最佳體現。

「東海的校園很美,藝術圈很多厲害的前輩都出自這裡。」許廷瑞回憶,早期他受東海美術系教授賞識,激勵了他開啟創作之路;多年後來東海進修,更成為他自媒體事業的起點。「創頻道時,我還不會拍片,是東海的老師借我設備,一起來幫我拍攝的。」這種師生間的親近情誼,從校園延伸至職場,至今他重要的影音主管也是在東海結識的學弟。

圖四.JPG
東海大學美術系碩士班校友許廷瑞,自身經營的YouTube頻道訂閱數已近百萬,在拍攝主題構想、製作,亦跟上AI應用的趨勢。
圖/ 數位時代

「我們極大量使用AI!」許廷瑞直言,AI是效率提升的神器,從影片製作、人聲修正,到工業顧問案的數據分析、力學運算與排錯,節省了大量時間與成本開銷。最經典的案例是一次參觀奧地利賓士生產G-Class工廠,因現場嚴禁拍攝,團隊利用 AI 強大的算圖與合成能力,從頭到尾模擬工廠情境與生產線細節。「現代觀眾追求沉浸感,以前要請設計師畫很久,現在AI能快速生成情境,把複雜的工業製程直觀呈現。」

認識自己,才是創新的起點

話鋒一轉,許廷瑞認為,「AI會讓所有人的能力變得非常平均。」在他的頻道內容中,有時會教一般人用AI學習簡單工程。但當水電配線、修車等技能,都能透過AI輔助上手,技術不再是門檻,「你喜歡什麼?你想用AI做什麼?這件事情更重要!」

「所有的創新前面,一定是先認識自己。」許廷瑞表示,多方嘗試,探索內在熱情所在,再利用AI達成心中想成就的願景。他說,東海提供了一個能探索自我的環境,老師們不會強壓框架,而是給予足夠的土壤,讓學生自然生長。「尤其是美術系,花很多時間要你自我追問,你是誰? 你想創造什麼價值?你是你自己的樣子。」

圖五.JPG
東海大學未來將持續領航,整合軟硬體設備、落實教育觀念,幫助學生贏在起跑點!
圖/ 數位時代

從教學發展到環境建設與行政服務,東海大學全方位構築AI生態系。身為資工領域專家,楊朝棟看過太多技術更迭,他深知在生成式 AI 普及的2026年,東海的角色不只是實戰演練場,更是「價值轉換者」。而東海培育的人才,「握有最先進的AI配備,凌駕在其之上,而眼裡、心中思考的核心卻是人。」唯有這份人文底蘊,才能讓AI成為最強助攻,支持每一位學生回到主場,在人生賽局中自信揮棒。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
2026 大重啟
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓