AI變學霸?國二科學測驗已難不倒它,答對9成考題
AI變學霸?國二科學測驗已難不倒它,答對9成考題

4年前,由微軟共同創辦人保羅.艾倫(Paul Allen)設立的艾倫人工智慧研究所舉辦的一場賽事中,超過700位電腦學者競相開發能通過美國8年級科學考卷的人工智慧,勝者將能獲得8萬美元獎金,然而最終無一達成目標。

擁有常人所不能的知識量,過目不忘的AI,竟會被區區國、高中等級的考卷給難倒,或許很難讓人想像。但事實上證明,當時最先進、複雜的AI系統,連取得60分都有困難。因為不管學識含量再豐富,看不懂題目就一點意義也沒有了。

不過,最近的AI研究終於攻克阻礙,艾倫人工智慧研究所新推出的AI系統「Aristo」成功跨越了這道門檻。且絕不是低空飛過,AI在美國8年級科學測驗中答對9成題目;12年級科學測驗中,也有8成的答題正確率。

aristo
官方的介紹網站中,你甚至可親自考考Aristo,看看它是如何理解並解開問題。
圖/ Allen Institute for Artificial Intelligence

雖然這有一些「前提條件」──礙於目前AI系統的能力,研究人員刪除了與圖表、圖片有關的題目,因為這需要更高一層將語言理解、邏輯與電腦視覺結合的能力。

儘管如此,Aristo依舊深刻展現了人工智慧技術在理解語言脈絡、模擬人類決策邏輯上的重大進展。

打造「數位版亞里斯多德」,科學家讓AI寫考卷進步

早從2013年起,艾倫人工智慧研究所便著手開發Aristo,他們希望能打造出一個「數位版的亞里斯多德」,研究人員認為,比起傳統讓AI下棋的作法,給它們寫科學考卷更具訓練意義。

研究人員指出,對考題的理解並非依靠學習規則(learning rules)就能掌握的,需要AI運用邏輯連結不同事物之間的關聯性,好比說若森林大火增加,就可能造成果實、昆蟲的數量銳減,進而導致松鼠死亡。

aristo 2
人類一眼便能理解的簡單句子,AI需要進行複雜的處理過程。
圖/ Allen Institute for Artificial Intelligence

Aristo的基礎源自一套由Google建立,名為Bert的自然語言處理模型。在徹底研讀維基百科數千篇條目,以及大量浪漫小說、科幻小說與自行出版書籍後,Bert開始學會如何推測句子中闕漏的字詞。

藉由這項訓練,Bert學會了語言的基本建構方式,而研究人員則給予Bert更廣泛的問題與答案,漸漸地,它也學習到如何解答類似的問題。

雖然Aristo距離學者的終極目標:模擬人類智慧,還有一大段距離,目前展現的研究成果,已經足以開創商業應用上的潛力。研究所負責人奧倫.埃齊奧尼(Oren Etzioni)對此頗具信心,「我能說的是,你將見識新世代產品的誕生,部分源自新創,另一部分則源自大企業。」

這些自然語言處理模型,如今已成為許多研究項目的核心,例如用於識別假新聞的工具,以及聊天機器人使用的對話系統。水能載舟,亦能覆舟,也有人擔心,有辦法熟稔運用語言的AI,反倒可能助長假新聞散播。

無論如何,這項技術的潛力太過龐大,沒有人敢為其未來做出定論。另一間AI研究室Fast.ai研究人員傑瑞米.霍華德(Jeremy Howard)就表示,目前仍處於技術的早期階段,還未探索到其真正的潛力,這項技術最終將抵達何方,可能還沒有人知道。

日本開發「東Robo君」...可惜沒能突破東大門檻

在美國以外,世界各地也有不少科學家將AI研究的目光,放在做考卷身上。過去日本國立情報學研究所曾開發出AI機器人「東Robo君」,並以達到東大的入學標準為目標。

東robo君.png
連續4年落榜後,東Robo君不再挑戰考取東大。
圖/ DENSO東ロボ手くん NII「ロボットは東大に入れるか」成果発表会2016

不過在東Robo君連續4年落榜後,該機構最終於2016年中止了這個計畫,坦承AI的理解能力有限,只要遇到必須深入理解的問題,便立刻踢到鐵板,成績原地踏步的情況下,決定重新將重心移到提升AI的理解力上。

2017年時,中國也曾進行了一場AI與「學霸」們的高考數學比試,最終AI獲得134分,以1分之差惜敗精英學生組的成績平均,但仍向外界揭露AI在做考卷這檔事上,已經越來越上手。

責任編輯:林美欣

資料來源:New York TimesFast Company

關鍵字: #人工智慧
往下滑看下一篇文章
AI 快速生成內容的時代下,品牌如何被記住?TVBS 用「體驗×數據」重寫行銷邏輯
AI 快速生成內容的時代下,品牌如何被記住?TVBS 用「體驗×數據」重寫行銷邏輯

生成式 AI 正在重塑品牌行銷的遊戲規則。當影像、文字甚至情感語氣都能被快速生成,大量風格相似的內容充斥市場時,真實體驗與感受,才是讓品牌被理解、被記住的關鍵。

TVBS 以台灣科技媒體領導品牌的身份,於2026 品牌發表會上,以「What is Real?」為主題,正式發表全新品牌「TVBS Activation(聯力啟動)」,藉此回應這場從「內容競爭」走向「體驗競爭」的技術變革。以頂級 Live Event(實體活動)為起點,整合內容製作與國際行銷等十大服務,協助企業打造可被感受、可被記憶的品牌體驗。

TVBS 總經理劉文硯認為,AI 可以生成完美的產品介紹與行銷文案,卻無法複製人的真實感受與體驗,而這正是讓消費者感同身受、在腦海中留下深刻印象的關鍵。因此,TVBS將無法被生成的價值轉化為品牌競爭力,讓品牌價值不只被看見,更能被實際感受,並進一步轉化為消費者的認同與選擇。

TVBS 數位事業部總監郭瀧億進一步說明:「TVBS 之所以能將品牌體驗轉化為實際行銷成果,關鍵在於《TVBS 新聞》、《食尚玩家》、《健康 2.0》、《女人我最大》、《地球黃金線》五大 IP 所累積的數據資產,結合 CMoney 發票數據,所形塑出的三大優勢。」並善用這三大優勢:粉絲行動力、消費洞察力與跨產業數據力,將品牌體驗從「被感受」推進至「可轉換」。

TVBS02.jpg
2026 TVBS 品牌發表會以四個維度不同的「真」串聯 TVBS 旗下各品牌溝通訴求
圖/ TVBS

優勢1:粉絲行動力,讓流量成為可被驅動的力量

首先以粉絲行動力來看,TVBS 五大 IP 所累積的不只是龐大流量,更是一群具高度參與意願與實際行動力的受眾。

舉例來說,《TVBS 新聞網》透過民調機制,讓 600 萬粉絲在接收資訊的同時,也能即時表達觀點,持續強化互動率。《健康 2.0》則是憑藉上千位醫師與專家背書,建立品牌信任度,使內容不僅被閱讀,更進一步被民眾採納與依循。《食尚玩家》透過手機 App 提供優惠券,串起從內容瀏覽到實際消費的完整路徑,不但在短時間內領取一空,更造就極高的優惠券兌換率。而《女人我最大》粉絲則展現強大購買力,例如2025年「頂級之夜」活動,於一週內成功完售合作品牌的商品。

「這些深耕不同垂直領域的 IP,所累積的正是品牌主最核心的目標受眾,也是品牌體驗能真正落地與轉換的關鍵基礎,」郭瀧億說。

優勢2:跨產業數據力,多維度描繪受眾樣貌

接著以跨產業數據力而言,TVBS 整合五大 IP 所打造的垂直數據聯網,不僅能完整描繪消費者樣貌,更能精準預見受眾在不同領域中的真實需求。

相較於一般數據公司多從單一媒體流量切入,所掌握的數據多停留在興趣層面,TVBS的垂直產業數據聯網涵蓋多元面向,從《女人我最大》的女性消費、《健康 2.0》的醫療保健、《食尚玩家》的休閒旅遊,到《地球黃金線》的交通工具,在每一個垂直領域中,持續累積消費者由「初步接觸、產生興趣到實際行為」的轉化歷程,建構出具備產業厚度的數據基礎。郭瀧億進一步說明,這些數據已整合在單一平台,不僅能掌握用戶在不同情境中下的真實行為樣貌,也能清楚勾勒出受眾輪廓,而非只是零散的興趣標籤。例如一位在《地球黃金線》關注休旅車的用戶,可能同時在《食尚玩家》搜尋露營場、在《健康 2.0》查詢戶外防蚊資訊,這些跨場景的行為,正是品牌理解顧客需求的重要線索。

郭瀧億認為,這樣的數據能力可為品牌帶來兩大效益:一是達成數據行銷破圈,擴大目標受眾來源,不再侷限於單一產業族群;二是可依據行銷目標,精準對應行銷漏斗中的不同階段,選擇最適切的溝通對象。進一步而言,這些數據亦可在多次行銷活動中持續累積與回饋,協助品牌鎖定高潛力族群,成為下一波溝通與轉換的依據,讓行銷從單次觸及,升級為可持續優化的經營機制。

TVBS03.jpg
TVBS 數位事業部總監郭瀧億認為,TVBS 垂直數據聯網可為品牌帶來兩大效益:一是擴大目標受眾來源;二是可依據行銷目標,選擇最適切的溝通對象。
圖/ 數位時代

優勢3、消費洞察力,提高行銷決策精準度

再者是消費洞察力,TVBS在既有垂直數據基礎上,進一步與 CMoney 發票數據合作,將內容瀏覽、廣告互動與實際消費紀錄等數據整合,讓分散的數位足跡串連為完整的消費旅程。對廣告主而言,TVBS將線上線下的數據加以整合應用,相當於建構了一套從引發消費意圖到消費成效驗證的科學行銷系統,並可依據廣告主不同階段的行銷需求,極大化數據在實務操作中的轉換價值。實證發現,知名保險業者推動「旅平險」,透過這套數據整合方案,鎖定特定時間內訂機票、飯店、遊樂園的消費受眾,其成效可提升至三成。另一則案例,保健食品藉由兩波廣告活動證實,運用TVBS受眾包進行「導流」,成效表現可成長二至三成;如果運用TVBS受眾包進行「轉換」,則幫助轉換效率提升二成左右。

郭瀧億再次強調,TVBS數據池的關鍵優勢,不只能觀測流量,更透過線上問卷等多元互動機制,邀請使用者主動分享需求與偏好,累積所謂的「0 方數據(Zero-Party Data)」。這類由消費者主動告知的「真實」數據,一來可讓 TVBS 更理解消費者在美妝保養、醫療保健、交通工具等特定產業的真實偏好與未來採購計畫,二來協助 TVBS 建立領先市場的預判能力,可以在消費者做出決策之前,協助品牌提前佈署關鍵接觸點,再結合發票數據去驗證轉換成果,使品牌能夠真正做到在對的時間、對的 IP,與對的人溝通。

在 AI 重塑內容與行銷邏輯的浪潮下,TVBS 正加速朝向「生態系聯盟變現」的商業模式發展。未來,TVBS 不只扮演內容傳遞者的角色,更進化為「一站式解決方案」的 MaaS (Media as a Service)平台。透過 IP 串接背後的垂直產業生態,讓消費者在獲取資訊的當下,即可在平台內做好決策,或直接找到並購買合適的解決方案,無須在不同平台間來回跳轉。同時,也讓品牌能在同一平台上完成溝通、轉換與數據回饋,建立一個彼此共生共榮的獲利模式。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
AI全球100+台灣20
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓