人類推理能力不比上AI?美國西北大學研發的新系統在智力測驗中超越75%民眾
人類推理能力不比上AI?美國西北大學研發的新系統在智力測驗中超越75%民眾

本文轉載自雷鋒網,原文〈美國西北大學新系統在智力測試中超越75%民眾,人類的推理能力也不及AI了?〉,文章轉載已獲授權。

你聽過瑞文氏標準推理測試(Raven’s Progressive MatriCES)嗎?上面這張圖就是一道標準的瑞文氏測試題目,是不是很眼熟?在公務員考試、一般的智力測試中我們經常看到它。

那麼問題來了,你知道圖中這道題的答案嗎?如果不知道,也用不著沮喪,因為有75%的美國人大概也不知道。但壞消息是:電腦可能知道。

近日,美國西北大學的科研團隊研發了一個全新的運算模型,在瑞文氏標準推理測試中達到或超越了75%美國普通大眾的表現。被媒體譽為人工智慧史上的又一里程碑。

要知道,根據2016年的數據顯示,一般18歲成年人的平均智商為97,6歲兒童的平均智商為55.5,相比之下Google人工智慧系統的智商則為47.3,微軟小冰是24.5。人工智慧的智商還不及6歲兒童的平均水平。

團隊負責人,來自西北大學McCormick工程學院的Ken Forbus教授對此表示:「模型在智力測試中的表現優於75%的美國大眾,這意味著人工智慧的邏輯推理能力已經高於人類的平均水平,起碼在測試題中如此。另外,由於對人來說很難的題目對模型來說通常也很難,這表示該模型已經可以表現出一些人類認知系統中特有的重要屬性。」

實力這麼強,這個模型到底是如何工作的呢?

據悉,該模型建立在一個名為CogSketch的「草圖」(sketch)理解系統之上,該系統同樣是Ken Forbus團隊的研究成果。這裡「草圖」是指人們在思考問題或表達觀點時自然而然在紙上畫下來的說明性圖樣,特別是面對有關空間理解和地理學的相關問題時,尤其必要。 CogSketch系統可以基於草圖進行空間建模和邏輯推理,再配合此次最新研發的運算模型,因而能夠在瑞文氏標準推理測試中脫穎而出。

Ken Forbus.jpg
Ken Forbus教授。
圖/ 雷鋒網

Ken Forbus教授認為類比推理是解決視覺問題的核心,團隊正是在這一核心思想的指導下研發了最新的計算模型。所謂類比推理即結構映射的過程,是在不同對象之間透過逐個匹配,尋找它們在結構上的相似點,從而透過圖式歸納(即關係結構表徵)把原問題中元素之間的關係要素提取出來,用於靶問題的解決。也就是說,先要形成基於源問題的圖式歸納,再基於源問題和靶問題之間的結構映射將圖式歸納應用到靶問題的解決。在新的計算模型中,團隊成員利用了結構映射理論來對比不同的圖像,透過標記兩張圖像中發現的相同結構,識別出其中的相同點和不同點。值得一提的是,結構映射是由心理學家Dedre Gentner於1983年提出的一個理論,他也是西北大學的教授。

針對西北大學的這項研究,雷鋒網隨機採訪了兩位相關專業的在讀研究生,他們表達了自己的看法。

鐘超傑是來自北京林業大學的碩士在讀生,曾參與車載攝像頭的行人檢測項目。他認為,雖然模型的智力測試成績超過了75%的人類,但這並不能說明計算機的智力真的就超過了人類。因為除了推理之外,智力的含義應該更複雜,比如還包括學習能力、數學計算能力等。而且他覺得如果模型建的好,經過一定數據量的訓練,計算機處理這類問題的能力一般是可以超過人類的,但超出這類問題的範疇應該就不行了。

周志敏是來自浙江大學的研二在讀生,了解機器學習領域的各種算法,包括svm、神經網絡等。他認為這是人工智慧針對特定任務的又一項成功應用,跟人類的類比、推理能力並不一樣。西北大學的模型之所以表現出超過75%普通民眾的推理能力,是因為它經過了大量的類似數據的訓練,如果讓它做圖形之外的工作應該就不行了。

當前,人工智慧係統對圖像和語音的識別能力已經相當出色,但對於語義和圖像含義的理解、推理能力仍有待提高。西北大學的團隊表示,在許多場景中除了對源數據進行識別之外,對其含義的推理和解釋也至關重要,這也是他們研發全新的計算模型並對其展開瑞文氏標準推理測試的原因。他們希望這項研究成果可以為計算機視覺領域今後的發展提供一些技術參考。

(公眾號:雷鋒網)

PS. 你覺得文章開頭的那道測試題應該選哪個?不妨留言告訴我們吧!

來源:tomshardware,雷鋒網編譯

雷鋒網版權文章,未經授權禁止轉載。詳情見轉載須知

關鍵字: #人工智慧
往下滑看下一篇文章
代理式商務來襲:萬事達卡與NCCC攜手產業打造信任新基礎
代理式商務來襲:萬事達卡與NCCC攜手產業打造信任新基礎

隨著代理式 AI(AI Agent)的快速普及,其在商務交易中的應用也從智慧搜尋、商品比價一路延伸至自主下單,逐步形塑出全新的代理式商務(Agentic Commerce)模式。為因應此一趨勢,萬事達卡攜手聯合信用卡處理中心(NCCC)於 15 日舉辦「 AI 時代支付安全與數據信任高峰會」,匯聚產官學界專家共同交流,深入探討代理式商務下的支付授權與驗證機制,以及 AI 時代金融監理的演進與詐欺防治重點。

萬事達卡台灣區董事總經理陳懿文表示,無論交易是由人或代理式 AI 發起,都應該在安全可信的環境中完成,萬事達卡將持續強化支付安全的把關能力,不僅著眼於風險控管,更期望將「信任」轉化為未來創新的基礎與成長動能。聯合信用卡處理中心董事長桂先農則認為,面對 AI 浪潮,支付安全已不再只是技術問題,更要在消費體驗、數據運用與隱私保護之間取得動態平衡。金融監督管理委員會主任委員彭金隆表示,金管會未來將持續秉持安全與發展並進的原則,致力於打造可信賴、穩健且具有包容性的環境,加速金融 AI 應用的發展。

Mastercard-02.jpg
金融監督管理委員會主任委員彭金隆特別出席,表示金管會核心理念為「負責任創新」,並於2025 年成立『金融科技產業聯盟』,期待結合金融周邊單位與金融機構的力量,打造可信任及穩健的AI 金融應用環境。
圖/ 數位時代
Mastercard-03.jpg
萬事達卡台灣區董事總經理陳懿文(左)攜手聯合信用卡處理中心董事長桂先農(右)致詞不約而同提到:面對 AI 浪潮,支付安全將會是如何在消費體驗、數據運用與隱私保護之間取得動態平衡的治理課題。
圖/ 數位時代

AI Agent 重新定義消費旅程,萬事達卡提 4 大要素保障支付安全

Google Cloud 台灣技術總經理林書平認為,代理式商務正在重新定義消費旅程,而 Universal Commerce Protocol(UCP)則是支撐這場變革的關鍵。他表示,UCP 就好像電商界的 Type-C 接口,可以串聯不同代理式 AI 與電商平台後台系統,讓代理式 AI 可以根據消費者需求,自主完成商品搜尋與推薦、比價到下單的交易流程,打造更即時、更個人化的消費體驗。

在此情況下,支付不再只是交易流程中的最後一步,而是串聯個人化服務、授權機制、風險控管與信任的核心環節。萬事達卡數據與顧問服務部資深副總裁戴輝瑾指出,要確保代理式商務下的交易安全,必須具備 4 個關鍵要素,包括可驗證代理式 AI 身份、明確的使用者授權、確保代理式 AI 執行的任務沒有超出授權範圍,以及在發生爭議時,能透過公開透明且可追溯的機制進行處理,確保各方權益。

此外,他也強調,風險管理不應侷限於付款當下,需從交易前、交易中、交易後到持續性的監控,建立端到端的治理架構。為此,萬事達卡推出多元解決方案強化整體防護能力,包括以 Identity Solution 強化數位身分驗證、以 Decision Intelligence Pro 提升即時風險判斷能力、透過 Ethoca 優化爭議處理流程,以及藉由 Recorded Future 提供即時網路威脅情報,全面覆蓋交易生命週期,打造更完整的支付安全生態系。

AI 監理邁入新階段,以信任為核心的監管新框架

從監理角度來看,AI 所帶來的變革也同步改寫治理思維。金管會銀行局局長童政彰指出,監理機關不僅要加強國際合作,更應深化與金融業及科技業的對話,建立更開放且具前瞻性的監理模式。進一步針對代理式商務來看,政大金融AI創新中心主任王儷玲認為,金融監理重心應由模型與資料管理,轉向代理式 AI 安全,尤其當 AI 可以代理消費者進行支付時,如何確保代理式 AI 在授權範圍內執行交易,將成為未來的監理重點。

在國際監理趨勢方面,萬事達卡數據與顧問服務部副總裁 Audrey Wong 分析亞太與全球支付生態並指出,AI 時代的監管核心已轉向「以信任為基礎」,金融業在應用 AI 時,必須具備可解釋性、可問責性與可稽核性,確保決策透明且可追溯。同時,隨著詐騙與洗錢行為跨境化,監理機制也應向外延伸,確保跨境一致性,並透過如 ISO 20022 等標準強化資料透明與治理能力。

回到金融機構實務面,國泰世華銀行數據長梁明喬表示,代理式 AI 將對既有支付與風控機制帶來結構性改變,以信用卡支付為例,過往的驗證重點在於是否為本人,但在代理式 AI 情境下,則轉變為驗證 AI 的身份、授權來源與行為意圖。未來,隨著代理式 AI 的普及發展,授權與權限管理將變得更加重要。

Mastercard-04.jpg
關鍵對談以「AI 時代的資安監管趨勢與企業應對策略 」為題,左起邀請:數位時代總編輯 王志仁主持及重磅與談人國立政治大學金融 AI 創新中心主任 王儷玲、國泰世華銀行數據長 梁明喬及萬事達卡數據與顧問服務部副總裁 Audrey Wong與會。
圖/ 數位時代

AI 詐騙升級,聯防機制成新關鍵

最後,本場研討會亦聚焦討論 AI 造成詐欺風險升級的議題。台灣大哥大資訊長蔡祈岩觀察,詐騙已從單一管道演變為跨平台、跨場景的複合型攻擊,尤其是假冒「代理式 AI 」的詐騙手法,透過對話引導消費者提供個資與支付資訊,正成為新興且高風險的威脅來源。

萬事達卡 Franchise Innovation 副總裁Dennis Koh 進一步歸納出 3 大詐欺發展趨勢。第一,Deepfake 服務化使詐騙門檻與成本大幅降低。第二,詐欺行為跨境化與遠端化,已經突破地理限制、走向全球攻擊。第三,社交工程從大量投放釣魚信件,轉為高度個人化、難以辨識的精準攻擊。

面對詐欺手法持續演進,聯合信用卡處理中心風險管理部資深協理李錦堯表示,聯卡中心正透過區塊鏈與FIDO生物識別技術,打造無密碼的數位身分認證系統,並結合AI數據模型提升TRACE風險預警系統的效能。未來,聯卡中心將持續優化模型,並建立跨機構資料共享的聯防機制,整合發卡機構與國際組織資源,以提升整體防詐能力,對抗日益複雜的詐欺攻擊。

代理式商務將為消費者帶來更好的消費與支付體驗,但同時也對安全、治理與信任造成更大的影響,促使產業必須從單點防護走向跨機構、跨生態系的整體治理思維。在此趨勢下,萬事達卡將持續扮演關鍵推動者角色,攜手監理機關與產業夥伴,強化支付安全標準,推動台灣支付產業的監管框架與創新發展,打造兼顧效率與信任的數位商務環境。

Mastercard-05.jpg
回應AI 代理經濟下的詐欺防制與個資挑戰,本論壇特別邀請台灣大哥大資訊長 蔡祈岩、聯合信用卡處理中心風險管理部資深協理 李錦堯、萬事達卡Franchise Innovation副總裁 Dennis Koh交流趨勢觀點。
圖/ 數位時代

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
AI全球100+台灣20
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓