人類推理能力不比上AI?美國西北大學研發的新系統在智力測驗中超越75%民眾

2017.01.23 by
雷鋒網
人類推理能力不比上AI?美國西北大學研發的新系統在智力測驗中超越75%民眾
雷鋒網
近日,美國西北大學團隊研發了一個全新的運算模型,在瑞文氏標準推理測試中達到或超越了75%美國普通大眾的表現。

本文轉載自雷鋒網,原文〈美國西北大學新系統在智力測試中超越75%民眾,人類的推理能力也不及AI了?〉,文章轉載已獲授權。

你聽過瑞文氏標準推理測試(Raven’s Progressive MatriCES)嗎?上面這張圖就是一道標準的瑞文氏測試題目,是不是很眼熟?在公務員考試、一般的智力測試中我們經常看到它。

那麼問題來了,你知道圖中這道題的答案嗎?如果不知道,也用不著沮喪,因為有75%的美國人大概也不知道。但壞消息是:電腦可能知道。

近日,美國西北大學的科研團隊研發了一個全新的運算模型,在瑞文氏標準推理測試中達到或超越了75%美國普通大眾的表現。被媒體譽為人工智慧史上的又一里程碑。

要知道,根據2016年的數據顯示,一般18歲成年人的平均智商為97,6歲兒童的平均智商為55.5,相比之下Google人工智慧系統的智商則為47.3,微軟小冰是24.5。人工智慧的智商還不及6歲兒童的平均水平。

團隊負責人,來自西北大學McCormick工程學院的Ken Forbus教授對此表示:「模型在智力測試中的表現優於75%的美國大眾,這意味著人工智慧的邏輯推理能力已經高於人類的平均水平,起碼在測試題中如此。另外,由於對人來說很難的題目對模型來說通常也很難,這表示該模型已經可以表現出一些人類認知系統中特有的重要屬性。」

實力這麼強,這個模型到底是如何工作的呢?

據悉,該模型建立在一個名為CogSketch的「草圖」(sketch)理解系統之上,該系統同樣是Ken Forbus團隊的研究成果。這裡「草圖」是指人們在思考問題或表達觀點時自然而然在紙上畫下來的說明性圖樣,特別是面對有關空間理解和地理學的相關問題時,尤其必要。 CogSketch系統可以基於草圖進行空間建模和邏輯推理,再配合此次最新研發的運算模型,因而能夠在瑞文氏標準推理測試中脫穎而出。

Ken Forbus教授。
雷鋒網

Ken Forbus教授認為類比推理是解決視覺問題的核心,團隊正是在這一核心思想的指導下研發了最新的計算模型。所謂類比推理即結構映射的過程,是在不同對象之間透過逐個匹配,尋找它們在結構上的相似點,從而透過圖式歸納(即關係結構表徵)把原問題中元素之間的關係要素提取出來,用於靶問題的解決。也就是說,先要形成基於源問題的圖式歸納,再基於源問題和靶問題之間的結構映射將圖式歸納應用到靶問題的解決。在新的計算模型中,團隊成員利用了結構映射理論來對比不同的圖像,透過標記兩張圖像中發現的相同結構,識別出其中的相同點和不同點。值得一提的是,結構映射是由心理學家Dedre Gentner於1983年提出的一個理論,他也是西北大學的教授。

針對西北大學的這項研究,雷鋒網隨機採訪了兩位相關專業的在讀研究生,他們表達了自己的看法。

鐘超傑是來自北京林業大學的碩士在讀生,曾參與車載攝像頭的行人檢測項目。他認為,雖然模型的智力測試成績超過了75%的人類,但這並不能說明計算機的智力真的就超過了人類。因為除了推理之外,智力的含義應該更複雜,比如還包括學習能力、數學計算能力等。而且他覺得如果模型建的好,經過一定數據量的訓練,計算機處理這類問題的能力一般是可以超過人類的,但超出這類問題的範疇應該就不行了。

周志敏是來自浙江大學的研二在讀生,了解機器學習領域的各種算法,包括svm、神經網絡等。他認為這是人工智慧針對特定任務的又一項成功應用,跟人類的類比、推理能力並不一樣。西北大學的模型之所以表現出超過75%普通民眾的推理能力,是因為它經過了大量的類似數據的訓練,如果讓它做圖形之外的工作應該就不行了。

當前,人工智慧係統對圖像和語音的識別能力已經相當出色,但對於語義和圖像含義的理解、推理能力仍有待提高。西北大學的團隊表示,在許多場景中除了對源數據進行識別之外,對其含義的推理和解釋也至關重要,這也是他們研發全新的計算模型並對其展開瑞文氏標準推理測試的原因。他們希望這項研究成果可以為計算機視覺領域今後的發展提供一些技術參考。

(公眾號:雷鋒網)

PS. 你覺得文章開頭的那道測試題應該選哪個?不妨留言告訴我們吧!

來源:tomshardware,雷鋒網編譯

雷鋒網版權文章,未經授權禁止轉載。詳情見轉載須知

每日精選科技圈重要消息