AI變學霸？國二科學測驗已難不倒它，答對9成考題|數位時代 BusinessNext

AI變學霸？國二科學測驗已難不倒它，答對9成考題

如何正確理解題意，一直是AI答題的一大困難，現在由微軟創辦人成立的AI研究機構成功邁出一大步，讓AI在美國8年級、12年級的測驗中獲得好成績。

4年前，由微軟共同創辦人保羅．艾倫（Paul Allen）設立的艾倫人工智慧研究所舉辦的一場賽事中，超過700位電腦學者競相開發能通過美國8年級科學考卷的人工智慧，勝者將能獲得8萬美元獎金，然而最終無一達成目標。

擁有常人所不能的知識量，過目不忘的AI，竟會被區區國、高中等級的考卷給難倒，或許很難讓人想像。但事實上證明，當時最先進、複雜的AI系統，連取得60分都有困難。因為不管學識含量再豐富，看不懂題目就一點意義也沒有了。

不過，最近的AI研究終於攻克阻礙，艾倫人工智慧研究所新推出的AI系統「Aristo」成功跨越了這道門檻。且絕不是低空飛過，AI在美國8年級科學測驗中答對9成題目；12年級科學測驗中，也有8成的答題正確率。

雖然這有一些「前提條件」──礙於目前AI系統的能力，研究人員刪除了與圖表、圖片有關的題目，因為這需要更高一層將語言理解、邏輯與電腦視覺結合的能力。

儘管如此，Aristo依舊深刻展現了人工智慧技術在理解語言脈絡、模擬人類決策邏輯上的重大進展。

打造「數位版亞里斯多德」，科學家讓AI寫考卷進步

早從2013年起，艾倫人工智慧研究所便著手開發Aristo，他們希望能打造出一個「數位版的亞里斯多德」，研究人員認為，比起傳統讓AI下棋的作法，給它們寫科學考卷更具訓練意義。

研究人員指出，對考題的理解並非依靠學習規則（learning rules）就能掌握的，需要AI運用邏輯連結不同事物之間的關聯性，好比說若森林大火增加，就可能造成果實、昆蟲的數量銳減，進而導致松鼠死亡。

Aristo的基礎源自一套由Google建立，名為Bert的自然語言處理模型。在徹底研讀維基百科數千篇條目，以及大量浪漫小說、科幻小說與自行出版書籍後，Bert開始學會如何推測句子中闕漏的字詞。

藉由這項訓練，Bert學會了語言的基本建構方式，而研究人員則給予Bert更廣泛的問題與答案，漸漸地，它也學習到如何解答類似的問題。

雖然Aristo距離學者的終極目標：模擬人類智慧，還有一大段距離，目前展現的研究成果，已經足以開創商業應用上的潛力。研究所負責人奧倫．埃齊奧尼（Oren Etzioni）對此頗具信心，「我能說的是，你將見識新世代產品的誕生，部分源自新創，另一部分則源自大企業。」

這些自然語言處理模型，如今已成為許多研究項目的核心，例如用於識別假新聞的工具，以及聊天機器人使用的對話系統。水能載舟，亦能覆舟，也有人擔心，有辦法熟稔運用語言的AI，反倒可能助長假新聞散播。

無論如何，這項技術的潛力太過龐大，沒有人敢為其未來做出定論。另一間AI研究室Fast.ai研究人員傑瑞米．霍華德（Jeremy Howard）就表示，目前仍處於技術的早期階段，還未探索到其真正的潛力，這項技術最終將抵達何方，可能還沒有人知道。

在美國以外，世界各地也有不少科學家將AI研究的目光，放在做考卷身上。過去日本國立情報學研究所曾開發出AI機器人「東Robo君」，並以達到東大的入學標準為目標。

不過在東Robo君連續4年落榜後，該機構最終於2016年中止了這個計畫，坦承AI的理解能力有限，只要遇到必須深入理解的問題，便立刻踢到鐵板，成績原地踏步的情況下，決定重新將重心移到提升AI的理解力上。

2017年時，中國也曾進行了一場AI與「學霸」們的高考數學比試，最終AI獲得134分，以1分之差惜敗精英學生組的成績平均，但仍向外界揭露AI在做考卷這檔事上，已經越來越上手。

責任編輯：林美欣