超越人類閱讀能力,阿里巴巴、微軟AI創紀錄,搶攻客服導覽工作
超越人類閱讀能力,阿里巴巴、微軟AI創紀錄,搶攻客服導覽工作
2018.01.16 | 微軟

「這是機器第一次在測試中超越人類。」人工智慧(AI)不僅擊敗圍棋世界冠軍李世乭,如今又在「閱讀理解」項目攻下一城。

阿里巴巴與微軟的AI機器學習模型,參與被認為最具權威性的史丹佛大學閱讀理解測驗,在分析500多篇維基百科文章、通過題目庫10萬條問題的隨機測驗後,最後出爐的成績都紛紛超越人類過去的紀錄。

阿里巴巴AI閱讀能力首度超越人類

由史丹佛大學研究人員所開發的史丹佛大學閱讀理解測試(Stanford Question Answering Dataset,簡稱SQuAD),被業界認為是最具權威與公信力的機器閱讀理解測驗,包括Google、IBM、Facebook、卡內基美隆大學等企業機構都曾參與。

人類過去在SQuAD測驗拿下最高的成績是82.304分,這次中國阿里巴巴所開發的人工智慧(AI)機器學習模型,在回答完一份由10萬條題目所組成的題目庫問題後,以82.44分的分數首度超越人類,接著微軟在相同的測驗中以82.650分同樣超越人類記錄。

Alibaba
阿里巴巴所開發的人工智慧(AI)機器學習模型,在閱讀理解測試中,以82.44分的分數首度超越人類,微軟也在相同的測驗中以82.650分超越人類表現。
圖/ shutterstock

消化大量資訊、模擬人類閱讀理解行為

SQuAD比賽由一個10萬條問題組成的機器閱讀理解題目庫組成,這些題目以500篇維基百科文章為基礎,主要用來測試機器是否能透過自然語言處理模仿人類對單字、句子的理解,在消化大量資訊後,精準地回答出問題。

AI在閱讀完題目庫中的一篇短文後,需要回答關於文章的幾個問題。例如,讓AI閱讀影集《異世奇人》資料,然後問「博士的飛船叫什麼名字?」;或是閱讀成吉思汗的歷史後,問「成吉思汗是哪年去世的?」

阿里巴巴研究團隊提出的「基於分層融合注意力機制」的深度神經網絡模型,是這項技術的重大突破,這款模型可以模擬人類在閱讀理解時的行為,包括串聯不同篇章的內容、帶著問題反覆閱讀文章、在閱讀時標註避免遺忘資訊等。

客服、導覽都派得上用場

阿里巴巴自然語言處理首席科學家司羅(Si Luo)表示,目前AI只能回答有明確答案的問題,如果問題表達的方式太模糊不清、不合語法、沒有預先準備好資料,AI有可能無法正常運作。

不過測驗結果還是相當振奮人心,「2018年有了一個強勁的開始。」SQuAD負責人Pranav Rajpurkar興奮地在Twitter上這麼寫下。

Museum tour
AI閱讀理解的精進,未來可以應用在客服、美術館導覽,甚至是回答病患的醫療問題。
圖/ shutterstock

透過AI閱讀理解的精進,未來將可以幫助人類處理大量資料、更加準確回答問題,「像是『為什麼會下雨?』這類客觀的問題就可以透過機器高度精準的回答。」首席科學家司羅(Si Luo)說:「這項科技可以應用在客服、美術館導覽,甚至是回答病患的醫療問題。」

成為第一家在閱讀理解測驗分數超越人類的科技公司,阿里巴巴近年加入騰訊、百度等公司的行列,積極在AI領域求突破,希望能借助AI發展社群媒體、廣告以及自動駕駛技術,中國也喊出要在2030年成為AI領域的領頭羊。

關鍵字: #人工智慧
往下滑看下一篇文章
2025年總統科學獎〉跨界40年!梁賡義院士在產官學研間,搭建科技、人文間橋樑
2025年總統科學獎〉跨界40年!梁賡義院士在產官學研間,搭建科技、人文間橋樑

2025年總統科學獎得主梁賡義院士,即便同時擔任逢甲大學春雨講座教授、浩鼎生技董事長,還為了協助國立臺東大學設立護理系而大力奔走,三不五時要環島、全臺走透透,日子忙得不得了,但他始終精神抖擻、滿懷熱情,只因他做的,是有益臺灣、社會發展的事。

事實上,梁院士從數學跨足生物統計,再投身高等教育與國家衛生,不僅以「廣義估計方程式」(Generalized Estimating Equations,GEE)改寫了縱貫式數據分析的規則,更以獨到的人文關懷,影響無數學子與政策制定。

從小,梁院士就喜歡數學的嚴謹與邏輯,1973年,他自國立清華大學數學系畢業後,便赴美深造,並在美國南卡羅萊納大學取得統計所碩士;接著,他又轉往美國華盛頓大學,攻讀生物統計博士學位。

從數學到生物統計,帶出數據背後的人性關懷

在研讀博士期間,他接觸到了當時炙手可熱的「存活分析」,意識到生物統計能直接幫助科學家、臨床醫師回答有意義的科學問題,對人類健康產生間接但深遠的助益,就此便踏上生物統計的「不歸路」。

教學界的老友們來到頒獎典禮,為梁院士祝賀殊榮。
教學界的老友們來到頒獎典禮,為梁院士祝賀殊榮。
圖/ 數位時代

1986年,已在美國約翰霍普金斯大學(Johns Hopkins University)任教職的他,與同事Scott Zeger研發出新的統計方法「廣義估計方程式」。梁院士解釋,不論是實驗室、世代流行病學或臨床試驗,只要是縱貫式硏究(longitudinal study),產學研界都會用到GEE,進行統計分析。尤其在國際大藥廠最常用的「前後測臨床試驗」(pre-post design for clinical trial designs)中,GEE讓全球臨床醫師能準確評估癌症、心臟血管和糖尿病等新藥的療效,進而獲得各國食藥署通過,造福千萬病患。GEE發表至今,已被引用逾22,000次,並納入R、STATA、SAS、SPSS等主要統計軟體中。

雖然在約翰霍普金斯大學任教長達28年,梁院士卻幾乎年年暑假,都返國舉辦研討會,分享國際生物統計和流行病學的新知。也因為始終心繫臺灣,讓梁院士在2010年,毅然辭去在美教職,回臺擔任國立陽明大學校長。

一方面,梁院士成功為學校爭取5年500億的計畫經費,成立腦科學中心、腫瘤免疫中心和高齡健康研究中心,將陽明大學打造成研究型大學,並在國際間嶄露頭角。另一方面,為了培育年輕人才,他選擇停下個人研究,建立起由資深教師帶領年輕教師的「師徒制」,鼓勵經驗傳承,「組織要永續發展,有賴於年輕人才的成長。」像是他自己儘管平常公務繁忙,仍活躍於社群,默默留心學生的大小事;他並邀請學生前往校長宿舍,定期舉辦「與校長有約」活動,這讓學生與他之間「零距離」,大至職涯規劃、小至生活瑣事,都樂於與他分享。

最重要的是,梁院士相當看重全人教育,因此廣泛開設人文講座、藝術文化等通識課程,尤其陽明大學以醫科見長,「所謂視病如親,醫護人員在專業之外,更需要具備人文素養,才能真正關懷病患。」

梁院士於頒獎典禮現場發表感言。
梁院士於頒獎典禮現場發表感言。
圖/ 數位時代

2017年,梁院士接下國家衛生研究院院長一職。這時,他又迅速轉換角色,每週檢視國際文獻、提供數十件政策建言,充分發揮國衛院的智庫功能。新冠肺炎爆發期間,他再度臨危受命,擔任中央流行疫情指揮中心研發組組長,帶領國衛院在15天內,完成公克級瑞德西韋合成,並與阿斯特捷利康(AstraZeneca)簽約,預採購1千萬劑疫苗,達成防疫、安定民心的任務。

不斷跨界,帶著使命感堅定前行

一輩子都在「跨領域」的梁院士,堅信創新不僅來自技術,也來自跨域合作帶來的新思維。他在美國求學、教書時,不是發表完論文就沒事了,他還持續思考,自己的研究能如何被用在臨床,因此他積極參與思覺失調症、強迫症研究等多項計畫,與基因學家、精神科和流行病學醫師腦力激盪、挑戰彼此。但梁院士特別提醒莘莘學子們,「跨領域」固然重要,大學時期仍應先在一個領域「站穩腳跟」,如此才能擁有與不同領域對話、欣賞的紮實基礎。

在產官學界耕耘逾40年,梁院士絲毫未停下前進的腳步。如今,他仍在杏壇作育英才,也深入業界,期望將研究成果更直接應用在藥物,以造福病患,「這是我一直鼓勵學生進入藥廠的原因!因為他們對人類的貢獻,可能比發表文章更直接。」近來,他心心念念的最大任務,是以自身人脈連結資源,為臺東大學爭取設立護理系,填補偏鄉地區的醫護缺口。

賴總統親自頒發「2025年總統科學獎」殊榮予梁院士。
賴總統親自頒發「2025年總統科學獎」殊榮予梁院士。
圖/ 數位時代

每一個統計數字背後,都承載著真實的生命重量;每一次跨領域的嘗試,都可能為人類帶來新的希望曙光。梁院士在統計學的精準座標中,繪製出一幅幅影響深遠的生命藍圖,持續為臺灣乃至全球的健康與福祉努力。

梁賡義 院士
專長:生物統計、流行病學
現職:逢甲大學春雨講座教授
成就:研發「廣義估計方程式」,讓全球臨床醫師得以正確評估許多如癌症、心臟血管及糖尿病等新藥的療效,造福嘉惠全球數以千萬計的病患;橫跨產官學界,為臺灣貢獻所長

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓