超越人類閱讀能力,阿里巴巴、微軟AI創紀錄,搶攻客服導覽工作
超越人類閱讀能力,阿里巴巴、微軟AI創紀錄,搶攻客服導覽工作
2018.01.16 | 微軟

「這是機器第一次在測試中超越人類。」人工智慧(AI)不僅擊敗圍棋世界冠軍李世乭,如今又在「閱讀理解」項目攻下一城。

阿里巴巴與微軟的AI機器學習模型,參與被認為最具權威性的史丹佛大學閱讀理解測驗,在分析500多篇維基百科文章、通過題目庫10萬條問題的隨機測驗後,最後出爐的成績都紛紛超越人類過去的紀錄。

阿里巴巴AI閱讀能力首度超越人類

由史丹佛大學研究人員所開發的史丹佛大學閱讀理解測試(Stanford Question Answering Dataset,簡稱SQuAD),被業界認為是最具權威與公信力的機器閱讀理解測驗,包括Google、IBM、Facebook、卡內基美隆大學等企業機構都曾參與。

人類過去在SQuAD測驗拿下最高的成績是82.304分,這次中國阿里巴巴所開發的人工智慧(AI)機器學習模型,在回答完一份由10萬條題目所組成的題目庫問題後,以82.44分的分數首度超越人類,接著微軟在相同的測驗中以82.650分同樣超越人類記錄。

Alibaba
阿里巴巴所開發的人工智慧(AI)機器學習模型,在閱讀理解測試中,以82.44分的分數首度超越人類,微軟也在相同的測驗中以82.650分超越人類表現。
圖/ shutterstock

消化大量資訊、模擬人類閱讀理解行為

SQuAD比賽由一個10萬條問題組成的機器閱讀理解題目庫組成,這些題目以500篇維基百科文章為基礎,主要用來測試機器是否能透過自然語言處理模仿人類對單字、句子的理解,在消化大量資訊後,精準地回答出問題。

AI在閱讀完題目庫中的一篇短文後,需要回答關於文章的幾個問題。例如,讓AI閱讀影集《異世奇人》資料,然後問「博士的飛船叫什麼名字?」;或是閱讀成吉思汗的歷史後,問「成吉思汗是哪年去世的?」

阿里巴巴研究團隊提出的「基於分層融合注意力機制」的深度神經網絡模型,是這項技術的重大突破,這款模型可以模擬人類在閱讀理解時的行為,包括串聯不同篇章的內容、帶著問題反覆閱讀文章、在閱讀時標註避免遺忘資訊等。

客服、導覽都派得上用場

阿里巴巴自然語言處理首席科學家司羅(Si Luo)表示,目前AI只能回答有明確答案的問題,如果問題表達的方式太模糊不清、不合語法、沒有預先準備好資料,AI有可能無法正常運作。

不過測驗結果還是相當振奮人心,「2018年有了一個強勁的開始。」SQuAD負責人Pranav Rajpurkar興奮地在Twitter上這麼寫下。

Museum tour
AI閱讀理解的精進,未來可以應用在客服、美術館導覽,甚至是回答病患的醫療問題。
圖/ shutterstock

透過AI閱讀理解的精進,未來將可以幫助人類處理大量資料、更加準確回答問題,「像是『為什麼會下雨?』這類客觀的問題就可以透過機器高度精準的回答。」首席科學家司羅(Si Luo)說:「這項科技可以應用在客服、美術館導覽,甚至是回答病患的醫療問題。」

成為第一家在閱讀理解測驗分數超越人類的科技公司,阿里巴巴近年加入騰訊、百度等公司的行列,積極在AI領域求突破,希望能借助AI發展社群媒體、廣告以及自動駕駛技術,中國也喊出要在2030年成為AI領域的領頭羊。

關鍵字: #人工智慧
往下滑看下一篇文章
AI 競爭全新戰場!美光 Mike Cordano:記憶體將成下一個企業戰略制高點
AI 競爭全新戰場!美光 Mike Cordano:記憶體將成下一個企業戰略制高點

從生成式AI訓練、推論,到代理式工作流程(Agentic Workflow)與未來的實體AI,資料流量正以指數級成長,讓記憶體從過去支援運算的配角躍升為決定AI效能與能源效率的關鍵角色。

全球知名的半導體與微電子技術分析機構TechInsights指出,AI競爭正逐漸從晶片算力擴展到記憶體架構設計能力,加速「Computational Memory」等新架構興起;在這波浪潮中,深耕記憶體與儲存技術數十年的美光科技,正與關鍵夥伴展開深度協同設計,包含攜手NVIDIA共同開發適用於新世代資料中心的低功耗記憶體技術,在AI基礎建設的新賽局中成為不可或缺的關鍵。

當GPU不再是唯一主角,記憶體為何躍上AI舞台中央?

過去,半導體的焦點多圍繞在晶片,例如CPU、GPU跟AI加速器等,市場普遍認為,晶片運算能力是左右科技產業發展速度的關鍵,但在進入生成式AI世代後,產業逐漸發現另一個事實:真正限制AI效能的瓶頸不是運算,而是資料能否快速被存取與傳輸。

從大型語言模型訓練,到AI推論、代理式工作流程(Agentic Workflow),甚至未來的機器人與自駕車,龐大的資料流量正持續推升對高頻寬、低延遲、高容量記憶體的需求,讓記憶體產業從過去相對標準化、以價格競爭為主的市場,逐漸轉變為AI基礎建設的重要核心。

「仔細觀察AI應用服務會發現,大多數工作負載都被頻寬限制。」美光科技全球業務執行副總裁Mike Cordano認為,記憶體是突破(頻寬)瓶頸的關鍵,也讓AI競賽從晶片算力升級到記憶體與儲存架構的系統級競爭。這樣的產業洞察,也正是Mike在歷經二十餘年的儲存產業資歷,加上四年半的創投生涯後,選擇加入美光的核心原因之一:在AI重塑產業結構的浪潮下,記憶體將成為這波成長最直接的動能所在。

美光 x 數位時代
美光科技全球業務執行副總裁 Mike Cordano
圖/ 數位時代

從零組件供應商到策略夥伴,記憶體共創時代來臨

AI的崛起,正在改變記憶體廠商與客戶的關係。

過去,記憶體產品多是標準化元件,客戶關注的是價格、供貨與規格;合作模式也偏向短期採購與交易導向。然而隨著AI系統規模愈來愈大,從資料中心、雲端平台到終端裝置,記憶體已經成為決定系統效能的重要關鍵,也因如此,越來越多企業將記憶體視為「策略性資產」,而非單純零組件。

Mike表示:「現在,我們跟客戶合作的時間跨度改變了,在產品正式上市前三到四年便開始合作,從系統架構階段就共同規劃未來需求。」例如,美光科技與NVIDIA共同研發的資料中心所使用的低功耗記憶體,便是雙方提前多年展開深度合作(co-design)的成果。

值得特別注意的是,美光科技除從技術層面與晶片製造商等夥伴共創產品,也在需求層面與客戶進行密切合作,例如,將過去較無約束力、期限僅一年的長期協議(LTA)轉變成為期五年、條款更具約束力的策略性客戶協議(SCA),藉此掌握客戶的未來需求,進而在技術層面做更深度的合作。Mike坦言,深度協同設計是高成本的投入,美光的做法是先廣泛進行市場感知,理解不同場域的需求方向,再與生態系統中的夥伴們展開客製化合作。

從裝置導向轉為Token導向,AI浪潮重寫記憶體成長模式

除了合作模式改變,更大的典範轉移是需求的改變。

Mike解釋,過去記憶體需求跟PC、手機跟伺服器出貨量息息相關,但在AI新世代,推動記憶體需求成長的核心不再是設備數量,而是AI模型所產生的運算與資料消耗量。「AI產業逐漸走向以『Consumption』或『Token』為主的新經濟模式,每一次的模型運算都需要消耗大量的記憶體跟儲存資源,這意味著,即使設備銷量成長趨緩,記憶體需求仍可能持續上升。」

更重要的是,AI應用正從資料中心外擴至手機、PC、自駕車與機器人等場域,儘管不同場域對記憶體的需求不盡相同,但是,Mike認為:所有AI裝置都存在三項共同需求:更快的速度、更大的容量,以及更高的能源效率。

正如Mike在受訪時提到的:「我們最大的挑戰,是如何與客戶和整個生態系保持高度一致,一方面創造供給與產能,另一方面持續推動技術創新。」可以預期,在接下來的五年,記憶體產業面臨的挑戰不僅僅是擴展產能,而是如何與客戶共同規劃需求、同步投入技術創新,而這也是美光科技積極經營AI生態體系的原因。

總的來說,AI帶來的改變,不只是算力提升,而是重新定義整個運算架構:過去,記憶體被視為支援運算的基礎元件;現在,則是決定AI效能、能源效率與創新速度的關鍵資源;當產業競爭從晶片性能延伸到資料流動效率,從裝置數量轉向Token消耗量,記憶體的重要性也將隨之水漲船高,對美光科技來說,這將是其從供應商走向AI生態系核心夥伴的關鍵角色轉變。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
代理式商務連動百兆商機
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓