叫陣輝達!微軟推出自研AI晶片Maia 200:效能比同價位多30%,有望搶回雲端算力主導權?
叫陣輝達!微軟推出自研AI晶片Maia 200:效能比同價位多30%,有望搶回雲端算力主導權?

重點一 :微軟推出第二代自研 AI 晶片 Maia 200,號稱在同價位下效能較競品高 30%。

重點二 :Maia 200 優先部署美國資料中心,支援 Microsoft 365 Copilot 與內部 superintelligence 團隊。

重點三 :微軟以高頻寬記憶體與大規模串接設計,主打能效與總持有成本優勢,正面對決輝達與其他雲端對手。

微軟 (Microsoft) 宣布推出第二代自研人工智慧晶片 Maia 200,正式將其自家 AI 基礎設施推向商用前線,直接對標市場主流的輝達 (NVIDIA) GPU 以及亞馬遜 (Amazon)、Google 等雲端業者的專用 AI 晶片。

微軟表示,在現有硬體同等支出下,Maia 200 的效能可較競品高出約 30%,並強調這是公司迄今部署過「效率最高的推論系統」。同時,新晶片已在美國部分資料中心導入,優先支援 Microsoft 365 Copilot、內部 superintelligence 團隊與 Microsoft Foundry 等關鍵 AI 工作負載,未來將逐步擴大對外供應。

Maia 200 算力規格比較
在同樣 3nm 世代的雲端自研 AI 晶片中,Maia 200 以壓倒性 FP4/FP8 算力、最大 HBM 容量與最高雙向互聯頻寬,主打「超大模型低精度推理效能與規模擴充都最強」。
圖/ 微軟

Maia 200的產品定位是?

從產品定位來看,Maia 200 比較像「雲端版的專用 AI 引擎」,而不是我們熟悉、什麼都能跑的通用 GPU。GPU 原本為繪圖設計,後來被廣泛用在訓練、推理、科學運算等各種工作負載,追求的是彈性與通用性; 而 Maia 200 則從一開始就鎖定在資料中心裡的大模型推理,把 FP4/FP8 低精度算力堆到極致,目標是用最低成本處理最多的 token。

若與 Google TPU 相比,兩者同屬雲端自研 AI ASIC,但 TPU 同時兼顧訓練與推理、偏向整體 AI 研發流程; Maia 200 則更聚焦在「模型上線之後」的大量推理場景 ,替 Azure 上的 GPT‑5.2、Copilot 等服務,在效能與雲端成本之間找到一個最好、也最符合微軟自身商業版圖的平衡點。

Google第七代TPU「Ironwood」
Google第七代TPU「Ironwood」,與Maia 200同為AI ASIC,同時兼顧訓練與推理。
圖/ Google

微軟自研 AI 晶片走向前台

微軟最早在 2023 年公開第一代自研 AI 晶片 Maia 100,但當時多半仍屬試驗性質,主要用於內部服務與展示用途,例如證明 GitHub Copilot 等應用可在 Maia 100 上順利運行,並未對雲端客戶全面開放租用。這一代的 Maia 200,則是首度明確被定位為「可望大規模對外提供」的自研 AI 晶片,顯示微軟在設計、製造與系統整合方面,已累積足以支撐商用部署的經驗。

據微軟雲端與 AI 業務執行副總裁 Scott Guthrie 在部落格的說法,Maia 200 將率先部署於美國中部 (U.S. Central) 資料中心區域,接著擴展至美國西部 3 區 (U.S. West 3),並依照市場需求與基礎設施規劃導入更多地區。這意味著,在 Azure 平台上,未來企業與開發者除了輝達加速卡、亞馬遜 Trainium 或 Google TPU 等既有選項外,將多出以微軟自研晶片為基礎的運算資源。

Guthrie 表示,Maia 200 是「微軟部署過最有效率的推論系統」。微軟同時開放開發者、學術研究者、AI 實驗室與開源模型貢獻者申請預覽版軟體開發套件 (SDK),讓生態系可以提早針對 Maia 平台優化與測試,為未來雲端正式商用鋪路。

Maia 200 已導入部分美國資料中心
微軟自研 Maia 200 機櫃與液冷散熱系統實景,可見高密度布線與垂直模組化設計,對應大規模 AI 推理叢集的供電與散熱需求。
圖/ 微軟

Maia 200 主打 30% 效能優勢

在技術面,微軟並未在原文中揭露完整細節,但指出 Maia 200 採用 3 奈米製程,並以四顆晶片為一組配置於單一伺服器中。這些晶片之間透過乙太網路 (Ethernet) 串接,而非輝達近年在高效能運算與 AI 集群中廣泛採用的 InfiniBand 標準。乙太網路雖然在延遲與頻寬上不一定勝過 InfiniBand,但在既有網路基礎設施、成本結構與標準化程度上具有優勢,有利於微軟在資料中心內以較低成本建構與擴充 AI 叢集。

微軟強調,Maia 200 在「同樣價格」下能提供約 30% 的效能提升,並以此作為其推論系統效率優勢的核心賣點。對雲端客戶而言,生成式 AI 模型的推論通常是長期且持續的成本來源,若在不提高支出的前提下取得更高效能,等同於每單位算力的電力成本與總持有成本 (Total Cost of Ownership, TCO) 同步下降。

此外,微軟指出,Maia 200 搭載的高頻寬記憶體 (HBM) 容量,優於亞馬遜雲端服務 (Amazon Web Services) 第三代 Trainium AI 晶片及 Google 第七代 Tensor Processing Unit (TPU)。在大型語言模型與多模態模型的推論情境中,HBM 的容量與頻寬往往是效能瓶頸之一,更大的記憶體空間可以減少模型切分與頻繁跨節點溝通的必要,進而降低延遲與額外的系統開銷。

6,144 顆晶片大規模串接,押注 AI 基礎設施主導權

在系統層級設計上,微軟宣稱最多可以將 6,144 顆 Maia 200 串接於同一集群內,形成大規模平行運算平台,以支撐愈來愈龐大的 AI 模型與工作負載。這種規模化的設計,搭配自家資料中心的電力與冷卻優化,意在進一步壓低整體成本,以提升在 AI 基礎設施軍備競賽中的競爭力。

應用面上,微軟表示,內部的 superintelligence 團隊將使用 Maia 200 作為核心算力基礎,用於開發更先進、更大型的 AI 模型;面向企業與商用市場,Maia 200 則會優先支援 Microsoft 365 Copilot 這類加值服務,以及協助客戶基於基礎模型打造專屬應用的 Microsoft Foundry 平台。

換言之,未來企業在使用 Copilot 或在 Azure 上建構 AI 代理與各式產品時,背後的算力愈來愈有可能來自「微軟自家晶片」,而不再完全仰賴第三方硬體供應商。

現階段,全球雲端服務商與資料中心營運業者面臨雙重壓力:一方面,Anthropic、OpenAI 等模型開發公司持續擴張模型規模與訓練與推論需求;另一方面,各產業企業也紛紛投入 AI 代理、客服機器人與智慧應用的開發。

在有限的電力與機房空間條件下,如何同時滿足算力需求與成本控管,成為戰略優先事項。因此微軟透過 Maia 200,試圖從「雲端平台 + 自研晶片」的角度出發,強化自家在 AI 基礎建設上的議價權。

延伸閱讀:微軟明明業績很好,為什麼裁員不手軟?一封給員工的信透露科技巨頭策略
AI淘汰了哪種企業?報告揭轉型血淚:企業為何陷入「為了AI而AI」5大致命盲點?

資料來源:微軟CNBC

本文初稿為AI編撰,整理.編輯/ 李先泰

關鍵字: #微軟 #Nvidia #GPU
往下滑看下一篇文章
以數位公共建設金流平台為橋樑,打造民眾、商家與銀行共贏生態圈
以數位公共建設金流平台為橋樑,打造民眾、商家與銀行共贏生態圈

在中央銀行與財金公司引領下,數位公共建設金流平台不僅整合「TWQR」,更連通銀行與民間電支機構,透過統一的QR碼「TWQR」,以「跨機構、一碼付」、「款券合用」、「跨境支付」以及即將上線的「多券合用」等功能,讓很多部會的券,甚至是金融機構發行的,都可以一起使用,逐步吸引民眾、商家與金融機構加入,民眾能即時使用、商家快速收款,銀行也能結合金融服務創新。隨著「TWQR」平台成熟,2026 年應用場景也從生活消費、公共繳費拓展至交通運輸等領域,形成涵蓋支付與生活服務的數位金融生態圈。

「數位公共建設金流平台」讓政府能運用既有的金融通路,完成艱鉅的數位政策推展,數位化取代紙本作業,不僅提升發放效率,更能大幅節省印製與回收的行政成本。對民眾而言,領取補助不再受時間與地點限制,免去紙本券排隊、保管不便的痛點,輕鬆取得「全時服務」,真正做到「數位領券免排隊、消費折抵更直覺」。為響應政府推動非現金支付的目標、打造更普惠的金融環境,玉山銀行率先將數位公共建設金流平台整合進玉山 Wallet App,於 2025 年 1 月推出「數位券」服務,同時,也領先同業推出「券+點+支付」整合付款功能,民眾可以在 App 內完成登記、領取與使用政府補助,並在 TWQR 與台灣 Pay 商店消費抵用,大幅簡化支付流程。

玉山銀行個人金融事業總處資深副總經理林榮華表示:「我們很重視客戶體驗,整合數位公共建設金流平台後,民眾不僅能透過玉山 Wallet App 領取各類政府補助券,例如客家幣,還能透過玉山電子支付與玉山 e point ,一鍵完成『券+點+支付』合併付款。」未來,玉山銀行也將與特約商店合作,透過「數位券」服務,發送更多數位優惠,讓商家能更容易推動數位行銷並提升支付體驗。

玉山銀行個人金融事業總處資深副總經理 林榮華
玉山銀行個人金融事業總處資深副總經理 林榮華
圖/ TWQR

以TWQR為核心,打造多方受益的數位金流生態圈

過去,面對不同政府機關發送的消費券或振興券,民眾常需要在不同平台登記、領取與使用,不僅流程繁瑣,商家核銷程序也相對複雜。為了解決這類問題,政府積極建構「數位公共建設金流平臺」,整合部會、地方政府與銀行,讓政策補助與振興措施更智慧,從三個面向共創生態系多贏:

提供民眾更便利的「全時服務」:民眾領取跟使用補助券不再受限於時間與地點,真正做到「想領就領、想花就花」。

玉山銀行信用卡暨支付金融處處長張正志進一步解釋,傳統的紙本券除了領取時間與地點受限,還有排隊等候、保管不易與使用不便等問題,即使金融機構推出數位券,民眾也面臨需要下載不同 App 才能使用的狀況。「整合數位公共建設金流平台後,民眾不需切換平台,即可在同一個 App 內完成電子支付、數位券與點數的整合付款。」

協助商家簡化核銷流程並增加客源。舉例來說,玉山銀行特約商家無需更改既有系統,也不用支付額外費用或重新簽約,可以原有收單系統完成收款與核銷,大幅降低導入門檻;此外,玉山銀行亦積極打造好玩、有趣、高互動性的數位券行銷活動,商戶可以透過參與這類活動提升曝光、接觸新客群,進而創造新的營收機會。

玉山分享不僅2月的「一馬當先好運金」活動帶動 10 倍流量,3月推出的「2026新年數位任務挑戰賽」等活動也吸引大量客戶參與,創造民眾、商家與玉山的共贏。對金融機構而言,則是擴大支付場景與深化客戶關係的關鍵平台。透過 TWQR 約 60 萬家商家通路,銀行等金融機構不僅能提升客戶使用頻率,也能逐步建立點數與支付整合的生態圈。

玉山銀行的作法是將數位公共建設金流平台與玉山 Wallet App 整合在一起,開通電子支付並綁定支付工具,藉此引導客戶多加使用玉山 Wallet App,以及透過 TWQR 通路優勢以及交通(乘車碼)跟生活繳費場景應用等方式提升客戶往來頻次與增加跨售機會。「根據我們的統計數據,玉山電子支付帶動玉山銀行開戶的數量,是其他錢包的 6 到 10 倍。」

民眾透過玉山Wallet掃描TWQR,即可在消費場景中使用一鍵完成「數位券+點數+支付」合併付款
民眾透過玉山Wallet掃描TWQR,即可在消費場景中使用一鍵完成「數位券+點數+支付」合併付款
圖/ TWQR

TWQR數位券再進化:從優惠工具、場景金融到實現精準行銷

對玉山銀行來說,整合數位公共建設金流平台不僅是優化民眾領取與使用消費券與振興券體驗的重要工具,更是實現多元場景金融、貫徹精準行銷的重要平台。舉例來說,相較於沒有精準分眾的活動,透過數據分析遴選出的玉山特選用戶領券繳費折抵的轉換率超過 8 成、重購率逾 7 成,成效十分亮眼。

張正志面帶微笑的說:「未來,我們將以系統平台為核心,由跨部門籌組的科技聯隊以數據分析跟 AI 持續優化行銷成效,打造差異化服務體驗。」例如,計畫推出行銷智能化服務:不用人工事先挑選名單,當客戶行為樣態觸發系統預判條件,AI Agent 便會智能發券,提供專屬禮遇。

總體來說,TWQR數位券讓支付更簡單、更智慧,也讓政策補助落地更快速,也為銀行與民間支付合作提供舞台。而玉山銀行除透過舉辦與TWQR相關活動引流、吸引客戶申請數位券服務,更透過平台將獎勵回饋發送到玉山 Wallet App,協助客戶開啟使用電子支付服務,使用後將再度獲得回饋進而養成使用習慣,爾後,以有趣且高互動的客戶經營方式,引導客戶從使用一個銀行服務擴展到使用多個服務,發揮獲客、活客、留客與悅客的正向循環,更好實現跨生態多贏。

#0 台灣Pay
玉山銀行個人金融事業總處資深副總經理 林榮華(右)、玉山銀行信用卡暨支付金融處處長 張正志(左)
圖/ TWQR
精華一次看>>數位時代 Youtube 頻道 Shorts

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
AI全球100+台灣20
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓