超微MI325X對槓Blackwell!CPU、GPU都坐二望一,AMD如何超車輝達、英特爾?
超微MI325X對槓Blackwell!CPU、GPU都坐二望一,AMD如何超車輝達、英特爾?

IC設計大廠超微(AMD)於美國時間10月10日在舊金山舉辦「Advancing AI 2024」大會,執行長蘇姿丰發表資料中心AI加速器Instinct MI325X、第5代 EPYC處理器「Turin」、商務AI PC晶片「Ryzen AI PRO 300」系列等產品。

《數位時代》前進現場,帶給讀者第一手觀察。

在今年第2季,超微的資料中心營收繳出28.3億美元、年增115%的亮眼成績單,並在公司整體營收佔據逾過半,也讓執行長蘇姿丰於9月曾直言,超微已成為一家資料中心為主的公司。

超微在資料中心的產品線,包括Instinct系列的AI加速器(GPU)、EYPC系列處理器(CPU),這2個產品有哪些特色?對上競爭對手輝達、英特爾有何優勢?而在GPU、CPU市場都是老二的超微,有哪些突圍關鍵?

關鍵1:下一代MI350,有望力抗輝達Blackwell

Instinct MI300X AI加速器自2023年12月推出以來,不到2季的銷售額就超過10億美元,成為超微史上成長最快的產品。

在今年6月的台北國際電腦展(Computex)上,超微宣布了Al加速器的產品發展藍圖:2024~2026年每年將推出一款新品,分別為MI325X、MI350系列、MI400。MI325X將於本季量產出貨,下游伺服器台廠如技嘉、華擎、英業達、雲達、神達等,將於明年第1季開始供貨。

AMD Advancing AI 2024 Instinct timeline.jpg
超微Instinct AI加速器系列2023年至2026年產品路線圖
圖/ 孫嘉君攝影

MI325X以台積電4/5奈米製程生產,採CDNA 3架構,搭載256GB的HBM3E記憶體,記憶體頻寬達6TB/s,記憶體容量為輝達H200的約1.8倍、記憶體頻寬約為1.3倍,AI訓練性能最高達H200的1.1倍、推論效能則是1.4倍。

AMD Advancing AI 2024 Instinct vs H200.jpg
MI325X記憶體容量為輝達H200的約1.8倍、記憶體頻寬約為1.3倍,FP8及FP16數據格式的算力則是1.3倍。
圖/ 孫嘉君攝影

另一方面,超微也預告規劃2025年下半推出的MI350系列晶片,以台積電3奈米製程生產,採用CDNA 4架構,推論能力將達MI300X的35倍;且記憶體容量再升級,將搭載288GB的HBM3記憶體,比Blackwell B200的192GB多上50%。此外,在FP4數據格式的運算能力,MI355X算力為9.2 PFLOP,也較B200的9 PFLOP略勝一籌。

不過,目前佔據GPU 9成市佔的輝達,以高度軟硬體整合的CUDA架構作為護城河,讓開發人員不易轉換生態系統。而包括持續優化軟體開發平台ROCm,與先前接連買下Mipsology、Nod.ai、Silo AI等AI新創,皆是超微在軟體層面持續追趕的努力。

在7月發布的第2季財報中,蘇姿丰表示,看好客戶對AI晶片需求,預期2024年資料中心GPU營收,從4月預測的40億美元,上修至45億美元。

關鍵2:資料中心CPU市佔34%!Turin效能可達英特爾2.7倍

而在資料中心CPU領域,過去由英特爾佔了超過9成市佔,自從2017年超微以EPYC系列產品重返市場以來,超微在資料中心市佔率由最初的僅2%,到2024年上半年成長到約34%,創下歷史新高。

AMD Advancing AI 2024 EPYC timeline.jpg
超微EPYC處理器市佔由2017年的2%,至2024年上半年成長至34%
圖/ 孫嘉君攝影

先前在Computex曾預告的第5代EPYC處理器(代號Turin),也在10日舉行的Advancing AI大會發表進一步細節。

Turin處理器以台積電3/4奈米製程生產,採用「Zen 5」核心架構,提供8核心到192核心的廣泛核心數量,據稱最高階的192核心CPU,比英特爾第五代旗艦Xeon處理器效能提升2.7倍。其中顯著的加速效果,像是視訊轉碼速度加快4倍、高性能運算(HPC)應用程式運算速度提升3.9倍等。

超微執行長蘇姿丰在專題演說中,並提到企業用戶可無痛把舊伺服器,汰換為超微的方案,不只省電且能部署更多算力資源。例如,將1000台較舊的英特爾Xeon Platinum 8280 伺服器,換成131台Turin伺服器,得以降低功耗68%、減少87%的伺服器數量。而且所節省下的空間,還可用於提升資料中心的AI算力。

AMD Advancing AI 2024 EPYC server .jpg
將1000台較舊的英特爾Xeon Platinum 8280伺服器,換成131台Turin伺服器,得以降低功耗68%、減少87%的伺服器數量
圖/ 孫嘉君攝影

相對於英特爾旗艦產品最多為64個核心,Turin則最高可達192個的超多核心數。一名台系伺服器廠主管指出, 以超微和英特爾CPU的特色來比較,英特爾較著重於單個核心的高性能,超微則是單核心的性能較不突出、但擁有的核心數較多。

而就他觀察,目前大部分客戶的需求是「夠用就好」, 不過,漸漸來選擇超微的客戶,一方面認為在接近的功耗、效能及成本下,更多的核心數「CP值相對較高」;其中,尤其雲端服務商需要較多的核心數,因為核心越多、能夠提供服務的虛擬機較多,因此會有較大的需求。

延伸閱讀:超微新AI晶片來了,強勢對標輝達H200!現場直擊:蘇姿丰4大策略衝AI市佔

責任編輯:李先泰

往下滑看下一篇文章
從生成式AI到代理式AI,不可輕忽的五大關鍵趨勢與致勝訣竅
從生成式AI到代理式AI,不可輕忽的五大關鍵趨勢與致勝訣竅

代理式AI將驅動產業創新變革與升級,對此,研究機構Gartner預測,截至2028年底,33%的企業應用軟體將整合代理式AI功能,至少15%的日常工作決策將改由代理式AI負責,以及三分之一的生成式人工智慧互動將改由行動模型與自主代理完成,同時,加速協作型 AI Agent出現與普及。
面對勢不可擋的AI浪潮,Google Cloud搶先布局市場:不僅提供含括AI優化基礎架構、AI模型、可互通的AI代理等高度整合AI雲端技術堆疊,更攜手CloudMile萬里雲等夥伴協助不同產業客戶發揮代理式AI的綜效。

不可輕忽的五大AI趨勢

隨著雲端與人工智慧等創新科技成為企業創新變革的關鍵基石,想要極大化科技綜效、搶先布局未來,不可輕忽五大AI趨勢:

趨勢一:AI Agent蓬勃發展。

生成式AI已從單純的處理提示(Prompt)轉變成具備模組化、自主化與協作化能力的 AI Agent,Google Cloud 更透過年度旗艦活動介紹超過 600 個 AI Agent 與跨產業應用案例。

Google Cloud 台灣總經理陳愷新表示:「因應用途的不同,Google Cloud 推出客戶代理(Customer Agent)、員工代理(Employee Agent)、創意代理(Creative Agent)、資料代理(Data Agent)、程式碼代理(Code Agent)與資安防護代理(Security Agent)六大類 AI Agent,協助企業提升營運效率、員工生產力、資安防護,進而加速產業創新。」

萬里雲 x Google Cloud_Podcast
Google Cloud 台灣總經理 陳愷新
圖/ 數位時代

趨勢二:多模態AI應用普及。

企業開始透過多模態AI整合文字、圖像、音訊與影片等資訊,讓 AI可以模仿人類學習方式,以更精準且自然的方式輸出與互動。

趨勢三:AI驅動輔助搜尋崛起。

透過生成式AI賦能,企業搜尋模式可以跳脫關鍵字,改以多模態輸入與對話提示等方式互動,讓使用者可以快速找到所需資訊並因應權限優化知識搜尋成效。例如,玉山銀行整合 Gemini 模型與內部知識管理系統,短短 3 個月推出「金融業務聊天機器人(金秘書)」,大幅縮短分行人員解決複雜客戶問題的時間,以及減少內部教育訓練負擔。

CloudMile萬里雲創辦人暨董事長劉永信表示:「Enterprise Search 不僅能打破孤島、快速連結Google Workspace、BigQuery、Looker、SAP、Salesforce 等內部系統與資料來源,還可以進一步提高企業內部搜索相關知識的效率。」

趨勢四:AI 輔助顧客體驗優化。

透過AI驅動的全通路個人化行銷,以無縫消費體驗提升零售業營收、效率跟提升客戶忠誠度。例如,CloudMile 萬里雲整合最新 AI 人臉檢測、表情辨識技術、服裝顏色分析與圖像標籤,以及串連 Google Workspace 雲端應用,打造出獨一無二的 AI 旅行推薦體驗服務 AI 魔鏡,消費者只要站在互動裝置前自拍,系統即會依照臉部表情與穿衣風格自動生成個人化旅遊行程與亮點,大幅提升選旅效率與便利性。

趨勢五:以 AI 加強資安防護。

面對AI帶來的嶄新、增強的安全攻擊,如深度偽造(DeepFake)攻擊與攻擊頻率增強等,企業除可以藉由 AI 增強現有安全系統,還可以透過偵測威脅、保護資料、識別潛在風險等方式對抗深度偽造與假訊息等釣魚攻擊。

「AI 與雲端將成為企業營運的關鍵基礎設施、發揮相輔相成的綜效,此外,也有助於企業加速業務創新與發展數位經濟生態圈,進而鞏固企業競爭力。」劉永信認為,透過 Google Agentspace 提供的多代理協作機制,企業不僅可以整合工作流程,還可以進一步優化模組設計與完善安全治理,讓 AI Agent 進入企業日常營運場景,在這個過程中,若進一步結合 A2A 協定(Agent-to-Agent Protocol),AI Agent 將不僅是單一任務執行者,可以相互溝通,型塑嶄新的企業虛擬團隊,讓企業能以更敏捷的人機協作模式回應市場與顧客需求。

3關鍵 X 5指標,助企業加速代理式AI落地與極大化綜效

劉永信表示:「Data Anywhere 是企業發展代理式AI的關鍵基礎,具體實作方式是從資安(Security)、人工智慧(AI)與雲端財務管理(FinOps)三個關鍵面向切入,型塑具備自主強化的『AI 優先』營運模式以優化創新轉型成效。」例如,企業需要一個含括雲端、邊緣、地端的數據同步與治理框架以確保數據即時性、隱私性、合規性與安全性。

萬里雲 x Google Cloud_Podcast
CloudMile 萬里雲集團創辦人暨董事長 劉永信
圖/ 數位時代

除了以 Data Anywhere 為基礎打造的 AI First 營運模式,Google Cloud 建議企業可以從 5 個關鍵指標選擇平台與合作夥伴:第一是平台服務是否含括全面 AI 技術堆疊,讓企業可以因應需求挑選所需的基礎設施、平台、模型與商業應用;第二是提供企業客戶多元選擇,包括選擇自行開發或者是以既有服務進行客製化開發,以及可以彈性選擇平台提供的 AI 模型、第三方 AI 模型與開放原始碼服務等。

第三是確保雲地、新舊系統的互通性,例如,Google Cloud 不僅在 2019 年推出混合雲管理平台 Anthos 服務,更於日前推出 A2A 協定協助企業打通、協作各個 AI 代理,以及推出 Google Agentspace 協助企業集中化管理AI代理與透明化營運成效等。第四是平台是否有支援開放標準與應用程式介面(API)等機制,讓企業客戶可以因應業務發展彈性串聯與擴展應用範疇。第五是確保平台提供的是負責任的AI以及提供與時俱進的安全防護機制,例如 Google Cloud 便積極深化在深度偽造防護(DeepFake Defense)的能量。

展望未來,隨著 AI 的推陳出新與日趨普及,Google Cloud 除會因應市場需求持續優化平台服務,也會攜手 CloudMile 萬里雲針對產業客戶需求提供最佳服務,以產業專屬、軟硬整合的方式發揮智慧化人機協作的綜效,實踐生態圈共贏。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓