觀點|AI進入代理時代!任務越複雜,為何真正被榨乾的是CPU,不是GPU?
觀點|AI進入代理時代!任務越複雜,為何真正被榨乾的是CPU,不是GPU?

今年 3 月初,AMD 執行長蘇姿丰出席摩根士丹利會議時指出,企業對伺服器中央處理器(CPU)需求急速升溫,使超微訂單成長「遠超出原先預期」,CPU 供應更出現吃緊情況。

英特爾財務長 David Zinsner 也呼應蘇姿丰的說法,他認為今年 CPU 市場將變得非常火紅。

不只伺服器 CPU 供不應求,連 PC 用 CPU 也將同步缺貨。

果不其然,3 月底媒體傳出用於個人電腦及伺服器的 CPU 供應吃緊、開始缺貨,平均交貨時間從一到兩週拉長至 8 到 12 週,在部分情況下甚至須等上半年。

英特爾股價谷底反彈

進入 AI 時代後,GPU 成為市場焦點,個人電腦用的 CPU 及伺服器用的 CPU 淪為配角,市場成長率平平。

英特爾在 AI 時代「掉隊」,沒有 GPU 撐場,晶圓代工市場虧損累累,僅靠 CPU 撐場。這使英特爾股價一再向下沉淪,2025 年 4 月 17 日,英特爾股價跌到 18.93 美元創下低點。

陳立武於 2025 年 3 月被任命為英特爾執行長,經數月的「磨練」後,英特爾經營情況漸入佳境,股價也隨之上漲;2026 年 4 月 16 日英特爾股價達 68.50 美元,創下近期新高。

AI 從訓練、推理走到代理

AI 時代初期主要技術發展是建立「大語言模型」,此時以「大語言模型訓練」為主,因此對 GPU 的需求殷切。

隨著大語言模型技術逐漸成熟,AI 技術發展重心轉向「推理」,這也是黃仁勳不惜斥重資引進 Groq 的 LPU 技術,以強化輝達在推論方面的技術實力。

隨著 AI 進入代理時代,面對愈來愈複雜的任務,AI 需要的不再只是運算能力,更需要拆解任務、安排流程、調度工具;使擅長這些能力的 CPU 再次登上台面,成為要角,而不再是隱身幕後的配角。

代理時代,CPU 成為任務調度關鍵

過去 AI 的運作,主要是由使用者輸入問題,經 CPU 進行基本處理後,交由 GPU 完成推理,再將結果回傳給使用者。這種一個口令一個動作的互動模式,計算重心集中在 GPU。

但到了代理 AI 時代,任務變得更為複雜,任務將被拆解為多個子任務,同時由多個代理執行。

執行過程中,可能會不斷呼叫工具、查詢資料庫、撰寫與執行程式,甚至進行多次自我反思與修正。這些涉及任務安排、資源調度與系統互動的工作,幾乎全落在 CPU 身上。

英特爾和喬治亞理工學院發表的一份研究指出,在這類 AI 代理工作負載中,CPU 甚至可能占據整體延遲的過半比例,成為真正影響效率的關鍵環節。 因此將推升 AI 對 CPU 需求的規模。

隨著 AI 代理能以遠高於人類的速度產生與處理請求,資料中心對 CPU 核心的需求可能在短時間內成長數倍,這是造成 CPU 缺貨的主要推力。

記憶體缺貨加速,PC 廠提前備貨

英特爾、AMD 之前對 CPU 市場的預估,低估了 AI 推理時代對 CPU 的需求,導致備貨積極度不足。

之前由於英特爾、AMD 的 CPU 庫存充裕,沒料到從今年初起,客戶積極拉貨,使庫存很快見底,不得不延長出貨時間。

另一個因素是記憶體缺貨、價格大漲,使 PC 廠積極備貨,期望在記憶體大漲期間提前出貨,以降低日後 PC 價格上揚、市場需求受抑制的衝擊。

由此可見,技術的演進引導對產品需求的轉換。由於高科技產品市場環環相扣,這一波大缺貨潮,是由 AI 對電子元件需求暴增所引起。

供給面而言,除了增加電子元件(如記憶體等)的產量外;需求面則若有技術突破可降低對電子元件的需求,也可能緩解供不應求的情況。

延伸閱讀:英特爾鹹魚翻身!9天市值狂飆1,000億美元,三大利多怎麼把它推上華爾街最火晶片股?

《數位時代》長期徵求針對科技時事的深度觀點文章,歡迎各領域專業人士來稿交流。稿件請寄至 edit@bnext.com.tw,全文字數至少 800 字,並請附上 100 字內個人簡介。文章若獲採用,將由編輯進行必要潤飾,如需調整標題,會事先與您討論確認。

(觀點文章呈現多元意見,內容不代表《數位時代》立場)

責任編輯:李先泰

關鍵字: #英特爾 #AMD
往下滑看下一篇文章
AI 成為企業新基礎設施,勤英科技從雲端代理走向 AI Infra 整合
AI 成為企業新基礎設施,勤英科技從雲端代理走向 AI Infra 整合

因應生成式 AI、代理式 AI 與實體 AI 的崛起,模型成為企業資訊基礎設施的一環,企業不僅需要算力、還必須具備同時管理多個 AI 模型、優化營運成本,以及確保 AI 基礎設施的安全與穩定;有鑑於此,服務超過 2,000 家企業客戶上雲的勤英科技(ELITE CLOUD)將業務範疇從雲端代理延伸到 AI 基礎設施整合商,協助企業整合多元模型資源、因應不同應用場景彈性調度算力資源,在 AI 新世代建立可規模化的 AI Infra 能力。

「隨著 AI 從單一聊天機器人進化到多模型、多代理協作,企業的核心競爭力不再僅是擁有 AI,而是建立一套可管理、多模型共存、穩定、安全且可持續擴充的 AI Infra 環境。」勤英科技區域總經理黃士培表示,為協助更多企業推進 AI 創新實務,勤英科技從原本的 AWS、Google Cloud、Azure 雲端代理角色,進一步轉型為 AI 基礎設施整合服務商,透過多語言模型平台 MixRoute、代理式 AI 導入與企業資料治理服務,協助企業建立真正可落地、可管理、可擴展的 AI 應用架構。

從 IT Infra 到 AI Infra,企業最大挑戰不是模型、算力而是管理

過去幾年,許多企業透過生成式 AI 實現「問問題」、「摘要文件」、「生成簡報」,提升員工工作績效,而代理式 AI 的崛起與普及,則讓「內嵌 AI 的企業應用」快速成為新常態,從企業資源規劃(ERP)、顧客關係管理(CRM)、人力資源(HR),到客服、研發甚至製造系統,AI 開始深度嵌入各類企業應用,AI 扮演的角色也從單純的輔助工具,逐漸進化為企業營運與決策流程的重要核心。

也因此,企業保持未來競爭力的關鍵,不再是「有沒有導入 AI」,而是「是否具備管理 AI 的能力」,包括如何讓多模型共存、如何控管 Token 成本、如何確保資料品質與一致性、如何依不同部門需求配置 Agent,以及如何避免 AI 成為新的資訊孤島,都是企業導入 AI 後的新挑戰。

「Gemini、Claude、OpenAI、Mistral 等模型快速迭代,意味著企業若只押注單一模型,未來很可能在成本、效能與彈性上失去優勢。」勤英科技區域總經理黃士培表示,企業接下來更需要以「Models as Infrastructure(模型即基礎建設)」的思維,將大型語言模型視為與運算、儲存、網路同等重要的基礎資源來規劃、治理以及進行成本管理,將資訊系統架構重塑為 AI 基礎建設。

勤英科技_內文1.JPG
圖/ 數位時代

勤英科技服務的客戶數超過 2,000 家,不少客戶已導入 AI 應用服務,正積極建置 AI Infra 與管理環境,因此,勤英科技自 2025 年積極轉型,將 AI Infra 視為企業長期競爭力的基礎建設來經營,業務範疇從傳統雲端代理擴展至 AI Infra 整合服務商,例如與多模型平台 MixRoute 合作,並開發可支援單一登入(SSO)、彈性調度不同大型語言模型 Token 的管理平台,協助企業簡化模型管理與成本控管,將更多資源與心力聚焦於核心業務與創新應用。

從雲端代理走向 AI Infra 整合,勤英科技從三面向協助企業發揮 AI 綜效

有鑑於 AI 應用與雲端環境息息相關,勤英科技除因應企業客戶的多雲策略協助管理多雲環境、優化成本,以及落實資安治理,更因應不同使用情境推出三種 AI 方案助力企業:

第一:提供開箱即用的 AI 服務。

黃士培以 Google Cloud 的產品為例解釋,透過整合 Gemini 的 Google Workspace,企業可直接在 Gmail、Meet、Docs、Sheets、Slides 中使用 AI 功能,包括會議摘要、文件生成、簡報整理等,快速提升員工生產力,同時,增強企業對 AI 應用的信心,為之後的應用深化做準備。

第二:協助企業規劃、打造與導入代理式 AI 應用服務。

「對於擁有豐沛結構化數據資料、知識庫的企業來說,除以生成式 AI 打造企業大腦,還會透過代理式 AI 提升自動化執行能力,重塑工作效率。」黃士培表示,勤英科技可以基於 Google Gemini Enterprise,提供含括底層雲端架構、AI 模型調度、資料治理與 AI Agent 串接等服務,讓企業員工可以自然語言安全調用企業資料,讓 Agent 進一步執行任務與推動流程。

舉例來說,勤英科技協助在台灣成立超過 50 年的製造業品牌商將 Gemini Enterprise 介接 SAP 與 Salesforce 訓練模型、建立可供 AI 調用的企業知識中樞;另在影音內容生成領域,勤英科技亦協助客戶導入 AI 自動化技術,將內容產製成本縮減達 90%。

第三:提供多模型聚合管理平台,滿足企業以 API 串連各種模型的需求。

勤英科技與新加坡 MixRoute 合作,提供企業客戶多模型管理平台,讓企業可以視需求彈性敏捷的調度 Gemini、Claude、OpenAI 等不同模型,並透過單一帳號、單一帳單與 Budget Alert 機制,管理 token 使用量與 AI 成本。

勤英科技_內文2.JPG
圖/ 數位時代

「透過我們提供的多模型管理平台,企業客戶不會被單一模型綁定,可以在模型快速疊代的環境下,更靈活地管理成本與算力資源。」黃士培如是說道。

總的來說,隨著 AI 應用從單點工具走向大規模企業部署,下一波競爭核心將從模型能力延伸至 AI 基礎設施管理能力,而這也是勤英科技從雲端代理走向 AI Infra 整合服務商背後的核心原因:當 AI 開始成為企業營運的一部分,企業需要的,已不只是模型供應商,而是能協助串接雲端、資料、Agent 與應用場景的長期技術夥伴。

有關更多勤英科技相關資訊,請查詢網站:https://www.elite.cloud/zh/

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
代理式商務連動百兆商機
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓