挑戰Nvidia!博通、微軟、Google推AI晶片有什麼亮點?能趕上嗎?
挑戰Nvidia!博通、微軟、Google推AI晶片有什麼亮點?能趕上嗎?

Nvidia(NVDA-US)憑藉其GPU的領先優勢,過去幾年炙手可熱,更乘著ChatGPT熱潮,公司的市值從今年年初至今更是大漲93.6%,不過,近日博通(AVGO-US)、微軟(MSFT-US)、Google(GOOGL-US) 都大動作出手,希望挑戰其獨霸地位。

博通發布新晶片Jericho3-AI,解決訓練AI「網路限制」

博通周二(18日)發布Jericho系列最新的產品Jericho3-AI。在他們看來,這是比輝達(Nvidia)Infiniband更適合AI的一個新選擇。

據博通所說,大公司(甚至 NVIDIA)都認為AI工作負載會受到網路延遲和頻寬的限制,而Jericho3-AI的存在則旨在減少AI訓練期間花在網路上的時間。其結構的主要特性是負載平衡以保持鏈路不擁塞、結構調度、零影響容錯移轉以及具有高乙太網基數(radix)。

博通強調,AI工作負載具有獨特的特徵,例如少量的大型、長期流,所有這些都在AI計算週期完成後同時開始。Jericho3-AI結構為這些工作負載提供最高性能,具有專為AI工作負載設計的獨特功能。

博通指出,「Jericho3-AI結構的一個獨特之處在於它提供了最高的性能,同時還實現了最低的擁有權總成本。這是通過長距離SerDes、分散式緩衝和高級遙測等屬性實現的,所有這些都使用行業標準乙太網提供。這些因素為最大的硬體和軟體提供商生態系統提供了網路架構和部署選項的高度靈活性。」

broadcom
圖/ shutterstock

延伸閱讀:蘋果密謀2025年淘汰博通晶片!庫克想逐步擺脫晶片商依賴,可能嗎?

微軟自研晶片Athena找台積電助攻,最新進展到哪了?

據The Information報導,微軟正在開發自己的代號為「Athena」的人工智慧晶片,該晶片將為ChatGPT等人工智慧聊天機器人背後的技術提供支援。

根據這一報導,這些晶片將用於訓練大型語言模型和支援推理—這兩者都是生成AI所需要的,例如ChatGPT中使用的AI來處理大量資料、識別模式並創建新的輸出來模仿人類對話。

報導稱,微軟希望該晶片的性能優於目前從其他供應商處購買的晶片,從而為其昂貴的AI工作節省時間和金錢。

目前尚不清楚微軟是否會向其Azure雲客戶提供這些晶片,但據報導,這家軟體製造商計畫最早於明年在微軟和OpenAI內部更廣泛地提供其AI晶片。報導也稱指出,該晶片的初始版本計畫使用台積電的5奈納米工藝,不過作為該項目的一部分,可能會有多代晶片,因為微軟已經制定了包括多個後代晶片的路線圖。

近年來,微軟加大處理器工程師的招聘力度,今年年初,微軟更是宣布收購一家名為Fungible 的DPU晶片公司。

微軟Azure核心部門的CVP Girish Bablani在一篇博文中寫道:「Fungible的技術有助於實現具有可靠性和安全性的高性能、可擴展、分解、橫向擴展的資料中心基礎設施」。

延伸閱讀:微軟祕密研發AI晶片「雅典娜」!成本大降3分之1,但不是要取代Nvidia A100

Google推TPU第四代、超級電腦,比Nvidia A100更快

近日,Google對其TPU v4,及其基於這個晶片的打造的超級計算系統,公布更進一步資訊。

據他們在一篇文章中指出,得益於互連技術和領域特定加速器(DSA) 方面的關鍵創新,Google雲TPU v4 在擴展ML系統性能方面比TPU v3有了近10倍的飛躍;與當代ML DSA相比,提高能源效率約2-3倍。

在與Nvidia A100相比時,Google表示,TPU v4比前者快1.2-1.7倍,功耗低1.3-1.9倍。在與Graphcore的IPU BOW相比,Google表示,其晶片也擁有領先的優勢。

基於這個晶片,Google打造一個擁有4,096個張量處理單元(TPU)的TPU v4超級電腦。

Google表示,這些晶片由內部開發的行業領先的光電路開關(OCS)互連,OCS互連硬體允許Google的4K TPU節點超級電腦與1,000個CPU主機一起運行,這些主機偶爾(0.1-1.0%的時間) 不可用而不會引起問題。

據Google稱,OCS動態重新配置其互連拓撲,以提高規模、可用性、利用率、模組化、部署、安全性、功率和性能。與Infiniband相比,OCS和底層光學元件更便宜、功耗更低且速度更快,不到TPU v4系統成本的5%和系統功耗的5%以下。

延伸閱讀:AI大戰的新戰場!Google推超級電腦、AI晶片,為何Nvidia老神在在?

本文授權轉載自:鉅亨網

責任編輯:傅珮晴、蘇祐萱

往下滑看下一篇文章
AI 成為企業新基礎設施,勤英科技從雲端代理走向 AI Infra 整合
AI 成為企業新基礎設施,勤英科技從雲端代理走向 AI Infra 整合

因應生成式 AI、代理式 AI 與實體 AI 的崛起,模型成為企業資訊基礎設施的一環,企業不僅需要算力、還必須具備同時管理多個 AI 模型、優化營運成本,以及確保 AI 基礎設施的安全與穩定;有鑑於此,服務超過 2,000 家企業客戶上雲的勤英科技(ELITE CLOUD)將業務範疇從雲端代理延伸到 AI 基礎設施整合商,協助企業整合多元模型資源、因應不同應用場景彈性調度算力資源,在 AI 新世代建立可規模化的 AI Infra 能力。

「隨著 AI 從單一聊天機器人進化到多模型、多代理協作,企業的核心競爭力不再僅是擁有 AI,而是建立一套可管理、多模型共存、穩定、安全且可持續擴充的 AI Infra 環境。」勤英科技區域總經理黃士培表示,為協助更多企業推進 AI 創新實務,勤英科技從原本的 AWS、Google Cloud、Azure 雲端代理角色,進一步轉型為 AI 基礎設施整合服務商,透過多語言模型平台 MixRoute、代理式 AI 導入與企業資料治理服務,協助企業建立真正可落地、可管理、可擴展的 AI 應用架構。

從 IT Infra 到 AI Infra,企業最大挑戰不是模型、算力而是管理

過去幾年,許多企業透過生成式 AI 實現「問問題」、「摘要文件」、「生成簡報」,提升員工工作績效,而代理式 AI 的崛起與普及,則讓「內嵌 AI 的企業應用」快速成為新常態,從企業資源規劃(ERP)、顧客關係管理(CRM)、人力資源(HR),到客服、研發甚至製造系統,AI 開始深度嵌入各類企業應用,AI 扮演的角色也從單純的輔助工具,逐漸進化為企業營運與決策流程的重要核心。

也因此,企業保持未來競爭力的關鍵,不再是「有沒有導入 AI」,而是「是否具備管理 AI 的能力」,包括如何讓多模型共存、如何控管 Token 成本、如何確保資料品質與一致性、如何依不同部門需求配置 Agent,以及如何避免 AI 成為新的資訊孤島,都是企業導入 AI 後的新挑戰。

「Gemini、Claude、OpenAI、Mistral 等模型快速迭代,意味著企業若只押注單一模型,未來很可能在成本、效能與彈性上失去優勢。」勤英科技區域總經理黃士培表示,企業接下來更需要以「Models as Infrastructure(模型即基礎建設)」的思維,將大型語言模型視為與運算、儲存、網路同等重要的基礎資源來規劃、治理以及進行成本管理,將資訊系統架構重塑為 AI 基礎建設。

勤英科技_內文1.JPG
圖/ 數位時代

勤英科技服務的客戶數超過 2,000 家,不少客戶已導入 AI 應用服務,正積極建置 AI Infra 與管理環境,因此,勤英科技自 2025 年積極轉型,將 AI Infra 視為企業長期競爭力的基礎建設來經營,業務範疇從傳統雲端代理擴展至 AI Infra 整合服務商,例如與多模型平台 MixRoute 合作,並開發可支援單一登入(SSO)、彈性調度不同大型語言模型 Token 的管理平台,協助企業簡化模型管理與成本控管,將更多資源與心力聚焦於核心業務與創新應用。

從雲端代理走向 AI Infra 整合,勤英科技從三面向協助企業發揮 AI 綜效

有鑑於 AI 應用與雲端環境息息相關,勤英科技除因應企業客戶的多雲策略協助管理多雲環境、優化成本,以及落實資安治理,更因應不同使用情境推出三種 AI 方案助力企業:

第一:提供開箱即用的 AI 服務。

黃士培以 Google Cloud 的產品為例解釋,透過整合 Gemini 的 Google Workspace,企業可直接在 Gmail、Meet、Docs、Sheets、Slides 中使用 AI 功能,包括會議摘要、文件生成、簡報整理等,快速提升員工生產力,同時,增強企業對 AI 應用的信心,為之後的應用深化做準備。

第二:協助企業規劃、打造與導入代理式 AI 應用服務。

「對於擁有豐沛結構化數據資料、知識庫的企業來說,除以生成式 AI 打造企業大腦,還會透過代理式 AI 提升自動化執行能力,重塑工作效率。」黃士培表示,勤英科技可以基於 Google Gemini Enterprise,提供含括底層雲端架構、AI 模型調度、資料治理與 AI Agent 串接等服務,讓企業員工可以自然語言安全調用企業資料,讓 Agent 進一步執行任務與推動流程。

舉例來說,勤英科技協助在台灣成立超過 50 年的製造業品牌商將 Gemini Enterprise 介接 SAP 與 Salesforce 訓練模型、建立可供 AI 調用的企業知識中樞;另在影音內容生成領域,勤英科技亦協助客戶導入 AI 自動化技術,將內容產製成本縮減達 90%。

第三:提供多模型聚合管理平台,滿足企業以 API 串連各種模型的需求。

勤英科技與新加坡 MixRoute 合作,提供企業客戶多模型管理平台,讓企業可以視需求彈性敏捷的調度 Gemini、Claude、OpenAI 等不同模型,並透過單一帳號、單一帳單與 Budget Alert 機制,管理 token 使用量與 AI 成本。

勤英科技_內文2.JPG
圖/ 數位時代

「透過我們提供的多模型管理平台,企業客戶不會被單一模型綁定,可以在模型快速疊代的環境下,更靈活地管理成本與算力資源。」黃士培如是說道。

總的來說,隨著 AI 應用從單點工具走向大規模企業部署,下一波競爭核心將從模型能力延伸至 AI 基礎設施管理能力,而這也是勤英科技從雲端代理走向 AI Infra 整合服務商背後的核心原因:當 AI 開始成為企業營運的一部分,企業需要的,已不只是模型供應商,而是能協助串接雲端、資料、Agent 與應用場景的長期技術夥伴。

有關更多勤英科技相關資訊,請查詢網站:https://www.elite.cloud/zh/

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
代理式商務連動百兆商機
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓