AWS雲端年會|一口氣推AI模型Nova、AI晶片Trainium2,亞馬遜如何撼動輝達霸業?
AWS雲端年會|一口氣推AI模型Nova、AI晶片Trainium2,亞馬遜如何撼動輝達霸業?

雲端龍頭亞馬遜AWS的年度大會re:invent於台灣時間12月4日登場,作為年底壓軸登場的大型發布會,AWS終於在生成式AI大戰開打兩年後,正式推出大型語言模型系列「Nova」,有四種等級,號稱能同時滿足高速、成本效益、專業、資料量等企業需求。

同時,AWS在自研晶片展現挑戰NVIDIA的野心,推出第二代AI訓練晶片Trainium2、超級伺服器,同時攜手AI新創Anthropic打造「史上最大的AI運算群集」,希望搶下超級電腦的話語權。

AWS re:invent 2024
AWS re:invent 2024登場,發表AWS年度重磅產品。
圖/ AWS re:invent 2024

大語言模型:Nova系列誕生,四種規格供客戶自選

AWS終於推出自家的大語言模型了,過去兩年Google、微軟等競爭對手在模型上打得火熱,AWS選擇以能統整多種模型供企業選用的平台Bedrock,作為最主力的武器,更喊出「這世界上沒有最強的模型」作為口號,今年也再度重申。

不過這一次,AWS宣布正式推出自家訓練的多模態生成式AI模型「Nova」,加入平台上眾多的模型陣營之中。共有四種等級可供客戶依照需求選擇:Micro、Lite、Pro 和 Premier,分別有不同的優勢。

Micro:純文字模型,能達到四種裡面最低的延遲,以小規模高速處理。
Lite:能處理文字、圖片、影像,但「體型」輕盈,強調最佳成本效益。
Pro:能處理文字、圖片、影像的專業多模態模型,兼顧速度、準確性、多元工作內容。
Premier:系列中功能最強大的模型,甚至可以作為「其他模型的老師」,也就是用來訓練其他大語言模型的能力。

AWS re:invent 2024
AWS re:invent 2024中推出大型語言模型Nova,共有4種等級可選。
圖/ AWS re:invent 2024

除了這些通用模型外,還專門推出圖片、藝術生成的Nova Canvas,提供工作室等級的專業製作,內有控制色彩濃淡、版面配置和專業水印等功能。另外還有專業影音生成的Nova Reel,可以控制360度旋轉、放大縮小等運鏡方式。

AWS執行長安迪.賈西(Andy Jassy)指出,整個系列成本都非常有效益,比其他Bedrock中其他同等級模型都便宜75%,而Nova全系列除了高階的Premier和Nova Canvas、Nova Reel在明年才會登場外,其他都已經上線供AWS客戶使用。

安迪.賈西強調,目前市面上已經有各種類型的模型,但客戶的需求尚未被滿足,同時能符合四大條件—提供豐富知識、符合成本效益、低延遲、垂直產業專業需求的模型,目前並不存在,因為四點之中仍有幾項是互相矛盾的,例如知識量大成本就高,延遲也更久,因此需要專門的訓練去滿足這些需求。

自研晶片:攜手Anthropic挑戰NVIDIA

雖然大語言模型是第一代,但是在自研晶片上AWS已經是耕耘數8年的老手,旗下也有4大晶片產品線,分別針對不同需求提供算力。

今年,專為模型訓練設計的Trainium也推出了第二代,簡稱Trn2,採台積電5奈米製程,效能比上一代提升4倍,能整合16顆晶片,算力達到20.8 petaFLOPS(每秒浮點運算次數),等於每秒可以執行20.8萬兆次運算。

作為比較,NVIDIA三月推出的Blackwell B200算力為20 petaFLOPS。也因為算力達到高效益,能耗降低2倍,同時也大省GPU成本,最高降低40%。

Trainium2.jpeg
AWS Trainium2 晶片。

外界普遍認為,AWS想要藉由Trainium2挑戰NVIDIA的AI晶片市場領導地位,甚至手機龍頭大廠蘋果高層Benoit Dupin都向媒體透露,已經成為這款晶片的客戶

安迪.賈西更預告,下一代Trainium3晶片也已經在路上,將採用3納米製程,2025年底就會推出。

除了晶片本身,還推出了一款超級伺服器「EC2 Trn2 UltraServers」,由64顆Trainium2組成,算力、內存、傳輸能力都提高四倍,一口氣拉升到83.2 petaFLOPS。

Amazon EC2 Trn2.jpeg
Amazon EC2 Trn2。

而AWS去年宣告和NVIDIA合作建設超級電腦,今年則表示即將和生成式AI領域大放異彩的新創公司Anthropic攜手合作,推出「Project Rainier」計畫,把這些Trn2 UltraServers超級伺服器組合成「史上最大的AI運算群集」,搭載數十萬個Trainium2晶片,號稱是為「未來等級的AI訓練」做好最萬全的準備。

Anthropic 創辦人暨執行長Dario Amodei
Anthropic 創辦人暨執行長Dario Amodei。
圖/ 隋昱嬋攝影

總結:AWS領域展開

AWS在生成式AI領域一直相對低調,不過在雲端基礎建設一直處於領先地位,加上靈活選用模型的Bedrock平台,成為生成式AI大戰中吸引企業客戶的絕招。

不過今年發布會可以看出AWS相對「大膽」的競爭策略,直接推出大型語言模型Nova加入Bedrock中,形成平台兼玩家的局面,更直言比各家模型都更便宜高效率,等於直接下場和其他合作夥伴競爭客戶的青睞。

AWS NVIDIA.jpg
輝達執行長黃仁勳(右)去年首度站台AWS re:invent。
圖/ AWS

此外,AWS和NVIDIA之間的「瑜亮情結」也隨著自研晶片的發展持續發酵中,雖然雙方仍有持續合作,但在AI伺服器等基礎設施越來越昂貴的大環境下,AWS背後擁有的龐大雲端算力,相比之下更能靈活調節工作負載,成為企業降低成本的希望,也讓使用AI的門檻更低。

英國研調機構Finimize指出,AWS將持續以Trainium等一系列AI晶片,挑戰龍頭NVIDIA的地位。

延伸閱讀:2024 MarTech 行銷科技高峰會登場!AI 浪潮下一步,從效率導向到創造品牌價值

責任編輯:李先泰

關鍵字: #AWS #AI
往下滑看下一篇文章
從新零售到新商務,騰雲科技以兩大策略打造新世代成長引擎
從新零售到新商務,騰雲科技以兩大策略打造新世代成長引擎

騰雲科技持續展現強勁成長,不僅連續五年維持雙位數的營收增幅,更於 2025 年前三季累計營收來到 5.47 億元、淨利 1.03 億元,年成長率高達 67%,顯示騰雲科技已從智慧零售解決方案供應商擴展成為智慧社區、智慧城市解決方案供應商,並持續發揮高毛利、高成長、以智慧場域資料為核心驅動的代理式 AI 解決方案全方位供應商。

騰雲科技是怎麼辦到的?

騰雲科技董事長暨總經理梁基文不藏私分享兩大關鍵:「首先是以 AI 賦能的產品與服務,協助客戶提升效率、優化營收;其次是透過騰雲孵化器與其生態系中新創夥伴協作,打造零售、不動產、製造與數位保險等產業所需的新商務服務。」

以 AI 賦能全產品線,強化客戶黏著度、深化長期關係

梁基文表示:「AI 不是單一產品或立即變現的技術,要能有效消除資訊不對等,需協助企業先將散落的資料整合成數據資產,才能找出能驅動決策的洞察。」因此,要讓 AI 真正落地,需要同時理解產業現況與營運痛點的夥伴,才能把技術與數據轉化為具體價值,成為企業成長的新引擎。

有鑑於此,騰雲科技的策略是推出 AI Agent 平台 –TrendVotex,由深耕百貨零售、商業不動產等產業的專業團隊協助打造符合場景需求的 AI 代理服務。

例如,為百貨零售打造的「AI 品牌行銷專家」透過市場輿論進行趨勢及同業動態分析、以口碑行銷進行品牌塑造、針對會員數據進行自動化文案生成及傳播、針對行銷成果進行效益分析等自動化決策,「AI 招商助理」則能整合商圈熱度、樓層營運狀態等資訊,提出精準的櫃位調整與招商策略。至於針對複合式商業不動產管理場景推出「AI 能源智慧管理」服務,導入 AIoT 終端裝置佈署並運用其感測數據與歷史異常紀錄,預測設備故障風險,協助排程維修,降低停機時間,大幅提升營運績效。

梁基文補充說明:「除了協助企業打造專屬 AI 代理與串接代理式工作流程(Agentic Workflow),我們也推出 Marketing、Content、Sales、Manufacturing 等跨產業可重複使用的 AI 代理模組,加速零售、不動產、製造、旅遊與數位保險服務等產業的導入腳步。」

值得注意的是,為真正發揮、極大化 AI 價值,騰雲科技不僅提供技術,也協助企業梳理流程、整合分散數據,打造可支撐多場景的數據驅動營運中台。

梁基文表示,不只零售業正加速虛實通路整合,製造與金融服務業也十分重視「全通路數據」,例如製造業需要即時掌握生產過程關鍵數據指標與庫存狀況以確保良率及產能、數位保險業則積極深化對顧客旅程的掌握以完善服務能量等,騰雲科技推出「隨開即用」、雲地整合的 AI 平台,讓企業能在多場景中無縫串接數據並兼顧資訊安全,充分展現「From Insight to Intelligence」價值。

例如,協助數位保險整合顧客的「線上資料(如客戶資料、風險判斷」與「線下數據(如客戶活動數據、場域營運數據)」,透過 AI 進行產品推薦、簡化內部核保作業流程,並提供更加順暢的一致體驗,讓保險也能像零售一樣真正做到懂顧客。

「接下來,我們會把在百貨零售與商業不動產驗證過的技術,進一步擴大到製造、數位保險等產業,讓價值放到最大。」梁基文如是說道。

騰雲科技
騰雲科技董事長暨總經理梁基文
圖/ 數位時代

五大技術、四大產業,騰雲科技以孵化器成就下一個十年

梁基文表示:「過去 10 年,我們專注在『新零售・新生活』;接下來將延伸至『新商務・新生活』,透過收購、合資、投資等方式與外部夥伴共創新的成長動能。」

具體做法是以 ABCDE(AI、Blockchain、Cloud、Data、Experience)五大技術為核心,鎖定零售、不動產、製造與金融服務四大產業,透過外部合作與孵化機制強化解決方案的廣度與深度:整合現場設備、門市裝置、POS、排隊系統、取貨流程、感測器與後勤運作,推出 AIoT 智慧場域管理方案,滿足跨場域、跨產業與跨國企業的需求。

例如,協助泰國五星級酒店導入 AIoT 智慧場域管理方案以優化能源設備管理、降低營運成本並提升使用者體驗等。明(2026)年,騰雲科技計畫將 AIoT 智慧場域管理方案推向製造業廠房,協助客戶管理冷氣、燈光等能源設備並進行碳管理,同時,透過監控產線設備的振動與溫度等數據,提供 AI 預判的設備維修時機(Preventive Maintenance),擴大數位與綠色雙軸轉型的綜效。

除以集團力量推廣 AIoT 智慧場域管理方案,騰雲科技亦積極擴大相應的生態體系發展:首先是與跨業夥伴一同延伸 AIoT 智慧場域管理方案 的應用範疇,如與保險業者合資成立數位保險公司以提供 AI-Ready 數位應用方案;其次是建立消費者生態體系以發揮「新商務‧新生活」的相互影響綜效。例如,騰雲科技子公司騰加數位將擴大 AIoT 平台運營版圖,深入零售、商辦與飯店等多元場景,並以此為載體整合數位支付、會員數據與數位內容傳播等應用,藉此強化場域的智慧化能力,以及拓展騰雲解決方案的落地深度與廣度。

「透過 AIoT 智慧場域管理方案、營運中台與 TrendVotex 等產品與服務,我們不僅能更精準回應台灣、日本與東南亞市場在流程自動化、營運效率提升上的需求,也能同步改善大眾的日常體驗,真正落實『新商務・新生活』的共好價值。」關於未來的發展,梁基文如是總結。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓