UCM是什麼?華為憋了一年的AI大計:它如何解決AI回應「貴又慢」的問題?
UCM是什麼?華為憋了一年的AI大計:它如何解決AI回應「貴又慢」的問題?

中國科技巨擘華為 8 月 12 日在 2025 金融 AI 推理應用落地與發展論壇上正式發表 AI 推理創新技術 UCM(推理記憶資料管理器),並計劃下月正式開源 UCM。

什麼是 UCM?解決 AI 回應慢又貴的問題

想像一下,當你問 AI 問題時,它需要「思考」很久才回答,而且運算成本很高。 UCM 就像給 AI 裝了一個「超強記憶系統」,讓它能更快回應、處理更長的對話,同時大幅降低成本。

華為副總裁周躍峰指出,目前 AI 推理面臨三大問題:「推不動」(輸入內容太長超出處理範圍)、「推得慢」(回應速度太慢)、「推得貴」(運算成本太高)。

UCM 透過「分層記憶」概念解決這些痛點,就像人腦會把常用資訊放在容易取得的地方,不常用的資訊存在深層記憶中。

KV Cache 技術突破 記憶容量從 GB 躍升至 PB 級

UCM 的核心是 以 KV 快取 (KV Cache) 和記憶管理為中心的推理加速技術。 KV 快取是 AI 模型在對話過程中儲存上下文資訊的關鍵技術,過去受限於高頻寬記憶體 (HBM) 容量,現在 UCM 能將 AI 的記憶容量提升百萬倍,從原本只能記住少量對話內容,擴展到可以記住海量的歷史資訊。

UCM 將 AI 推理系統的記憶分為三層: 即時記憶資料放在 HBM 中、短期記憶資料放在 DRAM、長期記憶放在共享專業儲存中 ,透過智慧分級實現最佳效能。

三大技術突破 效能大幅提升

UCM 的核心技術包括三個部分:

  • 推理引擎外掛程式:像萬用轉接頭,可以連接各種不同的 AI 系統
  • 智慧快取管理:支援多級 KV 快取管理及創新加速演算法,自動決定哪些資料要放在哪個層級的記憶體中
  • 高速存取適配器:提供高效能 KV 快取存取,加速資料讀取,減少等待時間

經測試驗證,華為宣稱 UCM 能帶來顯著改善包含:一,首次回應時間最高縮短 90%;二,系統處理量最大提升 22 倍;三,可處理內容長度增加 10 倍;四,Token(AI 理解和處理文字的最小單位)經濟性提升 2 倍以上。

創新聯想演算法 讓 AI 越用越聰明

UCM 還導入受打字輸入法聯想啟發的新聯想演算法,就像手機的智慧輸入功能,會根據你平常的使用習慣預測你想說什麼,讓 AI 能一次輸出多個詞彙,而不用一個字一個字慢慢生成。 這項技術讓 AI「存得越多推得越快」,比傳統預測加速效果更適合企業應用場景。

華為數據儲存產品線 AI 儲存首席架構師李國杰表示,相較於業界現有方案只有傳統 Prefix Cache 技術,UCM 提供更豐富、可靠且加速效果更好的演算法庫,能在各種場景下自動切換和適應。

瞄準 Agentic AI 時代 持續技術演進

UCM 著眼於未來 Agentic AI 時代的需求設計。除了今年發布的推理加速套件,華為還將持續建構面向 Agent 知識感知的多模態檢索加速能力,以及未來 Agent 原生記憶的管理和加速能力。

李國杰透露,UCM 從去年 6-7 月開始孵化,至今約一年時間,僅演算法方面就有百人級團隊投入,未來將面向 Agentic AI 做更深入演進。

開源計畫 推動產業發展

華為計劃 9 月在魔擎社區率先開源 UCM,隨後逐步貢獻給主流 AI 開發社區。華為強調,透過開放這項技術,希望與產業界共同建立更成熟的 AI 推理生態系統。

中國信通院專家指出,目前 AI 發展重心正從「訓練模型」轉向「實際應用推理」,而 KV 快取為核心的記憶體管理將是未來 AI 系統優化的關鍵技術。

UCM 的推出標誌著 AI 推理技術邁向新階段,不僅能讓 AI 回應更快、處理能力更強,也為 AI 技術在各行業的大規模應用奠定基礎。

延伸閱讀:GPT-5不愛拍馬屁了?OpenAI證實調降「情緒價值」:為何討好用戶的應聲蟲,不是好AI?
n8n是什麼?4個月身價飆6.5倍,有望成下一個AI獨角獸

本文授權轉載自鉅亨網

關鍵字: #華為 #AI
往下滑看下一篇文章
全球 80% 獨角獸都在用!AWS 為 AI 新創打造最強後盾
全球 80% 獨角獸都在用!AWS 為 AI 新創打造最強後盾
2025.11.14 |

生成式AI正掀起一波全球創新浪潮,新創企業正以驚人速度重塑產業生態。AWS與《數位時代》聯手製作的節目《科技潮什麼》,回顧了AWS日前舉辦的「AWS 台灣雲端高峰會 - AI 創新賦能日」論壇,帶聽眾掌握AI獨角獸與台灣新創的第一線觀察。

這場AWS舉辦的盛會,集結了全球專家對新金融、新經濟型態的全方位觀察。節目整理了論壇中提到的案例,從數據巨頭Palantir,到一年內達成獨角獸估值的日本Sakana AI,再到台灣的犀牛盾與完美移動,串起一場精彩的AI創業實戰課。

Palantir資深顧問Shawn Manasco 分享了自家「神秘數據公司」的成長故事。他提及:「過往美國軍隊很大,常常問一個問題,要等2-3周才有答覆,而且回答還是錯的。」Palantir在短短12天內,協助美國陸軍整合上百個資料庫,讓美軍即時掌握戰略資源。Palantir不僅展現AI與資料整合的威力,也揭示新創要成功必須解決真實痛點,而非「創造需求」,並能將技術轉化為實際商業價值。

Palantir 資深顧問 Shawn Manasco
Palantir 資深顧問 Shawn Manasco
圖/ AWS

日本的新創Sakana AI則在1年內就躍升為AI獨角獸。Sakana AI專注於用AI解決日本勞動力短缺與產業永續問題,在強調「速度」與「專注」的同時,也堅守安全規範,並在深耕技術的過程中,找到能真正影響社會的應用場景。Sakana AI提及:「這一切也要感謝AWS的協助,因為AWS提供很強大的資源。」

回到台灣,也有兩個亮眼的新創案例。首先是犀牛盾,面對全球市場中13,000張圖款與上百位創作者的內容管理挑戰,他們導入多模態模型CLIP,讓AI自動理解圖片與文字關聯,大幅提升策展效率;第二是完美移動,他們在開發技術時,找到了B2C轉型為B2B、API的商業模式,將原本針對消費者的AI虛擬試妝技術,轉化為API服務,成功打造可規模化的SaaS商業模式。兩家企業的共同點在於,不是一味追求最炫的技術,而是用AI解決實際問題。

要打造出好的AI服務,就必須有穩定、安全又可擴展的基礎架構。AWS正是許多新創背後的關鍵力量,全世界有80%的獨角獸企業都是AWS的客戶,而在專注於人工智慧與機器學習的獨角獸中,比例更高達96%。AWS不僅提供雲端運算資源,更是協助企業從概念驗證、技術開發到全球營運的堅實後盾,讓創新能夠真正落地。

AI時代的浪潮不斷向前,AWS也將持續推動產業創新,並於11月18日高雄舉辦「2025亞馬遜港都創新日」,邀請政府領袖、產業代表與國際專家齊聚,分享前瞻觀點與實戰經驗,打造百工百業共創的科技展區,呈現更多雲端應用的真實場景。同時若想了解更多AI創新趨勢與台灣新創的成長故事,立即收聽本集《AWS科技潮什麼》,掌握這波AI轉型的關鍵契機。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
一次搞懂Vibe Coding
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓