AI熱潮掀起後,最常被討論到的議題之一就是「能源」。資料中心消耗了大量電力,而且很大一部分都是花在散熱上,如今微軟嘗試透過微流體技術來幫助晶片降溫,應對短時間的高負荷需求。
資料中心耗費了龐大能源,根據高盛的報告,2022年時資料中心占美國電力消耗的3%左右,然而研究預計到了2030年時,能源消耗占比可能上升到8%之多。同時他們預估全球資料中心用電量將從目前約400十億瓩時,到2030年時突破1,000十億瓩時。
資料中心用電量如此之大的原因,一部分就在於散熱。資料中心有高達30%~40%的電力都是耗費在散熱,為了解決散熱問題,提升資料中心的效率,微軟正在嘗試一個新方法:微流體技術(microfluidics)。
微流體技術是什麼?怎麼幫晶片降溫?
AI運算會對資料中心產生比以往高得多的熱量,假如散熱技術沒有更上一層樓的話,AI的發展很快就會因為散熱限制遇到瓶頸。為了解決這個問題,微軟聲稱他們運用微流體技術打造出一套新散熱系統,比目前主流的冷板散熱效果要高出3倍。
微流體技術是指利用只有幾十到幾百微米的通道,精確控制極少量流體的技術,就像為液體及氣體打造的高速公路。在極小的空間裡,流體會展現與日常生活所見不同的物理特性,這項技術過去常用於科學研究,並且在醫療檢測、藥物開發以及各種化工領域都有運用潛力。
微軟指出,他們透過微流體技術,讓冷卻液直搗黃龍──直接進入晶片內部,更有效率地散熱。晶片背部會蝕刻極小的凹槽,讓冷卻液能夠直接流到晶片上,並且能利用AI識別晶片上的熱訊號,精確引導冷卻液流動。
微軟在過去兩年內擴充了2,000百萬瓩(GW)的資料中心容量,因此對提升效率非常重視。Azure資料中心硬體部門系統和基礎設施副總裁拉妮.伯卡(Rani Borkar)就明白表示,「當用這種規模營運時,效率非常重要。」
具體而言,微軟聲稱微流體散熱性能比主流的冷板高出3倍,還能將GPU內部的最高溫降低65%,不過這些數字會因為配置而有所差異,並預計可以提升能源使用效率、降低營運成本。
目前這項技術是在模擬Teams會議服務的伺服器上運用。微軟解釋,Teams並非是單一服務,而是300項服務協作的系統,每種服務有不同特性,對伺服器各個部份施加的壓力也不同。
好比說,會議往往是在整點或30分開始,這前後5分鐘內負責處理語音及視訊通訊的系統會非常忙碌,有兩種方法可以應對高峰:一是購買額外容量備用,這顯然不合成本,二是用超頻的方式讓伺服器更有效率運轉,這就需要更強大的散熱技術,而微流體技術就能派上用場。
Microsoft 365核心管理技術研究人員吉姆.克里溫(Jim Kleewein)指出,「它(微流體技術)在成本和可靠性上都有優勢,並且因為可以超頻,速度也更快。」
散熱技術如何改變資料中心?
外媒《GeekWire》指出,雖然微流體散熱技術是在英特爾的Xeon上演示,微軟計畫下一步將這項技術融入未來版本的自研晶片中,可能包括Azure Cobalt和Maia AI加速器。
雖然微軟目前仍主要使用輝達等業者的GPU,他們從2023年就開始投入自研AI晶片,認為需要採用更全面整合的方式,才能應用AI帶來的硬體挑戰,並在與Google、亞馬遜的雲端競爭中勝出。伯卡曾表示,AI需求非常龐大,他們需要從設計開始優化每一個層次,才有辦法滿足需求。
微軟也提到,微流體技術看似只改善了散熱,卻可能對整體資料中心的規劃產生更重大影響。散熱需求限制了當前資料中心的設計,微流體技術可以提昇資料中心伺服器的密度,進而提升運算能力。
同時,微流體散熱讓3D堆疊的邏輯晶片成為可能。3D堆疊技術已在記憶體領域使用,但礙於散熱的挑戰無法應用在CPU、GPU等晶片上,微軟認為可以透過微流體技術,讓冷卻液在每一層晶片中流動來解決問題。
值得一提的是,在微軟公佈微流體散熱技術的當天,資料中心冷卻系統廠商Vertiv股價便大跌6%以上。但微軟並非希望藉此擺脫合作夥伴,他們希望未來能有更多業者投入微流體散熱技術,「採用這項技術的人越多越好,對我們、我們的客戶,以及所有人都會是一件好事。」
資料來源:Microsoft、Bloomberg、GeekWire
責任編輯:李先泰