「液冷是不可逆的趨勢,不要再問我會不會回去氣冷了,各位可以大膽的投資。」 雙鴻董事長林育申並不避諱自己就是散熱產業的一員,相當自信地說道。
隨著大型雲端服務中心持續增加的資本支出、生成式AI導入各行各業等帶來的市場需求,除了推進AI晶片提升效能,隨之而來的就是伺服器的散熱和電力強勁需求。
林育申5月6日在台北國際電腦展AI NEXT FORUM主題演講中指出,散熱解決方案有天翻地覆的變化,但他認為:「散熱產業會一直有飯吃,而且可以吃很久。」
氣冷散熱逐漸退場,液冷成為主流
為了確保AI伺服器的晶片效能,林育申指出,傳統的氣冷、散熱鰭片(3D VC)將會逐漸被液冷散熱取代,走向液冷散熱,林育申斷言,「未來資料中心裡面一定會有一台In Row CDU(液冷控制單元)。」
而即將在下半年出貨的NVIDIA B300系列晶片,單一晶片所釋放的熱量(TDP)來到了1,000瓦,雖然目前B300系列伺服器的散熱架構目前林育申並未透露太多,但以B200以液冷散熱的方式來解熱,更高功耗的B300絕不可能倒退回氣冷。
除了晶片本身熱度提高,還有必須走向液冷的原因,就是電力。
AI晶片是吃電怪獸,只能從改變散熱架構省電
林育申指出,一台伺服器機櫃,傳統氣冷散熱就佔據整台機櫃的39%電力,剩下的則是網通(5%)、電源供應架構(7%)、IT系統(包含伺服器、儲存設備為49%),在晶片無法降低功耗和電力的情況下,能夠改動的只有在散熱和電源架構。
雖然液冷散熱建置成本相對氣冷來的高,但林育申提到,氣冷一年的成本為20萬美元、液冷的成本僅需要13萬美金,並且也能達到資料中心節能的PUE需接近1的指標,氣冷散熱的PUE最佳僅能達到1.6,而液冷技術則可以讓PUE降為1.1。
目前的散熱技術在液冷領域已經相對成熟,不過林育申也提到,現在也正積極開發能夠直接裝在晶片上的解熱技術,包含透過複合式材料進行解熱,「這條路走起來會很辛苦,但改變材質才能做到下一步的解熱。」
至於水冷快接頭還是面臨到漏水的問題,林育申也表示,會以更嚴謹的態度來進行測試和驗證,「裝在這麼貴的設備上,一萬個當中壞一個就不得了,問題也會被一直放大,馬虎不得。」
責任編輯:李先泰