NVIDIA針對超大規模資料中心(Hyperscale data center)需求,推出AI推論平台NVIDIA TensorRT。
攻資料中心市占,推新GPU Tesla T4
NVIDIA指出,資料中心每天需要處理數十億的語音搜尋、翻譯、圖像、影像、推薦服務以及社群媒體互動等,上述的每一個應用皆需透過伺服器內部不同類型的神經網路來處理。為了優化資料中心的最大吞吐量以及伺服器使用率,NVIDIA TensorRT包含即時推論軟體以及Tesla T4 GPU,其處理搜尋結果的速度較單獨使用CPU快40倍。
而Microsoft與Google等資料中心服務商與Dell與HPE等資料中心伺服器廠商也都將導入。NVIDIA還預估AI推論產業將於未來五年內成長至200億美元。
NVIDIA正努力在資料中心開疆闢土,全球資料中心大多採用NVIDIA GPU,而資料中心業務雖然營收總額還不到遊戲業務的一半,卻是NVIDIA各部門中成長最快的,同時也是影響股價的重要因素。
資料中心是營收成長火車頭,連兩季YoY成長至少70%
根據NVIDIA2018年第二季財報,NVIDIA第2季營收為31.23億美元,其中遊戲業務第2季營收為18億美元,YoY增加52%。資料中心業務營收則是來到7.6億美元,YoY增長高達83%。而在第一季資料中心營收7.01億美元,YoY成長也高達71%,可說是NVIDIA的營收成長火車頭。
短期內,NVIDIA仍能穩坐資料中心寶座,競爭對手AMD與Intel目前與NVIDIA還有明顯差距。
AMD甫推出7奈米Radeon GPU,雖然比Nvidia的7奈米產品提前半年至一年推出,製程上領先,但在下游應用端要取代NVIDIA並非易事,而Intel的資料中心GPU產品也才剛起步。
短期內,NVIDIA資料中心業務保持成長火車頭沒有大太問題,但若把時間拉長到3-5年以上,則NVIDIA隱患浮現。因為全球前七大資料中心其實都正在研發自家晶片。
垂直整合,全球前七大資料中心都有「異心」
以三大雲端廠商的Google、Microsoft與Amazon的資料中心來說,目前都採用NVIDIA GPU,但也都有「異心」,各自研發「非」GPU晶片,彼此保持競爭又合作的詭譎關係。而且對這些雲端大廠來說,自研晶片不會僅是嘗試,而是一種趨勢,「垂直整合態勢」明顯,半導體晶片將從一般通用走向「Domain Specific(特定領域)」用途,IC設計不做標準化產品,而是跟著應用需求做產品。而這也是為什麼這些科技大廠開始自行研發晶片的主因。
黃仁勳與Google的口水戰
其中又以Google的態度最為明顯,2016首次亮相的ASIC晶片Cloud TPU,供雲端運算的機器學習訓練和推論使用,短短兩年已經演進到第三代,而且在2017年Google還透過論文《In-Datacenter Performance Analysis of a Tensor Processing Unit》發表、大肆宣傳,更有趣的是,論文中還拿出NVIDIA多年前舊產品Tesla K80 GPU和最新TPU的效能做比較,結果顯示TPU的速度快Tesla K80 GPU15至30倍,此舉引發NVIDIA創辦人黃仁勳不滿,特地跳出來反駁。
今年Google則延伸至終端,推出Edge TPU,供邊緣運算的推論使用。雖然目前仍為Google自家用途為大宗,但Google也在測試對外販售以「變現」的可能性(如Google在2018年2月公佈開放開發者使用,Cloud TPU服務以秒計費,每小時收費6.5美元),什麼時候完全對企業開放收費,業界都在關注。
而Microsoft Azure則和Intel合作,在深度學習雲端平台Project Brainwave服務中也提供以Intel FPGA為基礎架構的硬體加速服務。Amazon則也找上全球最大FPGA晶片商賽靈思(Xillinx),在Amazon Elastic Compute Cloud(Amazon EC2)中使用Virtex UltraScale+系列晶片。
中美貿易戰下,若微軟中國當真採用華為晶片,代表什麼?
另一個隱憂,則是中國的華為。不過華為和Google的威脅不同,華為繼寒武紀IP麒麟980晶片,成為全球焦點後,近日美國媒體《The information》指出,微軟和華為正商談,讓微軟中國數據中心採用華為AI晶片。
先不論消息是否屬實,這若是純商業面的消息到還好,但若牽涉到政策面,那可就嚴重了。
美國禁止政府機構及與官方合作單位採用華為與中興相關設備與產品,那有無可能中國也以此反制,外資大廠在中國地區的資料中心業務,要採用中國AI晶片,如同蘋果iCloud在中國必須由中國廠商營運。由於中美貿易戰火持續,此時傳出此消息,不能不往政策面方向思索。