NVIDIA執行長黃仁勳:Google TPU在內的AI晶片都有其侷限性
NVIDIA執行長黃仁勳:Google TPU在內的AI晶片都有其侷限性
2018.05.30 | Google

NVIDIA執行長黃仁勳出席技術大會(GTC)之後的記者會強調,「人工智慧的世界很大,我們的焦點不是手機等物聯網產品,而是大規模的雲端資料中心。」

黃仁勳還指出包括Google TPU在內的各種AI專用晶片都有其侷限性,「NVIDIA致力於一般用途的通用GPU,可以用在任何的神經網絡上,而非僅有CNN網絡上。」

記者參與了大會演說和記者會後,僅有一個感想:就是不要再拿Google TPU類比NVIDIA GPU了。

不要再拿Google TPU比較NVIDIA GPU

因為兩者不僅從專用與通用AI晶片本質不同,發展取向也不同,Google TPU就算已經發展到第三代,重心還是圍繞自家產品與服務,和NVIDIA成為每個地方(everywhere)與多功能的發展取向不同。

NVIDIA要以其開放合作的精神,進攻10億美元的超級運算產業,鞏固包括Google在內的大規模與高速運算資料中心客戶,或成為醫療、自駕車領域夥伴的處理器平台,對於虛擬貨幣挖礦與自駕車感測器等領域晶片不感興趣。

看好高端資料中心產品,售價達1200萬台幣的DGX-2

NVIDIA並未走向FPGA與ASIC等專用晶片研發,而是持續投入更高運算效能的GPU產品,被黃仁勳稱為「世界上最強的,有史以來最大的GPU」的NVIDIA DGX-2系統。

這個史上最強的GPU主要在於GPU「雙向傳輸」技術NVLink Switch的突破。NVIDIA利用此技術將把16個GPU連結為單一且都可1對1點雙向傳輸的GPU。「若相比五年前的AlexNet採用GTX 580s系統需要六天的訓練時間,使用此產品僅需要18分鐘,在五年內,速度提升500倍。」黃仁勳說。「訓練時間大幅度縮短,在推論部分將推論延遲縮短到1.1毫秒,推論速度為每秒6250個影像。」

NVIDIA DGX-2重達350磅,單手難以舉起,每個GPU都可以用每秒300GB的速度運算,也是世界上第一個2PFLOPS (petaFLOPS,等於每秒1千萬億次的浮點運算)系統。那售價呢?黃仁勳指出,NVIDIA DGX-2效能略等於300萬台雙CPU伺服器,前者售價為39.9萬美元,後者成本高達300萬美元。

四家頂尖伺服器廠商包括聯想、雲達(QCT)、美超微(Supermicro)與緯穎 (Wiwynn)等伺服器廠都已推出基於DGX-2設計的系統,而富士康、英業達、廣達與緯創正開發中。

看淡挖礦市場:虛擬貨幣市場僅是額外的紅利

相較於資料中心產品的熱烈推銷,黃仁勳對於近來竄紅的挖礦需求看得很淡。受到挖礦熱潮影響,NVIDIA GPU市場價格水漲船高,Susquehanna分析師 Christopher Rolland 曾指出GPU市價較官方售價高出40%~70%,NVIDIA公布的2018年第一季財報時也指出挖礦GPU營收為2.89億美元。


不過NVIDIA並未看重這種「來得快,去得也快」的挖礦財,不僅會中對於加密貨幣隻字未提,黃仁勳還強調,「虛擬貨幣市場對我們來說本來就是額外的紅利(Bonus),因此如果沒有也沒有關係,我們在其他市場成長性很高。」

「GPU價格走跌對我們來說是好事,過於昂貴的GPU會導致電競玩家無法負擔,我們的GPU是專為電競玩家打造的。」黃仁勳說。

由於加密貨幣價格波動大,讓挖礦GPU需求起伏不定,礦工在乎的是GPU C/P值品牌忠誠度低,加上比特大陸等廠商紛紛ASIC等挖礦專用晶片市場,這些都是NVIDIA看淡挖礦需求的背後主因。

NVIDIA不會研發車用光達晶片

而在自駕車領域,NVIDIA也一貫維持其「通用」的精神,強攻NVIDIA DRIVE Xavier平台,但不會進軍光達晶片等專用垂直領域。

光達(Lidar)成本是自駕車感測硬體最高的部分,現今的機械式64線光達價格達8萬美元以上,業界認為若機械式光達晶片化後,價格將有機會低至500美元,意法半導體與Intel紛紛加入研發行列。


黃仁勳很明確地指出,「我們不會投入資源研發光達晶片」。

黃仁勳指出,人類利用耳朵、眼睛與皮膚等多重感官,精準感受這個世界,自駕車也雷同,需要多種感測器相輔相成,舉例來說,雷達對於移動(Motion)的感測很好,但解析度不夠高,光達可以看很遠,但解析度低,而照相機解析度高,但易受光影與氣候影響。因此NVIDIA會截長補短和廠商共同合作,把多種感測器融合在NVIDIA產品裡。

關鍵字: #Google #Nvidia
往下滑看下一篇文章
晶片裡的「隱形守護者」!從車用、物聯網到AI人工智慧,看上峰科技如何靠I-fuse®打開新局
晶片裡的「隱形守護者」!從車用、物聯網到AI人工智慧,看上峰科技如何靠I-fuse®打開新局

在電動車的感測系統、物聯網中的無電池標籤,以及AI伺服器的高速記憶體修復技術中,都有一個極其微小、幾乎難以用肉眼辨識的元件,默默地發揮關鍵作用。它負責確保系統功能的正確運作,並保護資料的安全性。這個不起眼卻不可或缺的元件,就是「單次可燒錄記憶體」(OTP)。

想像一下,當你坐在自動駕駛的電動車裡,這台移動的智慧裝置正以每小時100公里的速度行駛。它的感測系統、電池管理與安全控制,全仰賴晶片裡的數十億個電晶體協同運作。然而在這些肉眼不可見的微觀世界中,有一個被稱為「功能保險絲」的關鍵元件,如果它的數據在出廠後因高溫或電壓變化而悄悄「跑掉」,將可能在高速行駛下可能造成無法挽回的危險 。

當晶片製程往先進節點發展,傳統OTP技術隨製程微縮而暴露出可靠度與壽命的瓶頸。過去在成熟製程表現穩定的方案,進入7奈米或更先進的製程後,讀取壽命竟從理論上的「無限次」驟降至僅能維持數秒,突顯現有技術難以因應先進製程需求,對需要長期穩定運作的車用與工業應用而言是不可承受的風險。作為矽智財供應商的上峰科技,正是專注於這項關鍵技術的代表之一,其專利OTP技術已被應用於車用電子、物聯網裝置、AI與高可靠性工業設備等多個領域,為全球客戶提供穩定且可持續的解決方案 。「我們的目標是讓OTP在先進製程中一樣可靠,甚至比以前更好。」上峰科技創辦人暨董事長莊建祥開門見山地說。

以電遷移取代爆炸,上峰科技重寫OTP的可靠性

不同於傳統電子熔絲(eFuse)依靠高電流「爆炸式」燒斷導體,或反熔絲(Anti-fuse)以高電壓擊穿氧化層,上峰科技的I-fuse®解決方案採用低於熔斷點的熱輔助電遷移機制。簡單來說,就是用較低的電流與電壓,讓金屬原子在導線內緩慢遷移並改變阻值,而不是粗暴地炸斷它。

莊建祥解釋到,不同於eFuse的「爆炸式」斷裂,I-fuse®的方式更像是一種「緩慢推動」金屬原子的遷移,過程溫和卻能精準改變阻值。因為沒有爆炸,自然就沒有金屬碎屑或自我接回的風險,編程狀態因此能長期保持穩定;而在過程中所需的電壓與電流也遠低於傳統技術,無需高壓電路與內建電荷泵,讓系統設計更簡潔、功耗更低。

他進一步談到,I-fuse®還能在讀取過程中模擬燒錄狀態,所謂的"假燒”,產生類似靜態隨機存取記憶體(Static Random-Access Memory, SRAM)的重複讀寫測試模式,對整個OTP區塊進行全面檢測,確保每一顆出廠的OTP在進入車用或其他高安全性應用之前,都已經通過完整的可靠度驗證,以達成"零缺陷”。過去十多年,I-fuse®已在多種製程節點完成驗證,包括成熟製程與高介電常數金屬閘極(High-k Metal Gate, HKMG)節點。2023年,上峰科技也曾宣布I-fuse®成功在12奈米鰭式場效電晶體(Fin Field-Effect Transistor, FinFET)製程完成矽驗證,不僅延續低成本與設計彈性的優勢,也證明即使在先進製程下,仍能以極小面積支援業界優異的低操作電壓,且無需額外光罩與電荷泵。

不過隨著製程微縮,金屬線寬與高度同步縮小,對爆炸式燒斷的OTP而言是嚴峻挑戰,卻讓 I-fuse®的電遷移機制更得心應手,莊建祥表示當線條越細,越容易在低電壓下完成燒錄,因此上峰科技有足夠的信心能直接從12奈米跨入7奈米,並規劃向3奈米、甚至環繞式閘極(Gate-all-around, GAA)與FinFET架構前進。

計畫助攻跨入7奈米,I-fuse®應用版圖持續擴張

上峰科技聚焦標準邏輯製程,I-fuse® 助力解決晶片製程轉換關鍵挑戰。
上峰科技聚焦標準邏輯製程,I-fuse® 助力解決晶片製程轉換關鍵挑戰。
圖/ 數位時代

而這次的跨越,正是因為有經濟部產業發展署推動的「驅動國內IC設計業者先進發展補助計畫」(以下簡稱晶創IC補助計畫)協助。莊建祥坦言,對規模不大的IP業者而言,先進製程開發風險高、投入成本大,如果沒有外部資源挹注,很難同時負擔研發與驗證。「晶創IC補助計畫」不僅減輕了資金壓力,更讓上峰科技能集中火力解決7奈米製程的關鍵挑戰,包括更嚴格的設計規範與更密集的繞線限制。

「只要製程允許,我們的技術就能做。」莊建祥強調,I-fuse®採用晶圓廠提供的標準邏輯製程材料,不需改變製程或額外光罩,因此對製程轉換的適應速度遠優於其他OTP技術。「別人可能要花三、四年才能適應新的製程架構,我們幾乎可以無縫切換。」

OTP雖小但其用途極廣。在車用感測器中,它是確保不同零件出廠後能進行精準校正的關鍵;在 AI 伺服器與高速運算晶片裡,它能修補記憶體陣列中損壞的位元,延長晶片壽命;在物聯網無電池的裝置中,I-fuse®以極低讀取電壓(0.4V / 1µW)就能運作,適合能量收集環境。莊建祥更明確指出,I-fuse®未來將持續鎖定Wi-Fi裝置、微控制器單元(Microcontroller Unit, MCU)等對低功耗與高可靠性有高度需求的市場,與現有的車用與工業應用形成互補布局。

在全球晶片供應鏈中,OTP 是與輸入/輸出函式庫(I/O Library)、標準單元庫、靜態隨機存取記憶體編譯器(SRAM Compiler) 並列的「四大基礎 IP」之一,幾乎每顆晶片都需要。掌握這項技術,不僅是產品設計的靈活度,更關乎先進製程的導入速度與成本控制。上峰科技的策略是在穩固現有國際客戶基礎上,藉由「晶創IC補助計畫」加速進入7奈米,並持續向更先進節點前進。透過低功耗、高可靠性的 I-fuse®,讓臺灣有機會在先進製程OTP技術上,取得與國際一線供應商並肩甚至領先的地位。

「我們希望成為各種應用場景中,最可靠、最靈活的OTP解決方案。」 莊建祥說。從成熟製程到 7 奈米,從車用到AI與IoT,這顆小小的OTP正承載著臺灣在先進製程中的另一項關鍵優勢。

|企業小檔案|
- 企業名稱:上峰科技
- 創辦人:莊建祥
- 核心技術:專注於OTP矽智財的研發
- 資本額:新台幣2億元
- 員工數:46人

|驅動國內IC設計業者先進發展補助計畫簡介|
由國科會協調經濟部及相關部會共同合作所提出「晶片驅動臺灣產業創新方案」,目標在於藉由半導體與生成式AI的結合,帶動各行各業的創新應用,並強化臺灣半導體產業的全球競爭力與韌性。在此政策框架下,經濟部產業發展署執行「驅動國內IC設計業者先進發展補助計畫」,以實質政策補助,於113年鼓勵業者往AI、高效能運算、車用或新興應用等高值化領域之「16奈米以下先進製程」或「具國際高度信任之優勢、特殊領域」布局,以避開中國大陸在成熟製程的低價競爭,並提升我國IC設計產業價值與國際競爭力。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓