生成式AI(Generative AI)已經能寫詩作畫,讓人感覺科技正全速前進。然而回到現實,自動駕駛仍處於輔助階段,服務型機器人也尚未普及,AI在「動起來」這件事上,似乎顯得舉步維艱。
但這並非進展停滯,而是AI正進入難度呈幾何級跳升的新戰場:從雲端走進實體世界。產業界稱之為「實體AI(Physical AI)」或「具身智能(Embodied AI)」。廣義而言,具自主智慧的車輛、機器人及無人機,均可視為具身智能的載體。
傳統工業機器人在工廠裡執行寫死的程式(例如:座標X+30,抓取)。一旦工件偏移,傳統機器人就會抓空。未來「實體AI」則須賦予機器人視覺感測、觸覺、思考的大腦,以及執行精準動作的小腦。它要看懂螺絲、感覺抓握力道,即時決策如何調整角度將其鎖好。
台灣擁有全球最強硬體供應鏈,然而在這場「為機器人裝上大小腦」的革命中,我們該如何避免淪為單純的硬體代工廠,並在產業重組中掌握不可替代的地位?
AI為何要有感知的身體?
輝達(NVIDIA)執行長黃仁勳訪台引發的夜市追星熱潮背後,潛藏著深刻的科技趨勢。若抽離喧囂,聆聽演講核心,會發現他的思維已經從大型語言模型轉向更具破壞力的「實體AI」與「智慧機器人」。
自2025年初起,輝達陸續發布了Omniverse和Cosmos平台、Project GR00T人形機器人大腦、Isaac Lab模擬平台及開源Vision-Language-Action(VLA)Alpamayo-R1模型。訊號相當明確:AI的下一步是擁有「身體」。
目前特斯拉(Tesla)人形機器人Optimus技術仍領先一籌,但是Figure AI、Boston Dynamics、宇樹、智元、優必選等新創也不遑多讓;亞馬遜(Amazon)在物流運營中已使用總數超過100萬台、10種類型以上的機器人,包括智慧機器人及人形機器人;另一方面,特斯拉、Google Waymo、文遠知行(WeRide)、小馬智行(Pony AI)等智慧自駕企業,也加速L3+/L4車輛在美、中、歐及中東的試運營部署。
當台灣對「全世界AI伺服器與晶片都MIT」引以為傲時,危機在於:在實體AI時代,控制軀殼的「大小腦」(演算法與邊緣系統)仍掌握在矽谷或美中科技巨頭及領先新創手中。若只滿足於打造「軀體」與「組裝」,台灣恐將在價值更高的「大腦經濟」中,再次被推向微笑曲線的中間地帶。
多數人熟悉的「雲端AI」處理資訊輸出,即使出錯也能按下「重新生成」。但實體 AI必須在現實中實踐感知(Perception)、決策(Decision)與行動(Action)。
一、從「想」到「做」的毫秒競速: 實體AI必須在毫秒間做出正確反應。判斷錯誤的後果不是答錯考卷,而是自駕車撞車或工業設備損壞,甚至人身風險。將AI放進汽車與機器人,難度遠超雲端。智慧機器人如果要在家庭或醫護場所執行更多樣貌的工作,困難度愈大。因此,安全性及法規符合是必要考量因素。
二、真實世界的「不確定性」: 雲端數據是乾淨的,但現實世界充滿混亂(Chao)、不確定性(Uncertainty)。例如天氣、光影、地貌與人類行為都在變動。AI在乾淨的實驗室表現亮眼,到了真實場景卻頻頻失誤,這就是工程界最頭痛的「模擬到現實落差(Sim-to-Real Gap)」。
三、物理法則的枷鎖: 雲端AI擁有近乎無限的算力與電力。但智慧機器人必須在有限的電池續航與散熱空間內,運行高效推論。這是一場「夠快、夠準、夠省電、更要耐用」的極限挑戰。
儘管如此,美、中、歐,乃至中東國家,均持續投入大量資源,因為這是一場關乎未來數十年,全球經濟結構改變的長期布局:智慧駕駛重塑移動產業,機器人填補勞動力缺口,智慧工廠則改寫供應鏈效率。
從《駭客任務》看技術斷層,Sim2Real模擬仍是美中主場
教智慧機器人「走路」與教ChatGPT「對話」邏輯截然不同。在真實世界訓練機器人,每摔一次都是昂貴的硬體維修與時間成本,更不用提實體訓練自駕車了!
這引出了全球實體AI競爭的核心:模擬(Simulation)。如同電影《駭客任務》,科技巨頭正打造物理精確的虛擬世界。牛頓力學、摩擦力與重力都與真實無異。開發者在雲端虛擬道場置入上萬個虛擬機器人,進行加速「平行訓練」。等AI練成「動作大師」,再將模型下載到真實軀殼中。
這個「從虛擬到實體(Sim2Real)」的下載過程,目前制高點掌握在輝達、特斯拉、Google、亞馬遜、百度等科技大廠及領先新創手中。台灣製造了很好的硬體,卻極度缺乏供硬體「受訓」的虛擬平台。
檢視台灣產業地圖,我們正處於矛盾的交叉口:
- 晶片與算力(Brain Power):台積電與IC設計廠提供硬體基礎,我們是AI的心臟。
- 軀幹與關節(Body):上銀、台達電、達明、東元等在精密機械有一定基礎,但跨入仿生結構及關鍵模組,能力仍須升級擴大。
- 大腦與訓練場(Mind & Simulation):這是最嚴重的缺席。訓練機器人的模擬平台與基礎模型,台灣幾乎沒有發言權。
4潛能贏在起跑點!要讓AI客戶來台「留學」
若將實體AI產業畫成微笑曲線(下圖):左端為關鍵智慧組件、AI模型、模擬平台(高毛利、高技術門檻);右端是品牌定位、特定場景應用與服務(高毛利、高顧客黏著度);中央則是硬體組裝與製造(毛利受壓)。
台灣必須向左右2端提升。掌握「大小腦」的公司靠軟體更新賺取訂閱費;硬體廠商若無關鍵的智慧組件(Intelligent Components)技術,只是賺取辛苦的加工錢。當機器人需要學習新技能,客戶付錢的對象是軟體供應商,而非硬體商。
真正的競爭在於系統整合與數據獲取能力。實體AI是感測器、晶片、即時控制與機構設計的馬拉松。台灣雖非舞台中央的品牌大國,卻占據極佳的戰略支點:
一、工業元宇宙的造物主: 台灣擁有全球羨慕的寶藏「場域數據(Domain Data)」。矽谷軟體人才多半沒進過晶圓廠或紡織廠,不了解機台震動或螺絲成型的細節。台灣廠商應盡速數位化累積數十年、跨產業製造領域的資料及「隱性知識」(Tacit Knowledge),建立多層次「數位雙生(Digital Twin)」模型。
我們不只賣手臂,而是賣「整廠輸出的數位分身」,讓全球客戶在台灣打造的虛擬世界中建廠測試,這就是高附加價值的服務。
二、邊緣AI(Edge AI)的軟硬整合平台: 實體AI不能依賴雲端。台灣應發揮IC設計強項,開發專屬實體AI的系統晶片(SoC),將感知與推論整合在低功耗晶片內,定義智慧機器人的「小腦」與「反射神經」。掌握這些感測器融合與推論平台,才是產業鏈不可或缺的基礎。
三、從自動化躍遷為「智動化」的賦能者: 台灣中小企業擁有隱形冠軍級別的工藝數據。機會在於成立專注特定垂直領域的AI應用公司。教AI如何進行複雜拋光或極限組裝,其模型價值遠高於硬體本身。
四、關鍵智慧組件的標準定義者: 實體AI的核心不在於外殼,而在具備感知的智慧組件,以台灣累積的能力,應可推展具備即時推論能力的智慧組件,在毫秒內完成感知與反射,成為智慧機器人的「反射神經系統」,如內建視覺與力覺融合推論的「智慧夾爪」、可自主調整阻尼/預測動態負載的「AI關節模組」、具備情境辨識與即時補償能力的「感測融合模組」等。
台灣的上一代,在艱難中打造了全球科技硬體帝國,其歷程令人驕傲且動容。新一代科技人與政府決策者,則面對著AI這個更寬廣、挑戰性更大的舞台。
想蛻變「智慧碩造者」,須納物理、遊戲、傳藝設計力
理解實體AI,是如何在未來經濟中建立關鍵定位的嚴肅課題。未來的競爭,不只追求良率,更要懂物理、懂遊戲設計(模擬場景)、懂傳統工藝(訓練函數)的人才。下一座護國神山,未必是一家單獨的公司,而可能是一個實體AI生態系。
當全球自駕車廠與智慧機器人新創,願意選擇台灣提供的訓練場景與運算平台,台灣就能從硬體製造者晉升為「智慧碩造者」。當全球AI客戶都想來台灣「留學」,學習如何與物理世界相處時,我們才真正掌握了這場工業革命的入場券。
責任編輯:蘇柔瑋