今年4月,日本航空在東京羽田機場啟動為期2年的具身AI(Embodied AI)人形機器人地面勤務試行計畫,這不僅是為了解決日益嚴重的勞動力短缺,更象徵著具身AI從實驗室走進了複雜實體環境。AI不再只存在螢幕裡,機器人不再只是固定在產線上,它將嘗試學習裝卸行李、清掃機艙,甚至駕駛行李拖車,開始參與物理世界的流動。
物流,這項支撐全球貿易的「隱形基礎建設」,正處於AI變革的暴風中心。
想像你在手機上下單了一個日本禮盒。對你,這只是指尖一彈;實則,商品跨越數千公里的「歷險」:從工廠、智慧倉庫、自動化園區/港口碼頭、空海運大動脈、幹線高速公路、區域分撥中心,最後抵達你家門口的末端配送。
物流是一條端到端的供應鏈閉環。AI和具身AI 的真正價值,不僅是優化單一環節,而是如「神經系統」般串連跨場景的物件流動:從倉內收貨分揀、園區短距接駁、幹線長途運輸,到末端社區配送與空中緊急物資投遞。
所謂「具身AI」是讓演算法擁有物理實體,也可將它視為邊緣運算(Edge AI)的物理進化版。它有多種形態,不一定是人形機器人(廣義定義也包括自駕車輛及無人機等)。
具身AI由3層能力組成:感知層(Perception)融合視覺、LiDAR、雷達與多模態感測器,構建環境認知。決策層(Cognition)運用AI模型判斷目標形體、位置與操作策略。執行層(Action)則透過精準控制完成物理動作。
不同於傳統自動化只是會照劇本演出,具身AI是「目標驅動」的協作者,能針對環境變動進行臨場反應。
目前,倉庫是具身AI較成熟的戰場,常見自主移動機器人(AMR)穿梭於複雜環境中。亞馬遜在全球部署破百萬台機器人,並積極測試人形機器人執行複雜任務和人機協作。美國公司Symbotic則為沃爾瑪打造全自動「黑燈倉庫」,機器人如蜂群般協調作業。
競爭激烈的中國,京東與菜鳥導入大規模AMR與3D視覺分揀系統。結合視覺語言動作模型(VLA),智元與宇樹等的人形機器人已能聽懂自然語言指令,成為懂人話的夥伴。
活絡物流,2年內接手「3D工作」
相對開放道路,物流園區與港口環境較為規範且單純,自動化可更快實施。美國Gatik與沃爾瑪合作自動轉運系統;新加坡與洛杉磯港已部署自動貨櫃拖車日夜接駁。上海洋山港四期智慧碼頭,以數百台無人搬運車與自駕貨車精準穿梭碼頭與堆場,成為全球標竿。贏徹科技與小馬智行也將自駕貨車導入類似場域。
長途運輸是物流大動脈,也是缺工與疲勞駕駛的重災區。由於高速路線較固定,自駕較易落地。最具潛力的是「樞紐對樞紐」(Hub-to-Hub)模式:人類司機負責進出物流樞紐的接駁,L3/L4自駕系統接管長途高速路段。美國Plus、Kodiak、Bot Auto等,與中國嬴彻科技、京東、一汽解放等已累積破億公里的路線測試,以AI優化油耗和行駛安全。未來的司機將轉型為系統監控員與遠端接管專家。
末端配送是人力成本最高、也是大眾最易親近的具身AI場景。美國Starship配送機器人已累積數百萬次訂單;中國新石器無人配送車(Neolix)更於今年初突破累計1億公里;京東與美團的自動配送車亦穿梭於各園區。同時「低空經濟」崛起,美團送餐無人機在深滬常態化運行,Zipline與Wing則以無人機突破地形限制,將藥品與急件送達偏鄉。未來「貨車幹線+末端機器人/無人機」將是主流的協同模式。
加速具身AI發展的關鍵是「數位孿生(Digital Twin)」。透過如輝達Isaac Sim等模擬平台,機器人可以在進入現實世界前,先在虛擬環境中預演數千萬次,完成Sim2Real(虛擬轉現實)訓練;並藉由將真實場域數據持續反饋進行Real2Sim(現實轉虛擬)迭代。這可大幅降低部署門檻,讓中小企業也能導入適應性強的柔性AI方案。
2至5年內,具身AI有機會優先接手「3D工作」:Dangerous(危險)、Dirty(骯髒)、Dull(單調),以有效緩解物流業勞動力荒、提升整體物流效率並降低碳排,為綠色永續物流提供實質路徑。然而,惡劣環境及突發事件的「長尾情境」仍是挑戰,要求AI從規則驅動邁向自主推理。
短中期內,人類仍需要擔任例外處理的安全冗餘。同時,基礎設施必須同步升級,才能真正建立高效、安全的整體協作。此外,技術責任歸屬與國際法規框架急待完善,需要在實踐中建立安全邊界,以盡早贏得社會信任、加速產業發展。
未來5到10年內,全球物流有望實現像網路數據包一樣的「低延遲、永續的智慧流動」。數位孿生將作為大腦(神經系統),在雲端進行即時模擬優化;而具身AI機器人則作為肌肉(執行系統),在實體世界完成接力。
這是一場攸關空間與效率的實體經濟科技革命,而我們,正站在這場歷史變革的第一排。
責任編輯:陳祈安