如何精準與物體、環境互動,一直是機器人領域的聖杯,被認為是機器人及AI技術能否在現實世界發揮作用的關鍵門檻。近日一間法國新創Genesis AI發布了他們第一款機器人模型GENE-26.5,並在影片中展示了機器人打蛋、打冰沙、彈琴、玩魔術方塊等多種能力。
Genesis AI在一系列未經剪輯、一倍速播放的示範影片,展示了機器人在無人工干預下,如何執行精細如彈奏鋼琴、單手打蛋與電線組裝等複雜任務。這次的技術展示影片是使用與中國機器人公司舞肌科技合作開發的機械手臂。
模仿人手造型,展示多項高難度任務
Genesis AI是由執行長周銜及提奧菲爾.傑維特(Theophile Gervet)在2024年共同創辦的機器人公司,在法國及美國矽谷設有據點。值得一提的是,他們選擇採全端(full stack)開發策略,代表著該公司不僅研發AI模型,更自行設計機械手硬體、訓練用感測手套以及物理模擬器。
「我認為全端開發的優勢在於,當你在設計硬體時,能非常清楚AI需要什麼。」周銜指出。
Genesis AI本次發表的核心為名為GENE-26.5的AI模型。該模型被公司譽為「首個具備人類等級物理操作能力」的機器人大腦,能使機器人以極高的靈活度與精準度執行複雜、長週期的任務。
為了展示GENE-26.5的性能,Genesis AI發布了一系列的展示影片,涉及眾多高難度,要求人類水準的手部動作:
- 烹飪二十道工序料理:包含切番茄、單手打蛋,以及雙手無縫銜接的協同作業。
- 製作果昔:涵蓋食材處理、傾倒液體、啟動攪拌,並以精準的雙手控管完成杯具的空中傳接。
- 執行高精度實驗室操作:操作精密儀器進行微量移液、液體轉移,以及靈活的空中物體操縱。
- 電線組裝與佈線:將雜亂電線整理並固定成束,這被視為電子與電機工程中最具挑戰性的任務之一。
- 破解魔術方塊:在空中持續轉動方塊,展現高度複雜的即時推理能力與極其精細的手腕控制。
- 單手同時抓取多個物體:單手同時精準掌握四個大小不一的物體,並將其分類至指定的收納槽中。
- 人類水準的鋼琴演奏:以極高的流暢度與速度,完美詮釋極其複雜的鋼琴曲目。
並且影片中的內容均採「自主演示」並且一倍速播放,這意謂著影片演示並非人類遠端遙控,或者透過將機器人慢條斯理的動作加速實現。目前其動作效率與速度已達到人類的60%至70%。
不過,周銜坦承這些演示背後仍需要大量的訓練。例如,教會機器人彈奏一首新曲目大約需要一小時;而像打蛋這種複雜技能,則需要幾百組人類動作數據的軌跡記錄,搭配約30分鐘的機器人實作調整。
雖然目前在單手打蛋等極高難度動作上的成功率只有約為50%至60%,但周銜強調,這已是目前機器人領域在類人化操作上所能達到的最高水準。
根據《TechCrunch》報導,Genesis AI技術的一個關鍵在於讓機械手盡可能接近人手,而非過去常用的雙指或三指版本。周銜解釋,這讓他們避免了由於機器人與人類外型不同導致的型態落差(embodiment gap),使得模型及資料無法泛用。
獲重量級創投、前Google執行長支持
目前Genesis AI也正受到創投界關注,2025年7月他們便獲得重量級創投Khosla Ventures、Eclipse領投的1.05億美元種子輪募資。前Google執行長艾瑞克.施密特(Eric Schmidt)也是該公司的支持者之一。
施密特在Genesis AI的官方聲明中指出,通用機器人技術正在重塑全球經濟態勢,為AI發展揭開新篇章,「Genesis AI正在引領機器人領域的典範轉移,這對他們的團隊乃至整個產業而言,都是重要的里程碑。」
儘管目前機器人仍處於實驗與特定任務訓練階段,但Genesis AI已開始與多家工業夥伴洽談,計畫讓工廠員工戴上訓練手套收集真實作業數據,以加速模型的進化。
周銜預測十年之內,工廠使用的自動化機器人與家庭服務機器人在底層技術上將不再有本質區別。透過GENE-26.5及其後續版本的迭代,機器人將能跨越不同的環境,具備處理多樣化、非標準化任務的能力。
資料來源:TechCrunch、Business Insider、PR Newswire
本文初稿為 AI 編撰,整理.編輯/陳建鈞
