不只是代繳停車罰單,甚至可以為使用者爭取到醫療檢查費用的9折——這是輝達開發者技術總監Nader Khalil在GTC Taipei分享的親身體驗。他笑說:「我不知道它怎麼辦到的。但省下的120美元左右,正好可以拿來繳罰單。」
這樣的個人代理,正是輝達執行長黃仁勳在主題演講描繪的圖像。他宣告「實用的AI已經到來」,並端出軟硬全套的代理基礎建設,要讓每家企業、每位員工、乃至每個人都用上AI代理——這也意味著算力需求將隨之大幅爆發。
輝達對AI代理給出簡單定義:代理=LLM+harness。也就是基礎模型加上一層稱為harness的編排骨架。如果說模型是大腦,harness則為它補上協調、情境、記憶、工具呼叫與安全控制,讓它能真的「上工」。
Khalil表示,harness的創新推動AI代理進程來到一個轉折點,「不只是(基礎)模型變得強大,也因為harness,讓強大的模型能夠與這個世界進行互動。」他舉例,機器人就可以被視為是一種harness,讓模型可以在實體世界中互動。一個已經落地的案例是自駕車:自動駕駛系統是模型,而自駕車就是搭載了自駕模型的harness。但數位世界的代理拿到的工具不是輪胎,而是瀏覽器、電子郵件與企業軟體。
今年迎來的轉折點,就在於模型能力、以及harness的創新,同時成熟到了可用的程度。
看好代理算力需求,輝達推出模型、硬體及全套工具包
輝達在2024年就曾推出NIM Agent Blueprints,協助開發人員打造及部署客製化的生成式AI應用。微服務NIM本質上也是把模型能力打包成標準化、好部署的容器,可說是為可呼叫工具與API的AI代理打下基礎。
在飽受資安質疑的開源代理框架OpenClaw基礎上,輝達因應推出「企業安全版」NemoClaw,將模型與harness打包成可用的執行環境,加上安全沙盒「OpenShell」負責設定行動政策與隱私控制。
但輝達的代理布局實則橫跨軟、硬體整合。在模型端,6月4日正式上架的Nemotron 3 Ultra是參數量達5500億的混合專家模型,適合驅動代理應用的關鍵,在於Nemotron針對OpenClaw、OpenHands等主流harness做了後訓練,支持長時間運作且跨多種應用場景的代理能力。
在硬體端,一方面推出「為代理打造」的CPU Vera,專攻高速、高效完成代理型運算、資料處理與任務編排。另一方面提供DGX Spark、RTX Spark 與DGX Station三款本地裝置,讓使用者可以安心地將機敏資料與個人AI代理安置在自有硬體上。
輝達提出的願景是:每一家企業、每一個產業板塊,都會使用自己的資料與專業,打造出專屬代理。這些代理不只為人類服務,也供其他代理使用,形成一個綿密的多代理系統。
從益華(Cadence)、西門子、新思科技(Synopsys)與達梭系統等公司,都已打造出具自主性的AI代理用於工作流。鴻海亦宣布透過NemoClaw架構驅動自家Nurabot與CoDoctor平台,透過多組AI代理團隊,支援照護協調、文件處理等工作。
輝達企業AI平台副總裁Justin Boitano指出,輝達內部的研發流程也正在因為AI代理的能力進展而重塑。過去由人類工程師分工進行的軟體開發,如今拆成一群代理協作,從設計規格、撰寫程式碼到測試與回報問題,「我們基本上是在重建端到端的軟體生命週期。」
他補充,「我認為這就是每個企業正在經歷的轉型,也就是代理可以從事有生產力的工作。」
AI代理賦能個人,打破技術與非技術背景藩籬
目前推動AI代理落地的一大瓶頸,依然是知與行之間的落差。要將看見的用例,真正落實在個人、企業的工作流中,並帶來實質生產力提升,並不那麼容易。
但Khalil也分享一個或許令人振奮的經驗。他曾在公司替同事女兒在iPad上設定代理,結果十歲的孩子做出一個兒童可用的社群平台,她們稱為「KidsGram」。
Khalil表示,令他印象最深刻的是,過去人們常有把使用者分為「有技術背景」與「無技術背景」的兩種受眾的概念,但對於從未見過終端機介面的孩子來說,這就像是另一個app而已。「她們沒有應該對這東西感到害怕的先入為主的觀念,就直接使用。」他說,「我認為我們會看到更多這類情況。因為每一個代理都具有技術能力,人們只要使用這些代理就好。」
在易於使用、可安全信任及可靠穩定中,找到理想的平衡點,將是這場代理競賽的一大決勝點。
延伸閱讀:
黃仁勳點名下一家兆元公司:Marvell是誰?台灣概念股有哪些?懶人包一次看!
輝達一顆晶片,震撼PC市場!黃仁勳揭密:我為何找聯發科做RTX Spark?
