黃仁勳宣告「實用的AI已經到來」!輝達端出模型、硬體及全套工具包,迎戰代理商機
黃仁勳宣告「實用的AI已經到來」!輝達端出模型、硬體及全套工具包,迎戰代理商機

不只是代繳停車罰單,甚至可以為使用者爭取到醫療檢查費用的9折——這是輝達開發者技術總監Nader Khalil在GTC Taipei分享的親身體驗。他笑說:「我不知道它怎麼辦到的。但省下的120美元左右,正好可以拿來繳罰單。」

這樣的個人代理,正是輝達執行長黃仁勳在主題演講描繪的圖像。他宣告「實用的AI已經到來」,並端出軟硬全套的代理基礎建設,要讓每家企業、每位員工、乃至每個人都用上AI代理——這也意味著算力需求將隨之大幅爆發。

輝達對AI代理給出簡單定義:代理=LLM+harness。也就是基礎模型加上一層稱為harness的編排骨架。如果說模型是大腦,harness則為它補上協調、情境、記憶、工具呼叫與安全控制,讓它能真的「上工」。

agent briefing 2.jpg
輝達開發者技術總監Nader Khalil積極探索代理在個人與企業場景中的應用。
圖/ 記者拍攝

Khalil表示,harness的創新推動AI代理進程來到一個轉折點,「不只是(基礎)模型變得強大,也因為harness,讓強大的模型能夠與這個世界進行互動。」他舉例,機器人就可以被視為是一種harness,讓模型可以在實體世界中互動。一個已經落地的案例是自駕車:自動駕駛系統是模型,而自駕車就是搭載了自駕模型的harness。但數位世界的代理拿到的工具不是輪胎,而是瀏覽器、電子郵件與企業軟體。

今年迎來的轉折點,就在於模型能力、以及harness的創新,同時成熟到了可用的程度。

看好代理算力需求,輝達推出模型、硬體及全套工具包

輝達在2024年就曾推出NIM Agent Blueprints,協助開發人員打造及部署客製化的生成式AI應用。微服務NIM本質上也是把模型能力打包成標準化、好部署的容器,可說是為可呼叫工具與API的AI代理打下基礎。

在飽受資安質疑的開源代理框架OpenClaw基礎上,輝達因應推出「企業安全版」NemoClaw,將模型與harness打包成可用的執行環境,加上安全沙盒「OpenShell」負責設定行動政策與隱私控制。

build a claw.jpg
GTC Taipei 特有專為AI代理規劃的展區。
圖/ 記者拍攝

但輝達的代理布局實則橫跨軟、硬體整合。在模型端,6月4日正式上架的Nemotron 3 Ultra是參數量達5500億的混合專家模型,適合驅動代理應用的關鍵,在於Nemotron針對OpenClaw、OpenHands等主流harness做了後訓練,支持長時間運作且跨多種應用場景的代理能力。

在硬體端,一方面推出「為代理打造」的CPU Vera,專攻高速、高效完成代理型運算、資料處理與任務編排。另一方面提供DGX Spark、RTX Spark 與DGX Station三款本地裝置,讓使用者可以安心地將機敏資料與個人AI代理安置在自有硬體上。

輝達提出的願景是:每一家企業、每一個產業板塊,都會使用自己的資料與專業,打造出專屬代理。這些代理不只為人類服務,也供其他代理使用,形成一個綿密的多代理系統。

從益華(Cadence)、西門子、新思科技(Synopsys)與達梭系統等公司,都已打造出具自主性的AI代理用於工作流。鴻海亦宣布透過NemoClaw架構驅動自家Nurabot與CoDoctor平台,透過多組AI代理團隊,支援照護協調、文件處理等工作。

輝達企業AI平台副總裁Justin Boitano指出,輝達內部的研發流程也正在因為AI代理的能力進展而重塑。過去由人類工程師分工進行的軟體開發,如今拆成一群代理協作,從設計規格、撰寫程式碼到測試與回報問題,「我們基本上是在重建端到端的軟體生命週期。」

他補充,「我認為這就是每個企業正在經歷的轉型,也就是代理可以從事有生產力的工作。」

延伸閱讀:讓你的AI越用越聰明!Hermes Agent是什麼?跟OpenClaw差在哪?安裝步驟一次看

AI代理賦能個人,打破技術與非技術背景藩籬

目前推動AI代理落地的一大瓶頸,依然是知與行之間的落差。要將看見的用例,真正落實在個人、企業的工作流中,並帶來實質生產力提升,並不那麼容易。

agent briefing 1.jpg
輝達開發者技術總監Nader Khalil積極探索代理在個人與企業場景中的應用。
圖/ 記者拍攝

但Khalil也分享一個或許令人振奮的經驗。他曾在公司替同事女兒在iPad上設定代理,結果十歲的孩子做出一個兒童可用的社群平台,她們稱為「KidsGram」。

Khalil表示,令他印象最深刻的是,過去人們常有把使用者分為「有技術背景」與「無技術背景」的兩種受眾的概念,但對於從未見過終端機介面的孩子來說,這就像是另一個app而已。「她們沒有應該對這東西感到害怕的先入為主的觀念,就直接使用。」他說,「我認為我們會看到更多這類情況。因為每一個代理都具有技術能力,人們只要使用這些代理就好。」

在易於使用、可安全信任及可靠穩定中,找到理想的平衡點,將是這場代理競賽的一大決勝點。

延伸閱讀:
黃仁勳點名下一家兆元公司:Marvell是誰?台灣概念股有哪些?懶人包一次看!
輝達一顆晶片,震撼PC市場!黃仁勳揭密:我為何找聯發科做RTX Spark?

關鍵字: #COMPUTEX #Nvidia
往下滑看下一篇文章
AI 成為企業新基礎設施,勤英科技從雲端代理走向 AI Infra 整合
AI 成為企業新基礎設施,勤英科技從雲端代理走向 AI Infra 整合

因應生成式 AI、代理式 AI 與實體 AI 的崛起,模型成為企業資訊基礎設施的一環,企業不僅需要算力、還必須具備同時管理多個 AI 模型、優化營運成本,以及確保 AI 基礎設施的安全與穩定;有鑑於此,服務超過 2,000 家企業客戶上雲的勤英科技(ELITE CLOUD)將業務範疇從雲端代理延伸到 AI 基礎設施整合商,協助企業整合多元模型資源、因應不同應用場景彈性調度算力資源,在 AI 新世代建立可規模化的 AI Infra 能力。

「隨著 AI 從單一聊天機器人進化到多模型、多代理協作,企業的核心競爭力不再僅是擁有 AI,而是建立一套可管理、多模型共存、穩定、安全且可持續擴充的 AI Infra 環境。」勤英科技區域總經理黃士培表示,為協助更多企業推進 AI 創新實務,勤英科技從原本的 AWS、Google Cloud、Azure 雲端代理角色,進一步轉型為 AI 基礎設施整合服務商,透過多語言模型平台 MixRoute、代理式 AI 導入與企業資料治理服務,協助企業建立真正可落地、可管理、可擴展的 AI 應用架構。

從 IT Infra 到 AI Infra,企業最大挑戰不是模型、算力而是管理

過去幾年,許多企業透過生成式 AI 實現「問問題」、「摘要文件」、「生成簡報」,提升員工工作績效,而代理式 AI 的崛起與普及,則讓「內嵌 AI 的企業應用」快速成為新常態,從企業資源規劃(ERP)、顧客關係管理(CRM)、人力資源(HR),到客服、研發甚至製造系統,AI 開始深度嵌入各類企業應用,AI 扮演的角色也從單純的輔助工具,逐漸進化為企業營運與決策流程的重要核心。

也因此,企業保持未來競爭力的關鍵,不再是「有沒有導入 AI」,而是「是否具備管理 AI 的能力」,包括如何讓多模型共存、如何控管 Token 成本、如何確保資料品質與一致性、如何依不同部門需求配置 Agent,以及如何避免 AI 成為新的資訊孤島,都是企業導入 AI 後的新挑戰。

「Gemini、Claude、OpenAI、Mistral 等模型快速迭代,意味著企業若只押注單一模型,未來很可能在成本、效能與彈性上失去優勢。」勤英科技區域總經理黃士培表示,企業接下來更需要以「Models as Infrastructure(模型即基礎建設)」的思維,將大型語言模型視為與運算、儲存、網路同等重要的基礎資源來規劃、治理以及進行成本管理,將資訊系統架構重塑為 AI 基礎建設。

勤英科技_內文1.JPG
圖/ 數位時代

勤英科技服務的客戶數超過 2,000 家,不少客戶已導入 AI 應用服務,正積極建置 AI Infra 與管理環境,因此,勤英科技自 2025 年積極轉型,將 AI Infra 視為企業長期競爭力的基礎建設來經營,業務範疇從傳統雲端代理擴展至 AI Infra 整合服務商,例如與多模型平台 MixRoute 合作,並開發可支援單一登入(SSO)、彈性調度不同大型語言模型 Token 的管理平台,協助企業簡化模型管理與成本控管,將更多資源與心力聚焦於核心業務與創新應用。

從雲端代理走向 AI Infra 整合,勤英科技從三面向協助企業發揮 AI 綜效

有鑑於 AI 應用與雲端環境息息相關,勤英科技除因應企業客戶的多雲策略協助管理多雲環境、優化成本,以及落實資安治理,更因應不同使用情境推出三種 AI 方案助力企業:

第一:提供開箱即用的 AI 服務。

黃士培以 Google Cloud 的產品為例解釋,透過整合 Gemini 的 Google Workspace,企業可直接在 Gmail、Meet、Docs、Sheets、Slides 中使用 AI 功能,包括會議摘要、文件生成、簡報整理等,快速提升員工生產力,同時,增強企業對 AI 應用的信心,為之後的應用深化做準備。

第二:協助企業規劃、打造與導入代理式 AI 應用服務。

「對於擁有豐沛結構化數據資料、知識庫的企業來說,除以生成式 AI 打造企業大腦,還會透過代理式 AI 提升自動化執行能力,重塑工作效率。」黃士培表示,勤英科技可以基於 Google Gemini Enterprise,提供含括底層雲端架構、AI 模型調度、資料治理與 AI Agent 串接等服務,讓企業員工可以自然語言安全調用企業資料,讓 Agent 進一步執行任務與推動流程。

舉例來說,勤英科技協助在台灣成立超過 50 年的製造業品牌商將 Gemini Enterprise 介接 SAP 與 Salesforce 訓練模型、建立可供 AI 調用的企業知識中樞;另在影音內容生成領域,勤英科技亦協助客戶導入 AI 自動化技術,將內容產製成本縮減達 90%。

第三:提供多模型聚合管理平台,滿足企業以 API 串連各種模型的需求。

勤英科技與新加坡 MixRoute 合作,提供企業客戶多模型管理平台,讓企業可以視需求彈性敏捷的調度 Gemini、Claude、OpenAI 等不同模型,並透過單一帳號、單一帳單與 Budget Alert 機制,管理 token 使用量與 AI 成本。

勤英科技_內文2.JPG
圖/ 數位時代

「透過我們提供的多模型管理平台,企業客戶不會被單一模型綁定,可以在模型快速疊代的環境下,更靈活地管理成本與算力資源。」黃士培如是說道。

總的來說,隨著 AI 應用從單點工具走向大規模企業部署,下一波競爭核心將從模型能力延伸至 AI 基礎設施管理能力,而這也是勤英科技從雲端代理走向 AI Infra 整合服務商背後的核心原因:當 AI 開始成為企業營運的一部分,企業需要的,已不只是模型供應商,而是能協助串接雲端、資料、Agent 與應用場景的長期技術夥伴。

有關更多勤英科技相關資訊,請查詢網站:https://www.elite.cloud/zh/

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
代理式商務連動百兆商機
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓