2026年初,OpenAI發表了一項震撼業界的內部實驗:短短5個月,僅靠3位人類工程師,AI就自動生成了高達100萬行的程式碼,期間人類沒有親自手打任何一行,整體開發時間大幅縮減至傳統方式的1%。
這3位工程師最重要的工作並非寫程式,而是為 AI 設計一套能好好工作的環境與規範,OpenAI將這套方法論稱為「駕馭工程」(Harness Engineering)。
近年企業導入AI往往陷入追求最強模型的迷思,但業界逐漸發現,AI本身其實已經夠強,真正決定成敗的,是有沒有給設定一套好的「教練團跟戰術體系」,而駕馭工程就是引導AI發揮實力的關鍵方法。
本期《數位時代》特別邀請AWS社群英雄蔣鐙緯(Ernest),以其深厚的雲端與架構經驗深度拆解,從Vibe Coding到駕馭工程的技術演進、駕馭工程的三大支柱、AI代理人的分工邏輯,以及台灣企業在AI時代如何克服認知債。
以下Q為《數位時代》提問,A為AWS社群英雄蔣鐙緯的回答。當AI模型逐漸成為大眾商品,企業該如何透過駕馭工程,建立真正的護城河?
Q1:什麼是「駕馭工程」?為什麼它現在會成為業界焦點?
A:過去一年,業界經歷了從極度樂觀到焦慮的戲劇性過程。去年初,業界開始流行「Vibe Coding」,也就是開發者憑直覺下指令,完全交給AI來寫程式碼。
但蜜月期很短,隨之而來的是各種災難,例如AI寫出的程式出現大量資安漏洞,甚至有AI因為權限過大而刪除了整個資料庫。業界開始意識到,完全放任AI自由發揮是不行的。
為了解決這個問題,業界逐漸摸索出「AI代理人」(AI Agent)的架構,而OpenAI則在今年將這套體系正式命名為「駕馭工程」。
「Harness」這個字原本指的是馬具(如韁繩、馬鞍、馬鐙)。馬本身充滿力量且聰明,會自己躲避障礙,但人類需要透過馬具來引導牠的力量,朝正確的方向前進。這不是壓制或控制,而是一種借力使力的協同與引導。
如果把 AI 模型比喻為天才球員,Harness就是圍繞著這位球員的教練團與戰術體系。球員天賦再高,若沒有教練團設計戰術、設定規則,最終只會淪為個人英雄主義的單打獨鬥。
Q2:駕馭工程的核心方法論是什麼?我們該如何建構這套「戰術體系」?
A:軟體顧問公司Thoughtworks的專家Birgitta Böckeler為駕馭工程梳理出了一個非常完整的框架,我們可以將其拆解為三大支柱:
支柱一:上下文工程(Context Engineering)。 這就像是球探報告或戰術手冊。從AI的角度來看,它沒讀到的資訊就等於不存在。因此,我們必須為AI準備一份清晰的地圖(例如業界逐漸形成標準的agents.md檔案),告訴它遇到什麼任務該去哪裡找資料、該採取什麼策略,而不是塞給它一本幾千行的百科全書讓它迷失。
支柱二:架構與約束強制執行(Architectural Constraint Enforcement)。 這相當於球場規則與裁判機制。我們必須為AI設立嚴格的分層規則與邊界,定義什麼可以做、什麼必須先詢問人類。有趣的發現是,這些明確的框框條條並不會讓AI變弱,反而能讓它更有效率地發揮極強的戰鬥力。
支柱三:垃圾回收與迭代(Garbage Collection)。 AI在執行任務的過程中,難免會產生許多瑣碎、重複或錯誤的「垃圾」數據。這就像比賽結束後的賽後檢討,我們必須定期清理這些技術債,從失敗中提取經驗,進而迭代出下一版的限制條件與架構。技術債就像高利貸,定期清理才能讓系統越跑越順。
Q3:在實務操作上,當任務變得龐大且耗時,該如何讓AI分工合作,避免它「忘記」原本的目標?
A:AI模型目前的痛點之一是「工作記憶」(Context Window)有限。如果把所有任務和資訊塞給同一個AI,它最後就會像大腦當機一樣無法決策。
因此,我們必須導入 「子代理人」(Sub-agent) 的概念,並建立情境防火牆(Context Firewall)。我們不會把大任務整坨丟給單一AI,而是由一個「主要Agent」(如總教練)根據agents.md的地圖,將任務拆解發包給不同的「子Agent」(如體能教練、打擊教練)。子Agent在自己的專屬領域裡試錯、執行,只要把最終的判斷結果回報給總教練即可。
為了確保交接不出錯,大語言模型在軟體間的資料交換上,會大量使用格式嚴謹的JSON。不同於人類溝通用的Markdown,JSON具有清晰且嚴格的格式,AI在讀取這類結構化資料時不敢隨意更動,這能大幅降低代理人之間交接任務時的錯誤率。
Q4:在AI執行任務的過程中,我們該如何看待它的失誤?OpenAI實驗中提到的「孔安迴圈」是什麼?
A:「孔安迴圈」(Ralph Wiggum Loop)是一個非常經典且帶有人性化的概念。「孔安」是動畫《辛普森家庭》裡的角色,他天真、反應稍慢,但極度執著,搞砸了也不放棄,會不斷嘗試。
在駕馭工程中,我們不強求AI一次到位。當我們指派任務給AI後,它可能會失敗,這時系統會將錯誤記錄下來(留下log),分析哪裡做錯,並在下一次嘗試時避開同樣的錯誤,直到滿足條件為止。這是一種AI的自我審查與反覆迭代。
這就像棒球場上球員在牛棚裡反覆練投,透過影片回放不斷微調姿勢,直到形成肌肉記憶。我們允許AI撞牆,重要的是它能從錯誤的迴圈中學習並完成任務。
Q5:當市場上越來越多強大的AI模型出現,企業真正的護城河在哪裡?工程師的角色又會發生什麼轉變?
A:我常跟企業主用「帶新進員工」的過程,來比喻這幾年 AI 工程的迭代關係:
- 提示工程(Prompt Engineering):就像「面試新同事」,你丟幾個指令或問題給他,觀察他的反應,試著測出他的優點、缺點與強項。
- 上下文工程(Context Engineering):就像新員工「剛報到的前幾週」。你帶他認識公司環境、提供參考資料(如agents.md),讓他知道公司的SOP,熟悉工作的地圖。
- 駕馭工程(Harness Engineering):當這位員工上手後,你指派他去「成立新部門或分公司」。你不再手把手微管理,而是設立明確的邊界、給予目標與限制條件,讓他自己在範圍內發揮、迭代,甚至帶領其他子代理人去創造業績。
正因為建構這套管理體系需要長時間的磨合與經驗累積,現在我們深刻感受到, 模型本身已經變成一種大眾商品,如何建構這套駕馭體系,才是企業真正的護城河 。
就像所有半導體廠都能買到最先進的ASML曝光機,但台積電的良率就是比較高,因為護城河在於經驗值與管理細節的累積。換一個更強的AI模型,短期內絕對能看到降本增效;但長遠來看,軟體工程師與經理人的角色,已經從「親自下場打球的球員」,轉變為「球隊教練」。
我們必須學會精確描述任務、設計系統架構,並將大部分時間花在驗證與審查成果上。這對所有工作者來說,都是思維層次上的一次大升級。
Q6:面對AI帶來的全新工作模式,台灣企業導入AI時最大的挑戰是什麼?該如何跨越「認知債」?
A:台灣企業最大的挑戰在於基礎建設不足,也就是「沒有檔案與SOP」。很多公司的眉角與流程都存在老員工的腦袋裡,對AI來說,沒有寫成文件(如agents.md檔案)的資訊就是不存在。如果不建立書面文化,再強的 AI 也無法發揮作用。
更深層的危機是「認知債」(Cognitive Debt)。當AI產出程式碼與資料的速度遠超過人類吸收的速度,真正理解公司系統架構的人會越來越少。如果系統全部交由AI運作,一旦某天出了嚴重問題,人類可能會完全不知道該如何修復。
解決之道在於,人類的認知必須跟著提升。我們不能因為AI能力強就選擇「躺平」。AI替我們省下了大量重複勞動的時間,我們就應該把這些時間投資在擴充認知的廣度與深度上。各部門工作者都必須學會把自己的業務邏輯轉化為專業格式與AI協作,並具備判斷AI產出對錯的能力。這不再只是IT部門的事,而是整個企業組織能力必須共同跨越的門檻。
延伸閱讀:AI大神加入Claude陣營!Anthropic延攬Karpathy,押注「AI幫AI做研究」新戰場
自己的AI助理自己養!OpenAI工程師曝5大Codex進階用法,打造「專屬AI貼身特助」
原文出自【數位關鍵字】238.駕馭工程登場!Harness 才是護城河!AI 時代真正的企業競爭力 ft.AWS 社群英雄蔣鐙緯 Ernest
責任編輯:蘇柔瑋
