10 倍工程師不夠看了?Karpathy拋agentic engineering概念:品味為何遠比「寫程式技能」重要?
10 倍工程師不夠看了?Karpathy拋agentic engineering概念:品味為何遠比「寫程式技能」重要?

重點一:OpenAI 共同創辦人 Andrej Karpathy主張,他去年命名的vibe coding正升級成更嚴肅的agentic engineering(代理工程)。前者把寫程式的「樓地板」墊高給所有人,後者則是專業工程師守住品質「天花板」、又能讓 AI 跑得更快的紀律。

重點二:Karpathy 提出新的心智模型:LLM 不是動物,而是「鬼魂」(ghosts)。動物有本能、會被責罵調整,鬼魂則是統計性召喚出的精靈,吼它沒用,唯一能影響它的是 prompt、context 與環境設計。

重點三:Karpathy 直言「十倍工程師」這個說法已不夠用,能駕馭代理工程的人,加速幅度「峰值遠不只十倍」。但他同時警告,AI 把「思考」外包出去沒問題,「理解」永遠不能外包,這句話將是接下來幾年人才市場的隱形分水嶺。

去年是 Andrej Karpathy 把「vibe coding」這個詞丟進產業詞典的,當時他指的是一種半感應、半信任 AI 的寫程式狀態。

一年後,這位 OpenAI 共同創辦人、前 Tesla AI 主管、現任 Eureka Labs 創辦人在紅杉資本 AI Ascent 2026 由 Sequoia 合夥人 Stephanie Zhan 主持的對談中,把同一條軸線往後推了一大格:vibe coding 還在,但更嚴肅的 agentic engineering(代理工程)正在它之上長出來,而且人才差距正被新一輪寫程式範式拉開到「峰值遠不只十倍」的程度。

問題是,新十倍人才的分界線到底劃在哪裡?

為什麼連 Karpathy 都「沒這麼跟得上」

對談開頭,Stephanie Zhan 問了一個問題來開場:「你前陣子說,你從來沒有像現在這麼覺得自己跟不上寫程式的進度。這話從你嘴裡說出來,特別讓人意外。」

Karpathy 回答,過去一年他也用各種代理工具,但 2025 年 12 月是分水嶺:「最新一代模型生出來的程式碼大多『就是對的』,我幾乎想不起上次親手改過 AI 的輸出是什麼時候。」他放下警戒、開始信任系統,vibe coding 變成日常。

換言之,去年很多人把 ChatGPT 當 Google 替代品用,但在 2025 年底,真正在改變的不是模型參數量,是「人機分工的信任曲線」

這對企業的工程主管是個訊號:你們的開發流程還停在「AI 寫一段、工程師改一段」的舊節奏,還是已進到「AI 跑、工程師審」的新節奏?

Software 3.0:當提示詞成了新的程式語言

Karpathy 把寫程式分成三代:Software 1.0 是寫明確規則的程式碼,Software 2.0 是訓練神經網路(程式設計變成整理資料集與設計目標函數),而 Software 3.0 則是「prompt 即程式」,你寫進 context window 的內容就是控制 LLM 這台「可程式化解譯器」的指令。

他舉了兩個例子。第一個是裝 OpenClaw 工具:舊做法是寫 shell script 處理平台差異,腳本通常變得超複雜。新做法是直接複製一段文字給代理,代理自己看環境、自己除錯、自己跑完安裝。Karpathy 說:「你在 Software 3.0 範式裡,根本不需要把所有設定細節精確指定出來。」

第二個例子更激進。原本他 vibe coded 一個叫 Menu Gen 的 app,使用者上傳菜單照片,app 用 OCR 抽出菜名、用圖像生成模型畫出每道菜的樣子。然後他看到真正的 Software 3.0 版本:直接把菜單照片丟給 Gemini,叫它用 Nano Banana 把圖疊回菜單上,模型直接吐出一張菜單照片,每道菜旁邊都長出示意圖。

言下之意,就是Software 3.0 不是讓既有應用變更快,而是讓很多應用從一開始就不必存在。「我整個 Menu Gen 是多餘的,那個 app 根本不該存在。」Karpathy 說。

鬼魂指揮官:別再對 AI 吼叫了

整場訪談最具黏性的概念,是 Karpathy 反覆在用的比喻:LLM 不是動物,是鬼魂。

Karpathy 解釋,他寫過一篇「動物 vs 鬼魂」的短文,是為了釐清自己怎麼想這些東西。「如果你對它們吼叫,它們不會做得更好或更差,吼叫沒有意義。它們不是動物意義上的智慧。它們是統計模擬電路,預訓練是基底,再用強化學習(RL)疊上一層。」

鬼魂則是被人類數據召喚出來的精靈,能力分布是「鋸齒狀」(jagged),某些題目(比方數學、寫程式)峰值極高,某些題目卻出現匪夷所思的低谷。

Karpathy 給了經典案例:早期模型常在「strawberry 裡有幾個 R」這種題目上栽跟頭,這個老梗新一代模型已經修掉。但同一批能重構十萬行程式碼、找出零日漏洞的最先進模型,被問到 「我要去 50 公尺外的洗車場洗車,該開車還是走路?」 時,會一本正經地回你「這麼近當然走路啊」,完全沒意識到「你是要把車開去洗,走路過去這台車怎麼辦」這種五歲小孩都懂的常識。

「能駕馭鬼魂」這件事於是變成新的工程美學

Karpathy 認為,鋸齒狀能力的根源是兩件事:一是 AI 實驗室訓練模型時設了哪些 RL 環境,二是哪些資料剛好被丟進預訓練語料。他舉例,從 GPT-3.5 到 GPT-4 棋藝突飛猛進,並不是模型整體變強,而是 OpenAI 內部某個人決定把大量棋譜塞進預訓練資料。「我們其實有點任由實驗室擺佈,他們把什麼放進資料分布裡,你就有什麼能力。」

對工程主管來說,當團隊使用 AI 卡關,先問的不該是「是不是用錯模型」,而是「這個任務是在 RL 訓練甜蜜點裡,還是落在資料盲區?」是後者的話光換模型沒用,得回到 fine-tuning、自建 RL 環境,或乾脆換切入角度。

從 vibe coding 到 agentic engineering:「樓地板」與「天花板」

Karpathy 對對談者下的最關鍵新定義是這句:「vibe coding 是把所有人能寫軟體的『樓地板』墊高;agentic engineering 則是把專業軟體既有的『品質天花板』守住,同時讓速度上來。」

樓地板墊高的意思是:以前不會寫程式的人,現在也能 vibe code 出一個能用的東西,這很棒、很自由。但天花板那邊規則沒變,你不能因為用 AI 就往程式裡塞漏洞,你還是要對自己的軟體負責。問題是怎麼在維持品質下加速?

而這就是 agentic engineering 這套工程紀律的內容:「你怎麼協調這些既神奇又有點怪、稍微會出錯但極為強大的代理,讓它們一起跑得更快、又不掉品質。」

接著就是那句被引用無數次的話。Karpathy 說:「以前大家會說十倍工程師,我覺得這個倍率現在被放大很多。十倍已經不是你能拿到的加速幅度了……真正擅長代理工程的人,峰值遠超過十倍。」(原文:10x is not the speedup you gain... peak a lot more than 10x.)

這句話的份量在哪?它直接把 AI 時代的「能用 AI」從技能門檻,重新定義為人才市場的價值斷層。樓地板墊高了,但天花板更高了;中間那一層「會用、但用得馬虎」的工程師,正在被擠壓。

Karpathy 還順手點名一個很多公司還沒醒的問題:招募。

他說現在大家都想招強的「代理工程師」,但多數公司的招募流程還是停在「給你一道演算法題」的舊範式。他建議的新做法:給應徵者一個大專案,比方說「幫代理們寫一個 Twitter clone,做好做安全,然後我用 10 個 Codex 配置去試著打爆你部署的網站,看你撐不撐得住」。

這樣就可以從大專案、真實對抗、工具熟悉度,三件事一起看這個人。

「填空」與「設計」之間:工程師仍須在 loop 裡

Karpathy 主張,鋸齒性就是你必須留在 loop 裡的理由,得把代理當工具看、保持與它們的接觸、知道它們做什麼。他甚至坦白自己從來不愛「plan mode」這種設計:「我覺得它有用,但更通用的做法是,跟你的代理一起設計一份非常細的 spec,這份 spec 變成文件,再由代理寫,你負責頂層的判斷與監督。代理在底層做大量細節。」

他舉了一個真實 bug:Menu Gen 用 Google 帳號註冊、用 Stripe 儲值。代理為了把儲值金額對應到使用者,居然用 email 交叉比對,但這兩個服務的 email 可以不同。「為什麼會用 email 來交叉比對資金?這是非常奇怪的判斷。」

這個案例值得每個用 AI 寫程式的工程師貼在牆上:鬼魂在「填空」上很強,在「設計」上很笨。當你不告訴它要用唯一使用者 ID 時,它會自己編一個荒謬的方案。判斷力、設計感、品味,這些東西現在還無法外包。

結尾:可以外包思考,無法外包理解

對談收尾在 Stephanie Zhan 的最後一個問題:當智慧變便宜,什麼東西還值得深學?

Karpathy 拿出了他這幾天反覆想的一句話:「You can outsource your thinking, but you can't outsource your understanding.」(你可以外包你的思考,但你無法外包你的理解。)

Karpathy 用自身為例:「資訊還是得進到我的腦袋裡,我已感覺自己變成瓶頸:什麼東西值得做、為什麼值得做、我要怎麼指揮代理,這些都還得由我判斷。」他說,這也是為什麼他興奮做 LLM 知識庫專案:這些工具的本質是用來增強自己對世界的理解。

把這層意涵帶回到工程現場:agentic engineering 的核心競爭力,不在於你會不會用 Claude Code 或 Codex,而在於你能不能把問題拆解得夠細、能不能對代理的輸出做出有見識的判斷、能不能設計出對的 spec。 技能可以複製,品味卻不行。

對台灣的軟體業,這場對談留下的最實用一句話可能是這個:你可以外包你的思考,但你無法外包你的理解。十倍人才的真正分水嶺,劃在這條線上。

延伸閱讀:不用Obsidian也能建AI知識庫!Karpathy同款「說明書」設定,4.1萬人超人氣方法完整拆解

資料來源:Andrej Karpathy: From Vibe Coding to Agentic Engineering (Sequoia Capital, AI Ascent 2026)

本文初稿為AI編撰,整理.編輯/ 李先泰

關鍵字: #Vibe Coding

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
AI全球100+台灣20
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓