10 倍工程師不夠看了？Karpathy拋agentic engineering概念：品味為何遠比「寫程式技能」重要？|數位時代 BusinessNext

重點一：OpenAI 共同創辦人 Andrej Karpathy主張，他去年命名的vibe coding正升級成更嚴肅的agentic engineering（代理工程）。前者把寫程式的「樓地板」墊高給所有人，後者則是專業工程師守住品質「天花板」、又能讓 AI 跑得更快的紀律。

重點二：Karpathy 提出新的心智模型：LLM 不是動物，而是「鬼魂」（ghosts）。動物有本能、會被責罵調整，鬼魂則是統計性召喚出的精靈，吼它沒用，唯一能影響它的是 prompt、context 與環境設計。

重點三：Karpathy 直言「十倍工程師」這個說法已不夠用，能駕馭代理工程的人，加速幅度「峰值遠不只十倍」。但他同時警告，AI 把「思考」外包出去沒問題，「理解」永遠不能外包，這句話將是接下來幾年人才市場的隱形分水嶺。

去年是 Andrej Karpathy 把「vibe coding」這個詞丟進產業詞典的，當時他指的是一種半感應、半信任 AI 的寫程式狀態。

一年後，這位 OpenAI 共同創辦人、前 Tesla AI 主管、現任 Eureka Labs 創辦人在紅杉資本 AI Ascent 2026 由 Sequoia 合夥人 Stephanie Zhan 主持的對談中，把同一條軸線往後推了一大格：vibe coding 還在，但更嚴肅的 agentic engineering（代理工程）正在它之上長出來，而且人才差距正被新一輪寫程式範式拉開到「峰值遠不只十倍」的程度。

問題是，新十倍人才的分界線到底劃在哪裡？

為什麼連 Karpathy 都「沒這麼跟得上」

對談開頭，Stephanie Zhan 問了一個問題來開場：「你前陣子說，你從來沒有像現在這麼覺得自己跟不上寫程式的進度。這話從你嘴裡說出來，特別讓人意外。」

Karpathy 回答，過去一年他也用各種代理工具，但 2025 年 12 月是分水嶺：「最新一代模型生出來的程式碼大多『就是對的』，我幾乎想不起上次親手改過 AI 的輸出是什麼時候。」他放下警戒、開始信任系統，vibe coding 變成日常。

換言之，去年很多人把 ChatGPT 當 Google 替代品用，但在 2025 年底，真正在改變的不是模型參數量，是「人機分工的信任曲線」。

這對企業的工程主管是個訊號：你們的開發流程還停在「AI 寫一段、工程師改一段」的舊節奏，還是已進到「AI 跑、工程師審」的新節奏？

Software 3.0：當提示詞成了新的程式語言

Karpathy 把寫程式分成三代：Software 1.0 是寫明確規則的程式碼，Software 2.0 是訓練神經網路（程式設計變成整理資料集與設計目標函數），而 Software 3.0 則是「prompt 即程式」，你寫進 context window 的內容就是控制 LLM 這台「可程式化解譯器」的指令。

他舉了兩個例子。第一個是裝 OpenClaw 工具：舊做法是寫 shell script 處理平台差異，腳本通常變得超複雜。新做法是直接複製一段文字給代理，代理自己看環境、自己除錯、自己跑完安裝。Karpathy 說：「你在 Software 3.0 範式裡，根本不需要把所有設定細節精確指定出來。」

第二個例子更激進。原本他 vibe coded 一個叫 Menu Gen 的 app，使用者上傳菜單照片，app 用 OCR 抽出菜名、用圖像生成模型畫出每道菜的樣子。然後他看到真正的 Software 3.0 版本：直接把菜單照片丟給 Gemini，叫它用 Nano Banana 把圖疊回菜單上，模型直接吐出一張菜單照片，每道菜旁邊都長出示意圖。

言下之意，就是Software 3.0 不是讓既有應用變更快，而是讓很多應用從一開始就不必存在。「我整個 Menu Gen 是多餘的，那個 app 根本不該存在。」Karpathy 說。

鬼魂指揮官：別再對 AI 吼叫了

整場訪談最具黏性的概念，是 Karpathy 反覆在用的比喻：LLM 不是動物，是鬼魂。

Karpathy 解釋，他寫過一篇「動物 vs 鬼魂」的短文，是為了釐清自己怎麼想這些東西。「如果你對它們吼叫，它們不會做得更好或更差，吼叫沒有意義。它們不是動物意義上的智慧。它們是統計模擬電路，預訓練是基底，再用強化學習（RL）疊上一層。」

鬼魂則是被人類數據召喚出來的精靈，能力分布是「鋸齒狀」（jagged），某些題目（比方數學、寫程式）峰值極高，某些題目卻出現匪夷所思的低谷。

Karpathy 給了經典案例：早期模型常在「strawberry 裡有幾個 R」這種題目上栽跟頭，這個老梗新一代模型已經修掉。但同一批能重構十萬行程式碼、找出零日漏洞的最先進模型，被問到 「我要去 50 公尺外的洗車場洗車，該開車還是走路？」 時，會一本正經地回你「這麼近當然走路啊」，完全沒意識到「你是要把車開去洗，走路過去這台車怎麼辦」這種五歲小孩都懂的常識。

「能駕馭鬼魂」這件事於是變成新的工程美學。

Karpathy 認為，鋸齒狀能力的根源是兩件事：一是 AI 實驗室訓練模型時設了哪些 RL 環境，二是哪些資料剛好被丟進預訓練語料。他舉例，從 GPT-3.5 到 GPT-4 棋藝突飛猛進，並不是模型整體變強，而是 OpenAI 內部某個人決定把大量棋譜塞進預訓練資料。「我們其實有點任由實驗室擺佈，他們把什麼放進資料分布裡，你就有什麼能力。」

對工程主管來說，當團隊使用 AI 卡關，先問的不該是「是不是用錯模型」，而是「這個任務是在 RL 訓練甜蜜點裡，還是落在資料盲區？」是後者的話光換模型沒用，得回到 fine-tuning、自建 RL 環境，或乾脆換切入角度。

從 vibe coding 到 agentic engineering：「樓地板」與「天花板」

Karpathy 對對談者下的最關鍵新定義是這句：「vibe coding 是把所有人能寫軟體的『樓地板』墊高；agentic engineering 則是把專業軟體既有的『品質天花板』守住，同時讓速度上來。」

樓地板墊高的意思是：以前不會寫程式的人，現在也能 vibe code 出一個能用的東西，這很棒、很自由。但天花板那邊規則沒變，你不能因為用 AI 就往程式裡塞漏洞，你還是要對自己的軟體負責。問題是怎麼在維持品質下加速？

而這就是 agentic engineering 這套工程紀律的內容：「你怎麼協調這些既神奇又有點怪、稍微會出錯但極為強大的代理，讓它們一起跑得更快、又不掉品質。」

接著就是那句被引用無數次的話。Karpathy 說：「以前大家會說十倍工程師，我覺得這個倍率現在被放大很多。十倍已經不是你能拿到的加速幅度了……真正擅長代理工程的人，峰值遠超過十倍。」（原文：10x is not the speedup you gain... peak a lot more than 10x.）

這句話的份量在哪？它直接把 AI 時代的「能用 AI」從技能門檻，重新定義為人才市場的價值斷層。樓地板墊高了，但天花板更高了；中間那一層「會用、但用得馬虎」的工程師，正在被擠壓。

Karpathy 還順手點名一個很多公司還沒醒的問題：招募。

他說現在大家都想招強的「代理工程師」，但多數公司的招募流程還是停在「給你一道演算法題」的舊範式。他建議的新做法：給應徵者一個大專案，比方說「幫代理們寫一個 Twitter clone，做好做安全，然後我用 10 個 Codex 配置去試著打爆你部署的網站，看你撐不撐得住」。

這樣就可以從大專案、真實對抗、工具熟悉度，三件事一起看這個人。

「填空」與「設計」之間：工程師仍須在 loop 裡

Karpathy 主張，鋸齒性就是你必須留在 loop 裡的理由，得把代理當工具看、保持與它們的接觸、知道它們做什麼。他甚至坦白自己從來不愛「plan mode」這種設計：「我覺得它有用，但更通用的做法是，跟你的代理一起設計一份非常細的 spec，這份 spec 變成文件，再由代理寫，你負責頂層的判斷與監督。代理在底層做大量細節。」

他舉了一個真實 bug：Menu Gen 用 Google 帳號註冊、用 Stripe 儲值。代理為了把儲值金額對應到使用者，居然用 email 交叉比對，但這兩個服務的 email 可以不同。「為什麼會用 email 來交叉比對資金？這是非常奇怪的判斷。」

這個案例值得每個用 AI 寫程式的工程師貼在牆上：鬼魂在「填空」上很強，在「設計」上很笨。當你不告訴它要用唯一使用者 ID 時，它會自己編一個荒謬的方案。判斷力、設計感、品味，這些東西現在還無法外包。

結尾：可以外包思考，無法外包理解

對談收尾在 Stephanie Zhan 的最後一個問題：當智慧變便宜，什麼東西還值得深學？

Karpathy 拿出了他這幾天反覆想的一句話：「You can outsource your thinking, but you can't outsource your understanding.」（你可以外包你的思考，但你無法外包你的理解。）

Karpathy 用自身為例：「資訊還是得進到我的腦袋裡，我已感覺自己變成瓶頸：什麼東西值得做、為什麼值得做、我要怎麼指揮代理，這些都還得由我判斷。」他說，這也是為什麼他興奮做 LLM 知識庫專案：這些工具的本質是用來增強自己對世界的理解。

把這層意涵帶回到工程現場：agentic engineering 的核心競爭力，不在於你會不會用 Claude Code 或 Codex，而在於你能不能把問題拆解得夠細、能不能對代理的輸出做出有見識的判斷、能不能設計出對的 spec。技能可以複製，品味卻不行。

對台灣的軟體業，這場對談留下的最實用一句話可能是這個：你可以外包你的思考，但你無法外包你的理解。十倍人才的真正分水嶺，劃在這條線上。

延伸閱讀：不用Obsidian也能建AI知識庫！Karpathy同款「說明書」設定，4.1萬人超人氣方法完整拆解

資料來源：Andrej Karpathy: From Vibe Coding to Agentic Engineering (Sequoia Capital, AI Ascent 2026)

本文初稿為AI編撰，整理．編輯/ 李先泰