AI 開始自己寫自己。
Anthropic 發布了一篇談「遞迴自我改進」(Recursive Self-Improvement, RSI)的文章。整篇文章要講的事情很容易懂:如果 AI 已經可以寫軟體,那 AI 遲早會開始改寫自己、自我進化。
先講文章中最讓我有感的三個數字,因為這些完全吻合我的自身經驗,過去幾個月也都放在一些公開的投影片和演講當中分享。
截至 2026 年 5 月,Anthropic 合併進產品的程式碼,超過 80% 出自 Claude 之手。 在 Claude Code 推出之前,這個比例還是個位數。我自己實作產品的比例,是 85% 出自 Claude Code,但我做的是全新產品 Kuroma.ai,所以一開始就可以高比例用 Claude Code 來寫,沒有 legacy 人類手寫的 code 來當分母。
同一個工程師,現在每季產出的程式碼量,大約是 2024 年的 8 倍。 我自己最近寫程式的經驗是 5 到 10 倍,依不同的任務而定,有些 AI 來做會比較浪費時間的短任務,人類做起來還是比較快,例如翻譯幾個接地氣的字串、微調一下 UI、更改 production 資料庫的小部分內容,這些短指令自己跑一跑就好了,叫超級聰明的 AI 跑會稍微浪費時間 (bash 指令好歹還是自己下一下吧,全部交給 AI 真的就是全部腦袋外包了)。
根據 METR 的量測,AI 能可靠完成的任務長度,現在每四個月就翻倍一次,比過去每七個月翻倍又再加速。 Claude Opus 4.6 已經能處理人類需要 12 小時的任務。這部分沒什麼懸念,AI 現在處理長任務的可靠度,已經超過資深工程師的水準,不過,Anthropic 這邊沒講的是,對於真的需要架構師等級規劃的長任務,AI 幾乎沒辦法一次做對,如果沒有搭配精心調製的軟體開發 skill,做出來問題一大堆,所以老實說目前還沒到那麼神奇恐怖的地步,但確實正在往破台的路上逐步邁進。
Kuroma.ai 目前的規模是 900,000+ 行程式碼,接近百萬行。所以我觀察到的一個有趣現象是也驗證了我之前的結論, 我們還是需要資深的架構師來維護這種規模的軟體 ,人類數量雖然可以大量減少,但是到這個規模,已經不是「AI 可以快速產生網站,好厲害!」這種程度的 vibe coding 可以支撐。
當然啦,Anthropic 還是想把自己的論述推到底,我也認同:在 AI coding 這件事上,「動手做」這個動作,現在幾乎不花人類任何時間了。寫程式、跑實驗、產出結果,邊際成本趨近於零。
我在之前的文章裡寫過,頂尖的聰明人花了一個世紀寫頂尖的程式,最終目標居然是把自己取代掉,這種現實怎麼想都只能令人慘笑。一年過去,劇本只有更荒謬。AI 現在動手寫的,已經是「製造 AI 的那些程式碼」本身。這頭機器,開始自己造自己了。
Anthropic 也指出人類目前唯一還守得住的陣地: 研究的品味與判斷力 。講得更具體,是「決定哪些問題值得做」、「判斷哪些結果可以信」、「以及知道一條路什麼時候已經走進死巷」。文章把這件事叫做 direction-setting,方向設定。
這其實就是架構師該做的事情。
進入動手變免費的時代,價值與瓶頸一起往上游搬
所以軟體工程師要立刻改變自己的心態是: 趕快升級成為架構師,並且讓自己第一線接觸客戶和真實世界的需求 。你還是會花很多時間在螢幕前,但帶著這個螢幕去坐在客戶旁邊吧。
當「動手」變得免費,價值就會全部集中到 定義問題 和 判斷對錯 這兩件事上。這也是為什麼,工程師的能力必須從 how to code,往上爬到 how to architect,再往上爬到 how to decide。
最後,Anthropic 這篇文章很誠實地搬出了 Amdahl's law(阿姆達爾定律)。
當你把一段流程裡的某一段加速到極致,整體速度就會被「還沒被加速的那一段」卡死。Anthropic 自己就撞上了這道牆:當 Claude 開始海量產出程式碼,瓶頸立刻轉移到「人類來不及審查」。
所以說,AI 唯一的瓶頸就只剩下人類了。(怕)
不過啦,AI 不會消滅瓶頸,它只會把瓶頸往上游搬,搬到判斷、搬到審查、搬到驗證。所以未來的組織裡, 最值錢的能力會是「最快找到瓶頸、並且把它打通」的那種人 。這會是一種新的基本功。
接下來,是我最想跟台灣、跟亞太夥伴講的一個角度,外面比較少人提。
當AI開始自己寫自己,為什麼台灣扮演關鍵角色?
這篇文章描繪了三種未來,其中最極端的一種,是 AI 真的進入完整的遞迴式自我改進。在那個情境裡,文章寫了一句很關鍵的話: 到那一步,AI 進步的速度,將完全由「算力」這一個變數決定 。
這句話很重要請讀三遍。
如果 AI 開發最後變成一場純粹比算力的競賽,那麼誰掌握了算力的供應鏈,誰就握住了整個遞迴迴圈的「油門」。 而今天全球算力供應鏈最關鍵的瓶頸,是先進封裝 CoWoS,是 TSMC,是台灣。
我過去常用「賣鏟子給挖金礦的人」來形容台灣半導體的角色。我們賣了 40 年的鏟子(晶片)給淘金客(AI 公司)。現在劇情變了:金礦開始自己挖自己,而唯一能決定它挖多快的,仍然是鏟子。
換句話說,在遞迴的時代,台灣的籌碼不會縮水。在最極端的情境裡,台灣手上的 CoWoS 產能,會直接變成全人類 AI 進步速度的關鍵。這個角色不會變小,它會被更加放大。前提是,我們要先看懂這件事,並且在這 24 到 36 個月的窗口裡,從「只賣鏟子」往「自己操作推土機」這一端移動。
總之,因為 AI 開始自己寫自己,算力的需求可能在短期內還會出現更加戲劇化的加速。
AI治理最難一關:沒人驗證得了對手真的停了
最後,談一件我在艾森豪獎美國參訪行程當中,花最多時間在討論的事情: 治理 。
但我先講結論,這趟旅程當中,我完全沒有得到答案,連一點點方向的指引都沒有得到。我跟艾森豪總統的在世孫女 Susan Eisenhower 討論到用類似管制核武的方式,是否是個可以參考的方式,但結論是我們都不確定,只得到弱弱的結論:我們必須讓各國領導人和科技領袖坐下來好好談談這件事情。
Anthropic 這篇文章的後半讓我有點意外。它沒有說 RSI 一定會發生,也沒有說它一定是好事。Anthropic 拋了一個更難的問題: 如果有一天我們需要按下暫停鍵,這個世界有沒有能力,協調出一個「可被驗證」的暫停?
我自己覺得是幾乎不可能,因為訓練一個前沿模型,比偷偷藏一座飛彈發射井容易太多了,你幾乎無法查證對手是不是真的停了下來。無限的商業利益就在眼前,誰有時間跟你一起坐在地上喝啤酒給拍?
回到我一貫的判斷。
軟體只是第一張骨牌,下一個是AI自己
我始終認為,AGI 不會在某一個單點、某一個早上突然降臨。它會一個領域、一個領域被分別攻克。「軟體開發」是第一個落地的領域。而 Anthropic 這篇文章再次驗證的是:「AI 開發」本身,正在成為下一個被攻克的領域。
這張骨牌一旦倒下,會加速推倒後面所有的骨牌。這是一個槓桿最高的領域,必須先被破台,一但軟體被破台,後面的路就全通了。
所以我還是那句話:不要被嚇倒,但這個窗口是真的。人類的工作會一路往上搬,從寫程式,搬到設計系統,搬到決定什麼東西值得被做,最後搬到決定這個會自我改進的迴圈,到底是為了什麼而轉。
過去一個世紀,我們在解決「軟體要怎麼蓋」這件事情。
接下來,我們要自問:「那個會自己蓋自己的東西,到底是為了誰、為了什麼而存在。」
本文授權轉載自程世嘉
