最近看了 Lenny’s Podcast 訪問 Cat Wu 的這集,我覺得很值得推薦給所有 PM(產品經理)、產品主管,還有正在思考 AI 會怎麼改變工作方式的人。
Cat Wu 是 Anthropic 的 Head of Product(產品負責人),負責 Claude Code 和 Co-work。換句話說,她不是在旁邊評論 AI 產品的人,而是在 Anthropic 最核心的位置,每天真的面對模型能力變化、產品迭代、工程速度、企業導入與使用者回饋的人。
這集主要在講一件事: Claude 內部的 PM,到底是怎麼工作的 。
以前我們理解的 PM,很大一部分是在理解需求、寫 PRD(產品需求文件)、排 roadmap(產品路線圖)、協調工程、推動上線。這些能力當然還是重要,但在 AI 時代,當寫 code 的成本快速下降,當一個功能從六個月變成一個月、一週,甚至一天就能推出,PM 的價值就會從「怎麼把東西做出來」,慢慢轉向「什麼東西值得被做出來」。
Cat Wu 有一句話我很喜歡:
當 code 變得越來越便宜,真正變貴的是 product taste(產品品味)。
也就是說,未來不是誰比較會寫規格,而是誰更能判斷:現在這個模型到底能做什麼?使用者真正需要的是什麼?哪些功能只是看起來很炫,但其實沒有解決問題?哪些功能現在模型還不夠成熟,但半年後可能會變成關鍵能力?
這集裡面有三個觀念,我覺得特別值得分享出來
第一個是:95% 自動化,其實還不夠。
很多人在做 AI 導入的時候,會很興奮地說:「這個流程已經可以自動化 80%、90%、95% 了。」
但 Cat Wu 提到一個很關鍵的觀念:如果一個 AI 工具只做到 95%,很多時候它其實還不是真正的自動化。因為剩下的 5%,會讓人變成監工。
你還是要一直檢查它有沒有錯,你還是要確認它有沒有漏,你還是要擔心它哪一次突然亂做。這在 demo 的時候看起來很厲害,但真的放到企業流程裡,就會變成一件很尷尬的事情:它好像幫你省了時間,但又讓你不敢完全放心。
這也是我最近在想 AI Agent 時很深的感覺。AI 產品的挑戰,不只是「能不能做出一個很酷的 demo」,而是「能不能讓人放心交付」。
客服 AI 如果 20 次有 1 次亂回答,可能就會造成客訴。診所 AI 如果 20 次有 1 次給錯建議,可能就會變成風險。在實務場景裡,差的那 5%,常常就是產品能不能真正上線的關鍵。
所以未來 AI 產品很重要的能力,不只是模型,而是整套 workflow(工作流程)、permission(權限控管)、review(審核機制)、log(操作紀錄)、rollback(回溯還原)、human-in-the-loop(人工介入)。也就是說,你不是只做一個會回答問題的機器人,而是要做一個讓人敢把工作交出去的系統。
第二個是:eval 會變成 PM 的核心能力
以前 PM 定義成功,可能是寫在 PRD 裡:提升轉換率、降低流失率、增加使用次數、提高 NPS。這些當然還是重要,但 AI 產品多了一個更麻煩的問題:你要怎麼定義「AI 做得好」?
不是一句「回答要準確」就結束了。準確是什麼?在什麼情境下算準確?可以漏掉什麼?絕對不能錯什麼?如果它不確定,應該要問人,還是自己查資料?如果它答錯,錯到什麼程度算嚴重?
這就是 eval(評估)重要的地方。
Cat Wu 說,不需要一開始就做幾百個 eval,有時候 10 個好的 eval 就很有價值。因為好的 eval 可以幫團隊把「我們覺得 AI 應該要做得好」這種模糊的期待,變成可以被測量、可以被討論、可以被改善的標準。
我覺得這點對 PM 來說很重要。未來 PM 不只是寫 user story,而是要能寫出「好結果」和「壞結果」的判斷標準。
例如客服 AI,不是只說「要能回答停車問題」,而是要定義:
遇到退款問題時,什麼情況可以自動回答?
什麼情況一定要轉真人?
如果使用者情緒很差,要怎麼判斷?
如果訂單資料不完整,要不要繼續回答?
如果答案沒有足夠把握,要怎麼保守處理?
這些其實都是產品判斷,也是 eval 的來源。
所以我越來越覺得,未來好的 PM,不一定是最會寫 PRD 的人,而是最能把模糊的人類期待,轉成 AI 可以被測試、被改善、被部署的標準的人。
第三個是:模型會把你的輔助設計,也就是 harness,當早餐吃掉
這是整集裡面我覺得最有趣的一個觀念。
很多 AI 產品現在會加很多輔助設計,例如提醒模型要照步驟做、幫模型加 todo list、強迫模型檢查、加一堆 prompt 去避免它忘記事情。這些東西在當下都很有必要,因為模型還不夠強,所以產品要幫它補拐杖。
但 Cat Wu 提到一件事:隨著模型變強,很多以前必要的輔助設計,後來都會變得不再必要。因為模型自己就會做了。
Claude Code 一開始需要用 todo list 去提醒模型完成大型重構,不然它可能改了 20 個地方中的 5 個就停下來。可是後來模型變強之後,它自己就更知道要追蹤任務、完成清單、檢查工作。於是原本很重要的產品輔助,就慢慢被模型能力吃掉。
這件事對 PM 其實很殘酷,也很有趣。
因為你今天辛苦設計出來的 workflow、prompt、輔助功能,可能三個月後就被新模型內建的能力取代。你以為你在做產品護城河,結果它只是某一代模型能力不足時的臨時鷹架。
這也是為什麼 AI 產品很難做。你不能只為今天的模型設計,也不能只幻想未來的模型。你要知道哪些東西是暫時的補強,哪些東西才是真正長期存在的產品價值。
我自己的理解是,prompt、輔助流程、操作介面,很多都可能被模型吃掉。但場景理解、資料整合、權限控管、信任機制、使用者習慣、企業流程、eval 系統,這些比較不容易一下子被吃掉。
所以 PM 要問的不是「我要不要做 AI 功能」,而是「我現在做的這個功能,半年後會不會只是模型的基本能力?」
這集對我最大的提醒是:PM 這個角色正在從「需求管理者」,變成「AI 工作系統的設計者」。
如果你是 PM,我真的推薦你看一下這集。不是因為每家公司都會變成 Anthropic,也不是每個 PM 都要去做 Claude Code,而是因為 Cat Wu 講的不是遙遠的未來,而是很多產品團隊接下來一兩年就會遇到的現實。
最後用 Cat Wu 在影片裡的一句話作結:
Just do things.(去做就對了)
「我認為從第一原理出發思考很有價值。如果你知道自己要優化什麼,而且有清晰的第一性原理,那麼通常就能推斷出正確的行動方案,並能清楚地向所有利害關係人解釋清楚,然後就應該去做。」
「我覺得工作都是榥子。如果你了解限制條件,就能弄清楚自己能做什麼,然後儘快去做,從錯誤中學習,如果做錯了就道歉或改正。」
本文授權轉載自Eugene Wang
