PM角色大洗牌！Anthropic產品主管：當寫code變便宜，AI時代真正貴的是「product taste」|數位時代 BusinessNext

最近看了 Lenny’s Podcast 訪問 Cat Wu 的這集，我覺得很值得推薦給所有 PM（產品經理）、產品主管，還有正在思考 AI 會怎麼改變工作方式的人。

Cat Wu 是 Anthropic 的 Head of Product（產品負責人），負責 Claude Code 和 Co-work。換句話說，她不是在旁邊評論 AI 產品的人，而是在 Anthropic 最核心的位置，每天真的面對模型能力變化、產品迭代、工程速度、企業導入與使用者回饋的人。

這集主要在講一件事： Claude 內部的 PM，到底是怎麼工作的 。

以前我們理解的 PM，很大一部分是在理解需求、寫 PRD（產品需求文件）、排 roadmap（產品路線圖）、協調工程、推動上線。這些能力當然還是重要，但在 AI 時代，當寫 code 的成本快速下降，當一個功能從六個月變成一個月、一週，甚至一天就能推出，PM 的價值就會從「怎麼把東西做出來」，慢慢轉向「什麼東西值得被做出來」。

Cat Wu 有一句話我很喜歡：

當 code 變得越來越便宜，真正變貴的是 product taste（產品品味）。

也就是說，未來不是誰比較會寫規格，而是誰更能判斷：現在這個模型到底能做什麼？使用者真正需要的是什麼？哪些功能只是看起來很炫，但其實沒有解決問題？哪些功能現在模型還不夠成熟，但半年後可能會變成關鍵能力？

這集裡面有三個觀念，我覺得特別值得分享出來

第一個是：95% 自動化，其實還不夠。

很多人在做 AI 導入的時候，會很興奮地說：「這個流程已經可以自動化 80%、90%、95% 了。」

但 Cat Wu 提到一個很關鍵的觀念：如果一個 AI 工具只做到 95%，很多時候它其實還不是真正的自動化。因為剩下的 5%，會讓人變成監工。

你還是要一直檢查它有沒有錯，你還是要確認它有沒有漏，你還是要擔心它哪一次突然亂做。這在 demo 的時候看起來很厲害，但真的放到企業流程裡，就會變成一件很尷尬的事情：它好像幫你省了時間，但又讓你不敢完全放心。

這也是我最近在想 AI Agent 時很深的感覺。AI 產品的挑戰，不只是「能不能做出一個很酷的 demo」，而是「能不能讓人放心交付」。

客服 AI 如果 20 次有 1 次亂回答，可能就會造成客訴。診所 AI 如果 20 次有 1 次給錯建議，可能就會變成風險。在實務場景裡，差的那 5%，常常就是產品能不能真正上線的關鍵。

所以未來 AI 產品很重要的能力，不只是模型，而是整套 workflow（工作流程）、permission（權限控管）、review（審核機制）、log（操作紀錄）、rollback（回溯還原）、human-in-the-loop（人工介入）。也就是說，你不是只做一個會回答問題的機器人，而是要做一個讓人敢把工作交出去的系統。

第二個是：eval 會變成 PM 的核心能力

以前 PM 定義成功，可能是寫在 PRD 裡：提升轉換率、降低流失率、增加使用次數、提高 NPS。這些當然還是重要，但 AI 產品多了一個更麻煩的問題：你要怎麼定義「AI 做得好」？

不是一句「回答要準確」就結束了。準確是什麼？在什麼情境下算準確？可以漏掉什麼？絕對不能錯什麼？如果它不確定，應該要問人，還是自己查資料？如果它答錯，錯到什麼程度算嚴重？

這就是 eval（評估）重要的地方。

Cat Wu 說，不需要一開始就做幾百個 eval，有時候 10 個好的 eval 就很有價值。因為好的 eval 可以幫團隊把「我們覺得 AI 應該要做得好」這種模糊的期待，變成可以被測量、可以被討論、可以被改善的標準。

我覺得這點對 PM 來說很重要。未來 PM 不只是寫 user story，而是要能寫出「好結果」和「壞結果」的判斷標準。

例如客服 AI，不是只說「要能回答停車問題」，而是要定義：

遇到退款問題時，什麼情況可以自動回答？
什麼情況一定要轉真人？
如果使用者情緒很差，要怎麼判斷？
如果訂單資料不完整，要不要繼續回答？
如果答案沒有足夠把握，要怎麼保守處理？

這些其實都是產品判斷，也是 eval 的來源。

所以我越來越覺得，未來好的 PM，不一定是最會寫 PRD 的人，而是最能把模糊的人類期待，轉成 AI 可以被測試、被改善、被部署的標準的人。

第三個是：模型會把你的輔助設計，也就是 harness，當早餐吃掉

這是整集裡面我覺得最有趣的一個觀念。

很多 AI 產品現在會加很多輔助設計，例如提醒模型要照步驟做、幫模型加 todo list、強迫模型檢查、加一堆 prompt 去避免它忘記事情。這些東西在當下都很有必要，因為模型還不夠強，所以產品要幫它補拐杖。

但 Cat Wu 提到一件事：隨著模型變強，很多以前必要的輔助設計，後來都會變得不再必要。因為模型自己就會做了。

Claude Code 一開始需要用 todo list 去提醒模型完成大型重構，不然它可能改了 20 個地方中的 5 個就停下來。可是後來模型變強之後，它自己就更知道要追蹤任務、完成清單、檢查工作。於是原本很重要的產品輔助，就慢慢被模型能力吃掉。

這件事對 PM 其實很殘酷，也很有趣。

因為你今天辛苦設計出來的 workflow、prompt、輔助功能，可能三個月後就被新模型內建的能力取代。你以為你在做產品護城河，結果它只是某一代模型能力不足時的臨時鷹架。

這也是為什麼 AI 產品很難做。你不能只為今天的模型設計，也不能只幻想未來的模型。你要知道哪些東西是暫時的補強，哪些東西才是真正長期存在的產品價值。

我自己的理解是，prompt、輔助流程、操作介面，很多都可能被模型吃掉。但場景理解、資料整合、權限控管、信任機制、使用者習慣、企業流程、eval 系統，這些比較不容易一下子被吃掉。

所以 PM 要問的不是「我要不要做 AI 功能」，而是「我現在做的這個功能，半年後會不會只是模型的基本能力？」

這集對我最大的提醒是：PM 這個角色正在從「需求管理者」，變成「AI 工作系統的設計者」。

如果你是 PM，我真的推薦你看一下這集。不是因為每家公司都會變成 Anthropic，也不是每個 PM 都要去做 Claude Code，而是因為 Cat Wu 講的不是遙遠的未來，而是很多產品團隊接下來一兩年就會遇到的現實。

最後用 Cat Wu 在影片裡的一句話作結：

Just do things.（去做就對了）

「我認為從第一原理出發思考很有價值。如果你知道自己要優化什麼，而且有清晰的第一性原理，那麼通常就能推斷出正確的行動方案，並能清楚地向所有利害關係人解釋清楚，然後就應該去做。」

「我覺得工作都是榥子。如果你了解限制條件，就能弄清楚自己能做什麼，然後儘快去做，從錯誤中學習，如果做錯了就道歉或改正。」

本文授權轉載自Eugene Wang