別濫裝Claude Skill!Anthropic 新生態顛覆 SaaS:頂尖工程師為何只養 20 個黃金技能?
別濫裝Claude Skill!Anthropic 新生態顛覆 SaaS:頂尖工程師為何只養 20 個黃金技能?

重點一:技能不是提示詞,而是三層結構的 SOP 系統,摘要、流程、知識庫必須分開管理,才能逐步調校。

重點二:技能描述模糊時,Claude 正確啟動率只有約 20%;裝 500 個劣質技能,比養 20 個精良技能更傷效率。

重點三:AI 技能是「人類流程的放大器」,SOP 若寫得含糊,AI 只會更快複製混亂。

隨著 Claude 訂閱大爆發,目前公開可安裝的 Claude Code Skills,光是第三方索引站 skillsmpp,就號稱從 GitHub 上抓了超過 28 萬個技能。另一個市集 skillhub 也收錄了上萬個技能。

於是網路上開始出現各種「炫耀清單」:一次裝載 500 個、甚至 1,000 個技能,彷彿數字越大,AI 就越強。

YouTube 頻道 Simon Scrapes 近期一支影片,直接用實測數字打臉了這個迷思。

據 Simon Scrapes 引用的一項非公開實驗,當 Claude Code 技能只有「基礎設定+模糊描述」時,模型能正確啟動對應技能的機率最低僅約 20%,等於是同一個任務連續嘗試五次,平均只有一次會真正叫對工具。

相反地,在技能描述明確、觸發條件與 hooks 設計完整的情況下,啟動率最高可提升到約 84%,但仍代表平均每五次互動就會有一次沒有成功啟動目標技能。

值得注意的是,這組數字是在僅包含四到五個精心設計技能的實驗環境下得到的;當實際部署的技能數量暴增到數百甚至上千個,而且描述彼此重疊、職能範圍模糊時,啟動失誤與「啟動錯技能」的風險只會進一步放大。

那問題到底出在哪裡?為何在網路上搜刮過來安裝的Skills,未必能幫到你?

技能不是「好一點的提示詞」

先從觀念回答起:多數人對技能的直覺是:一段更長、更精緻的 system prompt。 這個理解從根本上就偏了。

Simon Scrapes強調,真正能穩定運作的技能,是有三層結構的資料夾系統。第一層是 YAML 頭部:只有幾行,定義技能的名稱與觸發條件,決定 Claude 在掃描清單時會不會想到要用它。

第二層是 skill.md 的流程正文:告訴 Claude 啟動後按什麼順序執行,哪個節點需要停下來確認,遇到模糊輸入時怎麼追問;而第三層才是知識本體:references(細節知識庫)、assets(樣板格式)、scripts(可被呼叫的程式碼)。

這三層分開,帶來一個關鍵好處:出問題時,你知道要查哪裡。是流程描述不夠清楚?還是知識庫內容過時了?還是觸發條件寫得太模糊?三者拆開管理,才能逐步改良。

延伸閱讀:Agent skill 是什麼?Agent skill教學,6步驟打造你的第一個Skill

因此,把所有東西混在一個大提示詞裡,等同於把 SOP 手冊、操作說明書和程式碼,全部列印在同一張紙上,改起來無從下手。

這也是為什麼瞎裝一堆 skills,或是單純認為問題出在提問的 prompt,很難真正解決 AI 工作流的結構性問題。

漸進揭露:讓模型只看當下需要的東西

要先認知到的關鍵是,技能系統的核心設計原則叫做「漸進揭露」(progressive disclosure)。

技能清單的 YAML 頭部加總有一個 15,000 字元的上限。每次執行任務時,Claude 先掃描這份摘要清單,判斷需要啟動哪個技能;確定後,才把對應技能的流程正文載入上下文;流程中若需要查某份 reference 資料,再把那份文件讀進來。

Anthropic 官方把這個邏輯稱為「point, don't dump」:流程的作用,是在正確時機指向對的知識區塊,而不是一開始就把所有東西倒進去。

數據說明了差異。根據 Anthropic 官方指南的對比數據,同一個任務沒有技能時需要 15 輪往返對話、消耗約 12,000 個 tokens;有技能後減少到 2 個確認問題、6,000 個 tokens,執行成本減半,輸出穩定性同步提升。

更重要的是,這個架構讓技能可以組合使用。一個工作流程可以依序觸發「文件解析技能」→「資料整理技能」→「報表輸出技能」,每個技能只在需要時載入,不互相干擾。這比把所有流程塞進一個大提示詞要靈活得多。

真正值得用的技能是哪些?

技能生態的規模成長非常快,但訊號雜訊比很差。Indie Hackers 上有一位測試者花數個月評估了約 200 個技能,最後只推薦 20 個。他的篩選標準很具體:

  1. 第一次使用時輸出有沒有明顯超越不用技能的結果?
  2. 使用兩週後有沒有繼續用?
  3. 遇到邊界情況時會不會直接失效?

結果發現,按照上述**三個條件,大多數技能全數落榜。

當前Skills市集上重疊的情況十分嚴重。光是「SEO 寫稿」相關的技能,就有各種命名變體:SEO writer、long-form blog writer、content optimizer……。描述高度相似、觸發條件互相踩踏。把這些一次裝進來,Claude 在每次執行時都要從模糊的清單裡做選擇,選錯的機率自然升高。

反過來,養好 20 到 30 個針對自己工作流程設計的技能,讓每個技能的 YAML 描述清晰、觸發條件互不重疊,穩定啟動率可以維持在 80% 以上。這就是Skill「少而精」帶來的實際結果。

流程先於工具

技能系統最核心的現實,可以總結成依一句話:AI 是放大器,不是修復器。

一個能穩定產出的技能,背後必須先有寫清楚的 SOP、整理過的知識庫、以及對「什麼叫做完成」的明確定義。這些東西不是 AI 會幫你補上的,它們必須由人寫出來。如果一開始流程就含糊,技能只會讓混亂跑得更快。

對剛嘗試導入AI的工作者來說,有一個值得正視的慣性:習慣嘗試新工具、安裝新平台,卻很少停下來問「我們自己的流程是什麼」

而技能系統恰好把這個問題強制搬上檯面,你必須先能說清楚自己怎麼做事,才能把它轉化成可重複呼叫的模組。

上萬個公開技能裡,真正值得用的可能不超過幾十個。但那幾十個養好了,會比 500 個裝好看的技能,更接近「組織知識的軟體化」。

延伸閱讀:Google AI生態系一圖看懂!從底層模型、寫Code到代理⋯6大領域20項產品全都包!

資料來源:Simon Scrapes

本文初稿為AI編撰,整理.編輯/ 李先泰

關鍵字: #Anthropic #Claude
往下滑看下一篇文章
從模型競爭走向算力經濟,INFINITIX 助客戶打造軟體定義 AI 基礎建設
從模型競爭走向算力經濟,INFINITIX 助客戶打造軟體定義 AI 基礎建設

過去兩年,人工智慧技術以史無前例的速度翻轉企業營運與競爭態勢,從客服、知識管理到軟體開發,越來越多企業將大型語言模型(LLM)導入企業營運流程,隨著應用程度的深化與廣化,越來越多發現,真正的挑戰早已不只是「選擇哪個模型」,而是如何管理算力、控制成本、確保資料安全,以及讓不同世代GPU、模型與AI應用可以持續共存與調度。

代理式AI崛起後,AI應用從回答問題進展為執行任務、操作系統以及串接流程,連帶拉升對AI基礎設施的需求與架構複雜度,而這意味著,想要發揮AI綜效,光只有模型與技術尚不夠,必須將整體IT環境逐步升級為AI基礎建設(AI Infra)。

深耕AI管理領域多年的數位無限(INFINITIX),近年積極布局軟體定應AI基礎建設(Software Defined AI Infrastructure)市場,除持續深化與GPU、伺服器與AI硬體生態系的合作關係,如於2021年取得NVIDIA Solution Advisor全球夥伴資格,2025年亦獲AMD GPU生態建設夥伴獎,也因應市場需求推出AI-Stack與ixCSP兩大產品線,協助企業、雲端服務供應商(CSP)與新世代AI雲端業者,更有效率地管理跨世代AI算力資源。

數位無限執行長陳文裕表示:「我們的目標是協助客戶打造軟體定義AI基礎架構,讓其可以視需求向下整合不同世代GPU、儲存與網路設備,同時,向上鏈結模型、Token跟AI應用,加速企業的AI創新轉型腳步。」

數位無限執行長陳文裕.JPG
數位無限執行長陳文裕
圖/ 數位時代

從AI模型到AI經濟,企業競爭焦點轉向算力與Token調度能力

過去市場談AI,焦點多半放在模型參數、推論效能與模型能力,但在大型語言模型推論需求暴增的現下,AI Infra早已從單純GPU採購演變成涵蓋機櫃、網路、儲存、散熱與電力的整體工程;企業真正需要的,不是更多GPU、而是如何更有效率地調度與利用算力。

尤其在NVIDIA提出Token Factory概念後,全球AI產業正逐步從模型競賽轉向「AI經濟」,亦即,影響企業AI決策的再也不是使用哪個模型、部署多少GPU,而是消耗多少Token、產生多少AI服務,以及算力是否能被有效共享與調度。

換言之,在AI新世界,算力調度能力的重要水漲船高。對此,陳文裕十分認同的說:「企業想要提升AI競爭力,不僅要掌握模型與應用,還必須進一步思考如何有效切割GPU資源、讓不同部門甚至集團子公司共享算力、延長舊世代GPU的使用壽命,甚至是如何將閒置算力轉變成可交易的資源等。」

事實上,這也是大量AI資料中心(AIDC)跟新世代AI雲端服務(Neo Cloud)業者出現的原因,包括CoreWeave、Nebius、Lambda Labs、GMI Cloud等業者皆試圖以更具彈性的方式,提供企業所需的GPU服務與AI算力平台。

看準這波趨勢,數位無限除透過AI-Stack提供GPU切片、模型部署、模型管理與MLOps等服務,協助客戶提升GPU使用率,更進一步推出ixCSP平台,讓雲端服務供應商與新世代AI雲端業者,能從過去單純販售GPU資源轉型為提供GPU as a Service、Token as a Service與Model as a Service等創新AI服務。

以Software Defined AI Infrastructure助企業以「通用化、鬆耦合」迎戰瞬變AI世代

因應AI新世代帶來的挑戰:模型快速升級、算力需求攀升、GPU世代交替迅速,企業在追逐AI落地的同時,勢必得面臨基礎建設更新速度過快、硬體投資壓力升高,以及資源利用效率難以最佳化等挑戰。

為協助企業在AI快速演進與基礎建設投資之間取得平衡,數位無限的作法是,透過AI-Stack將底層硬體抽象化,以Token或模型服務形式提供,讓企業客戶、AIDC與Neo Cloud業者可以延長不同世代與不同品牌的AI硬體設備的生命週期、創造更高的使用價值、甚至是展開更多元的營收模式。

例如,高雄醫學大學附設中和紀念醫院便透過數位無限的AI-Stack解決GPU資源調度效率不彰問題,加速39項AI模型進入臨床應用階段,成功建立起「從模型開發到臨床落地」的完整生態系統。而日本精密製造大廠–Union Tool Co.–則是透過AI-Stack簡化GPU資源共享、加速AI模型的開發與測試腳步,為提升生產效率做最佳準備。

「如果大型企業或AIDC業者擁有閒置資源,也可以透過ixCSP平台,把算力共享或調度給集團內部團隊、子公司,甚至上下游合作夥伴使用,進一步提升整體資源利用率。」數位無限執行長陳文裕如是說道。

隨著AI從工具演變成企業核心基礎建設,企業真正需要的,也不再只是單一模型,而是一套能持續適應AI快速演進的AI Infra,而這與數位無限近年來的重要轉型方向一致:從AI管理軟體提供者轉型為軟體定義AI基礎建設供應商,更好協助客戶打造具備「通用化」與「鬆耦合」特性的AI基礎建設。

除以AI-Stack與ixCSP協助客戶提升算力使用效率與價值,數位無限亦計畫與硬體合作夥伴推出Agentic AI一體機方案,協助企業快速建立可驗證、可部署、可切割、可共享的AI運算環境,降低企業從PoC走向實際導入的門檻,加速AI落地。

總的來說,隨著AI競爭從模型能力延伸到算力治理,企業比拚的不僅是導入速度,而是能否建立一套足夠彈性、可持續演進的AI Infra,而這與數位無限的發展目標一致,將持續不斷優化產品服務,化身企業搶進AI新世代的關鍵合作夥伴。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
代理式商務連動百兆商機
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓