訓練AI模型，要多少數據？拆解企業人工智慧專案為何難落地|數位時代 BusinessNext

訓練AI模型，要多少數據？拆解企業人工智慧專案為何難落地

企業導入AI似乎已成為一種趨勢，但是訓練AI模型，需要多少數據？其背後的商業命題與成本又該如何解決？帶你來一起窺探AI專案背後的秘密！

企業的AI專案在釐清問題本質、找到命題之後，首先會面臨到一個問題：收集數據（Data Collection）和建立AI模型（Model Establishing），該以什麼作為評估基準？

訓練一個AI數據模型，需要多少數據？

訓練AI數據模型時，其實有三個要素，彼此互相影響。分別是： 商業問題的複雜度 、 AI模型複雜度 （Model Complexity），以及 數據複雜度 （Data Complexity）。

因此，如果想知道需要多少訓練數據（Training Data），建議先釐清：這個AI專案到底要處理什麼問題，以及這個問題有多複雜？確定之後，再來判斷應該選用哪種程度的模型來做訓練。根據不同的商業命題複雜度，用不同複雜度的模型和精準數據彼此搭配，找出最佳平衡，才能讓AI專案順利落地。

但光憑想像，很難評估實際的AI數據量和成效，所以開始AI的第一步，需要先透過POC概念驗證（Proof of Concept）實驗來找答案。

AI模型的POC概念驗證實驗怎麼做？

簡單來說，就是針對不同複雜程度的商業問題，嘗試選用不同複雜度的模型搭配測試，直到模型跑出來的曲線，符合理想目標。

一般狀態下，假設商業問題本身的複雜度很高，我們會預期要選擇複雜度較高的模型。但是如果數據量不足，那麼選擇複雜度較高的AI模型，反而會比用簡單的AI模型效果還差。（上圖左上、右上，分別代表複雜度10和複雜度50的問題，可以明顯看出複雜的模型曲線比較接近學習數據集（Dataset），但是在測試數據集上的誤差 Eout，反而比簡單模型還差了許多。）

上圖的左下和右下，是以不同複雜度的模型去做POC，跑出來的結果曲線圖。藍色線代表的是學習數據（Training Data）成效，紅色線代表的是測試數據（Testing Data）成效。最理想的POC目標，應該是兩條曲線很貼近彼此，而且位置越低越好。

我們會發現，左下這張圖的兩條曲線雖然彼此貼近，但是就算增加數據，也無法降低誤差。這表示模型偏誤（Bias）高，效果不佳，應該要增加模型複雜度（Model Complexity）。

增加模型複雜度之後，就會像右下這張圖，藍色曲線（學習數據）雖然數值很低，但在學習數據不足的情況下（灰色區塊），紅色曲線（測試數據）卻「飄」得太高。這表示模型變異誤差（Variance）高，應該要增加學習數據。最後在慢慢增加模型複雜度以及學習數據之後，我們就可以達到理想的結果（兩條曲線很貼近彼此，而且位置越低越好）。

數據哪裡來？發展AI人工智慧之前，先建立數據流

先前我在文章裡提到，很多企業會急著開發AI模型，但AI專案落地經驗的三大關鍵之一，其實是先確認：是否已經準備好數據了？如果沒有這樣的能力，談AI落地其實有點好高騖遠。

AI數據收集（Data Collection）最大的挑戰，在於針對不同型態的命題，會產生不同的AI數據需求，因此需要建立的「數據流」（Data Pipeline），AI數據處理（Data Processing）和數據標註（Data Annotation）的模式及流程也會有所不同。

發展AI之前，如果能建立起從數據收集（Data Collection）、數據處理（Data Processing）到AI模型學習的數據流（Data Pipeline），並確保可以順暢運行，實際訓練AI模型時才會省力很多。

數據不夠或太多怎麼辦？

Google開設的機器學習（Machine Learning）課程中，第一項原則就開宗明義地指出：「Don’t be afraid to launch a product without machine learning」。

如果你的產品或業務不一定需要用到機器學習（Machine Learning），那就別用，除非你有AI數據。有數據，再來談機器學習（Machine Learning）。但在業界的實際狀況，大家不是沒有數據，而是只有一些些，這時候該怎麼辦？我會建議，先從小地方開始做起，也就是從POC專案著手。

POC專案要有具體成效，除了要注意設計專案、實驗模型的指標（Metrics），企業最重要的是要先定義清楚：AI專案要達到什麼樣的指標，才算是成功？這樣最後做出來的成果，才會真正符合商業目標。

如果今天不是沒有AI數據，而是數據很多，又該從何下手呢？

我建議，嘗試減少訓練AI人工智慧時的「 數據大小 」和「 數據筆數 」。

過去曾經處理過一個AI專案，數據多達2億筆。第一次實驗，把數據全部餵進AI模型，取得結果。第二次，只拿其中有代表性的500萬筆出來訓練人工智慧。

猜猜結果如何？兩次實驗的表現，只差異不到1%。

所以，如果企業對於AI數據的品質和數量有一定程度的自信根據，其實不用把數據全部餵進AI模型訓練（Model Training），只用有代表性的AI數據來訓練就可以了。市面上很多常見的AI工具（Cluster），可以做到這點，幫助省時省力。

AI模型訓練，記得校準商業目標

企業發展AI人工智慧的最終目的，還是希望能 達到商業目標，創造價值 。

所以，訓練AI模型時，團隊如果不知道如何判斷哪個指標，對AI模型學習來說比較重要，建議回歸初心，重新釐清「 這個專案想達到的商業目標是什麼 」。

比方，趨勢科技（Trend Micro）要開發一個能夠判斷電腦病毒的AI，但是勒索病毒（denial-of-access attack）和廣告病毒對客戶的傷害程度大不相同。這時候，工程師就會針對這個命題，餵給AI模型不同病毒種類的數據，讓它學會判斷不同病毒的重要性，分辨出哪些病毒比較嚴重不能有判斷錯誤，而哪些病毒比較無害，不一定要做到一百分。

最常見的訓練方法，是用成本函數（Cost Function）的方式，訓練完再回去調整AI模型的評分（Rating），用加扣分的方式，告訴機器它的學習表現是好是壞，做對就加分，做錯就扣分。

上述評分原則的制定，和企業的商業價值考量息息相關，所以一般在組織分工，會由PM專案團隊負責判斷哪些項目重要，請資料科學家設計在上述Cost Function裡面。

很多人以為，AI人工智慧開發要做到很完美才行，但其實根據我們的經驗，只要AI開發成本符合預算、AI模型表現可接受（大約做到60–70分），而且結果有助於降低成本，就可以算是達到商業目標。反過來，即使AI模型表現非常好（高達90分），但成本卻遠超出預算，就不建議執行。

另外，因為POC階段會做很多的實驗，需要拿兩個穩定且可以互相比較的基準做A/B Test，所以做好基礎建設非常重要。

如果一個團隊裡面有三位工程師，但三個人做出來的結果都無法互相比較，那麼這個實驗就會變得霧裡看花，導致AI專案難以落地。

AI數據小學堂：模型指標（metrics）

在做模型實驗時，通常會用混淆矩陣（Confusion Matrix）的四種指標：TP（True Positive）、TN（True Negative）、FP（False Positive）、FN（False Negative），以及Count、Unique和Accuracy等等函數，來判斷這個模型的表現好不好。

P或TN值，代表模型辨識的答案正確，和預期結果一致。例如：模型正確判斷出「這是一隻貓」、「這不是一隻貓」。而FP或FN值，則代表模型的判斷錯誤，例如「明明是貓，模型卻說不是貓」、「明明不是貓，模型卻說它是貓」。

責任編輯：文潔琳、蕭閔云
本文授權轉載自：若水AI數據處理實戰攻略

從「人」出發：從超級個體到超級組織，啟動 AI 原生轉型

TVBS 集團成長長簡西村表示，早在生成式 AI 浪潮成形之初，TVBS 便已啟動轉型布局。不僅於 2023 年成立AI未來科技部，專責 AI 應用開發與轉型推進，更由董事長親自主持每週一次的 AI 策略會議，確保決策與執行節奏高度一致，並進一步盤點出「人、流程、科技（PPT）」三大轉型關鍵，逐步落實將 AI 導入各項營運環節。

從「人」的角度來看，TVBS 以 AI 提升效率與創造價值為目標，提出超級個體與超級組織的轉型藍圖。其中，超級個體指的是能善用 AI 工具的記者，例如：透過 AI 分析海量資料、自動生成初稿或經營個人品牌，透過與 AI 的分工協作，不僅提升產出效率，也讓記者得以回歸深度核實與現場採訪等核心職能。

當多個超級個體串聯，便進一步形塑出超級組織，透過 AI 全面提升團隊的數位戰力，成為 AI Native（AI原生）媒體組織。TVBS 的願景是，讓每一個議題皆能發展出專屬 AI Agent，負責資料處理與初稿生成，而人扮演總編輯角色，負責內容品質與倫理把關。如此一來，不僅能實現全天候、高頻率的內容更新，更可透過多 Agent 協作，同時產出文字、影音、Podcast 等不同形式的內容，實現一次生產、全平台分發的目標。

從「流程」出發：讓AI嵌入新聞產製，縮減 30% 作業時間

從「流程」的角度來看，AI 唯有真正嵌入新聞產製流程，才能發揮最大效益。然而，哪些環節最適合導入 AI、導入後流程該如何重塑，往往只有第一線新聞人最清楚。為此，TVBS 邀請新聞部同仁組成「文科種子」團隊，並由主管從日常工作情境出發，親自示範 AI 應用，讓記者實際感受到 AI 帶來的效率提升，進而翻轉「不好用」的既有印象，吸引更多資深同仁投入 AI 應用開發。

TVBS新聞部網路新聞中心總編輯楊致中強調，「AI不是要把新聞人變成工程師，而是要讓新聞人重新回到專業現場。」因此，這群橫跨編輯、記者、編譯等不同職能的種子成員，從使用者視角出發，與工程師並肩協作，以使用情境取代傳統規格書，讓技術團隊得以深入理解採訪流程中的真實痛點，進而開發出涵蓋多語翻譯、初稿生成、重點歸納、多稿比對、標題與內容優化等 AI 應用，整體作業時間平均縮短逾三成。同時，新聞部也與 AI 部門建立每週開會機制，持續提出痛點及回饋使用經驗，推動產品快速迭代。

另一方面，TVBS 也連續三屆舉辦員工限定的「AI 黑客松」，各部門同仁由日常工作中的痛點出發，發想出更貼近第一線需求的 AI 解決方案，讓 AI 逐步成為組織共通的語言，不僅有效提升工作效率，也進一步形塑出 AI 驅動的創新文化。

從「科技」出發：打造混血系統 AI WIZE，讓AI真正貼近使用需求

從「工具」的角度來看，如何在滿足使用需求的同時兼顧技術快速迭代，成為關鍵課題。為此，TVBS 提出混血系統概念，由新聞人與 AI 部門協助，共同開發出專為媒體場景打造的 AI WIZE 平台。

TVBS AI未來科技部副總監吳楨文說明，AI 技術迭代速度極快，若仍沿用傳統「使用者提需求、工程師寫程式」的開發模式，不僅溝通成本高、也難以快速及時優化，容易導致使用體驗不如預期。若是直接使用外部 AI 工具，在產出結果不穩定的情況下，使用者常常要反覆調整提示詞與修正細節，反而會增加時間成本，使 AI 應用淪為新的負擔。

為解決這樣的困境，TVBS 在開發 AI WIZE 時，結合系統化與人才混血兩大策略，由工程師在「深水區」把關系統架構、資訊安全與成本控管，而新聞人則在「淺水區」透過 AI Studio 等自然語言工具定義應用場景，並將新聞專業封裝成可重複使用的 AI Agent技能，同時透過持續回饋機制，讓 AI Agent 不斷學習與優化，使工具更貼近日常工作需求。

簡西村最後強調，人機協作不是選擇，而是必然路徑。TVBS 期望透過這場 AI 轉型，打造兼具速度、深度與可信度的新型媒體競爭力，並以自身實踐經驗為基礎，帶動台灣媒體在 AI 浪潮下強化整體產業競爭力，重新定義媒體的「真實」價值，開創新聞產業的 AI 新時代。