掌握資料科學的四大分析步驟，啟動 AI 專案|數位時代 BusinessNext

掌握資料科學的四大分析步驟，啟動 AI 專案

人工智慧（AI）的應用更是愈趨廣泛，舉凡語音助理、手機美拍、人臉辨識等，非電腦科學背景的職場工作者能不能善用AI，將是影響未來職場競爭力的關鍵。

數位科技的運用，不僅驅動智慧化生活，企業也加快推動數位轉型，人工智慧（AI）的應用更是愈趨廣泛。舉凡語音助理、手機美拍、人臉辨識、個人會行銷，都是日常生活中常見的應用。這些新穎的技術，不只讓生活更方便，也悄悄地影響了多數職場工作者的工作內容。對非電腦科學背景的職場工作者來說，能不能善用人工智慧、與人工智慧協同合作，將是影響未來職場競爭力的關鍵。

不會寫程式，也能做 AI 專案嗎？全球知名資訊科技研究顧問機構 Gartner 近日發佈的一份文章指出，在 2024 年將有 80% 的科技產品與服務出自於非 IT 技術專業人士，這項變革背後最大的推手即是無程式碼工具（no-code AI tool）。只要瞭解基礎的資料分析流程與原理，運用這類的 AI 建模軟體，即可快速建立 AI 模型。

資料科學專案的分析步驟

以精準行銷的 AI 專案為例：某雜誌擁有大量的訂戶，平時也有經營社群，並且推廣課程。今年推出了一套針對中高階主管的全新的商管課程，希望能夠透過精準投放，提高課程的購買率。然而行銷的總預算有限，在茫茫的會員人群中，要如何篩選出成交機率高的會員，提升效率與利潤，是行銷部門的首要之務。

要達到上述目的，需要打造「潛在客戶名單推薦系統」，作法如下：首先，要將訂戶資料與社群會員資料做整併，進行初步的資料探索。在這個步驟，我們可能發現有少部分客戶的年齡被誤植成負數（資料探索）。為了不影響後續建立模型後的準確率，我們將這幾筆資料予以刪除（資料清理）。接著以 AI 建模軟體建立購課成交率的預測模型（建立模型），再從中選出表現最佳的模型，介接至潛在客戶名單推薦系統，對所有客戶名單進行購課成交率預測，針對成交率高的客戶，進行簡訊或電話行銷（模型部署、實際應用）。

從以上的範例可以發現，資料科學的工作流程大致可以歸納成以下四大步驟：

一、資料探索

對手上的分析繪製簡單的統計圖表，並且觀察個欄位的統計量。其目的在於了解資料的分佈是否與認知相符，查看離群值的分佈，找出關聯性，從圖表找出洞察，建立並測試假說。
在這個步驟，經常查看的統計量有：平均值（Mean）、中位數（Median）、眾數（Mode）、最小值（Min）、最大值（Max）、範圍（Range）、四分位差（Quartiles）、變異數（Variance）、標準差（Standard deviation）。
圖表方面，常見的單變量的圖表有直方圖（Histogram）、柱狀圖（Bar chart）；雙變量的圖表則是會看散佈圖（Scatter plot）、箱型圖（Box plot）、熱力圖（Heat map）。

二、資料清理

在資料探索階段，可能會發現許多內容不合理的數據，或是遺失值。此時需要仔細檢查為什麼會收到這樣的資料，並針對不同的情境，做出相對應的資料清理動作。
像是發現某些訂戶資料的年齡為負數時，深入去檢查原始資料庫的資料，發現是雜誌社的工作人員登打的時候，將客戶的出生日期打錯了，因此後續才會有有不合理的年齡資訊。此時可以考慮將該筆資料移除，維持資料的正確性。

三、建立模型

資料清理完畢之後，只要訓練資料集與演算法之後，即可建立 AI 模型。目前市面上的 AI 建模軟體已經內建 Auto ML 技術，使用者毋須一一調整參數，軟體會自動進行參數最佳化，將最佳的結果回傳。

四、模型部署、實際應用

上述的步驟可以多次反覆執行，建立多個 AI 模型。從中挑選出表現較佳的模型，將之部署上線，開始實際運用到工作場域中。

上述的範例中，行銷人員每月可將新收集到會員資料匯入「潛在客戶名單推薦系統」，系統即回傳成交機率較高的客戶名單。行銷人員即可用這份名單執行後續的促銷活動。

AI 時代的行銷利器：Tukey

對於行銷、業務人員而言，不外乎想要讓更多人可以認識自家產品，提高潛在客戶的成交意願，進而提升訂單成交率。由 Chimes AI 詠鋐智能所研發的企業級 AI 建模與管理平台 Tukey ，可提供精準投放、商品推薦、挖掘潛在商機、商品銷量預測等各種行銷面向上的決策輔助。

Tukey 的 No-Code AI 產品設計，提供非機器學習演算法專家 (譬如：銀行理財專員、電商營運專員) 簡單直覺的操作介面，讓直接面對營運問題的一線人員，迅速完成 AI 模型建置，提升工作效率。Tukey 也可以完整追溯資料專案的資料歷程，在需要跨部門團隊協作的場合，彌平認知落差，亦可與他人進行跨平台的協同運作，增加工作的一致性與正確性，進而提升工作效率。

Tukey 目前已經被台塑公司採用，並且被納入台灣人工智慧學校的高階經理人班教材。想了解更多，歡迎報名《數位時代》推出的「資料科學概念系列課」！立即打造你的第一個 AI 行銷專案吧！