一個門外漢的資料科學學習之旅
一個門外漢的資料科學學習之旅

「嗯,就決定去試看看了!」那年大三,系上瀰漫著一股有意無意互相試探畢業專題指導教授的詭譎氛圍。

當時,我在偶然的機會下看到一則世界最大的超市集團沃爾瑪(Walmart)的網路文章。他們用資料探勘技術分析會員資料,偶然發現週五晚上男性的結帳清單中啤酒和尿布具有高度相關性,深入解析原因發現是因為年輕爸爸抓住到超市採購小朋友尿布的機會,順手拿了幾罐啤酒好迎接將到來的週末。

沃爾瑪於是調整商品陳列,將啤酒與尿布擺放在鄰近的位置,進而提升商品30%的銷售率。那是我第一次接觸到資料探勘這個名詞。就因為這樣?資料探勘?成長30%?我覺得很神奇。

於是在毫無任何先備知識的狀況下,硬著頭皮主動詢問教授能不能有機會執行相關主題?獲得同意後,我開始了人生的第一個資料科學相關實作。是的,毫無任何先備知識,沒有學過任何關於統計、機器學習的知識。

被神化而不得其門而入的資料科學

很多人神化了資料科學。過度膨脹的謠傳使得資料科學與普羅大眾之間築起了一道牢不可破的高牆。要不覺得非得要是程式天才或是數學神童,才算是真的有能力踏進資料科學領域,要不就是三不五時報章雜誌報導資料科學預測出誰會當選美國總統,或是機器學習和人工智慧又一次打敗人類棋王等等的新聞,而讓人產生一些半信半疑的幻想。

大家都在談,但卻沒有人真的知道它是什麼。我相信很多人腦海中曾經躍躍欲試想稍加了解,但卻又因為某種光怪陸離的說法讓資料科學在心裡慢慢變成比較接近玄學的不切實際,然後就漸漸演變為想接近卻又不得其門而入,望之卻步。

我想,只需要一點點好奇心跟傻勁就夠了。搜尋資料科學教學影片,或是瀏覽一個已經完成的競賽,看看別人的做法,然後找份資料動手試試看,幾十個、幾百個長度的小小資料,從Excel開始也無所謂。

因為,資料科學只是一種用資料解決問題的方法罷了!

PHP之父Rasmus Lerdorf
我不是一個真的工程師。我把東西弄一弄,弄到能跑之後就不管了。真的工程師會說「這段程式能跑,但記憶體沒管理好,我們來修好它。」我只會說,一直重新開機不就好了。

你很難想像這段話是出自世界上最頂尖的工程師之一:PHP之父Rasmus Lerdorf的嘴裡。但是資料科學也一樣,不用什麼天分或熱情,也同樣是可以學習的,並沒有想像中的難以接近。

從眾迷思的漩渦

「我不懂,所以資料科學到底能幫我們公司做些什麼,為什麼一定要資料科學?」

幾年後,在一家新創公司每月底的全公司例行分享會中,談到當時業界最火熱的資料科學話題,一個精通三國語言、承接海內外業務的產品經理問了這個問題。

「事情該發生,它就會發生,自然而然就會知道了。」印象中,我聽到公司的資料科學家是這麼回答的。

「我想,他的意思是當事情水到渠成時,該產生幫助時就會產生幫助,也非得一定要資料科學,而只是剛好被它實現。」看著那位產品經理仍一臉狐疑後,執行長補充道。

我知道會議結束後,那位產品經理仍然沒有真的理解他們的回答。

我確定我想舉起手補充一點什麼,但很意外的我語塞了,做過大大小小的專案,我一直以為我很清楚資料科學在做些什麼。

資料科學浪潮

進入資料科學領域的歷程似乎一切都來得太過自然。自然的就像企業間無不戰戰兢兢的爭相仿效,並大張旗鼓聲明要投資多少資金在資料科學領域一樣。沒有太多原因,只因為不做的話,好像會被所謂的「大數據浪潮」吞噬。

我試著從頭釐清我的學習歷程,給出一個能說服自己的說法。資料科學,必須建構在資料可以被輕鬆且大量存取的技術成熟之後。

受益於雲端化的普及,當今的企業幾乎都能輕鬆存取資料,而就因為資料夠多、夠齊全,我們便能試著從這些資料中,用一些科學化的方法去產生可以被公司利用的價值,進而將資料轉化為知識。

也許是預測公司下一季的財報,幫助財務部門編列預算。也許是分析生產線機台的工作數據,預測出未來一週內可能故障的機台,早一步檢修以降低產品良率不佳的風險。甚至是分析客戶資料,將不同特徵的客戶分類,並進一步針對不同分類的客戶給予適合的行銷手段等等。

當然,我絕對同意上述例子不見得需要資料科學也可以完成。資料科學,是一種透過資料為媒介,講求流程性與科學化的方法,進而輔助、驗證甚至主導所訂下的目標,讓目標的達成能更有效率且更準確。

「其實,資料科學只是一種讓公司的某些策略不全然只是依靠主觀意識判斷的方法而已,它一樣是一種提出問題、驗證問題進而解決問題的方法,和其他方法唯一的不同只是:它的載體可以是公司中的任何資料罷了!」我仔細的思考後給了自己這樣的答案。

那趟回家的路途,是踏實而滿足的。

本文為讀者投書,出自<一個門外漢的資料科學學習之旅>。

《數位時代》長期徵稿,針對時事科技議題,需要您的獨特觀點,歡迎各類專業人士來稿一起交流。投稿請寄edit@bnext.com.tw,文長800至1000字,兩天內會回覆是否採用,文章會經編輯潤飾,如需改標會與您討論。
關鍵字: #資料科學
往下滑看下一篇文章
健細胞科技攜手中興大學,推出「Cancell Insight」醫療AI 輔助決策平台,消弭醫療數位鴻溝
健細胞科技攜手中興大學,推出「Cancell Insight」醫療AI 輔助決策平台,消弭醫療數位鴻溝

為打破醫療 AI 高昂的算力與人力門檻,健細胞科技與國立中興大學資管系蔡孟勳教授團隊產學合作,正式推出「Cancell Insight 醫療 AI 模型平台」(https://insight.cancell.ai)。該平台以 SaaS(軟體即服務)模式提供一站式託管,讓先進的醫療 AI 資源不再侷限於大型醫學中心,有效消弭基層與城鄉間的醫療數位鴻溝。

軟體硬實力:打通 AI 落地最後一哩路

過去,許多由學術或生技單位開發的優秀模型因缺乏部署工具,往往淪為「實驗室孤兒」;而中小型醫院也常因 IT 建置成本對 AI 望之卻步。

健細胞科技創辦人周子堯Victor憑藉其UIUX規劃、程式開發技術背景,親自領軍AI 模型研發團隊,建構 Cancell Insight 平台。他強調,智慧醫療落地必須具備「無感化部署」、「持續性反覆運算」與「大眾化使用」三大要素。Cancell Insight 包辦了從數據清潔、標註到模型訓練與部署的底層工程,醫療機構僅需提供去識別化數據,繁瑣技術難題全由平台解決,讓 AI 真正回歸醫療「輔助」本質。

專為高壓臨床環境設計,七大核心優勢重新定義臨床運作效率

健細胞科技
Cancell Insight提供涵蓋數據清洗、精準標註、模型訓練至部署託管的一站式解決方案
圖/ 健細胞科技

【行動化與 LINE 整合】 支援 LINE 一鍵登入,醫師可直接透過官方帳號上傳檔案呼叫模型並查閱紀錄,實現真正的醫療行動化。

【隨選模型與高相容性】 提供多元 AI 模型庫供彈性訂閱。每組模型具備獨立 API Key,可無縫串接醫院現有 HIS 系統或 APP。

【團隊協作共享】 首創以「團隊」為服務單位,跨科別成員可同步共享模型權限、數據分析與歷史紀錄,提升研究協調效率。

【自動化數據處理】 支援模板批次上傳,內建自動校準系統,若格式不符將自動轉檔、去識別化與重構,大幅解放 IT 人力。

【雙模態 AI 解析】 深度整合 Dr.Cell AI (Gemini) 多模態能力,不僅輸出預測結果,更提供進階臨床解說與治療準則問答,提升決策參考價值。

堅守醫療嚴謹性,推動醫療平權與永續商業價值

在追求科技創新的同時,Cancell Insight 嚴格把關醫療安全性。平台所有 AI 模型輸出結果均定位為「臨床決策輔助」與「研究檢測輔助」,透過「非直面病患」的機制,確保所有 AI 建議皆由專業醫療人員進行最終判讀。

透過 SaaS 專案訂閱模式,Cancell Insight 成功以合理經費取代了傳統的高額硬體採購,讓中小型醫院與偏鄉診所也能具備同等的診斷實力,落實真正的醫療平權。對研發端而言,平台不僅是加速醫療科技商用化、縮短變現週期的推進器,其高度結合日常工作流的特性,更有效減少了醫護的行政負荷,緩解當前醫療量能短缺的危機。

【進階部署】啟動臨床試驗,Docker 地端部署確保資安與時效

為進一步驗證臨床效益並符合醫療機構對資訊安全的高標準,Cancell Insight 即將與各大醫療機構攜手展開「臨床研究計畫」。針對有高度資安控管需求的醫院,平台提供彈性的 Docker 地端模型部署(On-premise Deployment) 方案。第一線的醫師與護理師可直接在院內本機端快速啟動 AI 模型,安全地注入病患臨床數據後,即可「零時差」取得預測結果。此舉不僅確保了敏感醫療數據「不出院」,完美符合嚴格的醫療法規與病患隱私要求,更能實際驗證 Cancell Insight 在真實高壓的臨床場域中,能即時、有效地提供精準的決策輔助。

健細胞科技
部署輕量化模型於地端,支援離線模式使用模型,完善保護企業敏感資料
圖/ 健細胞科技

展望未來,擴大智慧醫療生態圈

透過 SaaS 模式取代高額硬體採購,Cancell Insight 致力落實醫療平權。未來,健細胞科技將以此平台為樞紐,尋求跨界深度合作:

醫療機構: 提供各級別醫院隨選即用的 AI 助理及地端部署選項。
學術/生技: 協助實驗室模型落地,並優化新藥研發與臨床試驗的數據處理效率。
商業保險: 整合 AI 評估工具,提供更精準的健康管理與風險控管服務。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
AI全球100+台灣20
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓