【黑貘來說】 挖掘巨量資料的秘密步驟
【黑貘來說】 挖掘巨量資料的秘密步驟
2013.03.26 | 創業

現在已經有太多的報導說某某公司利用使用者的行為記錄,來算出每一個人的喜好,並且導出商機等等新聞到處可見,但我相信大家看再多次,不是覺得這樣會不會太可怕了?不然就是這好厲害阿!這兩種答案,不然就是兩種都有。

但事實上這件事並不神奇或可怕,會覺得這樣是因為大部份的人不知道怎麼做,或者是說這能夠做甚麼,若是你知道後,發現這跟本只是個套來套去經過計算的結果,甚至在某方面你用手來算都可以,只是不一樣的是人只能處理少量資料,而電腦可以處理巨量資料,當很多事情會有量變產生質變的時候,威力就在此顯現,但這些步驟,說穿了一點都不聰明,甚至還非常的機械化的制式。

當然我不是很好的深入淺出的作者,所以沒辦法寫給大多數的讀者看,而是寫給已經有一點實務經驗的人,尤其是程式設計師或資料庫管理師等工程師,但若沒有這技術背景,我相信做這樣的拆解,可以讓大家從一知半解變成知道個大概,而透過這樣的了解,讓大家有機會去應用是我寫這幾篇的目的。

只是還有一個前提,就是我不會在這邊寫資料探勘的基礎,也就是說,「請先去看本資料探勘的書」,再來看下面幾篇文章吧。

目標:能夠知道某個特定人喜歡甚麼東西,購買每一個商品的機率,或者是說我們該如何推薦商品給他,以及知道他喜歡這商品的原因?

人與商品之間的行為有下面幾種:

  1. 瀏灠
  2. 放入清單
  3. 購買
  4. 評價或評論
  5. 其他

    上面每一種行為都有其數量化的差異,有些是一年幾次,幾十次或到幾百次或更多,而每一個行為都可能有個 「權重 (Weight)」,以及時間 (Time) 與次數 (Times) 的屬性,甚至更有可能是一個 Vector (向量) 的指標,例如喜好、觀感等等,無論是可以量化或不能量化,這些都可以成為建立人與商品的「關連」。

    所有的資料探勘系統實作都是從這些資料做轉化,甚至是簡化,畢竟可以運算,以及算得出結果才是重點,甚至是能夠算給所有消費者顧客使用才是資料探勘的精隨。

    但有趣的事是很多實用的系統都很少是用單一方法去建構出來的,畢竟除了人的行為之外,商品有有幾個屬性:

  6. 商品本質、內容

  7. 商品描述 (meta-data) 與分類
  8. 最後才是商品的使用

    在還沒有 Semantic Web 之前, 我們能用的就是商品的使用,也就是我們使用者/消費者與商品/物品之間的關係,而在有了語意網路之後,我們就可以進一步的處理本質 (文化商品) 與描述了,只是在這之前還要有幾個前置作業。

  9. 會自動化新增關鍵字詞的表

  10. 會自動化連結出語意網路的表

    這兩個表若是可以扣掉前面「會自動化新增/連結」 的話,我相信很多人都有從很多單位去取得這樣的詞庫與關連庫,但在實務上我們有絕大部份的狀況都是在處理運算最新的商品或議題時,沒有一種機制能夠新增或更新的話,幾乎是不實用的。

    只是這新增/更新有時不見得是自動化,因為自動化是件相當困難的事,就我所知有不少在做這項業務的公司單位,用的就是「工人智慧」,而不是人工智慧,但無論如何,有了這兩個表之後,再加上從資料探勘能夠得知的:

  11. 關連分析 (一階, 或高階)

  12. 群落分析 (Clustering)
  13. 時間序列預測

    有了上面三個很基本的工具後,可以配合產出很多的可能性:

  14. 最常見的關連購買

  15. 在搜尋結果中做排序
  16. 從分類結果做語意分析產出因子
  17. 有了高階的關連分析可以透過配對做活動
  18. 從銷售預測中作備品或庫存準備
  19. 只要你想得到的

    當然上面說得很簡單,好像是三兩天就可以開發出來的東西,但事實上單單一個「會自動化連結出語意網路的表」,我記得當時就弄了兩三個月才弄出來,當然現在再弄一次就只須要兩三天到兩三個星期了,畢竟有經驗跟沒有經驗還是差很多的。

    記得我在 5 年多前寫過 Data Mining 是一個須要跟效率挑戰的高度技術的事,但現在的機器已經比 5 年前快 5 倍了,加上資料庫的多樣性,雲端系統的完善,讓寫這樣的系統跟之前簡單不只 5 倍,我在兩個月以前自己從無到有又自己跑一次,以前須要半年的現在只要半個多月就夠了,想想時代還真可怕阿。

    所以說,在這樣成熟的時機而言,導入真正的巨量資料探勘已經不是預算的問題,也不是技術的問題,而是心態的問題了,你準備好了嗎?

轉自[黑貘來說](http://gene.speaking.tw/2013/03/blog-post_20.html)
關鍵字: #大數據
往下滑看下一篇文章
強震激發營運升級思維:富邦泰國保經攜手自由系統以 M365 與 DaaS 打造韌性辦公
強震激發營運升級思維:富邦泰國保經攜手自由系統以 M365 與 DaaS 打造韌性辦公

因應台商南向布局,富邦產險早在1989年即進入東南亞市場,並於2006年設立富邦保險經紀人(泰國)股份有限公司(以下簡稱富邦泰國保經),長期協助企業客戶掌握在地風險與營運機會。

一場突如其來的災害,讓富邦泰國保經意識到:現代化辦公環境才是支撐持續成長的關鍵。

「2025年3月28日下午,緬甸發生規模7.7強震,對曼谷帶來巨大衝擊,如高樓倒塌,以及員工基於安全考量無法正常進辦公室。」富邦泰國保經總經理吳明凱回憶:「這件事讓我們意識到,企業不能再把『辦公室』當成唯一的工作場域,必須將『營運不中斷』從口號轉為落地的能力。」

而這,也是富邦泰國保經會啟動現代化辦公模式升級的關鍵。

從IT支援到營運韌性,自由系統扮演關鍵角色

對多數南向布局的中小型據點而言,IT往往不是優先投資項目,富邦泰國保經同樣面臨人力精簡、資源有限、缺乏專職IT人員等挑戰,在跨國溝通與合規要求的牽引下,增加新系統的導入複雜度。

「我們需要的不只是技術,而是能幫我們『說清楚』的人,而這正是我們會選擇與自由系統合作的關鍵因素之一。」吳明凱回憶雙方第一次接觸是富邦泰國保經突然面臨網路連線問題,但因語言隔閡以及在地服務廠商的品質參差不齊,既有廠商花費許多時間仍找不出根本問題,但這個狀況在自由系統進場後便迎刃而解,透過排查網路電話跟系統設定等方式,自由系統短短幾個小時就找到問題、隔天成功修復,展現專業的技術能量,逐步建立雙方的信任與合作關係。

富邦保險經紀人(泰國)股份有限公司_吳明凱總經理
富邦保險經紀人(泰國)股份有限公司 吳明凱 總經理
圖/ 數位時代

從早期協助排除網路斷線問題,到後續整體架構優化,自由系統不僅展現即時技術能力,更重要的是,能在(富邦產險)總部規範、在地環境與使用者需求之間進行有效轉譯,以長期且彈性的方式提供協助,讓富邦泰國保經得以專注核心業務發展、不用再為IT問題分心。

自由系統泰國區域經理潘子維表示:「我們與富邦泰國保經的關係不是單純的一次性系統工具導入,而是在合規前提下,協助富邦泰國保經重構工作模式與IT架構,讓技術真正服務營運,兼具營運韌性與業務彈性。」

M365+DaaS,不只是工具,而是「可持續運作的辦公基礎」

自由系統因應富邦泰國保經的商業模式與需求提出短、中、長程規劃與建議後,立即從三個面向協助優化資訊系統架構:導入 Microsoft 365、引進裝置即服務(Device as a Service;DaaS),以及在網路架構不變的狀況下升級交換機、建置防火牆與導入虛擬私人網路(Virtual Private Network;VPN)設備,藉此建立一個不受地點限制、具備安全與彈性的工作環境。

例如,富邦泰國保經在自由系統的協助下將傳統桌機全面轉向筆電,並透過DaaS整合設備生命週期管理、資安設定與IT支援,成功將原本零散的維運工作轉為可預測、可控的服務模式。

吳明凱表示:「M365與DaaS上線時間短短不到半年,便取得亮眼成果:不僅大幅降低IT維運負擔、建立遠距辦公能力,更進一步降低營運相關文件儲存成本,以及全面強化資安防護機制。」更重要的是,透過自由系統提供的教育訓練與流程轉換,非IT背景的同仁也能順利上手,確保資訊投資發揮實際效益。

從IT現代化到AI驅動營運升級

隨著遠距辦公環境與IT基礎架構現代化工程完畢,富邦泰國保經與自由系統將目光轉向下一階段:AI應用。雙方計畫在2026年底或明年初評估、導入智慧文件分析、自動化流程與AI協作工具,藉此將財務等人員從高重複性的作業中釋放出來、將心力聚焦在更高價值的決策與分析工作。

而這意味著:IT的角色將從支援系統進一步升級為驅動營運效率與創新的引擎。

從自由系統與富邦泰國保經的實務,可以清楚看到:在「不確定」已成常態的時代,企業競爭力不再只來自規模或資源,更在於是否具備能在任何情境下持續運作、快速調整的能力。過去,這樣的能力或許多屬於大型企業;如今,透過適切的合作夥伴與IT架構設計,中小型企業與海外據點同樣可以快速建立具韌性的營運基礎。

對富邦泰國保經來說,M365、DaaS與機房重整只是起點,真正關鍵的,是打造一套能隨環境變動持續進化的營運基礎,而這正是自由系統長期深耕的核心價值,不僅協助企業完成IT現代化,更憑藉長期積累的服務經驗,陪伴企業建立具彈性且能持續演進的營運體系,為下一階段的營運升級與成長奠定更穩固的基礎。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
代理式商務連動百兆商機
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓