【黑貘來說】 挖掘巨量資料的秘密步驟
【黑貘來說】 挖掘巨量資料的秘密步驟
2013.03.26 | 創業

現在已經有太多的報導說某某公司利用使用者的行為記錄,來算出每一個人的喜好,並且導出商機等等新聞到處可見,但我相信大家看再多次,不是覺得這樣會不會太可怕了?不然就是這好厲害阿!這兩種答案,不然就是兩種都有。

但事實上這件事並不神奇或可怕,會覺得這樣是因為大部份的人不知道怎麼做,或者是說這能夠做甚麼,若是你知道後,發現這跟本只是個套來套去經過計算的結果,甚至在某方面你用手來算都可以,只是不一樣的是人只能處理少量資料,而電腦可以處理巨量資料,當很多事情會有量變產生質變的時候,威力就在此顯現,但這些步驟,說穿了一點都不聰明,甚至還非常的機械化的制式。

當然我不是很好的深入淺出的作者,所以沒辦法寫給大多數的讀者看,而是寫給已經有一點實務經驗的人,尤其是程式設計師或資料庫管理師等工程師,但若沒有這技術背景,我相信做這樣的拆解,可以讓大家從一知半解變成知道個大概,而透過這樣的了解,讓大家有機會去應用是我寫這幾篇的目的。

只是還有一個前提,就是我不會在這邊寫資料探勘的基礎,也就是說,「請先去看本資料探勘的書」,再來看下面幾篇文章吧。

目標:能夠知道某個特定人喜歡甚麼東西,購買每一個商品的機率,或者是說我們該如何推薦商品給他,以及知道他喜歡這商品的原因?

人與商品之間的行為有下面幾種:

  1. 瀏灠
  2. 放入清單
  3. 購買
  4. 評價或評論
  5. 其他

    上面每一種行為都有其數量化的差異,有些是一年幾次,幾十次或到幾百次或更多,而每一個行為都可能有個 「權重 (Weight)」,以及時間 (Time) 與次數 (Times) 的屬性,甚至更有可能是一個 Vector (向量) 的指標,例如喜好、觀感等等,無論是可以量化或不能量化,這些都可以成為建立人與商品的「關連」。

    所有的資料探勘系統實作都是從這些資料做轉化,甚至是簡化,畢竟可以運算,以及算得出結果才是重點,甚至是能夠算給所有消費者顧客使用才是資料探勘的精隨。

    但有趣的事是很多實用的系統都很少是用單一方法去建構出來的,畢竟除了人的行為之外,商品有有幾個屬性:

  6. 商品本質、內容

  7. 商品描述 (meta-data) 與分類
  8. 最後才是商品的使用

    在還沒有 Semantic Web 之前, 我們能用的就是商品的使用,也就是我們使用者/消費者與商品/物品之間的關係,而在有了語意網路之後,我們就可以進一步的處理本質 (文化商品) 與描述了,只是在這之前還要有幾個前置作業。

  9. 會自動化新增關鍵字詞的表

  10. 會自動化連結出語意網路的表

    這兩個表若是可以扣掉前面「會自動化新增/連結」 的話,我相信很多人都有從很多單位去取得這樣的詞庫與關連庫,但在實務上我們有絕大部份的狀況都是在處理運算最新的商品或議題時,沒有一種機制能夠新增或更新的話,幾乎是不實用的。

    只是這新增/更新有時不見得是自動化,因為自動化是件相當困難的事,就我所知有不少在做這項業務的公司單位,用的就是「工人智慧」,而不是人工智慧,但無論如何,有了這兩個表之後,再加上從資料探勘能夠得知的:

  11. 關連分析 (一階, 或高階)

  12. 群落分析 (Clustering)
  13. 時間序列預測

    有了上面三個很基本的工具後,可以配合產出很多的可能性:

  14. 最常見的關連購買

  15. 在搜尋結果中做排序
  16. 從分類結果做語意分析產出因子
  17. 有了高階的關連分析可以透過配對做活動
  18. 從銷售預測中作備品或庫存準備
  19. 只要你想得到的

    當然上面說得很簡單,好像是三兩天就可以開發出來的東西,但事實上單單一個「會自動化連結出語意網路的表」,我記得當時就弄了兩三個月才弄出來,當然現在再弄一次就只須要兩三天到兩三個星期了,畢竟有經驗跟沒有經驗還是差很多的。

    記得我在 5 年多前寫過 Data Mining 是一個須要跟效率挑戰的高度技術的事,但現在的機器已經比 5 年前快 5 倍了,加上資料庫的多樣性,雲端系統的完善,讓寫這樣的系統跟之前簡單不只 5 倍,我在兩個月以前自己從無到有又自己跑一次,以前須要半年的現在只要半個多月就夠了,想想時代還真可怕阿。

    所以說,在這樣成熟的時機而言,導入真正的巨量資料探勘已經不是預算的問題,也不是技術的問題,而是心態的問題了,你準備好了嗎?

轉自[黑貘來說](http://gene.speaking.tw/2013/03/blog-post_20.html)
關鍵字: #大數據
往下滑看下一篇文章
把身心狀態當公司財報管理?公關教母岳啟儒用AI,讓休息也能成為一門科學!
把身心狀態當公司財報管理?公關教母岳啟儒用AI,讓休息也能成為一門科學!

在被數位浪潮推著跑的時代,「斜槓」早已非新鮮事,近來更成為現代菁英的標準配備。而仲誼公關創辦人岳啟儒,便是「多工」的最佳代表。她每天要打理公司的日常事務,要錄製Podcast節目和線上課程,還要完成去參加各項馬拉松賽事的訓練菜單,兒子放假回家時,又要和寶貝們一起追動畫。對她而言,生活就像多個視窗同時運作的電腦螢幕,時刻都必須進行高強度的身分切換。

想管理如此多工的斜槓人生,岳啟儒是怎麼辦到的?

善用科技、數位工具,換取工作、生活平衡

「善用各種科技、數位工具,並找到對的方法,管理團隊,也管理自己。」她強調,AI並非取代人力的威脅,而是能讓工作更精準、更具創造力的外掛工具,因此她不僅鼓勵同仁積極嘗試運用AI,製作文案、生成各種視覺素材,更將仲誼的21周年慶主題,直接訂為「AI煥新」。

這種講求效率的思維,也被她應用在自我管理上,發展出一套「化整為零術」。岳啟儒相當擅長利用各種零碎的時間,處理繁雜公務,「我的美甲師知道,我選她是因為動作快、不聊天。」她笑稱,每每在做指甲、染髮等看似「等待」的空檔,她都會架起手機、戴上耳機,和同仁展開視訊會議,或是快速看資料、批閱文件。

有趣的是,這種將公務「化整為零」塞進碎片時間的策略,並非是為了做更多工作,重點其實是換取高品質的「時間」,「我將忙碌全部集中,就是為了把完整的時間留給生活、休息。」一旦她將角色切換回母親、自己時,那個時間區塊就必須是高純度、不被干擾的。

這也是為什麼,岳啟儒認為,「按摩」是最佳的修復方式之一。

她是從懷孕時,便開始接觸專業的孕婦真人按摩,後來因為工作繁忙,便逐漸將重心轉向居家按摩椅。她坦言,真人按摩雖然有溫度,但「預約」本身就是一種時間成本,加上師傅的素質不一,有時遇到狀況不佳或愛聊天的師傅,反而讓只想安靜、放鬆的她,更感焦慮。

為了解決困擾,早在幾年前,岳啟儒就購入了OSIM uDream Pro 5感養身椅,讓家中成為隨時待命的頂級SPA。近期,隨著AI持續演進,她看見「AI賦能」的更多可能,搭載全新科技的OSIM AI•5感養身椅 (uDream•AI)讓他為之一亮,「在數位時代,我們習慣看數據做決策,我也很好奇,uDream Pro已經夠頂尖了,AI•5感養身椅(按摩椅)能把『休息』這件事推升到什麼新高度?」

從憑感覺到看數據,掃臉就能讓AI「精準養身」

事實上,岳啟儒相當習慣與各領域頂尖人士合作,因此對「專業」有著極高標準,「AI•5感養身椅(按摩椅)最讓我驚豔的,就是科技含金量!尤其是搭載全新的AI影像健康監測,輕而易舉就變成了可視化的數據。」

在凡事講求數據的數位時代,AI•5感養身椅(按摩椅)與全球頂尖的AI健康科技公司Binah.ai合作,將原本抽象的疲勞「數據化」,使用者只需要透過手機、平板鏡頭,掃描臉部透過面部血容量與血流,無需穿戴任何裝置,系統就能精準解讀出呼吸頻率、心率,並據此分析出壓力指數,並建議當下最適合的按摩模式。岳啟儒強調,透過科學化的健康管理,讓她能客觀且全面掌握身心狀況,實現「精準休息」。

岳啟儒X數位時代-2-3
AI•5感養身椅(按摩椅)讓使用者只需要透過手機、平板鏡頭掃描臉部,統就能精準解讀出呼吸頻率、心率,並據此分析出壓力指數,並建議當下最適合的按摩模式。
圖/ OSIM

還原純正技法實力,岳啟儒讚許三國大師手技的真實深度

不只擁有精密運算的「科技腦」,AI•5感養身椅(按摩椅)更擁有「職人魂」。岳啟儒不斷讚許由「中、日、泰」三位國際級按摩大師設計的按摩技法;將中式滑推的撥筋推揉、日式精準到位的掌壓指壓、泰式拉伸的伸展頂背與扭轉,簡直是還原純正的按摩手技,讓每一次啟動,都能對應不同身體狀態與當下需求,層次更豐富,感受也更加立體。

總能在忙碌中找到縫隙出門旅遊的岳啟儒相當喜歡去泰國,每當她前往曼谷、清邁等城市「long stay」時,一定會天天到泰式SPA報到,「我超愛泰式按摩!只要有去泰國玩,都會去按好按滿!」

岳啟儒X數位時代-3.jpg
熱愛按摩的岳啟儒分享,AI•5感養身椅(按摩椅),真的是還原泰式按摩中最具代表性的頂背、拉伸、扭轉高難度技法,讓她一秒沉浸在泰國!
圖/ OSIM

岳啟儒進一步說到,AI•5感養身椅(按摩椅)中日泰三種技法各有特色,但他最愛的「泰式拉伸按摩」,由泰國 Loft Thai 精品 SPA 首席大師 Khun Pie設計技法,再透過OSIM獨家專利按摩科技,真的是還原泰式按摩中最具代表性的頂背、拉伸、扭轉高難度技法,好像真人泰式按摩師傅在身邊,讓她相當驚訝——完全打破了按摩椅的既定想像與物理限制。對她來說,不用飛出國、不用承擔真人師傅狀況不一的風險,在家就能享受大師級的專業手感,正是最高效的享受。

岳啟儒X數位時代-4.jpg
從AI•5感養身椅(按摩椅)「鸚鵡螺」的黃金比例的流線型設計、再到能隨情緒與壓力指數變換的情境光,OSIM全方位打造出現代人身心皆可放鬆的靜心角落。
圖/ OSIM

沉浸式享受與黃金比例設計,打造心靈棲息地

岳啟儒還特別提到,「聽覺」是放鬆的重要一環。平常她就在家中,擺了法國頂級音響品牌Devialet,閒暇時放點音樂、洗滌心靈,「沒想到這次,OSIM就和Devialet合作了!」AI•5感養身椅(按摩椅)搭載了Devialet,讓聲音不只是背景音樂,而是具穿透力、包覆感的聲場,「我坐在椅子上播放音樂時,可以立刻進入自己的世界,專注、放鬆下來,有種與世隔絕的沉浸感。」其他包括能隨情緒與壓力指數變換的情境光、獨家配置的香氛,以及新加坡精品茶品牌TWG特調的甜夢茗茶(選配),都讓按摩超越單純的「觸覺」,成為一場含括「5感」的全方位饗宴。

岳啟儒X數位時代-5.jpg
AI•5感養身椅(按摩椅)搭載了Devialet,讓聲音不只是背景音樂,而是具穿透力、包覆感,透過聽覺的深度感受,讓身體慢慢紓緩、專注在這一刻。
圖/ OSIM

在先進的科技之外,作為經手過無數精品大秀的時尚推手,岳啟儒對居家美學向來不馬虎,「我就是個外貌協會!」她大笑道,好的按摩椅,不只要能修復身體,還要能融入現代居家風格,成為藝術擺設才行。

他形容AI•5感養身椅(按摩椅)「鸚鵡螺」的黃金比例的流線型設計,不僅在視覺上優雅和諧,更打破了傳統按摩椅的厚重感,即便不按摩時坐在上頭,也能成就一幅家中的最美風景。

岳啟儒X數位時代-6.jpg
圖/ OSIM

「真正的成功,不是把行程表塞滿,而是懂得在忙碌中,保有對身體的覺察。」在岳啟儒看來,全馬跑步是她對意志力的鍛鍊,按摩則是她修復身心的基地,運動、按摩缺一不可,「只要知道身體當下的真實需求,找到讓自己精準休息的方式,可以是投資在一張好的養身椅,可以是一段完全獨處的空白時光,這都將成為下一次起跑的強大動能。」

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
2026 大重啟
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓