[專訪]  核桃運算薛文蔚:每個人都可以成為資料科學家
[專訪] 核桃運算薛文蔚:每個人都可以成為資料科學家
2014.12.01 | 科技

當大家都在談大數據分析和應用,台灣新創團隊核桃運算MacroData卻選擇切入最底層的技術,打造即時資料分析引擎Big Object。創辦人薛文蔚甚至想顛覆工程師從1970年代以來對資料運算的看法,也就是說,資料不必先下載到記憶體,運算完再放回去,而是設計出「in-place computing」模式,創造接近無限的空間,讓所有資料都為了運算而準備好。10秒就能處理1億筆資料,一台電腦就可以處理幾十億資料,比起現有的資料庫,運算速度還要快50倍到100倍。

硬體科技的進步,促成大數據

核桃運算創辦人薛文蔚指出,「目前處理大數據的技術還是在非常早期的階段,很多技術還不是很方便,這就好像我們現在回頭談70年代的電腦一樣。」

薛文蔚說,「昨天的垃圾,是明天的黃金。」隨著硬體科技不斷進步,現在儲存資料的代價很低,所以有各式各樣沒有目的的資料被儲存起來,才會形成這3-5年很紅的「大數據」概念。

大數據面臨的挑戰是,很快獲得很多資料,卻難以想像要如何處理資料。當資料量很大的時候,要怎麼做才能快速處理這些大數據?

三年前,薛文蔚遇到中國供應商的單品項管理問題,必須同時處理40萬個品項,乘上1萬個通路時,預測出來的值是幾百億點。然而,現行的資料運算架構主流根本沒辦法處理,才讓他進而去解決架構所產生的問題,直接從運算模式下手。

enter image description here
(圖說:核桃運算創辦人薛文蔚推出即時資料分析引擎,推翻工程師長久以來對資料運算的看法。圖片來源:郭芝榕攝影。)

顛覆資料運算模式

「我們現在還在用1945年所設計出的電腦運算模式!」(也就是范紐曼架構)薛文蔚解釋,以前記憶體很小,把資料當成外來物,程式和原始碼是一等居民,支配資料。每次要運算時,都要把資料從硬碟內搬移至記憶體運算,再搬回硬碟,花費很多時間在「搬移」。

目前大多數使用者端的資料庫和程式都以這種邏輯設計出來,薛文蔚說,這樣的工作台模式適合資料運算嗎?

所以,核桃運算3年前設計出不必搬移資料的「in-place computing model」,試圖要顛覆資料運算的模式。記憶體從32位元前進到64位元是一個很重要的觀念改變,用空間換取時間,用有效率的方式對映到現有的CPU和記憶體,創造出一個無限的空間,把程式送到資料儲存地運算,避掉資料搬移的過程。

例如,HTC就推出64位元處理器的智慧型手機Desire 820,可以把資料放在雲端、伺服器和物聯網上。

enter image description here
(圖說:核桃運算顛覆資料運算的模式,開發出資料運算引擎BigObject。圖片來源:取自核桃運算官網。)

此外,核桃運算在做運算時,會用各式各樣的轉換技術做分門別類,例如分開性別和收入,並善用關聯,讓4G記憶體可以跑100G資料,比MYSQL快100至1000倍。

薛文蔚指出,「只要一台64位元的電腦,就能處理幾十億筆資料,未來也可以用在手機上。降低一般人使用的門檻,展現平民化的大數據運算力量。」可處理關聯式分析、多維度分析。

未來,嵌入式裝置愈來愈多,大數據將是隨處可見的技術。他更進一步指出,未來的使用者將會是資料導向,10年後可能變成人人都對資料「有感覺」,資料科學將成為基礎知識,而非現在的專家系統。

大數據四大類:應用、產品、工具、底層科技

薛文蔚是台大資工系第一屆畢業,在哥倫比亞大學念資工博士學位,1995年就開始創業。他將大數據分成應用、產品、工具、底層科技四大類,目前切入大數據領域的新創團隊,大多都是大數據應用,包括手機、物聯網,有一大部分落在社交媒體,用心理學分析關聯度,例如兩個人的相似度。

做大數據的平台和科技比較少,薛文蔚說,底層科技還有許多可發展空間,會形成一個生態系統。台灣的強項在硬體,像是固態硬體、永久記憶體、快閃記憶體等等,核桃運算也許會進一步結合硬體,讓運算模式更快速。而10年後,底層的硬體可能會被生物記憶體所取代。

關鍵字: #Mac #大數據
往下滑看下一篇文章
從會員數據到 AI 行銷:Vpon 打造零售業 AI-Ready 數據中台,提升決策效率
從會員數據到 AI 行銷:Vpon 打造零售業 AI-Ready 數據中台,提升決策效率

在 AI 快速進入企業營運核心的時代,數據不再只是被動的分析素材,而是 AI 模型運作與決策優化的重要基礎。

零售品牌積極累積大量第一方數據,例如會員資料、交易紀錄以及線上與線下行為數據,但因這些數據分散於不同系統,缺乏統一的身分識別機制以及明確的元數據(Metadata)定義,導致難以整合與分析,同時,也影響 AI 對這些數據資產的理解與應用。

為解決上述挑戰,Vpon 威朋將累積十餘年的實務經驗轉化為產品與服務,如 Audience Center 與 AI Agent 等解決方案,並透過專業顧問團隊協助企業完成數據收集、清理、整合與分析等關鍵流程,從資料清理到 AI-Ready 再到落地應用,讓行銷與業務團隊能以自然語言將數據查詢與分群受眾逐步自動化,大幅縮短過去仰賴技術與分析團隊溝通需求與開發分析邏輯的時間。

Vpon 助零售業打造 AI-Ready 數據基礎,以 Audience Center 驅動業務商機

如何建立 AI Ready 數據基礎建設?

Vpon 威朋數據科學經理廖宜楷指出,在 AI 驅動的時代,數據的品質決定模型價值。其中四個關鍵分別是:建構標準化的數據採集與處理管線,透過統一的工程規範,確保所有進入系統的數據在格式、維度與質量上具備高度一致性;其次是定義語義清晰的元數據(Metadata)體系,確保數據能夠被 AI 理解與使用,從而產出具備可靠性的產出結果;再來是打破企業內部的「數據孤島」, 透過完整整合線上(Web/App)行為與線下(POS/CRM)會員資訊,建構全方位的會員數據輪廓,精準捕捉消費者的跨通路行為軌跡。最後,數據的價值隨時間遞減,AI 的決策品質取決於數據的「新鮮度」,因此,數據的持續更新與自動化維護,不僅能讓企業在動態市場中保持敏銳,還可進一步深化會員輪廓分析的即時性。

舉例來說,在 Vpon 團隊的協助下,台灣百貨零售龍頭透過整合 Web 與 App 行為資料,並將線上與線下數據集中於數據中台進行分析,將傳統耗時數小時的複雜資料庫分析工作縮短至秒級回應,並基於此高效率基礎,進一步開發不同業務主題的預測與分群模型,提升行銷精準度與營運決策的敏捷性。

扎實數據基礎的價值落實:Audience Center 如何賦能企業實現「數據即戰力」?

有了堅實的數據底座後,下一步是透過 Audience Center 將數據資產轉化為商業動能。

廖宜楷指出,在變化快速的零售與數位行銷市場中,速度就是競爭力。然而,仍有許多企業在數據應用上面臨嚴重的溝通與技術斷層。過去,當行銷或業務人員需要數據支持時,通常得花費繁複的內部流程申請需求、討論需求,才會進到後續的資料清理、建模與分析,最後才能得到想要的分析結果或行銷名單。這種以「週」為單位的進程,不僅拖慢了決策效率,更讓企業在競爭激烈的市場中錯失先機。

Audience Center 的核心價值在於徹底翻轉上述流程,將數據處理轉化為數據服務,透過直覺的介面與背後扎實的數據基礎支撐,讓非技術人員不用編寫程式碼,即可自行組合維度,大幅縮短從需求到執行的距離,將原先需要耗時數週的作業流程優化成秒級產出。

「Audience Center 的導入,不僅有助於提升效率,更賦予企業快速試錯與精準捕獲趨勢的能力,讓數據真正成為驅動業務增長的引擎。」廖宜楷如此總結。

#1 從會員數據到AI行銷:Vpon打造零售業AI-Ready數據中台,提升決策效率
Vpon 威朋數據科學經理 廖宜楷
圖/ 數位時代

以 AI Agent 重塑數據使用方式,讓數據更貼近決策流程

「Vpon 除提供 Audience Center 協助品牌發揮第一方數據資產價值、提供豐沛的第三方數據助品牌深化對客戶輪廓的掌握度,更推出 AI Agent 服務讓品牌與行銷人員能更直覺地使用數據。」Vpon 威朋數據科學資深總監陳文謙表示,在數位轉型的過程中,許多企業面臨的挑戰不僅是數據整合,更包括如何讓不同部門的人員都能更即時協作與應用數據,有鑑於此,Vpon 推出四種 AI Agent 協助企業分析與應用數據,極大化第三方數據成效:

第一,以 Reporting Agent 讓高階主管或行銷人員可以自然語言查詢數據與生成報表,即時掌握市場動態,加速決策下達與決策品質。

第二,透過 Insight Agent 確保數據分析不受分析人員的主觀意識或產業知識侷限,可以輕鬆完成跨領域數據分析、快速挖掘潛在市場機會與消費者洞察。

第三,藉由 Audience Agent 將客戶分群方式從規則導向(Rule-based)轉變為關聯導向,以關聯分析擴大受眾範圍,協助品牌找出更多潛在客群。

第四,推出 Creative Agent 協助行銷人員分析廣告素材表現的根本原因,釐清受眾喜歡的素材跟不喜歡的素材,藉此優化廣告投放內容,持續提升轉換率。

陳文謙表示:「透過 AI Agent 的輔助,品牌不僅能更快完成數據分析,也能將分析結果直接轉化為行銷策略與創意建議,降低跨部門溝通成本,讓數據真正參與決策流程。」

#2 從會員數據到AI行銷:Vpon打造零售業AI-Ready數據中台,提升決策效率
Vpon 威朋數據科學資深總監 陳文謙
圖/ 數位時代

鏈結數據生態夥伴,以跨境數據放大行銷效益

除了協助品牌主建立 AI Ready 的數據基礎環境並提升數據使用效率,Vpon 也持續拓展數據生態圈,協助零售品牌更精準布局海外市場。

Vpon 威朋產品行銷資深經理邱心儒表示,跨境行銷過去多仰賴經驗與市場直覺,但透過數據整合與 AI 分析,品牌能更精準理解海外消費者的旅遊與消費行為。

以 Vpon 與日本 Loyalty Marketing Inc. 合作為例說明,透過雙方的獨家合作,企業可以結合 Ponta 超過一億的會員數據、問卷調查結果以及 Vpon 的七大數據來源,深入分析日本消費者的消費偏好與購買力——包括哪些日本族群對台灣品牌最感興趣、最受歡迎的台灣商品類型,以及不同客群的價格敏感度與回購行為等,將行銷決策從過往的經驗判斷轉變為精準的數據洞察,成為品牌出海的重要工具。

簡言之,對零售品牌而言,跨境數據是理解海外旅客真實樣貌的一大利器,也能進一步優化廣告投放、內容策略與商品布局,讓品牌在拓展國際市場時,可以更有效率地接觸潛在客群,放大行銷效益。

#3 從會員數據到AI行銷:Vpon打造零售業AI-Ready數據中台,提升決策效率
Vpon 威朋產品行銷資深經理 邱心儒
圖/ 數位時代

展望未來,Vpon 將持續擴展數據生態圈並優化產品服務,幫助零售品牌從數據整合、AI 分析到市場決策建立完整的數據應用循環,希望以數據夥伴的角色與品牌共同成長,打造互利共贏的數據生態。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
AI全球100+台灣20
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓