[專訪]  核桃運算薛文蔚:每個人都可以成為資料科學家
[專訪] 核桃運算薛文蔚:每個人都可以成為資料科學家
2014.12.01 | 科技

當大家都在談大數據分析和應用,台灣新創團隊核桃運算MacroData卻選擇切入最底層的技術,打造即時資料分析引擎Big Object。創辦人薛文蔚甚至想顛覆工程師從1970年代以來對資料運算的看法,也就是說,資料不必先下載到記憶體,運算完再放回去,而是設計出「in-place computing」模式,創造接近無限的空間,讓所有資料都為了運算而準備好。10秒就能處理1億筆資料,一台電腦就可以處理幾十億資料,比起現有的資料庫,運算速度還要快50倍到100倍。

硬體科技的進步,促成大數據

核桃運算創辦人薛文蔚指出,「目前處理大數據的技術還是在非常早期的階段,很多技術還不是很方便,這就好像我們現在回頭談70年代的電腦一樣。」

薛文蔚說,「昨天的垃圾,是明天的黃金。」隨著硬體科技不斷進步,現在儲存資料的代價很低,所以有各式各樣沒有目的的資料被儲存起來,才會形成這3-5年很紅的「大數據」概念。

大數據面臨的挑戰是,很快獲得很多資料,卻難以想像要如何處理資料。當資料量很大的時候,要怎麼做才能快速處理這些大數據?

三年前,薛文蔚遇到中國供應商的單品項管理問題,必須同時處理40萬個品項,乘上1萬個通路時,預測出來的值是幾百億點。然而,現行的資料運算架構主流根本沒辦法處理,才讓他進而去解決架構所產生的問題,直接從運算模式下手。

enter image description here
(圖說:核桃運算創辦人薛文蔚推出即時資料分析引擎,推翻工程師長久以來對資料運算的看法。圖片來源:郭芝榕攝影。)

顛覆資料運算模式

「我們現在還在用1945年所設計出的電腦運算模式!」(也就是范紐曼架構)薛文蔚解釋,以前記憶體很小,把資料當成外來物,程式和原始碼是一等居民,支配資料。每次要運算時,都要把資料從硬碟內搬移至記憶體運算,再搬回硬碟,花費很多時間在「搬移」。

目前大多數使用者端的資料庫和程式都以這種邏輯設計出來,薛文蔚說,這樣的工作台模式適合資料運算嗎?

所以,核桃運算3年前設計出不必搬移資料的「in-place computing model」,試圖要顛覆資料運算的模式。記憶體從32位元前進到64位元是一個很重要的觀念改變,用空間換取時間,用有效率的方式對映到現有的CPU和記憶體,創造出一個無限的空間,把程式送到資料儲存地運算,避掉資料搬移的過程。

例如,HTC就推出64位元處理器的智慧型手機Desire 820,可以把資料放在雲端、伺服器和物聯網上。

enter image description here
(圖說:核桃運算顛覆資料運算的模式,開發出資料運算引擎BigObject。圖片來源:取自核桃運算官網。)

此外,核桃運算在做運算時,會用各式各樣的轉換技術做分門別類,例如分開性別和收入,並善用關聯,讓4G記憶體可以跑100G資料,比MYSQL快100至1000倍。

薛文蔚指出,「只要一台64位元的電腦,就能處理幾十億筆資料,未來也可以用在手機上。降低一般人使用的門檻,展現平民化的大數據運算力量。」可處理關聯式分析、多維度分析。

未來,嵌入式裝置愈來愈多,大數據將是隨處可見的技術。他更進一步指出,未來的使用者將會是資料導向,10年後可能變成人人都對資料「有感覺」,資料科學將成為基礎知識,而非現在的專家系統。

大數據四大類:應用、產品、工具、底層科技

薛文蔚是台大資工系第一屆畢業,在哥倫比亞大學念資工博士學位,1995年就開始創業。他將大數據分成應用、產品、工具、底層科技四大類,目前切入大數據領域的新創團隊,大多都是大數據應用,包括手機、物聯網,有一大部分落在社交媒體,用心理學分析關聯度,例如兩個人的相似度。

做大數據的平台和科技比較少,薛文蔚說,底層科技還有許多可發展空間,會形成一個生態系統。台灣的強項在硬體,像是固態硬體、永久記憶體、快閃記憶體等等,核桃運算也許會進一步結合硬體,讓運算模式更快速。而10年後,底層的硬體可能會被生物記憶體所取代。

關鍵字: #Mac #大數據
往下滑看下一篇文章
國泰人壽業務平台升級 助攻業務行銷數位力
國泰人壽業務平台升級 助攻業務行銷數位力

國泰人壽持續推動數位轉型,第四屆數位業務發表會近日登場,發表AI創新應用及數位工具升級成果。會中亮點包括升級業務行銷工具「新業務平台 NAP 3.0」(New agent Platform, NAP)導入三大 AI 功能,並率先試辦「全場景人臉辨識計畫」,以提升業務通路服務效率與專業能力;並特地邀請新加坡保險同業MDRT(百萬圓桌會員)業務菁英參加,同台分享跨世代客群溝通與數位轉型實務經驗,泰國人壽更派出策略創新長等高階主管來台參與盛會,期能攜手海外同業彼此交流,為國壽業務部隊經營開創新視野。本次發表會活動吸引逾400位業務人員到場,另有2萬人透過線上直播參與,創下發表會收視人數歷史新高。

國泰人壽自2022年起每年舉辦數位業務發表會,透過新技術、新應用發表,協助業務人員更掌握科技趨勢與善用工具提升工作效率。國泰人壽總經理劉上旗於發表會中表示:「國泰人壽的數位工具不斷進化,NAP從5年前戰情室藍圖規畫,現已成為業務同仁日常工作不可或缺的工具,落實了效率工作與輕鬆生活的承諾,期許進入AI時代,國壽同仁以更堅實的底氣疾風前行。」強調保險服務已邁入智慧新時代,作為台灣保險業數位轉型的先驅,國泰人壽持續投入創新科技,為業務夥伴打造全方位的數位工作環境。

國泰人壽
國泰人壽副董事長李長庚(左3)及總經理劉上旗(右3)率領高階主管,出席數位業務發表會,展現公司對數位轉型的高度重視。
圖/ 國泰人壽

此次發表的「新業務平台NAP 3.0」導入三大AI新功能:一是「文件智慧識別」,透過AI大型語言模型(LLM)輔助智慧字元辨識技術(Intelligent Character Recognition,簡稱ICR),當業務夥伴為客戶進行保單健檢時,不需手動輸入,就能透過ICR拍照將資料正確帶入相關欄位;二是「自動生成圖文」,讓業務夥伴運用AI自製賀卡轉傳給客戶,利用生成式AI技術產生各類情境圖文,讓業務員有源源不絕的話題可以拜訪客戶;三是「AI COACH口袋教練」,能協助業務人員模擬真實銷售情境,透過話術指導與即時修正建議,提升與客戶溝通的精準度與專業服務水準。再搭配「FitBack健康吧」增進與客戶的互動,提供完整且深度的保險資訊,成為業務人員的最強後援。

國泰人壽
國泰人壽NAP「AI COACH口袋教練」協助業務人員模擬真實銷售情境,透過話術指導與即時修正建議,提升與客戶溝通的精準度與專業服務水準。
圖/ 國泰人壽

「新業務平台NAP 3.0」平台使用率已達到100%,深獲業務人員肯定,今(2025)年國泰人壽更率先實現試辦「全場景人臉辨識計畫」,應用於投保、保單變更、保費付款授權、理賠申請及據點臨櫃辦理等五大保險服務流程,業務夥伴可協助客戶使用NAP平台完成人臉註冊,暢行國泰人壽全服務平台,除了讓客戶能享受快速、安全且便利的數位服務,亦能強化業務通路的服務效率,預計年底前將全面推行。

在培育業務人員專業能力方面,國泰人壽優化「C-Learning」內部學習社群平台,以遊戲式的學習模式,提供教育訓練及時事分享,提升學習動能;更透過「集團全攻略」匯聚人壽、產險、金融及健康四大核心服務素材,讓業務人員能夠開拓例如企業主、新手爸媽、超跑車主、銀髮族等不同客戶族群,並透過工具獲得實質的銷售幫助。未來,國泰人壽將持續落實集團「BETTER TOGETHER共創更好」的品牌精神,深化AI技術應用,打造「人機協作」的最佳典範,優化數位服務功能,攜手業務夥伴開創保險服務的新局,為客戶創造更多價值。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
蘋果能再次偉大?
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓