台灣本土實例!數據應用進化大解密
專題故事

別好高騖遠,再說這些都是 Buzz Word,有許多數據應用其實就在你我身邊。《數位時代》這次要帶你挖掘台灣本土的最新數據應用實例。

1 數據應用落地,離你我一點都不遠!

Shutterstock
台灣數據難做,但不是沒有解決方法。許多企業正在投入小心前進,在你意想不到的應用情境,找到相對合理,可接受成本的解決作法,從事後收集資料,一路做到即時數據分析。

提到數據思維,今天任何人都可以侃侃而談。當市場上所有人都能對大數據一詞琅琅上口,一夕間我們彷彿資料環伺,大夥兒只要把數據水管一接上,業績就源源不絕。相較美國與中國的產業環境,台灣本土的產業更是特殊,市場人口少是一回事,實際資料來源、落地應用的實作都沒想像中容易簡單。有些國際數據來源由來已久,要對接不難,但碰到文化差異、文字辨識、技術開發的難關,甚至法律主管機關的保守詮釋與商業競爭,所導致難以進行跨組織數據交換,許多時候台灣企業就只能啞巴吃黃蓮;空有策略與目標,卻因為缺數據工作的將才、缺資料來源、缺成本合理的解決方案,而難以實現。

但難,不表示沒有人做。就算如蜀道難如上青天,還是有許多台灣企業前仆後繼、披荊斬棘,小心投入成本測試,針對自己所處產業與處境,找到最適解後慢慢向前推進。他們可能在你意想不到的應用情境,找到相對合理的作法,努力耕耘累積數據,從事後收集資料,一路做到即時數據分析。

Pixabay

這些數據可能有以時間為經的垂直整合應用,或以使用者類群為緯的橫向切分整理;也可能隨產業類別結合不同數據源,配上學校教的線性代數就有大用途。他們在零售、流通、金融、資訊媒合等不同產業,可能結合線上與線下,最後都為了提供消費者更好的服務、輔佐企業琢磨並傳承營運能力。

接下來,你可以看到實體展店、線上線下零售整合與線上媒合服務進化的本土數據應用實例,這些案例其實就構成你我的日常。

每日精選科技圈重要消息

2 展店都靠商圈數據!實體通路傳承不再瞎子摸象

侯俊偉攝影
實體通路展店或經營,早已不只有傳統的數據可做參考。透過更即時的資料蒐集,同時整合異質來源資訊,讓現代商業營運可以靠數據傳承下去。

實體世界的生意和線上很不一樣。如果要開一家店,你必須計算很多問題,門店區位牽涉到商圈、交通環境、附近競業、人潮流動、面寬、臨路狀況、租金與使用分區等不同因素,過去地產市場甚至有文市(小店、吃商圈人潮,較適合做專賣生意)、武市(批發、製造、維修等需要主動出擊開發客戶的生意)等描述不同環境與合適展店行業的描述語。

就算開了一家店,如何收集數據、評估效益,如同線上網站不斷優化生意也是一大挑戰。過去的實體店面收集數據的方法有限,甚至難以實時蒐集數據再應用,但近 10 年來逐步普及的科技已經改變一切。

實體店面的數據蒐集再進化

「過去流通業講數據,主要是兩端,POS系統與店內的監控設備。」中華電信大數據分析解決方案顧問許益誠說,POS可以看經營績效,但只能追蹤輸入與輸出,輸入通常指訂貨與進貨資訊,輸出指消費端的結帳資訊。「但整個消費歷程其實都不知道!」許益誠說。

中華電信大數據分析解決方案顧問許益誠
James Huang攝影

過去,在店內做監控最多就裝個實體主機,如果擔心資料遭到破壞而沒有證據,最多再把監控數據,也就是影像檔案丟到雲端。放上雲端好處也多了些,例如總部可以直接從遠端觀察、瞭解一家店的經營狀況,也因此進一步產生更多需求。近年來,影像辨識的解決方案日益成熟,透過監控資訊即可同步計算經過與入店人流比率,相比使用POS端的發票資訊,可得出實體店面的轉換率(通常,線上的轉換率是指最後轉化成實際訂單與流量之間的比例)。「以前必須按碼表計算的問題,現在靠監控系統就可全自動做到」許益誠說。

外面經過多少人、然後有多少人走進來,這就是入店率。入店率要夠多、轉化率要夠紮實,才能支撐一家門店。因此對於每家實體店面來說,人流的資訊就相當重要。「其實,中華電信自己也遇到一樣的問題」,許益誠提問:「中華電信到底要開多少家實體門市?難道競爭對手開,我們就要開嗎?到底要怎麼決定這個數字?」

侯俊偉攝影

許益誠觀察,不同產業、不同公司,開店策略都不會一樣。「有的公司對手開他就馬上開在附近,你也可以看到有些便利商店明明同一家,卻相隔不太遠。」但透過科技累積數據,加上原有的策略判斷,馬上可以做出更精準的決定。以前入店率往往是不同部門各說各話;在一家企業裡,往往負責做展店的開發部門,與實際掌理門店營業的部門是兩個單位。「展店就像生小孩,生完以後要養,如果長得好,生和養都沒話講,但養不好就會怪生的人。」許益誠笑著說。

透過技術力,讓展店、商圈等異質數據收集更即時

以往,為了蒐集實體通路資訊,通常只能參考政府的開放資料,或靠人工去收集,有些開放資料如電子發票,還因為個資法的關係,顆粒還很粗,只有縣市和區。人流資訊甚至幾乎只能靠人工,除了去馬路上按碼表,還可以早晚各抽一張發票。「但是這些都需要人工,不但辛苦,而且相對不一定精準。」

但中華電信從 2010 年起就開始收集自家的數據,除了原有的財務、話務方面的數據,其中一個就是基地台端的訊號資料,因為行動網路必須服務人群,在人口密集區一定佈建更多的基地台提供訊號源,所以中華電信就能夠知道不同時間點、在 150 平方公尺範圍內有多少人能夠經過的資訊,轉化為人潮資訊。因此,除了人口數字,有多少人流、有多少人進來,透過影像的人頭辨識就可做到,那就可透過這個再透過預測模型,加上學校商圈、辦公商圈、住戶型的外部環境、人會如何行走的陰陽面分析(陰面表示人通常不會行走)。

「其實每個路段的車流不一樣,道路的寬度、是否好停車,甚至平均每小時有多少車經過都是考量點」許益誠提及,每個路段的車流量可透過導航系統的數據做為參考依據。從展店到經營,中華電信整合了政府端的開放資料、結合店內的影像辨識、與中華電信自身的人潮資訊等異質性數據,協助自家或零售業店面選址,或評估店面效益,除了展店,也可以觀察商圈變化。

「人突然變多或變少,可能是競業或交通設施改變使然」許益誠說,中華電本身曾經有過一個門市管理的案例,是因為鐵路高架化導致車站出入口改變,因而人流就不會從店門口經過,如果不是因為數據發現,營運總部可能很難察覺,進一步佈局新商圈快速反應。

過去的商業靠人的經驗,現代商業靠數據傳承

做了許多年數據顧問工作的許益誠,認為許多人對大數據都有幾個迷思,一是主觀因素,覺得別人做的都不可靠,或懷疑這些數據到底是不是母體,但當數據說話,透過實際證據證實某些假設或觀察,一般人又常認為理所當然,這些都是廢話,大家都知道。

「可是數據其實是可以用來傳承的,當我們把在行業內需要花數年才能夠觀察出的洞見,濃縮成幾個月就可以做出的結果,而且事後還有機會追蹤、深入分析,我們就有機會把這些數據交給未來的掌舵者參考。」
許益誠說

「過去,我們認為經商除了天分,開店除了時運、能力,就是得手把手的教、透過經驗累積去傳承接棒,但數據其實為我們開啟了一條新路,讓未來的商業有機會透過現代數據,快速傳承下去。」許益誠如此總結。

每日精選科技圈重要消息

3 即時數據就如同汽車後照鏡!是實體品牌主動出擊的關鍵

ShutterStock
實體門店與線上銷售的即時整合,如同實體品牌經營的照後鏡,有了數據這樣的即時資訊,才能讓企業隨時化被動為主動,進行各種經營操作。

你有多久沒有在實體店面購物了呢?隨著線上購物的興起,以及現代社會工作條件更加繁亂,許多人都時常透過網際網路購買各種生活所需。舉凡日常生活用品、3C產品甚至食、衣、住、行需求,搭配便利商店、快遞收貨機制,每個人或多、或少,都有了線上購物的經驗,也都各自養成了線上或線下的不同購物策略。比價找便宜、不急可以等的到拍賣甚至淘寶。台灣沒有賣的上日本、美國、歐洲 Amazon.com 或上 PTT 等地找代購。很急一定要又沒有空去賣場,在都會區還可以考慮國內的 24 小時購物,甚至 8 小時以內的購物平台。唯一的差異可能僅存日常逛街、百貨或零售通路的檔期促銷或週年慶,才進行消費。

在目前台灣,線上與線下購物經驗大大不同。品牌實體店內的接待人員,不會有機會在客人入店開始,就發現他是昨天在網路店的那個人。「但在數位時代,這些失落的環節終於有機會可以拉成閉環。」91APP行銷長李朝基認為,數據不是最近才開始,因為台灣製造業興盛,數據通常都集中在後端或內部資料,例如為了改善製程、調整成本庫存,透過財會數據,以內勤監控為主。就算到了零售端,資料多半都是在內部使用,頂多有一塊東西叫做客戶關係管理(CRM, Customer Relationship Management)。

雲世代真正到來,讓線上與線下銷售方式形成閉環

李朝基認為,以往面對客戶端都是行銷人員在操作,媒介有電視,報紙或廣播這些主要的媒體也相對單純,只要有一定的比例在計劃案結束後反映在業績或績效上,比起來比較單純。這種行之有年,過去數十年間的做法,甚至有的大型品牌公司,都已經做成 knowhow,或是有經驗,像P&G寶橋家品等等國際品牌都是這樣。當這些公司面對數位環境,參與的方式相對簡單,就是把線上當成另外一個通路來看,讓線上與線下完全分開。但科技近用已從雲端走向行動世代,這樣的遞送服務設計會產生虛實之間環節的問題,首先是資訊落差,線上線下的數據難以整合,客人的資料對不起來、就算可以對得起來也很難做到即時。第二個問題是商業組織設計的問題,實體與虛擬業績往往會因為前面的資訊落差難以追蹤,因此必須分開計算,進一步產生組織衝突。大家覺得在網路上做生意會搶到實體通路生意,因此實體門市通常會抗拒,「不敢做又做不好,最後只能促銷過季商品」李朝基觀察。

James Huang 攝影

但雲端概念發展到現在,透過不同裝置的資訊,片段式的使用者資料都已經可以輕鬆收集;以往看到的都只有銷售點資訊、後端生產成本與時間之間的關係,可以更簡單整合線上、線下會員,不論消費者在哪裡消費,都可以被即時記錄,門市、線上都可以輕鬆區分,只要透過電話號碼或手機 APP 顯示會員條碼,就可以快速比對做到會員分級。「當這些資料歷程都被記錄下來,大家就不用再瞎子摸象」李朝基說,「只要系統一比對,門市或線上消費金額與時間,甚至線上購物車裡沒買的商品都一目了然,這時店內人員就很容易立刻跟進促銷。」李朝基強調,品牌如此應用數據,才有機會在實體環境裡建立直覺溝通。

「這些都還是被動出擊!」李朝基轉而解釋,當品牌以往習於發送的紙本型錄、生日券,改成電子型錄或折價券,甚至連型錄都可以不需要做,讓串接消費資料做到即時,例如某個品牌設定消費累積單筆滿 5,000 元是一般會員,當消費者累積消費接近 4,000 元,後台就該給出折價券,會推薦相關產品讓他累積滿額。

shopping shutterstock
ShutterStock

「這才叫做數據主動出擊!」李朝基說;過去,這樣的作法通常都是銷售前線人員自行變通的線下作法,事實上和系統是切開的。以前通常都是在後台先跑完資料,把所有想做的動作按照假定分析好,在消費情境下系統沒有任何即時反應,需要事後分析才知道結果。「傳統 CRM 與資料分析和現今世界最大的不同,是通常都需要資料先決,但效益通常反而後知後覺!」李朝基說明。

化被動為主動,縱橫向整理運用數據

「這還只是數據的時間差攻擊!」李朝基解釋,上述的即時作法,是將不同時間的消費軌跡進行會總,由系統主動即刻做出反應,但當系統收集夠多的交易歷程、時間點、商品類型、甚至會員資訊,就有機會作橫向的分析,預測更精準、更節省成本的折扣活動,進一步刺激消費。「時間差與產品類型的交錯是重要關鍵,另一個關鍵是頻率!」不小心透露了秘訣的李朝基露出一抹微笑。當這些數據都可以交叉應用,李朝基預測線上、線下的銷售金額佔比將逐漸模糊。「你不能清楚分辨出哪些是線上或線下的單純業績,這時候的業績有可能是線上帶動線下或線下帶動線上,是交錯的混和業績貢獻,這些佔比將進一步挪動!」

根據 KPCB Internet Trend 與資策會 MIC 的資料,台灣目前整體零售市場規模接近 4 兆新台幣,其中約 10% 是線上零售市場,實體零售市場仍佔有 90%。91APP 預期台灣在未來十年內,虛實整合的新零售市場比重將快速達到全市場的 5 成,但僅作線上零售的傳統電商將萎縮僅存不到 5% 的規模。

李朝基認為,數據對現代企業的重要性與日俱增,拿駕駛汽車來比喻企業經營,以往都只需要看前面,看見業績目標即可。「但當車速越來越快,你必須要靠後照鏡才能抓清楚行進過程與前後左右的關係,並隨時決定往左或往右切」李朝基說。

「數據就像是你的後照鏡,駕駛必須要有即時資訊,才能在快速前進中,立刻決定接下來的方向!」

李朝基進一步提到「接下來能夠即時處理這些資訊,讓企業自動執行決定,才有機會邁向半自動駕駛或自動駕駛!」李朝基觀察線上店面數據本來就比較完整,接下來品牌將進入線下門店整合線上銷售經驗的時代,透過開設實體店面、提高直營店比例,才有機會累積數據。他期許「這時候,人工智慧才有機會派上用場!」

每日精選科技圈重要消息

4 當數據跑在前面!我們做錯一個步驟就可能影響到人的一生

shutterstock
數據的應用目的之一,主要是為了做預測,為了優化服務,推薦演算變得異常重要。然而粗糙設計的演算法,可能算錯一個值、秀錯一個資訊,就有可能讓人與一個工作機會擦身而過,進而影響到他的一生。

如果你常在網上閒逛,無論是單純去一個網站然後停留多頁,或是跨網站蜻蜓點水式地移動,你一定注意到現在的線上服務越來越厲害了。無論是跨網站追蹤的網路廣告投放,或是單一網站內不斷根據你的瀏覽行為推薦你有興趣話題的機制,亦或是議題、商品列表,或搜尋引擎結果排序,背後全都是運算。這些功能看似邏輯簡單,但要簡化出合理邏輯、實時收集數據,並根據即時資訊立刻進行機率推論,反應給螢幕前的使用者,其實是一連串的基本功。

「你可以猜想大如 Amazon 這樣的電商平台,是怎麼做數據的?」104人力銀行數據長呂承諭說「做一個網站,我們通常從使用者入站開始,有機會得到他從前一站轉介來的資料(Referal),接下來就開始是他在我們網站內的旅程了。」呂承諭解釋,當一個網站主決定要收集數據,並進一步利用即時數據的話,首先第一步就得鉅細靡遺地盤出使用者踏入自家網站某個頁面後,接下來可能出現的所有路徑,並在每一個路徑都準備了資料收集點,收集使用者在網站上走過這些路徑的每個足跡。

104提供

「數據的應用目的之一,主要是為了做預測;因此,當使用者在一個頁面,我們可以猜想他的下一步,是在幾毫秒後,要往哪裡去,而有了一個預測路徑用,總和為 1 的機率矩陣。」博士班時就鑽研機器學習、語意分析的呂承諭,開始解釋起計算的基礎原理。「在不同的產業,我們都有一個基礎標準,使用者按下連結後,我們多久要回應,通常標準是 100-300 毫秒不等。」呂承諭進一步解釋「所以網站當然希望預測你的路徑,針對你可能會走的方向,在你正在瀏覽的期間,開始準備載入;你可以想像,最簡單的作法,是針對你接下來可能會請求的路徑,預先把相關內容準備在最靠近你的伺服器端,來降低你請求所需時間。」

「這時候,剛剛說的那個路徑預測機率矩陣就很重要了!」呂承諭說「透過持續累積過去使用者足跡,網站方應該可以有一份根據過去使用者資料所做出來的機率矩陣」呂承諭指出,網站主甚至可以根據使用者的背景,例如性別、年齡、偏好、地區別,或網站的使用足跡進行分群,於是不同群體會擁有不同的機率矩陣,也因此可以預準備面對使用者的下一步。「但這都是根據過去資料,更厲害的網站可以做到更短頻率就更新預算出的機率,從幾個月、幾週、幾天,甚至變成每天幾小時就更新一次。」於是網站主就可以應對不同的網站功能開發,無論是廣告版位、商品導購轉換,讓網站反應能力不能抵觸這個演算天花板。

shutterstock

呂承諭認為,大多數的小公司沒有這種資源去做實驗,那只要使用者勉強可以忍耐一個網頁大概能夠在 1-2 秒內跑完,但當一個網頁由更多元素所組成,後面還要考慮網路傳輸及計算時間,大家就必須一個一個往回推,因此演算法規範非常依賴數據與營運經驗。因此,如果一家公司要成立資料科學家團隊,除了一個權限很高,職能上可介入營運的主任資料科學家外,還需要有產品經理、使用者經驗(User Experience)與工程團隊共同支應。呂承諭觀察,如果一個大型網路服務有許多不同的路徑預測機率矩陣,每個節點一定都有服務瓶頸,主任資料科學家就必須根據數據、結合不同職能討論出每個瓶頸的合理上下限,考慮讓使用者最舒適完成一個網站旅程。

如果我們發現一個重度使用者進來,我們甚至應該針對他客製化一個推薦清單,並透過路徑預測機率來最適化他的服務流程。呂承諭以 104 人力銀行為例,104 基本上服務企業端的招募者,與求職者兩方人群,由於服務內容是工作媒合,很幸運地已經有了完整的使用者資訊。「如果能更深入探勘文字資訊,與使用者行為背後的邏輯」我們就有機會提供最好的服務。呂承諭觀察,英語系國家都有不錯的人才媒合服務,在推薦、分析上的確領先 104 不少,例如 monster.com ,但他用同樣技術要跨到華文時,這些服務都會碰到華文地雷,在中文斷詞斷句上碰到文化上的演算障礙。

台積電晶圓十二廠外觀
台積電提供

「例如我們很容易分辨台積電、台灣積體電路公司、台積、TSMC都是同一家公司,但是如果你不做文字整理,電腦沒辦法斷出這些都是同義詞,並自動給予適當分類的。」呂承諭進一步比較,光是網路上常用的正體中文(Traditional Chinese)可能還分成三個分支,台灣中文、港澳中文與馬來西亞中文,以 3 - 5 萬常用字來說,這三類中文就分別有 10% 左右的不同語彙。「光這段關鍵詞做好,我們就可以立刻優化工作搜尋。」呂承諭笑說。

硬底子的數據應用,全來自於點滴功力的累積

「光是一個個人履歷,就可以拆開許多不同的數據觀點」呂承諭說,履歷裡面可以拆分出硬技能(Hard skill)與軟技能(Soft Skill),硬技能包含學經歷、性別、年紀或其他具體特徵,軟技能則包含你的性向、與社會網絡關係,例如家庭或同事等等。這些軟技能會不會影響你的專業表現,其實得看你從事什麼樣的工作。呂承諭表示, 104 有一個性格職能測驗,根據 9 大職類可能需要的性向提供測驗量表,「但社會網絡關係就不需要靠量表了!」呂承諭笑說,我們可以透過學歷與經歷,去計算出你在什麼時間點,與哪些人可能有求學或工作上的重疊,這些人在 104 所留存的職涯軌跡又分別是什麼,進一步幫忙計算出這些軟技能。「104 還有一個特別的服務叫做 104職涯社群,幫助你找到職涯上的導師,透過導師的職涯,也是另一種重要關係。」呂承諭稱。

數據可以幫助媒合,然而回到更現實的問題是服務往往有斷點存在。縱然擁有接近 663 萬求職會員、32.4 萬家企業會員的 104,已經是台灣主流的人力銀行媒合服務之一,甚至在非正式統計有頂尖國立大學約 5 成畢業生的使用率,但諸如雇主只留下 email 聯絡方式、投了履歷卻杳無音訊,都會讓求職者在使用服務時受挫。「這個時候就更需要機率矩陣來做排序了!」呂承諭強調,當招募者資訊不完整,或招募者刊登一個職缺過久沒有更新,事實上都代表著不同的用人訊號。「如果一個招募者一天到 104 好幾次,每次甚至搜尋或瀏覽很多履歷,我們會知道他很心急想要找到工作夥伴!」他解釋,但反過來說,如果他只留下 email ,或是刊登一個職缺很久都沒有找到人,但也不調整或下架,這很有可能是一個假職缺,或只是保留一個可能的彈性窗口,表示企業並不急著要找人。「這時候如果求職者在瀏覽清單,我們就可以給予不同的權重來秀出這些資訊。」呂承諭說。但事實上,這個權重的資訊必須下得非常小心。

「我們是人才媒合服務,一個粗糙設計的演算法,如果導致推薦系統算錯一個值、秀錯一個資訊,就有可能讓人與一個工作機會擦身而過,影響到他的一生!」
呂承諭進一步解釋

也因此, 104 在測試每個數據應用,都是抽選非常小部分的使用者做小流量的測試,如果這些使用者軌跡符合當初設計的旅程,才有機會擴大應用。如果不是,就需要馬上做數據修正。經歷過求職階段的人都能輕鬆明白,遇見一份好職缺往往需要靠一點機運。在 1993 年中年失業後的楊基寬,觀察到當時社會找工作的管道有限,因此成立 104 人力銀行,期許「104 不只是幫求職者找一份工作,更是要幫助他人找到人生方向」。呂承諭​發願,要用數據讓求職者更即時遇見好機緣!

每日精選科技圈重要消息