[專訪] 搶當大數據科學家,5大特質你有嗎?

2015.05.04 by
李欣宜

大數據科學家有多夯?讓我們從有史以來市值最高的科技公司蘋果看起。為搶大數據科學家,蘋果開出美金16萬到20萬(約合台幣400萬到600萬)的年薪,以及任何你想得到的好康福利:美味員工餐、健身中心、教育津貼甚至凍卵補助,但蘋果不是唯一一個需要數據科學家的公司,打開領英(LinkedIn),上頭至少有5萬3千個數據科學家的職缺,而這還只是美國的統計數字。

美國專業招聘公司羅致恆富(Robert Halt)公布的《2015薪資指南》把大數據工程師列為今年薪資漲幅最大的六大行業之一,預計薪資年成長率9.3%,平均年薪119,250美元至168,250美元,在國內根據經驗平均也有100萬到500萬的薪資行情。

鼎鼎大名的數據科學家你也許聽過不少,諸如美國白宮首席數據科學家帕帝亞(DJ Patil)、被選為全美Top 4技術長的寶立明又或者是阿里巴巴集團大數據的第一把交椅車品覺,但這些如雷貫耳的大數據科學家動輒掌管一個個國家或跨國企業的海量數據,彷彿離一般人很遙遠。其實,現在各行各業都亟需大數據科學家,你也可以加入大數據淘金潮,但到底什麼樣的人才適合做大數據的工作呢?想要搶搭大數據人才熱潮,晉身高薪一族,又需要注意哪些事情?

大數據行動廣告平台威朋是一家藉由分析行動裝置的數據,為客戶找到精準行銷目標的數據管理平台(DMP)與即時廣告競價(RTB)投放公司,業務橫跨台、日、中、港等地,數據分析為其業務核心,數據分析部門佔其人員大宗,威朋數據科學研發經理彭智楹與張嘉祜分別擁有多年數據分析經驗,現身說法分享數據科學家到底在做什麼以及如何成為數據科學家。

威朋大數據科學家
(圖說:威朋數據科學研發經理彭智楹擁有將近8年的數據分析經驗,張嘉祜則是4年。照片來源:蔡仁譯攝。)

威朋大數據科學家現身說法
張嘉祜

學歷:
臺灣大學資訊工程學系網路與多媒體研究所博士
中央大學通訊工程學系碩士
中興大學電機工程學系學士

彭智楹
學歷:
臺灣大學資訊工程研究所 博士
臺灣大學物理系學士
臺灣大學心理系學士

就跟絕大數從事電腦工程的人一樣,張嘉祜和彭智楹皆畢業於資工系,在學期間就已開始從事資料分析工作,每日需與大量數據為伍,兩人皆認為在學校所學的知識和技能有助於他們進入職場從事相關工作。張嘉祜念博士時分析大量的影音多媒體資料,而彭智楹曾與生物學家合作分析生物影像,分析影像資料看似與分析廣告數據大不相同,但其實背後原則相差不遠,重點都是要從茫茫資料海中找到有價值的資訊,只是資料種類不同而已。

兩人的工作雖然都是大數據分析,但張嘉祜更專注於幫助線上廣告投放達到最大效益化,偏向商業智慧分析,並且發展幫助其他同事可以快速找到問題答案的工具,快速從大數據中檢索需要的統計資料,幫助客戶改善行銷策略。另一方面,從市場反應決定要做出什麼相對應措施,時常與點擊率、轉化率和流失率等數據為伍。而彭智楹則負責開發資料探勘系統、寫演算法和機器學習,例如預測點擊率,判斷使用者打開App時點擊廣告的機率有多大,較偏向於垂直面的研究。

特質一:定義和釐清問題

談及好的數據科學家具備什麼條件,彭智楹認為可以分成兩種等級:一種是是別人幫你把問題定義好,然後你來解開,但更厲害的是你知道怎麼找問題,什麼問題才是重要的,自己發現問題。「你要定義最有前瞻性最重要的問題,結果不只正確還要顯著性,對各領域發展有貢獻,要有商業價值和技術進步的空間,兩者能兼備是最好的。」彭智楹說。張嘉祜也認為在分析數據時,定義問題的能力很重要,因為問題分成很多層面,數據科學家必須要看當下要解決什麼問題,再用那個指標去回答。因此數據科學家首要具備的條件就是:定義和釐清問題。

特質二:想像力

不要以為數據科學家整天在電腦前面工作,只要一板一眼地分析數據就好,其實想像力也很重要。張嘉祜根據自己的工作經驗指出,有一定的創意才能幫助自己找到不一樣的觀點,學校會訓練你使用習慣的工具,但你應該要嘗試各種可能,如果沒有專業知識判斷,最後得到的結果就會跟大家差不多

例如在威朋工作常會需要幫助客戶找到具有某種特徵的族群,這個時候若只靠經驗和專業是不夠的,還需要發揮一些想像力。「我們在描述一個人的行為傾向時是很多維度的東西去做整合,除了你對生活經驗的豐富度之外,你還要有創意去描述這種人具有什麼樣的行為特徵,我們再透過機器學習的輔助,幫助你快速收斂這些特徵背後隱含的意義是什麼,不然一般人就是我想到什麼樣的資訊我就勾一勾,這樣不夠。」張嘉祜說。

特質三:邏輯思考能力

數據科學家的工作時常需要建立假設然後去驗證它,並且建立模型,這個過程仰賴優秀的邏輯思考能力,否則追尋答案到一半可能不小心就會走到岔路。大學時期雙修物理和心理學的彭智楹認為,心理系的訓練幫助他可以更容易了解他人的動機和想法,也因此在分析數據時常有意想不到的收穫。

以數據科學家最討厭的機器人為例,這類的假數據抓不勝抓,又會影響到統計結果,令人不堪其擾,但彭智楹認為與其去思考機器人在哪裡,要怎麼抓,不如反向思考什麼樣的網頁需要機器人,機器人的數據從哪裡來,就像是偵探福爾摩斯一樣,「偵探怎麼找出犯人,他不是從犯案手法去看的,而是從動機。」

威朋大數據科學家
(圖說:彭智楹平時就喜歡分析生活中的常見現象,例如觀察公司電梯哪一台跑最快,為什麼最快。照片來源:蔡仁譯攝。)

特質四:基礎數理與資訊工程能力

雖然彭智楹和張嘉祜都同意數據科學家不一定非得要是理工學院或電資學院出身的,但也都異口同聲地指出數據科學家還是必須具備基礎數理與資訊工程能力。

張嘉祜說,你也許可以用Excel去處理數據,但如果想要加快資料處理速度的話,程式能力依然是必須的。彭智楹認為不能害怕數字很重要,必須要培養對數字的敏銳度,例如他在念博士時就會用眼睛觀察數列是否有周期性的變化,從中訓練自己對數字的敏銳度,他甚至寫了一個產生各種亂數模型的程式,然後用眼睛一一把每個數字看過一遍,分析影像時也一樣,每張影像他都一一檢視過,「什麼時候要把資料分開或結合看,這都需要經驗。」彭智楹說。

但在工具之外,張嘉祜認為最重要的還是商業嗅覺,現在很多人隨隨便便就說自己會做數據分析會用什麼資訊工具,但沒有商業眼光依然白搭

特質五:跨界合作能力

最後,由於大數據科學家必須膽大心細又要天馬行空,邏輯好之外還得要融合自身生活經驗,這些特質要在一個人身上面面俱到非常困難。張嘉祜指出,跨界合作能力在這裡就顯得格外重要,因為不同的產業別需要不同的觀點,如果不懂得傾聽別人的意見,恐怕陷入盲點而不自知,跨界合作有助於發現不同面向切入分析,更有效率地做決策

和沛科技創辦人翟本喬曾說:「在大數據領域的英雄不是圖靈,也不是克勞德·夏農(發明資訊概論的人),而是福爾摩斯,這種有點自閉但能夠看出事情關鍵的人,如果只是因為大數據很紅就去學這些工具,你學這些工具就是賺22K的,把專業領域做好,你可以賺2200K。」因此,與其盲目追隨大數據熱潮,不如看看自己是否具備這些特質以及專業,再來決定要不要加入大數據淘金潮。

@@ACTIVITYID:513@@

每日精選科技圈重要消息