[專訪] 搶當大數據科學家,5大特質你有嗎?
[專訪] 搶當大數據科學家,5大特質你有嗎?
2015.05.04 | 科技

大數據科學家有多夯?讓我們從有史以來市值最高的科技公司蘋果看起。為搶大數據科學家,蘋果開出美金16萬到20萬(約合台幣400萬到600萬)的年薪,以及任何你想得到的好康福利:美味員工餐、健身中心、教育津貼甚至凍卵補助,但蘋果不是唯一一個需要數據科學家的公司,打開領英(LinkedIn),上頭至少有5萬3千個數據科學家的職缺,而這還只是美國的統計數字。

美國專業招聘公司羅致恆富(Robert Halt)公布的《2015薪資指南》把大數據工程師列為今年薪資漲幅最大的六大行業之一,預計薪資年成長率9.3%,平均年薪119,250美元至168,250美元,在國內根據經驗平均也有100萬到500萬的薪資行情。

鼎鼎大名的數據科學家你也許聽過不少,諸如美國白宮首席數據科學家帕帝亞(DJ Patil)、被選為全美Top 4技術長的寶立明又或者是阿里巴巴集團大數據的第一把交椅車品覺,但這些如雷貫耳的大數據科學家動輒掌管一個個國家或跨國企業的海量數據,彷彿離一般人很遙遠。其實,現在各行各業都亟需大數據科學家,你也可以加入大數據淘金潮,但到底什麼樣的人才適合做大數據的工作呢?想要搶搭大數據人才熱潮,晉身高薪一族,又需要注意哪些事情?

大數據行動廣告平台威朋是一家藉由分析行動裝置的數據,為客戶找到精準行銷目標的數據管理平台(DMP)與即時廣告競價(RTB)投放公司,業務橫跨台、日、中、港等地,數據分析為其業務核心,數據分析部門佔其人員大宗,威朋數據科學研發經理彭智楹與張嘉祜分別擁有多年數據分析經驗,現身說法分享數據科學家到底在做什麼以及如何成為數據科學家。

威朋大數據科學家
(圖說:威朋數據科學研發經理彭智楹擁有將近8年的數據分析經驗,張嘉祜則是4年。照片來源:蔡仁譯攝。)

威朋大數據科學家現身說法
張嘉祜

學歷:
臺灣大學資訊工程學系網路與多媒體研究所博士
中央大學通訊工程學系碩士
中興大學電機工程學系學士

彭智楹
學歷:
臺灣大學資訊工程研究所 博士
臺灣大學物理系學士
臺灣大學心理系學士

就跟絕大數從事電腦工程的人一樣,張嘉祜和彭智楹皆畢業於資工系,在學期間就已開始從事資料分析工作,每日需與大量數據為伍,兩人皆認為在學校所學的知識和技能有助於他們進入職場從事相關工作。張嘉祜念博士時分析大量的影音多媒體資料,而彭智楹曾與生物學家合作分析生物影像,分析影像資料看似與分析廣告數據大不相同,但其實背後原則相差不遠,重點都是要從茫茫資料海中找到有價值的資訊,只是資料種類不同而已。

兩人的工作雖然都是大數據分析,但張嘉祜更專注於幫助線上廣告投放達到最大效益化,偏向商業智慧分析,並且發展幫助其他同事可以快速找到問題答案的工具,快速從大數據中檢索需要的統計資料,幫助客戶改善行銷策略。另一方面,從市場反應決定要做出什麼相對應措施,時常與點擊率、轉化率和流失率等數據為伍。而彭智楹則負責開發資料探勘系統、寫演算法和機器學習,例如預測點擊率,判斷使用者打開App時點擊廣告的機率有多大,較偏向於垂直面的研究。

特質一:定義和釐清問題

談及好的數據科學家具備什麼條件,彭智楹認為可以分成兩種等級:一種是是別人幫你把問題定義好,然後你來解開,但更厲害的是你知道怎麼找問題,什麼問題才是重要的,自己發現問題。「你要定義最有前瞻性最重要的問題,結果不只正確還要顯著性,對各領域發展有貢獻,要有商業價值和技術進步的空間,兩者能兼備是最好的。」彭智楹說。張嘉祜也認為在分析數據時,定義問題的能力很重要,因為問題分成很多層面,數據科學家必須要看當下要解決什麼問題,再用那個指標去回答。因此數據科學家首要具備的條件就是:定義和釐清問題。

特質二:想像力

不要以為數據科學家整天在電腦前面工作,只要一板一眼地分析數據就好,其實想像力也很重要。張嘉祜根據自己的工作經驗指出,有一定的創意才能幫助自己找到不一樣的觀點,學校會訓練你使用習慣的工具,但你應該要嘗試各種可能,如果沒有專業知識判斷,最後得到的結果就會跟大家差不多

例如在威朋工作常會需要幫助客戶找到具有某種特徵的族群,這個時候若只靠經驗和專業是不夠的,還需要發揮一些想像力。「我們在描述一個人的行為傾向時是很多維度的東西去做整合,除了你對生活經驗的豐富度之外,你還要有創意去描述這種人具有什麼樣的行為特徵,我們再透過機器學習的輔助,幫助你快速收斂這些特徵背後隱含的意義是什麼,不然一般人就是我想到什麼樣的資訊我就勾一勾,這樣不夠。」張嘉祜說。

特質三:邏輯思考能力

數據科學家的工作時常需要建立假設然後去驗證它,並且建立模型,這個過程仰賴優秀的邏輯思考能力,否則追尋答案到一半可能不小心就會走到岔路。大學時期雙修物理和心理學的彭智楹認為,心理系的訓練幫助他可以更容易了解他人的動機和想法,也因此在分析數據時常有意想不到的收穫。

以數據科學家最討厭的機器人為例,這類的假數據抓不勝抓,又會影響到統計結果,令人不堪其擾,但彭智楹認為與其去思考機器人在哪裡,要怎麼抓,不如反向思考什麼樣的網頁需要機器人,機器人的數據從哪裡來,就像是偵探福爾摩斯一樣,「偵探怎麼找出犯人,他不是從犯案手法去看的,而是從動機。」

威朋大數據科學家
(圖說:彭智楹平時就喜歡分析生活中的常見現象,例如觀察公司電梯哪一台跑最快,為什麼最快。照片來源:蔡仁譯攝。)

特質四:基礎數理與資訊工程能力

雖然彭智楹和張嘉祜都同意數據科學家不一定非得要是理工學院或電資學院出身的,但也都異口同聲地指出數據科學家還是必須具備基礎數理與資訊工程能力。

張嘉祜說,你也許可以用Excel去處理數據,但如果想要加快資料處理速度的話,程式能力依然是必須的。彭智楹認為不能害怕數字很重要,必須要培養對數字的敏銳度,例如他在念博士時就會用眼睛觀察數列是否有周期性的變化,從中訓練自己對數字的敏銳度,他甚至寫了一個產生各種亂數模型的程式,然後用眼睛一一把每個數字看過一遍,分析影像時也一樣,每張影像他都一一檢視過,「什麼時候要把資料分開或結合看,這都需要經驗。」彭智楹說。

但在工具之外,張嘉祜認為最重要的還是商業嗅覺,現在很多人隨隨便便就說自己會做數據分析會用什麼資訊工具,但沒有商業眼光依然白搭

特質五:跨界合作能力

最後,由於大數據科學家必須膽大心細又要天馬行空,邏輯好之外還得要融合自身生活經驗,這些特質要在一個人身上面面俱到非常困難。張嘉祜指出,跨界合作能力在這裡就顯得格外重要,因為不同的產業別需要不同的觀點,如果不懂得傾聽別人的意見,恐怕陷入盲點而不自知,跨界合作有助於發現不同面向切入分析,更有效率地做決策

和沛科技創辦人翟本喬曾說:「在大數據領域的英雄不是圖靈,也不是克勞德·夏農(發明資訊概論的人),而是福爾摩斯,這種有點自閉但能夠看出事情關鍵的人,如果只是因為大數據很紅就去學這些工具,你學這些工具就是賺22K的,把專業領域做好,你可以賺2200K。」因此,與其盲目追隨大數據熱潮,不如看看自己是否具備這些特質以及專業,再來決定要不要加入大數據淘金潮。

@@ACTIVITYID:513@@

關鍵字: #大數據
往下滑看下一篇文章
2025年總統科學獎〉跨界40年!梁賡義院士在產官學研間,搭建科技、人文間橋樑
2025年總統科學獎〉跨界40年!梁賡義院士在產官學研間,搭建科技、人文間橋樑

2025年總統科學獎得主梁賡義院士,即便同時擔任逢甲大學春雨講座教授、浩鼎生技董事長,還為了協助國立臺東大學設立護理系而大力奔走,三不五時要環島、全臺走透透,日子忙得不得了,但他始終精神抖擻、滿懷熱情,只因他做的,是有益臺灣、社會發展的事。

事實上,梁院士從數學跨足生物統計,再投身高等教育與國家衛生,不僅以「廣義估計方程式」(Generalized Estimating Equations,GEE)改寫了縱貫式數據分析的規則,更以獨到的人文關懷,影響無數學子與政策制定。

從小,梁院士就喜歡數學的嚴謹與邏輯,1973年,他自國立清華大學數學系畢業後,便赴美深造,並在美國南卡羅萊納大學取得統計所碩士;接著,他又轉往美國華盛頓大學,攻讀生物統計博士學位。

從數學到生物統計,帶出數據背後的人性關懷

在研讀博士期間,他接觸到了當時炙手可熱的「存活分析」,意識到生物統計能直接幫助科學家、臨床醫師回答有意義的科學問題,對人類健康產生間接但深遠的助益,就此便踏上生物統計的「不歸路」。

教學界的老友們來到頒獎典禮,為梁院士祝賀殊榮。
教學界的老友們來到頒獎典禮,為梁院士祝賀殊榮。
圖/ 數位時代

1986年,已在美國約翰霍普金斯大學(Johns Hopkins University)任教職的他,與同事Scott Zeger研發出新的統計方法「廣義估計方程式」。梁院士解釋,不論是實驗室、世代流行病學或臨床試驗,只要是縱貫式硏究(longitudinal study),產學研界都會用到GEE,進行統計分析。尤其在國際大藥廠最常用的「前後測臨床試驗」(pre-post design for clinical trial designs)中,GEE讓全球臨床醫師能準確評估癌症、心臟血管和糖尿病等新藥的療效,進而獲得各國食藥署通過,造福千萬病患。GEE發表至今,已被引用逾22,000次,並納入R、STATA、SAS、SPSS等主要統計軟體中。

雖然在約翰霍普金斯大學任教長達28年,梁院士卻幾乎年年暑假,都返國舉辦研討會,分享國際生物統計和流行病學的新知。也因為始終心繫臺灣,讓梁院士在2010年,毅然辭去在美教職,回臺擔任國立陽明大學校長。

一方面,梁院士成功為學校爭取5年500億的計畫經費,成立腦科學中心、腫瘤免疫中心和高齡健康研究中心,將陽明大學打造成研究型大學,並在國際間嶄露頭角。另一方面,為了培育年輕人才,他選擇停下個人研究,建立起由資深教師帶領年輕教師的「師徒制」,鼓勵經驗傳承,「組織要永續發展,有賴於年輕人才的成長。」像是他自己儘管平常公務繁忙,仍活躍於社群,默默留心學生的大小事;他並邀請學生前往校長宿舍,定期舉辦「與校長有約」活動,這讓學生與他之間「零距離」,大至職涯規劃、小至生活瑣事,都樂於與他分享。

最重要的是,梁院士相當看重全人教育,因此廣泛開設人文講座、藝術文化等通識課程,尤其陽明大學以醫科見長,「所謂視病如親,醫護人員在專業之外,更需要具備人文素養,才能真正關懷病患。」

梁院士於頒獎典禮現場發表感言。
梁院士於頒獎典禮現場發表感言。
圖/ 數位時代

2017年,梁院士接下國家衛生研究院院長一職。這時,他又迅速轉換角色,每週檢視國際文獻、提供數十件政策建言,充分發揮國衛院的智庫功能。新冠肺炎爆發期間,他再度臨危受命,擔任中央流行疫情指揮中心研發組組長,帶領國衛院在15天內,完成公克級瑞德西韋合成,並與阿斯特捷利康(AstraZeneca)簽約,預採購1千萬劑疫苗,達成防疫、安定民心的任務。

不斷跨界,帶著使命感堅定前行

一輩子都在「跨領域」的梁院士,堅信創新不僅來自技術,也來自跨域合作帶來的新思維。他在美國求學、教書時,不是發表完論文就沒事了,他還持續思考,自己的研究能如何被用在臨床,因此他積極參與思覺失調症、強迫症研究等多項計畫,與基因學家、精神科和流行病學醫師腦力激盪、挑戰彼此。但梁院士特別提醒莘莘學子們,「跨領域」固然重要,大學時期仍應先在一個領域「站穩腳跟」,如此才能擁有與不同領域對話、欣賞的紮實基礎。

在產官學界耕耘逾40年,梁院士絲毫未停下前進的腳步。如今,他仍在杏壇作育英才,也深入業界,期望將研究成果更直接應用在藥物,以造福病患,「這是我一直鼓勵學生進入藥廠的原因!因為他們對人類的貢獻,可能比發表文章更直接。」近來,他心心念念的最大任務,是以自身人脈連結資源,為臺東大學爭取設立護理系,填補偏鄉地區的醫護缺口。

賴總統親自頒發「2025年總統科學獎」殊榮予梁院士。
賴總統親自頒發「2025年總統科學獎」殊榮予梁院士。
圖/ 數位時代

每一個統計數字背後,都承載著真實的生命重量;每一次跨領域的嘗試,都可能為人類帶來新的希望曙光。梁院士在統計學的精準座標中,繪製出一幅幅影響深遠的生命藍圖,持續為臺灣乃至全球的健康與福祉努力。

梁賡義 院士
專長:生物統計、流行病學
現職:逢甲大學春雨講座教授
成就:研發「廣義估計方程式」,讓全球臨床醫師得以正確評估許多如癌症、心臟血管及糖尿病等新藥的療效,造福嘉惠全球數以千萬計的病患;橫跨產官學界,為臺灣貢獻所長

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓