台灣資料科學年會推手陳昇瑋:資料科學家跨界玩,更性感

台灣資料科學年會
資料科學家(Data Scientist)被譽為21世紀「最性感」的人才。到底性感在哪裡?外界對這份職業又有哪些迷思?

資料科學家(Data Scientist)被譽為21世紀「最性感」的人才。到底性感在哪裡?外界對這份職業又有哪些迷思?台灣資料科學協會理事長、中研院資訊科學所研究員陳昇瑋,對於資料科學家的定義是「可以從數據中淘金,用數據解決問題的人。」

這幾年,大數據、資料科學蔚為產業風潮,但在這些名詞還未為眾人所知之前,台灣資料科學協會理事長、中研院資科所研究員陳昇瑋就已深耕於此。陳昇瑋原先是一位工程師、在IT業界資歷頗深,他在2000年後投身學術界,並在三年前創辦一年一度的台灣資料科學年會,積極推廣資料科學在各領域的應用。

在學術界中,陳昇瑋也是第一個在學術研究中結合真實商業數據的人。他經手過許多產業的數據研究,例如使用情緒量測技術,來預言線上遊戲的成敗;將資料數據分析應用在公益領域,分析捐款人的偏好等。

陳昇瑋說,目前資料科學在各行各業都已經有很多有效的應用,例如美國職棒、職籃隊伍幾乎內部都有資料科學家,他們會根據球的位置、球員的位置,跳多高、跳的角度等,來擬定有效的作戰策略,或是分析球員體能表現等;運用在電商領域可以得出哪些特質的消費者會喜歡什麼樣的產品;透過各個城市蒐集來的空氣數據來得出污染源等等。

資料科學家的「跨界能力」

從程式人跨到學術人,陳昇瑋其實最懂資料科學家所具備的「跨界」能力。正如同他自身經歷,陳昇瑋認為,資料科學家必須周遊在各個產業領域之間,絕對不像外界所想的只需要具備Programming(程式設計)能力。資料科學家的位置介於資料工程師(Data Engineer)與資料分析師(Data Analyst)中間。資料工程師需要的是電腦科學(Computer Science)專業;資料分析師需要的是統計(Statistical Skills)專業,資料科學家還得再加上一項領域知識(Domain Expertise)。

「資料科學沒有很神奇,它也是一種科學。你得先觀察資料,提出你的假設,然後再去驗證結果。」也就是說,不管資料科學家在什麼產業,都要先掌握那個產業的domain know-how(領域知識),再進一步提出假設、才能得出好的結果,「因為問出對的問題,才會得到對的答案。」陳昇瑋說。

不管資料科學家在什麼產業,都要先掌握那個產業的domain know-how(領域知識),再進一步提出假設、才能得出好的結果,「因為問出對的問題,才會得到對的答案。」陳昇瑋說。

創意也很重要

陳昇瑋提到,資料科學家最好要具有資訊、數學統計、問題三種領域的專業知識,而人格特質又以細心、溝通能力、創意為三大重點。為什麼需要創意?因為作為一個資料科學家,「創意」會是加乘條件。「當你看的東西與人不同,你想的東西也就與眾不同。」要如何訓練自己的創意?強迫自己觀察,直到觀察成為生活的一部分。

總結來說,資料科學家其實不一定非要資訊背景出身,除了資工、資訊、電機等理工人外,其實統計、財務管理人才也很適合,因為他們具有其他產業的知識,也更具有商業嗅覺,只要補足程式能力,都有可能轉型成為未來炙手可熱的資料科學家。

從企業的角度出發,陳昇瑋說,企業內最理想的初始資料科學團隊規模是五個人,包括一位PM(專案經理)、一位Data Scientist(資料科學家)、兩位Data Engineer(資料工程師)跟一名Visual Designer(視覺設計師)。但如果企業沒有這麼多資源的話,可以先從兩、三個人訓練起,先求有、再求好。陳昇瑋說,資料科學牽涉到典範移轉(Paradigm Shift),傳統倚賴經驗、現在倚賴測量;傳統資料是私有,現在卻是開放。「典範移轉本來就不是簡單的事,但這是不得不做的事。」

因此,資料科學家也要具備一定的商業敏感度。「商業敏感度是『混』出來的,他不會憑空出現。」隸屬於企業中數據部門的資料科學家,還要常和業務部的人經常在一起,不只是一起開會,最好還要一起喝茶、吃飯,讓彼此更加熟悉。

顛覆未來各個產業

正因為資料科學家能從繁複的數據中「看到別人看不到的東西」,他們能夠重新定義問題以及尋找答案,為企業在無論消費者行為分析、商業決策等方面「解惑」,也讓資料科學家變成目前產業趨之若鶩的未來人才。

「這已經是現在進行式。」陳昇瑋說,資料科學目前已經影響網路、金融業,未來,下一波衝擊又最可能會發生在倉儲、餐飲、製造業等傳統產業。因為包括生產線、原物料、供應鏈、庫存成本等,若能有更好的數據控管,得出獨特的商業Insight(洞見),資料科學家就能顛覆各個產業。

TIPS

  1. 找顧問、有經驗的資料科學家進入企業,組建資料科學團隊,讓老鳥帶小鳥進入產業。
  2. 企業招攬資料科學相關的實習生,讓學生透過實習,了解業界需求,進入職場後能力就能銜接得上。
  3. 讓統計學家、資料處理相關人才,開始跨足資料科學領域,逐漸轉型資料科學人才。
陳昇瑋 SHENG-WEI CHEN
出生年|1976年
學經歷|清大資工碩士、台大電機工程博士
現職|中研院資科院研究員、台灣資料科學協會理事長

本文出自:@@BOOKID:126838@@

追蹤我們