你的音樂喜好,他們比你還懂──KKBOX資料科學家

攝影/吳晴中
聽音樂是種非常個人化的行為,KKBOX資料科學家的工作難處在哪?又需要具備哪些能力?

不論是通勤時、工作中、下班後,生活中的每個片刻,有了音樂陪伴總是更美好。不過,你可能沒有想過,當你無意識地按下播放鍵時,遙遠的另一端,有一群人正忙著讀取你傳遞出來的每一個訊息。他們,是KKBOX的資料科學家。關於你的音樂偏好,這群人很可能比枕邊伴侶還懂你。

KKBOX資料科學家陳怡安擁有土木專業背景,取得台大資管所博士學位後,她在2011年加入雅虎,參與過新聞和電子商務相關專案。並在去年11月進入KKBOX,擔任研究中心機器學習組經理,運用機器學習技術打造個人化音樂串流體驗和音樂內容解析。今年10月,KKBOX發表一套與台大、政大和中研院合作開發的新版演算法,就是研究中心團隊努力的成果。

「我的資料科學旅程,其實是從兩、三年前正式開始的。」陳怡安說。當時還在雅虎服務的她,正好加入電商推薦技術開發團隊,而她也因此一腳踏入資料科學領域。

音樂聆聽行為很細膩,考驗資料科學家功力

陳怡安表示,雖然同樣是資料科學,但是電子商務和音樂領域差異極大。

「以電商來說,大部分的人都有非常明顯的intention(意圖),就是『我要買東西』。」她以女性服飾為例指出,消費者挑選服飾時,除了風格之外,品牌和身材等也是重要的購買決定因素。「可是在音樂的世界不太一樣,音樂的聆聽自由度是很高的。你可能觀察到一個人聽A曲風、BPM(Beats Per Minute,每分鐘節拍數)是多少、喜歡這個歌手,但是這並不代表他對其他BPM或是歌手不感興趣,而是你要在比較適當的時候推薦給他,他可能就會買單。」陳怡安強調,聆聽音樂,其實和使用者當下的心理狀態有很深的關係。

此外,在電商和新聞領域中,很少會發生「重複購買和觀看」的現象,但是在音樂領域中,反覆聽同一首歌反而是主流行為。因此,什麼時間點要推薦什麼歌曲、推到第幾次才算夠,在在考驗資料科學家的經驗和功力。

「最難的一點是,很多推薦都有demographic(人口統計學)的資訊在裡面,比如說你的年齡和性別,可能可以做很準的預測。可是聽音樂是非常個人的事情。」她舉例說,一位女性用戶或許也會聽搖滾、龐克等比較陽剛的音樂,「所以你很難用年齡和性別去猜她喜歡什麼,還是要從她一些細微的動作去推測。」陳怡安說,使用者聽到一首歌時,有沒有把它加入收藏、是否反覆聆聽,都是重要的判斷依據。

懂音樂會加分,但是合作力才最重要

身為串流音樂產業中的資料科學家,陳怡安自己喜歡聽音樂嗎?「我很喜歡聽音樂。不過有些人聽音樂聽得很專業,可能曲風很挑或是設備很好,可是我不是那一種。」陳怡安說:「來KKBOX之前,我是『有得聽就好』,也會聽熱門的歌手像陳奕迅、王菲。來KKBOX之後,做了蠻多專案,有的專案是和曲風有關,所以越聽越廣,越聽越多。然後你就會發現,聽音樂真的是還蠻個人的事情。」她笑說,經過這幾年的工作歷練,回想起來,以前自認的「喜歡聽音樂」和現在的程度又差很多了。

其實,熟悉音樂對資料科學家來說,只是加分條件,並非決定成敗的關鍵因素。陳怡安解釋,KKBOX平常需要和許多音樂人、專業策展人合作,因此,資料科學家如果對音樂有興趣,當然可以幫助自己更進入狀況。「但是以音樂領域來講,只靠一個人的力量是不太夠的。」

她以曲風分類為例指出,「曲風其實不是固定的分類架構,它會隨時間變動,有時候會有新的曲風出現,有時候會有舊的曲風被併到別的地方。這就要靠專家的力量,幫助你判別分類器好不好,再來就是看使用者的點擊率、留存率等等的反應。」

陳怡安強調,相較於音樂專業,資料科學家更需要具備溝通能力和合作能力。「因為一個人不能懂所有的domain。」

陳怡安解釋,曲風分類會隨著時間變動,例如爵士在1960年代很紅,紅了一陣子之後,就帶動搖滾崛起了。「音樂不像新聞有政治、娛樂等固定分類,而是一直在變化的。」
攝影/吳晴中
延伸閱讀
3,000萬
目前KKBOX曲庫中共有超過3千萬首歌曲。
資料科學
Data Science
「資料科學」指將大量資訊加以歸類、分析,並從中萃取出條理化的知識及未來洞見的跨學科領域,此名詞在1996年被國際分類聯盟 (IFCS) 正式採用。資料科學領域範圍甚廣,包含「人工智慧」、「統計學」、「資訊視覺化」等。在雲端運算和硬體迅速進步的現代,與大數據一同重新崛起。《哈佛商業評論》描述資料科學家為「21世紀最性感工作」,他們「懂得如何從眾多非結構化資訊,找到重要商業問題的答案」,是目前最炙手可熱的人才。 (來源: 台灣資料科學年會數位時代 )
追蹤我們