不論是通勤時、工作中、下班後,生活中的每個片刻,有了音樂陪伴總是更美好。不過,你可能沒有想過,當你無意識地按下播放鍵時,遙遠的另一端,有一群人正忙著讀取你傳遞出來的每一個訊息。他們,是KKBOX的資料科學家。關於你的音樂偏好,這群人很可能比枕邊伴侶還懂你。
KKBOX資料科學家陳怡安擁有土木專業背景,取得台大資管所博士學位後,她在2011年加入雅虎,參與過新聞和電子商務相關專案。並在去年11月進入KKBOX,擔任研究中心機器學習組經理,運用機器學習技術打造個人化音樂串流體驗和音樂內容解析。今年10月,KKBOX發表一套與台大、政大和中研院合作開發的新版演算法,就是研究中心團隊努力的成果。
「我的資料科學旅程,其實是從兩、三年前正式開始的。」陳怡安說。當時還在雅虎服務的她,正好加入電商推薦技術開發團隊,而她也因此一腳踏入資料科學領域。
音樂聆聽行為很細膩,考驗資料科學家功力
陳怡安表示,雖然同樣是資料科學,但是電子商務和音樂領域差異極大。
「以電商來說,大部分的人都有非常明顯的intention(意圖),就是『我要買東西』。」她以女性服飾為例指出,消費者挑選服飾時,除了風格之外,品牌和身材等也是重要的購買決定因素。「可是在音樂的世界不太一樣,音樂的聆聽自由度是很高的。你可能觀察到一個人聽A曲風、BPM(Beats Per Minute,每分鐘節拍數)是多少、喜歡這個歌手,但是這並不代表他對其他BPM或是歌手不感興趣,而是你要在比較適當的時候推薦給他,他可能就會買單。」陳怡安強調,聆聽音樂,其實和使用者當下的心理狀態有很深的關係。
此外,在電商和新聞領域中,很少會發生「重複購買和觀看」的現象,但是在音樂領域中,反覆聽同一首歌反而是主流行為。因此,什麼時間點要推薦什麼歌曲、推到第幾次才算夠,在在考驗資料科學家的經驗和功力。
「最難的一點是,很多推薦都有demographic(人口統計學)的資訊在裡面,比如說你的年齡和性別,可能可以做很準的預測。可是聽音樂是非常個人的事情。」她舉例說,一位女性用戶或許也會聽搖滾、龐克等比較陽剛的音樂,「所以你很難用年齡和性別去猜她喜歡什麼,還是要從她一些細微的動作去推測。」陳怡安說,使用者聽到一首歌時,有沒有把它加入收藏、是否反覆聆聽,都是重要的判斷依據。
懂音樂會加分,但是合作力才最重要
身為串流音樂產業中的資料科學家,陳怡安自己喜歡聽音樂嗎?「我很喜歡聽音樂。不過有些人聽音樂聽得很專業,可能曲風很挑或是設備很好,可是我不是那一種。」陳怡安說:「來KKBOX之前,我是『有得聽就好』,也會聽熱門的歌手像陳奕迅、王菲。來KKBOX之後,做了蠻多專案,有的專案是和曲風有關,所以越聽越廣,越聽越多。然後你就會發現,聽音樂真的是還蠻個人的事情。」她笑說,經過這幾年的工作歷練,回想起來,以前自認的「喜歡聽音樂」和現在的程度又差很多了。
其實,熟悉音樂對資料科學家來說,只是加分條件,並非決定成敗的關鍵因素。陳怡安解釋,KKBOX平常需要和許多音樂人、專業策展人合作,因此,資料科學家如果對音樂有興趣,當然可以幫助自己更進入狀況。「但是以音樂領域來講,只靠一個人的力量是不太夠的。」
她以曲風分類為例指出,「曲風其實不是固定的分類架構,它會隨時間變動,有時候會有新的曲風出現,有時候會有舊的曲風被併到別的地方。這就要靠專家的力量,幫助你判別分類器好不好,再來就是看使用者的點擊率、留存率等等的反應。」
陳怡安強調,相較於音樂專業,資料科學家更需要具備溝通能力和合作能力。「因為一個人不能懂所有的domain。」