更懂你想看什麼的Netflix,如何用數據解構好萊塢影片?

2014.01.13 by
PingWest
PingWest 查看更多文章

宣導「有品好玩的科技一切與你有關」,開始構建科技創新實踐者與消費者的共用社區,成為科技融入生活與消費方式的創新實驗室。

更懂你想看什麼的Netflix,如何用數據解構好萊塢影片?
為了弄懂訂戶的觀劇喜好,線上視頻提供商Netflix創造至少7萬種視頻「微類型(micro-genres)」,來細分已有的視頻內容。然後,再...

為了弄懂訂戶的觀劇喜好,線上視頻提供商Netflix創造至少7萬種視頻「微類型(micro-genres)」,來細分已有的視頻內容。然後,再通過元素的重組,為下一步新的影視內容攝製提供參考。

Netflix面對龐大的好萊塢影視業,它又要以怎麼樣個性化分類,來滿足旗下的4000萬訂閱用戶的需求?

NF

Netflix切入點很細,這些「微類型」對應特定的觀眾區間。有時分類甚至讓人覺得很特殊、很荒謬。比如情感鬥爭類的紀錄片、基於現實生活的古裝劇、20世紀80年代的外國魔鬼故事……

根據大西洋月刊的記者粗略統計,Netflix至少把影片分成76897種「微類型」。這打破了原本對於影片類型粗略式的分類方法。Netflix能由此分析出最受歡迎的影片類型、以及最受歡迎的演員與導演等。

除了Netflix的員工以外,沒有人瞭解Netflix是如何細緻分類的。他們要面對好萊塢那般空前的資料儲存,而記者所統計的數量的類型只是冰山一角。

Netflix內部把這種分類過程稱之為「altgenres」,它由Netflix副總裁 Todd Yellin構想發明,這是一項特殊的解構電影的過程,整個系統複雜精確。Netflix首先要雇傭一群人,讓他們閱讀一份長達36頁的培訓文檔,訓練他們如何對影片的性暗示內容、暴力程度、浪漫橋段、甚至情節等等元素,作出精確地評級細分。

他們捕捉了數萬種不同的電影屬性,甚至是人物的道德派別。這些標記內容,與千萬級使用者的觀影習慣相配對,便成了Netflix的競爭優勢。Netflix的主要目標,是為了獲得並留住訂閱用戶。通過這種微類型,對應不同的觀影受眾,正好是他們戰略的一部分。

在2012年的時候,Netflix就在其官方博客中提到,瞭解用戶喜歡的「微類型」的內容,就能用高收視的類型取代低收視的部分,以贏得競爭力。只要,Netflix更瞭解用戶,用戶就越容易黏在它的平臺上。

過去的幾年中,Netflix建立了屬於自己的使用者偏好資料庫。這個資料庫,雖然不能告訴導演編劇影視劇要怎麼拍,但他能告訴這些人,影視劇中需要什麼樣的元素。比如他們拍攝紙牌屋的時候,就該知道哪些元素需要有的放矢。

Netflix通常是這樣對影視內容進行分類的,比如:

● 獨立情感的體育電影
● 20世紀30年代、間諜和冒險類點電影
● 中國浪漫主義黑幫片
● 黑色懸疑科幻恐怖電影
● 廣受好評、主角情感受挫的電影……

這種細分方法可以概括成:首先是國家,其次是類型片大類,比如是西部片還是恐怖片。其次是影片的創作來源,基於現實生活、古典文學還是虛構內容。然後影片設定的時代,比如20世紀80年代。觀影級別,比如16周歲以上觀看等。還有一些比較特殊的通用分類,比如女英雄主義,激進的浪漫主義等,當然還有導演與演員的個人風格。

這些繁複又有規則的分類方法,又組成了這樣一種公式:

影片類型****=****地區****+****主題****+****形容詞元素****+****類型片類型****+****演員特性****+****創作來源****+****時間****+****故事情節****+****內容****+****得獎情況****+****適宜觀看人群等等。

但這並不意味著所有的微類型,都能線上找到對應的影片。而這些細緻分類代表所有的排列組合的可能性,而不止是代表觀眾在特定時間場合看到的影片。

Netflix****自有的片庫不能涵蓋到所有微類型的影片,但它的價值在於,如果市場需要的話,****Netflix****可以根據這些標籤,去拍攝這種類型的片子。

假如把以上過程,可以看做是Netflix把影視內容轉碼成資料過程。而對資料最簡單的處理,就是做個統計排行榜。

 

基於Netflix分析,訂戶最喜歡的主題是結婚。

 N1

 

訂戶最喜歡的形容詞元素是浪漫的。

N2

 

訂戶最受歡迎的電影所處時代是20世紀80年代。

N3

 

訂戶喜歡的電影場景設定在歐洲。

 N4

Netflix副總裁 Todd Yellin,與另外兩位工程師通過數月的努力,制定了以上被稱為「Netflix量子理論」的東西。Yellin本人像一位混跡於科技公司、不安分的製片人,它需要為影片生產所有流程精心算計,就像紙牌屋中Frank Underwood的智囊 Doug Stamper那樣。

Yellin告訴大西洋月刊的記者,他們分析出的內容,只是他們終端的產品形態。而在Netflix資料庫內部,資料分類捕捉會更加繁複。他說道:「我們要把影片內容給撕裂。」

通過這些分類標籤,Netflix不僅能給他的訂戶推薦影片,甚至告訴他們你喜歡的類型究竟是什麼。基於Netflix演算法,它甚至提前幫用戶預估,他們看完影片,會給影片打幾分。

這家公司還拿出100萬美元懸賞,獎勵給能提高這種預估評分演算法準確度的技術團隊。經過幾年時間的改進,準確度僅僅提升了10%。儘管該獎金在2009年開始設立,但Netflix並沒有把它納入新模式,而只是一種工作需要。他們認為,比起感性的得分,更個性化風格的微類型細分,才是觀眾真正要的。

標記的微類型判斷使用者喜歡什麼還不是全部,這些資料還能用來分析,什麼類型影片哪些演員來出演,會更受歡迎。Netflix還希望演算法基於資料,能在合適的時間,給特定的觀影物件,推送合適的內容。

 

轉自PingWest

每日精選科技圈重要消息