評分時常「自我感覺良好」?Netflix改以使用者行為定義你的品味
評分時常「自我感覺良好」?Netflix改以使用者行為定義你的品味

本文摘自:《品味選擇題》,大塊文化出版

某天晚上,我在瀏覽Netflix,看是不是有什麼東西可看,結果跳出來一部名叫《木馬贏家》(The Rocking Horse Winner)的電影(「因為您喜歡看《驚魂記》、《安妮霍爾》、《血風暴》」)。我點選了它,發現是一部1949年的片子,改編自勞倫斯(D.H. Lawrence)的小說,講一個男孩,只要騎在玩具馬上,就能預測賽馬的贏家。這個故事和這部電影我都沒看過。

the rocking horse winner.jpg
圖/ 木馬贏家

我在這件事所想的是,透過演算法來推薦,這套系統實在太厲害了:從歷史的垃圾桶裡,用一種看不到、超過我所能理解的方式,挑了一部沒人知道的電影。是什麼東西把《木馬贏家》跟伍迪艾倫的經典喜劇、希區考克的驚悚片和柯恩兄弟黑色幽默的西部片連在一起?我所做的評分動作是如何把這四部電影兜在一起?

有一段時間,我很認真地研究我的Netflix演算法。每一部看過的電影,我都給評分,然後研究我會得到什麼推薦電影。我希望事情穩定下來,能掌握我的品味的曲折面貌。我想讓它不只是知道我喜歡什麼,而是我為什麼喜歡它。

這是為什麼當我跟Netflix產品創新副總裁葉林(Todd Yellin)坐下來的時候,我會聽到針刮過唱片的聲音。「我在這裡的首要工作是負責產品個人化。我帶領同事研究如何進行評分、如何改善預測、要把它放在使用者介面的哪裡。」到目前為止,一切都還不錯。然後他說,「我們在這幾年拓展個人化的範圍,把評分預測的比重降低了。」

「我們還是覺得這是很有用的資訊,」葉林說。「但這已經是次要的了。」發生了兩件事,讓它變得沒那麼有用。負責Netflix推薦系統的阿瑪崔安(Xavier Amatriain)表示,第一件事就是,Netflix在預測品味的速度已經到了頂。「你花了百分之二十的時間,有了百分之九十的準確性,然後花了其他百分之八十的時間,設法改善那百分之十的準確度。」是否值得這麼做,其實還很難說。

還有別的事情也改變了。從Netflix成立之後,Netflix已經從一家只寄送DVD的公司變成主要提供影片串流服務的公司了。因為有了串流,Netflix得到的回饋或許明顯減少,但卻有更多隱而不顯的行為。「我們可以得到即時的播放資料,」葉林說,「這比他們口頭說自己想要什麼要來得更豐富。」Netflix知道更多關於你看什麼、如何看:你什麼時候在看,看什麼,你在哪裡看,你在哪裡停下來,你接下來看什麼,什麼東西你看了兩次。你搜尋什麼──這又是一個品味的訊號。

Netflix曾經很依賴人們自陳他們喜歡什麼,現在則把焦點更放在人實際上看了什麼。「這有很多好處,」阿瑪崔安表示。「其中一個是人們評分的方式:他們以熱切的方式進行評分──他們會喜歡看什麼或是他們希望如何看。」

葉林指出,「人們想要自我感覺良好。他們甚至可以幻想出自我形象──他們說他們喜歡哪種東西、他們會給某一部電影幾顆星、他們實際上看什麼電影。」你可能會給《盧安達旅館》(Hotel Rwanda)五顆星,給《美國隊長》(Captain American)兩顆星,「但你可能更喜歡看《美國隊長》。」

這並沒什麼稀奇。從韋伯倫(ThorsteinVeblen)開始,經濟學家就在談論我們「品味」的炫耀「記號」(不論是否誠實)。它們通常會往上流動:人們不會給《美國隊長》五顆星,給《盧安達旅館》兩顆星,然後偷偷看《盧安達旅館》。社會學家高夫曼(Erving Goffman)有個很有名的看法,以「擬劇行為」來描述我們呈現自己的方式:「我們發現,向上流動牽涉到做出適當的表演,為了保有態度舉止而做出犧牲,以求努力往上移動,不走下坡。」

盧安達飯店.png
圖/ 盧安達飯店

這又牽涉到一個人類學家崔佛斯(Robert Trivers)和心理學家席柏爾(William von Hippel)提出的有趣問題:「自我欺騙是演給誰看?」高夫曼說人經常不得不去維持標準,「因為人相信有個看不見的人在看,如果未達標準,將會受到懲罰。」於是就有了「有罪惡感的歡愉」(guilty pleasure)的罪惡了。

這並不意味著,當照見自我欺騙的時候會是讓人愉快的。Netflix最常碰到的抱怨,就是「你們為什麼要推薦那些只有兩、三顆星的電影給我?」換個說法,我不會喜歡的東西,你們為什麼要給我?但是Netflix並不是要把你變成影迷。它只是想讓你繼續看Netflix而已。巫理柏說,「當有人給《辛德勒名單》評分的時候,通常給分會很高──相對於我看的《扭轉時光機》(Hot Tub Time Machine)這種傻里傻氣的喜劇。」但如果你只給顧客四、五顆星的電影,「這不表示他們在辛苦工作了一整天的周三晚上會去看它。」

Hot Tub Time Machine.jpg
圖/ 扭轉時光機

評分系統充滿了偏見。一般會避免最高和最低的一級──這叫做「收縮偏見」──所以兩顆、四顆星的評分比一顆、五顆星的要多得多。阿瑪崔安指出,另一個統計的缺陷是,「我們知道評分的級距並不是線性的,一顆星跟兩顆星之間的差距,不同於兩顆星與三顆星之間的差距。」這中間平凡枯燥的地帶是相當泥濘不堪的。此外還有「整數偏見」,人傾向於給出整數的分數。

自此世人對星號評分的做法爭吵不休。一個明顯的問題是,因為人的品味偏好各有不同。別人認為這部電影有三顆星,但你可能覺得是部五顆星的佳作。這也是為什麼Netflix會分成整體評分和「我們猜你會喜歡」兩個部分。這把品味直接攤在桌上:你喜歡這部電影的程度比其他人高了0.7分。我們或許會認為,這種表達「我們」的品味的方式比較純粹,但是出現的一個難題是,這個數字有一部分來自別人的作為。另一個問題是,不管你對某部電影怎麼想,你給的評分有可能會不一樣──偏高或偏低。

這說明了Netflix及其評分有趣之處。以前的評論者有自己一套評分系統,而我們是從舊時代過來的人,會認為星號評分就衡量的品質或至少是個人品味而言是穩定的。然而,從個人與統計的層次來看,Netflix的評分都是很不穩定的。

事情在個人的層次可能還更混亂。要某人把某部他看過的電影重新評分,他很可能會給一個不太一樣的分數。實驗顯示,你只要改變受試者第一次給的分數,就能影響他第二次給的評分。人在一次給好幾部電影評分(訓練他們演算的本事)和一次只評一部的方式有所不同。評電視節目的方式也跟評電影不同。「電視節目得到的平均評分要比電影高得多,」葉林說。電視影集的品質會比電影好嗎?「我的直覺看法是這裡頭有篩選的因素,」他說。「誰會給《黑道家族》(The Sopranos)打分數?不會是那些看了五分鐘就決定不喜歡它的人。會看它的人就是那些入了迷、花了幾小時追劇的人。」

The Sopranos.jpeg
圖/ 黑道家族

「我已經深入這套評分的遊戲多年,」葉林語氣沉重,聽起來像是一個疲憊的匪徒,回首在街頭討生活的不堪歲月。我感覺到他想在這些評分中找到某種純粹、某種柏拉圖式的理想。到最後,從評分不見得能看出人會看什麼,也看不出人的性別和地區。「但如果他們在Netflix看了五部電影,那我們對他們的了解就不只是年齡、性別、地址而已。」

談了這些評分系統是如何不再受到強調,並不是要說推薦也不重要了。它們在Netflix的演算工作中確實比以前更重要,驅動了超過七成五的觀看率。

只不過,它們變得比較不外顯。Netflix不會告訴你,你喜歡什麼,現在基本上是讓你看到你喜歡什麼。「個人化」的欄位基本上是以你自身的行為所創造的。「每一件事都是推薦,」阿瑪崔安喜歡這麼描述新的介面,「超越了五星評分」的思維。即便是搜尋──這標示了「我們無法向他們展現要看什麼」──也送進推薦引擎裡。知道你在找什麼,這透露了你可能會喜歡什麼。

這反映了在兩個極端標誌之間的中間地帶,而這些標誌的本身並不是完全有用:第一個是你所敘述的喜好。這會把人帶到某種品味的死胡同去,充滿了晦澀、有趣的電影,但你很少會去看它。演算法以「過適」(overfitting)稱之:某個意義上來看,引擎所推薦的太過完美──所以完全無效。

第二是普及性。阿瑪崔安告訴我,這與「個人化」恰恰相反;如果想把消費極大化的話,「會員最可能看別人在看的電影。」這可能會引發「刺激一九九五問題」,全世界都看過這部電影,推薦已經多到過剩。《刺激一九九五》(The Shawshank Redemption)是Netflix最受好評的電影,網路上對它讚不絕口,結果推薦幾乎沒有任何預測力。「什麼鬼地方的人都喜歡這部電影,」葉林搖著頭,覺得不可思議。

Netflix並沒有全然倚賴使用者的行為來做推薦,或許這是對人類品味無可改變的喧囂的讓步。 Netflix也雇了人去「下標」,架設電影元資料(meta-data)的迷宮。Netflix發現,與其找出兩個人之間的類似之處,不如去確認兩部電影之間的類似處。結果有了很奇怪的發現。導演阿莫多瓦(Pedro Almodóvar)的名字可能就會把兩部不搭軌的電影連在一起,換了其他字眼是無法做此連結的。但是元資料本身也可能誤導。《厄夜變奏曲》(Dogville)是一部評價兩極的電影,如果只因為都是妮可基嫚所主演的,就把它推薦給看過《時時刻刻》(The Hours)或《紅磨坊》(Moulin Rouge)的人,可能會給自己找來大麻煩。

Dogville.jpg
圖/ 厄夜變奏曲

但是元資料也能理清靠我們一己之力無法發現的事情。那往往很詭異、由人所製造的作品類型提醒了我們,分類對我們的偏好影響很大。Netflix的詭異分類設法從那看似隨便提的建議中形塑意義。「推薦有可能太跳脫了,」葉林說,「這就好像是說,『哇,它為什麼會這麼說,只因為我給了《大紅燈籠高高掛》五顆星,就以為我會喜歡這部日本小鬼的電影?』葉林指了指他的筆記電腦。在他的Netflix頁面有一串推薦片名:《娥摩拉罪惡之城》(Gomorrah)、《血染天堂路》(Valhalla Rising)、《嗑到荼靡》(Enter the Void)、《安達魯之犬》(Un Chien Andalou)。這都是放在一個叫做「精神不正常的外國片」的類別下。「這看得我很興奮,」他說,「但你要是就只給我看這個,而沒有上下文,就不見得會讓人想看。」就像作家馬椎格(Alexis Madrigal)所說的,「Netflix不只是給你看你可能會喜歡的影片,它還能告訴你,那些東西是什麼。」

往下滑看下一篇文章
硬體新創如何打國際盃?邁特Demo Day揭出海關鍵:技術是門票,信任才是護照
硬體新創如何打國際盃?邁特Demo Day揭出海關鍵:技術是門票,信任才是護照

第十屆邁特創新加速計畫Demo Day在2025 Meet Taipei盛大登場。今年邁特以「邁國際」為活動主軸,邀請加拿大、新加坡、日本和台灣的專家,除了探討全球市場的開拓,也期望運用邁特創新基地,建立具磁性的網絡(Magnetic Net),持續吸引硬體創新團隊與專家,建構蓬勃發展的全球硬體生態系。

中華民國全國創新創業總會秘書長謝戎峰在致詞時直指,台灣市場量體小,硬體新創要走到小量試產非常不容易,過往台積電就是為輝達做到開源、加速整合的角色,「邁特也在系統面扮演同樣角色,從打樣、試樣到小量試產,提供新創全方位協助。」

從矽島進化新創島,「國際化」是關鍵指標

事實上,邁特創新基地自2016年創立以來,便致力成為硬體創新領域的加速器,期望提供「從0到100的解決方案」,並打通「硬體創新的最後一哩路」。邁特創新基地執行長戴憶帆指出,台灣被譽為半導體、電子製造服務強國,在全球產業鏈中具核心地位。如今,台灣正在善用「矽島」具備的卓越製造、供應鏈能力,聚焦創新研發,成為讓硬科技落地、加速商業應用的「新創島」,「其中,『國際化』絕對是衡量新創團隊能否快速成長、取得成功的最重要指標。」

邁特創新基地
加拿大駐台北貿易辦事處副處長拓喬丹特別蒞臨分享,期待與更多台灣新創攜手合作。
圖/ 數位時代

目前,邁特已幫助來自全球逾13個國家、超過150家的新創公司向外擴展。而為了具體展現協助台灣硬體新創出海、邁國際的決心,本屆Demo Day特別邀請來自跨國創投的專家,一同探討全球市場的開拓。

加拿大駐台北貿易辦事處副處長拓喬丹(Jorden Turley)首先指出,邁特的國際協同合作理念,與加拿大不謀而合,「加拿大視台灣為亞太戰略中,不可或缺的重要夥伴,我們彼此間不是競爭而是合作。」例如台灣在硬體製造、實作方面有優勢,加拿大則在設計方面表現出色,多邊合作有助於企業分散風險,並加速打入第三市場。

講好故事、建立信任感,打破技術迷思

跨界對談開場前,主持人邁特創新基地顧問柯旂,也先回應「邁國際」不只是今年的主題,更是台灣硬體創新的必然道路。本屆 Demo Day 不僅邀請到加拿大駐台單位、日本京都大學創投、新加坡創新生態圈代表,更有台灣創新總會秘書長、台經院等重要嘉賓蒞臨,一同見證台灣硬體新創與全球鏈結的關鍵時刻。跨界對談更邀請包含:日本京都大學創投(Kyoto University Innovation Capital)亞太區業務發展經理Raymond Woo,以及德國馬牌集團(Continental)旗下創投部門的合作與創投管理總監邱殷樂,為新創提供具體出海建議。

戴憶帆強調,「國際化」已是台灣新創現今最重要的課題,而新加坡、日本會是台灣進軍國際的首選前哨站。新加坡作為東南亞地區的中心,許多國際團隊選擇在當地募資、上市櫃,介接資源方便;日本則與台灣的文化、理念相近,相當重視「信任」、夥伴關係,加上在東京、京都等頂尖大學裡,有最前沿的技術,對需要發展應用、商業化成長的新創來說,是值得尋求技術互補的合作對象。

邁特創新基地
跨界對談由左至右分別為主持人邁特創新基地顧問柯旂、邁特創新基地執行長戴憶帆、日本京都大學創投(Kyoto University Innovation Capital)亞太區業務發展經理Raymond Woo,以及德國馬牌集團(Continental)旗下創投部門的合作與創投管理總監邱殷樂,與現場與會者進行交流。
圖/ 數位時代

邱殷樂直指,台灣新創的技術極佳、很有實力,甚至勝過美國、以色列的公司,「最大的問題,是不會講述自己的故事,以及不清楚如何對接正確的人和事。」他建議,新創在展開跨國合作之前,必須先確定在台灣的根基已穩,同時了解自家的技術優勢,以便說服投資人和潛在客戶;在和大集團、大客戶合作時,也要找到能推動技術使用的關鍵人物或團隊。

Raymond Woo觀察,技術背景出生的創辦人,經常會犯下只看技術、看不到大局的盲點,加上創業是相當依賴人脈的事業,「新創必須學習用技術來解決特定商業問題,並與合作夥伴建立最重要的『信任』,否則技術再好、再先進,也無法順利擴展、被妥善應用。」

硬體新創精銳盡出,智慧農業、智慧醫療、綠色創新吸睛

精彩的對談後,緊接著輪到參與第十屆邁特創新加速器計畫,涵蓋智慧農業、智慧健康、智慧製造與綠色創新等硬體領域的六組新創團隊,一一登台Pitch,並由邱殷樂、Raymond Woo、日本村田製造所新規事業推進部部長東端和亮、邁特創新基地日本代表顧問上野峻基和華碩電腦協理Sean Lai等業界先進擔任評審。

首先登場的台灣百應生物科技,是運用AI、電腦視覺技術,實現家禽養殖的自主監控,完全無需人工干預,準確度已可達98.5%。擴核生醫科技則打造一款模組化、可程式化的實驗室自動化平台,能將整合液體處理、細胞培養、影像擷取和資料分析等流程集於一體,加速生技與藥物開發的研發、驗證流程。雨傘不滴的綠色創新專利產品「傘不滴」,是透過物理擠壓與高科技吸水部件,讓雨傘四秒內便完全不滴水,取代一次性塑膠套,解決公共場所地滑和環保痛點。恆帝斯智能科技是結合ESG輔導與碳IoT設備,自主開發韌體,解決聯網不穩、斷電導致的數據品質等問題,助力企業邁向淨零轉型。領動智慧科技的空中手寫輸入技術,鎖定的是下一代殺手級產品「智慧眼鏡」,透過高精度動態感測,為智慧眼鏡提供直覺、隱私友善的文字輸入解決方案。超術感醫學科技研發的AR顯微手術模擬訓練系統,則利用真實手術器械,提供精確控制回饋與AI動作分析,解決傳統訓練器械缺乏的「手感」問題,能被應用在眼科、神經外科等高精密的手術訓練。

最終大獎,分別由台灣百應生物科技、擴核生醫科技和超術感醫學科技抱走。東端和亮直言,透過此次Pitch,一方面看到台灣在軟硬整合的實力,更令人激賞的是,「團隊在營利之外,還致力解決社會問題,創造美好世界。」

邁特創新基地
日本村田製造所新規事業推進部部長東端和亮特別代表評審團致詞,除了欣賞台灣新創軟硬整合的實力,更發現團隊在營利之外,還致力解決社會問題,創造美好世界。
圖/ 數位時代

從在地驗證到鏈結全球,助新創在國際市場站穩腳跟

團隊對於自家產品、服務的用心,正是邁特極力提倡的核心價值,也是台灣新創通往世界舞台的基石。邁特創新加速計畫的運作模式,便如同硬體創新領域的國際嚮導,持續為新創團隊提供在地技術驗證和商業基礎訓練,並將新創的產品對接到國外大廠、國際創投。未來,台灣新創若能持續深化國際化、與多元夥伴合作,並具備正確的敘事能力和出海戰略,必能加速向外擴展,在全球市場中站穩腳跟。

立刻了解更多
https://bit.ly/m/mightynet

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓