談評價系統與行為:不適切的評價系統如何影響食物平台外送員?以及你、我?
談評價系統與行為:不適切的評價系統如何影響食物平台外送員?以及你、我?
2019.11.13 | 生活

「根據社會地位的高低或個人價值的差異,來決定誰能過富裕舒適的生活、誰該活在貧窮與困苦之中,這種社會制度一點道理也沒有。」──《收入不平等》Richard Wilkinson, Kate Pickett

前一陣子不幸發生食物平台外送員在外送期間發生車禍的意外,再次讓大家注意外送員勞動權益的問題,今天我們不討論僱傭跟承攬之間的界線以及後續該怎麼處理;這篇文章想從「評價系統如何影響我們行為的層面」來跟大家討論:使用外送平台、Uber服務、Airbnb這類共享經濟平台的各方使用者如何被評價?而平台的評價機制會怎麼影響被評價者在不同環節中所做的決定,進而造成某些後果。 意識到這個評價系統對我們每個人的影響之後,就能夠知道如何改變或對抗評價系統,並降低意外發生的可能性。

根據台灣地區外送員在部落格的分享[7],每週跑單5到6天,在沒有促銷活動的情況下,一個月大概18K左右,而外送平台的對外送員的獎勵機制會受訂單的每週接案率、訂單取消率、運送服務範圍、顧客評價、單位時間內達到的運送趟數、尖峰與離峰時間的訂單量而影響[3,4,5,6]

在這樣的評價系統底下,背後的目的是為了要求外送員做到:「把餐點在最快的時間內、以最好的餐點狀態以及好的服務態度送到客戶手上。」這時候身為要賺生活費的外送員,為了達到能讓自己獲利的趟數目標,很合理的行為就是:騎車要「有效率」。要怎麼有效率?就是多工,騎車的時候需要分配注意力在找最近的路線、密切注意餐點狀況、送達的時間、訂單狀況、如何安排自己的路線以及送單的優先順序,同時又要注意交通狀況。在這樣緊湊又高壓的情況下,很難避免意外發生。

foodpanda
在評價系統的壓力下,高效服務是大家競相追逐的重點,很難避免意外發生。
圖/ shutterstock

看出「評價系統」對我們行為的影響了嗎?

當我們所賺的錢是取決於我們「多有效率」完成任務,我們就會想辦法讓自己盡可能地快。在外送的情境下可能的後果就是交通意外;在工廠、辦公室裡過度追求單位時間內產量的這個評量指標,帶來影響的就是加班過勞;在學術圈裡過度追求發表量的評量指標,所產生的影響就是不健康的師徒制,以教學之名行壓榨之實。

共享經濟服務帶來的好處是讓閒置資源得以有效率運用,但盈利企業為了確保服務品質所設計的評價機制,對不同環節使用者潛藏著什麼風險? 接下來我想透過共享經濟平台(Uber, Uber Eats, Airbnb, Foodpanda等)的設計,帶大家來看評價系統對人類行為的影響,接著一起思考我們可以如何改變。

當演算法開始介入我們被評價的方式

一個負評就有可能丟了工作

客戶評分是所有共享經濟平台上會用來評價服務提供者常用的指標,在Airbnb上,房客可以為房東評分、Uber乘客可以為司機評分、在食物外送平台上,餐廳跟點餐的客戶可以為外送員評分。

評價別人很容易,但是我們在評價別人之前,有沒有想過我們給的分數對眼前這個人會有多大的影響?

在美國的Uber與Lyft(另一家載客服務)司機就曾經因為評價系統而吃虧,太多乘客們對於分數的認定跟平台系統評斷司機優劣的方式不完全相同,乘客給予4分很有可能就會讓他們失去後續接單的機會,因為「只」得到4分的司機在演算法的排序下很有可能完全接不到單,有司機向媒體分享,如果他分數在4.6分以下,那他真的得擔心自己未來要怎麼辦[4]。

shutterstock_220587022_driver
乘客對分數的認定跟平台系統評斷司機優劣的方式不完全相同,乘客給予4分,很有可能就會讓他們失去後續的接單機會。
圖/ stefanolunardi via shutterstock

由於司機們覺得乘客在評分的時候,根本沒有意識到他們輕易給的一個分數會對司機的職涯有重大影響,於是司機們索性就在椅背上貼著一張紙,向乘客說明他們給的分數在評價系統代表的意義:

  • 5分 = 這趟旅程很棒、還算可以,在路途中司機可能沒有注意到一些社交線索或是說了冷笑話,但至少他載我到我的目的地。
  • 4分 = 這個司機很差勁,慢慢的開除他吧。(4分並不表示這趟旅程是普通或是平均程度,當得到太多4分的時候,我的下場就是流落街頭。)
  • 3分 = 這個司機差勁到極點,我這輩子都不要再見到他。(3分完全不等於「普通」。)

這個問題也不是在美國才有,前一陣子筆者訪談台灣Uber司機,也有司機提到他必須很努力讓分數維持在4.9分以上,否則搶不到單;除此之外,今年也有Uber Eats的外送員表示如果他接收到一個負評,就需要靠多接很多訂單才能洗白,評分如果掉到90分以下也會被警告[3]。

當演算法介入評價系統,如果沒有讓所有利益關係人(司機與乘客)都知道背後運作的機制,帶來的不只是司機工作權益的問題,這些心理壓力連帶也會影響司機與乘客之間的關係。像是司機以為乘客帶有惡意在評價自己,對乘客有過高的警戒心等等。

對陌生的演算法感到焦慮

另一方面,讓人捉摸不定的評價系統也會對使用者帶來焦慮。這裡以Airbnb的例子來說明。

Airbnb也是實現共享經濟的一個提供住房服務的平台,他們的研究員為了了解自己公司設計的演算法對於屋主的影響,在2017年訪談了15位使用他們平台提供住房服務的屋主[1],發現房東們需要經常煩惱兩件事情,一個是如何吸引顧客,另一個是如何符合Airbnb演算法的期待。

airbnb
Airbnb房東們為了要吸引顧客以及符合演算法的期待,想盡各種辦法來讓自己的房間被放在選單最上面。
圖/ Airbnb

屋主們經常擔心自己做了什麼事、或沒做什麼事會被平台背後的演算法判定是「不好的」,進而影響自己的獲利。舉例來說,在Airbnb上面,旅客可以依序瀏覽符合搜尋條件的住處,但是誰的房子會先被看到是怎麼決定的呢?由於屋主們不清楚演算法根據什麼來讓自己的房間被放在選單最上面,於是他們就定期更新房屋的照片、儘可能快速的回覆房客提問、或甚至是把房屋內各種設施都寫在標題,嘗試影響演算法排序的結果,想辦法在他們可以調整的範圍內讓自己的房間被房客瀏覽到。

怎麼對抗不透明評價系統的方式?

面對這難懂的評價系統該怎麼辦?這個研究的另一個發現是屋主們會用一些方法來讓自己接受這個難以捉摸的評價系統,像是告訴自己演算法應該會是「公平的」,只要乖乖照著Airbnb的指示做,演算法就會讓他們更容易被房客搜尋到,舉例來說,只要把自己的客戶評價都維持得很好,他們就確信Airbnb的演算法會讓自己的房屋被放在搜尋頁面上。

此外,研究者也發現另一招屋主會使用的方式是自己當工程師實測看看,透過逆向工程的方式,和網站上其他房東提供的房子的比較、自己嘗試改變網頁上的資料、根據附近的房價彈性調整自己房屋的價錢,或是去網路上爬各種房東的分享文來看,用盡各種方式來推測系統評價他們的方式。

共享經濟的類似服務平台可以如何改善?

Airbnb對自家的服務做了深入的研究,透過這個研究,他們其實也發現了另一個難題:系統演算法到底應該設計得多透明?對於公司利益來說,保持演算法有一定程度的模糊地帶是為了避免房東鑽漏洞,但是設計得太難捉摸又會使得房東無所適從,因此,他們提出了幾個共享經濟的平台可以改善的方案:

  • 當房東嘗試在平台上做出會讓平台演算法判斷為「不好」的行為的時候,這時系統可以自動偵測並提醒他,幫助房東判斷哪些行為是對演算法的輸出有影響的,而哪些因素是演算法根本不會納入考量的。像是當房東延遲回覆太多次,背後的演算法就會把這個行為判斷為不好,這時候系統可以提醒房東,回覆速度的快慢會影響他的房間曝光度;但是如果房東經常更動標題,把不同關鍵字放在標題中,系統就可以提醒他做這些事可能大部分只是徒勞無功。

  • 這類型服務平台演算法在評價房東的時候,可以盡量只參考房東可以控制或改變的參數,像是他們的回覆態度、回覆頻率、顧客評價等,而盡量避開一些他們無法自己決定的因素,像是房子所處的地理位置或是擔任房東多久這些先天就決定好,也難以做出什麼改變的因素。

【補充】這裡的房東評價指的是房客會看到的分數,例如一個房東得7分(假使總分10分),不是因為納入了他的房子地理位置,而是因為他回覆太慢或態度不夠好這種他自己可以決定的因素,而不是一個他努力也改變不了的因素。如同我們平常在被評價一樣,不能因為我是「女生」或我是「亞洲人」就認為我是一個比誰好或比誰不好的人,因為性別跟種族不是我們能控制的。

  • 該怎麼在平台本身(Airbnb)、服務提供者(房東)、服務使用者(房客)三個利益關係人之間取得平衡?目前可能的一種解法就是平台透過一些設計來促進房東跟房客之間的關係,像是想辦法透過系統設計來讓房東更同理房客的需求,另一方面讓房客也看見房東的努力,藉由提升雙方關係來達到三贏的局面。

其實不只Uber、Airbnb,透過社群媒體行銷或是推出創作內容的人,也會面臨類似的焦慮,當YouTuber不知道YouTube是根據什麼機制來推薦自己生產的內容給觀眾時、藝術作品放在IG上不知道會被誰觸及、文章分享在FB或Medium上卻不了解平台背後演算法是如何影響觀眾觸及創作內容時,這些都會對內容或服務提供者帶來很多不可控制感以及焦慮。

辨識自己周圍的評價系統

一個適當的評價系統可以塑造出「好」的行為,就像Airbnb的優良房東機制就能鼓勵房東們帶給房客信任感以及良好的溝通,但是一個不適切的評價系統,就像是自己建立了一個不適當的牢籠來綑綁自己,引導人做出不適切的行為。

這篇文章並不是要傳達我們得完全摒除評價系統,畢竟有這些評價系統我們才有線索知道自己多會玩人生這場遊戲,這篇文章想讓大家意識到的是:

我們每個人所處的社會位置,其實都有不同的評價系統在影響我們的行為。

從小到大的我們的行為都被各種不同的評價系統所形塑著,大學招生的時候會評量一個學生主科好不好,所以我們就想盡辦法在這些會被評量的層面上花很多時間,然後壓縮自己做其他休閒的時間(想想你是不是也經歷過類似從小開始學鋼琴、舞蹈、畫畫但是升上國高中後因為要「專心讀書」就中斷);大學的時候如果出席分數占很多,我們就想辦法點名的時候一定要到;公司績效評鑑的時候要看我們業績多好,拉了多少客戶、提出多少可執行的企劃案,我們就用各種不同的方式達到帳面上可以交代的數字;學校計畫需要成果展示,當初規劃的經費有沒有用完是評量計畫成果的指標,我們就在計畫截止前趕快把錢花完;不勝枚舉。

許多時候衝突與傷害就來自於我們跟合作夥伴在不同的評價系統標準下互動,當兩個站在不同位置的人需要合作或互動的時候,他們各自所處的評價系統就會影響他們決定做什麼事、以及決定怎麼做的優先順序。

shutterstock_1475972507_chess
當兩個站在不同位置的人需要合作或互動,他們各自所處的評價系統就會影響他們決定做什麼事、以及決定怎麼做的優先順序。
圖/ ic36006 via shutterstock

舉例來說,當某些教授被評價的方式是研究發表量,而某些研究生被評價的方式是就業能力時,兩個不同的評價系統就會造成兩方目標不一致,然後形成衝突,一方覺得做研究比較重要,另一覺得找工作重要;在工作場合,設計師部門被評價的方式可能是讓使用者有好的體驗,但假使工程部門被評價的方式是有效率的做完手邊的案子,兩方合作就會因為目標不一致導致溝通受阻;產業界被評價的方式是銷售量、可執行性,學術界被評價的方式是研究的創新與前瞻性,來自兩個不同評價系統中的人一旦需要對話,就容易因為沒看到各自其實是在追求不同目標而互相看不起。

看清自己處在什麼評價系統之中

談了這麼多並不是要得到一個「人生好難」的結論,而是希望大家在看完之後,去想想現在自己的社會角色(學生、員工、伴侶、晚輩、管理者、領導人等)是受什麼評價系統影響、這個評價系統衡量的價值是跟你在意的價值一致嗎?一致的話,恭喜你!你能在這個角色上盡情發揮、如魚得水;但如果發現目前的評價系統不適合自己的話,可以想想這個評價系統評量你的方式真能夠衡量到某個價值嗎(創作品質、教學品質、設計品質、產量等等)?不適合的話,要不要考慮換到一個評價系統適合自己的地方?或是思考能如何改變這個評價系統?

記住,評價系統是人類自己建立的(人類需要仰賴評價系統來確認自己的價值跟位置),這個系統的存廢與內涵也只有我們自己能改變。

參考資料:
1. Jhaver, S., Karpfen, Y., & Antin, J. (2018, April). Algorithmic anxiety and coping strategies of Airbnb hosts. In Proceedings of the 2018 CHI Conference on Human Factors in Computing Systems (p. 421). ACM.
2. Lee, M. K., Kusbit, D., Metsky, E., & Dabbish, L. (2015, April). Working with machines: The impact of algorithmic and data-driven management on human workers. In Proceedings of the 33rd Annual ACM Conference on Human Factors in Computing Systems (pp. 1603–1612). ACM.
3. 自由時報 (2019, July 24). 易遭惡意洗負評? Uber Eats評分機制引外送員不滿 — 生活 — 自由時報電子報.
4. O’Donovan, C. (2017, April 11). Nobody Knows What Five Star Ratings Mean. That’s Bad For Gig Workers.
5. 【心得】台中UBEREATS外送員心得.
6. Uber機車UberEATS 台北獎勵方案(含最新嘉義雲林宜蘭花蓮) @Uber司機安安(10/14已更新) @ Uber司機安安租賃靠行包車旅遊一條龍服務 :: 痞客邦 ::
7. Uber Eats桃園-市場分析,到底適不適合全職做呢?(2019/07/01更新) @ 大小人 :: 痞客邦 ::
8. Uber Eats桃園-當日達標獎勵與新人推薦獎勵的迷思(2019/07/01更新) @ 大小人 :: 痞客邦 ::
9. 王郁倫 (2019, October 15). 5萬外送員是雇傭還承攬?Uber Eats、foodpanda現身說:讓我們有下一個七年!|數位時代.

責任編輯:陳建鈞

《數位時代》長期徵稿,針對時事科技議題,需要您的獨特觀點,歡迎各類專業人士來稿一起交流。投稿請寄edit@bnext.com.tw,文長至少800字,請附上個人100字內簡介,文章若採用將經編輯潤飾,如需改標會與您討論。

(觀點文章呈現多元意見,不代表《數位時代》的立場。)

往下滑看下一篇文章
從模型競爭走向算力經濟,INFINITIX 助客戶打造軟體定義 AI 基礎建設
從模型競爭走向算力經濟,INFINITIX 助客戶打造軟體定義 AI 基礎建設

過去兩年,人工智慧技術以史無前例的速度翻轉企業營運與競爭態勢,從客服、知識管理到軟體開發,越來越多企業將大型語言模型(LLM)導入企業營運流程,隨著應用程度的深化與廣化,越來越多發現,真正的挑戰早已不只是「選擇哪個模型」,而是如何管理算力、控制成本、確保資料安全,以及讓不同世代GPU、模型與AI應用可以持續共存與調度。

代理式AI崛起後,AI應用從回答問題進展為執行任務、操作系統以及串接流程,連帶拉升對AI基礎設施的需求與架構複雜度,而這意味著,想要發揮AI綜效,光只有模型與技術尚不夠,必須將整體IT環境逐步升級為AI基礎建設(AI Infra)。

深耕AI管理領域多年的數位無限(INFINITIX),近年積極布局軟體定應AI基礎建設(Software Defined AI Infrastructure)市場,除持續深化與GPU、伺服器與AI硬體生態系的合作關係,如於2021年取得NVIDIA Solution Advisor全球夥伴資格,2025年亦獲AMD GPU生態建設夥伴獎,也因應市場需求推出AI-Stack與ixCSP兩大產品線,協助企業、雲端服務供應商(CSP)與新世代AI雲端業者,更有效率地管理跨世代AI算力資源。

數位無限執行長陳文裕表示:「我們的目標是協助客戶打造軟體定義AI基礎架構,讓其可以視需求向下整合不同世代GPU、儲存與網路設備,同時,向上鏈結模型、Token跟AI應用,加速企業的AI創新轉型腳步。」

數位無限執行長陳文裕.JPG
數位無限執行長陳文裕
圖/ 數位時代

從AI模型到AI經濟,企業競爭焦點轉向算力與Token調度能力

過去市場談AI,焦點多半放在模型參數、推論效能與模型能力,但在大型語言模型推論需求暴增的現下,AI Infra早已從單純GPU採購演變成涵蓋機櫃、網路、儲存、散熱與電力的整體工程;企業真正需要的,不是更多GPU、而是如何更有效率地調度與利用算力。

尤其在NVIDIA提出Token Factory概念後,全球AI產業正逐步從模型競賽轉向「AI經濟」,亦即,影響企業AI決策的再也不是使用哪個模型、部署多少GPU,而是消耗多少Token、產生多少AI服務,以及算力是否能被有效共享與調度。

換言之,在AI新世界,算力調度能力的重要水漲船高。對此,陳文裕十分認同的說:「企業想要提升AI競爭力,不僅要掌握模型與應用,還必須進一步思考如何有效切割GPU資源、讓不同部門甚至集團子公司共享算力、延長舊世代GPU的使用壽命,甚至是如何將閒置算力轉變成可交易的資源等。」

事實上,這也是大量AI資料中心(AIDC)跟新世代AI雲端服務(Neo Cloud)業者出現的原因,包括CoreWeave、Nebius、Lambda Labs、GMI Cloud等業者皆試圖以更具彈性的方式,提供企業所需的GPU服務與AI算力平台。

看準這波趨勢,數位無限除透過AI-Stack提供GPU切片、模型部署、模型管理與MLOps等服務,協助客戶提升GPU使用率,更進一步推出ixCSP平台,讓雲端服務供應商與新世代AI雲端業者,能從過去單純販售GPU資源轉型為提供GPU as a Service、Token as a Service與Model as a Service等創新AI服務。

以Software Defined AI Infrastructure助企業以「通用化、鬆耦合」迎戰瞬變AI世代

因應AI新世代帶來的挑戰:模型快速升級、算力需求攀升、GPU世代交替迅速,企業在追逐AI落地的同時,勢必得面臨基礎建設更新速度過快、硬體投資壓力升高,以及資源利用效率難以最佳化等挑戰。

為協助企業在AI快速演進與基礎建設投資之間取得平衡,數位無限的作法是,透過AI-Stack將底層硬體抽象化,以Token或模型服務形式提供,讓企業客戶、AIDC與Neo Cloud業者可以延長不同世代與不同品牌的AI硬體設備的生命週期、創造更高的使用價值、甚至是展開更多元的營收模式。

例如,高雄醫學大學附設中和紀念醫院便透過數位無限的AI-Stack解決GPU資源調度效率不彰問題,加速39項AI模型進入臨床應用階段,成功建立起「從模型開發到臨床落地」的完整生態系統。而日本精密製造大廠–Union Tool Co.–則是透過AI-Stack簡化GPU資源共享、加速AI模型的開發與測試腳步,為提升生產效率做最佳準備。

「如果大型企業或AIDC業者擁有閒置資源,也可以透過ixCSP平台,把算力共享或調度給集團內部團隊、子公司,甚至上下游合作夥伴使用,進一步提升整體資源利用率。」數位無限執行長陳文裕如是說道。

隨著AI從工具演變成企業核心基礎建設,企業真正需要的,也不再只是單一模型,而是一套能持續適應AI快速演進的AI Infra,而這與數位無限近年來的重要轉型方向一致:從AI管理軟體提供者轉型為軟體定義AI基礎建設供應商,更好協助客戶打造具備「通用化」與「鬆耦合」特性的AI基礎建設。

除以AI-Stack與ixCSP協助客戶提升算力使用效率與價值,數位無限亦計畫與硬體合作夥伴推出Agentic AI一體機方案,協助企業快速建立可驗證、可部署、可切割、可共享的AI運算環境,降低企業從PoC走向實際導入的門檻,加速AI落地。

總的來說,隨著AI競爭從模型能力延伸到算力治理,企業比拚的不僅是導入速度,而是能否建立一套足夠彈性、可持續演進的AI Infra,而這與數位無限的發展目標一致,將持續不斷優化產品服務,化身企業搶進AI新世代的關鍵合作夥伴。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
代理式商務連動百兆商機
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓