ChatGPT背後「血汗工廠」:時薪40、每小時標註2萬單詞,數據標註員有多慘?
ChatGPT背後「血汗工廠」:時薪40、每小時標註2萬單詞,數據標註員有多慘?
2023.02.13 | AI與大數據

ChatGPT被譽為當年最具創新性的人工智慧工具之一。這項強大的AI聊天機器人幾乎可以生成任何問題的文本,從莎士比亞的十四行詩,到用5歲孩子都能理解語言描述的複雜數學問題,可謂「無所不能」。

瑞銀此前發布的一份研究報告顯示,ChatGPT的月活躍用戶在今年1月份預計達到了1億,這距離其推出只有2個月時間,成為史上增長最快的消費者應用。

然而,在ChatGPT掀起的這場人工智慧「革命」和資本市場狂歡的背後,有一個被邊緣化的、被遺忘的卻又至關重要的群體,值得所有人關注,他們就是 數據標註員

為了訓練ChatGPT,大量數據標註員時薪不到2美元

據美國《時代周刊》上月中旬的報導,為了訓練ChatGPT,OpenAI僱傭了時薪不到2美元的肯尼亞外包勞工,他們所負責的工作就是對龐大的數據庫手動進行數據標註。

從當下看來,OpenAI已經成為「生成式人工智慧」行業無可爭議的領頭羊。

最樂觀的投資者認為,計算機生成的文本、圖像、視頻和音頻將改變無數行業的經營方式,從創意藝術到法律,再到計算機編程,該技術都將提高人類的工作效率。

然而,數據標籤員工的工作條件揭示了行業背後「黑暗」的部分: 儘管人工智慧魅力無限,但它往往依賴於全球最廉價的勞動力,他們往往被大幅剝削。儘管他們為數十億美元的產業作出了傑出貢獻,但這些幾乎「隱形」的工人仍然處於最邊緣的地帶

時薪1.32~2美元,每小時或標註超2萬個單詞

《時代周刊》查閱的文件顯示,OpenAI在2021年底與Sama簽署了三份總價值約20萬美元的合約,為數據庫中有害的內容進行標記。

Sama是一家總部位於美國舊金山的公司,該公司僱傭了肯尼亞、烏干達和印度的外包員工。

大約30多名工作人員被分成三個小組,每個小組都專注於一個主題。三名員工對《時代周刊》表示,他們每9個小時要閱讀和標註150~200段文字。這些段落的範圍從100個單詞到1000多個單詞不等。如此計算,平均每小時他們最多要閱讀和標註超2萬個單詞。

接受《時代周刊》採訪的四名員工都表示,這份工作給他們留下了持久的心理創傷。儘管他們有權參加健康諮詢師課程,但四人都表示,由於對工作效率的要求很高,他們只能選擇參加小組會議。其中還有一人表示,他們要求以一對一的方式與心理諮詢師會面的請求,被Sama管理層多次拒絕。

Sama官網截圖
在ChatGPT掀起的人工智慧「革命」和資本市場狂歡的背後,有一個被邊緣化的、被遺忘的卻又至關重要的群體,他們是數據標註員。
圖/ Sama官網截圖

合約規定,OpenAI將為該項目向Sama支付每小時12.50美元的報酬,這是該項目員工時薪的6~9倍。

《時代周刊》稱,其查閱了數百頁Sama和OpenAI的內部文件(包括工人工資單),並採訪了Sama四名參與該項目的員工,驚人的內幕顯示, Sama為OpenAI僱傭的數據標籤員工支付的時薪在1.32美元~2美元之間(約新台幣39.9元~60.5元),具體取決於資歷和表現

據Sama員工透露,「代理商」是三個小組中最初級的數據標籤人員,他們的基本工資為每月2.1万肯尼亞先令(約170美元、新台幣5,140元)。此外,他們每月還能獲得約70美元的獎金,如果達到準確性和速度等關鍵績效指標,他們還可以獲得佣金。

按此計算,一名每天工作9小時的員工預計稅後時薪至少能拿1.32美元,如果超額完成所有目標,則最高可達到1.44美元(約新台幣43.5元)。質量分析師是資歷更深的數據標籤員工,他們的工作是檢查「代理商」的工作,如果他們達到了所有績效目標,時薪可以拿到2美元。

公開資料顯示,肯尼亞並沒有統一的最低工資標準,但當這些外包員工受僱時,肯尼亞首都內羅畢的最低時薪是1.52美元。

生成式AI煉成的背後:血汗工廠違法嗎?

據《時代周刊》報導,Sama的一名發言人在一份聲明中稱,公司對工人的要求是在9小時的工作中標註70段文字,而非200段。此外,工人們的稅後時薪是1.46美元~3.74美元,不過這位發言人拒絕透露哪類崗位會達到其所述時薪區間的上限。

OpenAI的一位發言人則在另一份聲明中稱,該公司沒有發布任何的業績目標,且外包員工的工資和心理健康由Sama的管理層負責。

2022年2月,Sama開始為OpenAI的另一個項目進行試點工作,但工作內容根據美國的法律是非法的。儘管這項試點工作似乎與ChatGPT無關,但僅僅在幾週之內,Sama便叫停了與OpenAI的所有項目,比合同中約定的時間提前了8個月。

Sama當時在一份聲明中稱,其為OpenAI收集的圖像協議中不包括任何涉及非法的內容,直到相關工作開始後,OpenAI才發來「附加指示」,提到了「一些非法的類別」,隨後肯尼亞團隊的高管立即提出了擔憂並結束了該項目。

Sama曾向多家矽谷大廠提供類似服務,自稱是「有道德的AI公司」

訓練ChatGPT對OpenAI來說至關重要。

ChatGPT的前身GPT-3已經展示了非常強大的語句串聯的能力。然而,當時的GPT-3卻存在很多弊端,例如內容容易出現暴力、性別歧視等言論。之所以會出現這樣的不足之處,是因為AI工具從互聯網抓取了數千億個單詞來訓練,這也是一把雙刃劍——由於互聯網的詞彙有不少帶有偏見及負面的詞彙,因此單純憑藉學習能力無法來清除這些訓練數據。

《時代周刊》的報導顯示,即使是一個由數百人組成的團體,也需要幾十年的時間才能手動搜索龐大的數據庫。OpenAI只能透過建立一個額外的、AI驅動的安全機制,才能控制上述弊端,創造出適合人們日常使用的聊天機器人。

《時代周刊》報導截圖
《時代周刊》查閱了數百頁Sama和OpenAI的內部文件,並採訪了Sama四名參與該項目的員工,內幕顯示, Sama為OpenAI僱傭的數據標籤員工支付的時薪在1.32美元~2美元之間,具體取決於資歷和表現。
圖/ 《時代周刊》報導截圖

據報導,為了建立這個安全系統,OpenAI借鑒了Facebook(現Meta)等社交媒體公司的做法。此前,Facebook已經證明其可以構建能夠檢測仇恨言論等的AI工具,並將這些內容從其平台上移除。這項工作也很簡單:給AI提供標有暴力、仇恨語言等標籤,AI工具就可以學會檢測這些內容。目前類似的工具已經內置到ChatGPT當中,以檢測它是否與訓練數據的內容相呼應,並在它觸及到用戶之前將不良內容過濾掉。

《時代周刊》報導稱,為了獲得這些有害內容的標籤,OpenAI從2021年11月開始便向一家外包公司發送了數萬條文本片段。其中大部分文字似乎都是從互聯網「最黑暗的角落」挖掘出來的。

據報導,OpenAI發言人曾在一份聲明中證實,Sama在肯尼亞的員工為該公司正在開發的監測有害內容的工具作出了貢獻,該工具最終被內建到ChatGPT中。

除了OpenAI,Sama還為谷歌、Mate和微軟等矽谷科技巨頭標註數據。此外,Sama還標榜其是一家「有道德的人工智能公司」,並稱其已經幫助5萬多人脫貧。

人工智慧組織聯盟Partnership on AI表示,「儘管這些豐富數據的專業人士發揮了基礎作用,但越來越多的研究表明,這些工人都面臨著不穩定的工作條件。這可能是慶祝技術效率提升的同時,試圖掩蓋人工智慧對龐大勞動力依賴的結果。」

本文授權轉載自:36kr

責任編輯:傅珮晴、林美欣

關鍵字: #AI #Chatbot
往下滑看下一篇文章
多問一點,離健康更近一些!VITABOX® AI 健康配速員,陪你找回身體的聲音
多問一點,離健康更近一些!VITABOX® AI 健康配速員,陪你找回身體的聲音

健康知識普及,卻未讓選擇變得容易。琳瑯滿目的營養補充品與建議,加上網路上碎片化、標準不一的資訊,反而讓判斷成本提高,許多人因此在起步階段就裹足不前。

「很多人其實想掌握健康,卻在資訊洪流中忘了相信自己身體的感受。」VITABOX® 營養師溜溜觀察,當選擇焦慮與資訊混亂成為常態,人們反而忽略了最簡單的事——傾聽身體的聲音。VITABOX® 因此在 LINE 推出 「AI 健康配速員」,透過對話幫助消費者重新找回與身體的連結,從內在需求出發,打造簡單好上路的保健起點。

VITABOX® 「AI 健康配速員」,開啟健康對話第一步

「大眾常見的保健問題其實高度重複,但過去客服量能有限,我們常常得讓客戶等上兩三天才回覆。現在有了 AI,能即時解答基礎問題,營養師則可專注處理較複雜的個案。」溜溜說明,VITABOX®「AI 健康配速員」是一套全年無休的對話系統,平均每日處理超過 600 筆提問,其中約 90% 可由 AI 即時解決,僅有 10% 需轉由真人營養師接手。常見問題如「孕婦能吃哪些益生菌?」或「睡不好該補什麼?」等,AI 均能提供清楚、專業的建議。

若遇到較複雜或個人化程度高的問題,則可透過機器人自動回應+AI+營養師的分層機制,轉接給真人營養師進行後續諮詢,有效縮短等待回覆的時間,也提升整體使用體驗。「我們不是單純導入 AI,而是選擇用 AI 互動來實現我們相信的一種陪伴方式,讓對身體的好奇與理解,不必等待。」

VITABOX
VITABOX® 營養師溜溜表示,「我們希望 AI 不只是回答問題,而是陪伴每個人重新認識自己的身體需求。」
圖/ 數位時代

啟用方式也極為簡單,加入 VITABOX® 的 LINE 官方帳號即可一鍵啟動。系統會先詢問性別、年齡等基本資訊;若使用者無法清楚描述問題,AI 也能進一步拋出問題、比對歷史紀錄,或透過選擇題的方式,引導釐清隱性需求與個人目標。

「像是近期討論度較高的 NMN,不少人打成 NNN、MNM,所以我們也特別訓練 AI 的語意理解與錯字判讀能力,能親切引導確認:『請問你是想問 NMN 嗎?』即使輸入有誤,也能繼續獲得正確資訊,讓使用者感受到 AI 的理解與體貼。」溜溜指出,AI 的價值不只解答問題,還要能夠預判可能的模糊與錯誤,比使用者先想一步,做到主動理解、精準回應。

整合知識圖譜,打造 AI 與營養師的雙軌協作

這套 AI 系統由大型語言模型(LLM)驅動,結合 VITABOX® 多年累積的產品資料、CRM 數據、真實客服對話、營養學與醫學期刊,建構出可持續學習的健康知識圖譜。不同於傳統「問一答一」的機制,AI 採用語境分層邏輯,先從作息與飲食習慣切入,層層推進至保健建議,再進一步提供產品推薦,並不直接導向消費,反而強化使用者信任與參與感。

「我們不是在打造冷冰冰的機器人,而是塑造一個有溫度的健康夥伴。」溜溜強調,VITABOX® 延續 Make it Simple 的核心精神與一貫的品牌語調,講究準確,也講究陪伴與信任。

VITABOX
有了「AI 健康配速員」多問一點,營養師也能專注處理較複雜或個人化程度高的專案。
圖/ 數位時代

為強化資訊安全與建議品質,AI 系統由營養師與產品團隊共同把關,建置完整的風險識別與回應邊界。當提問涉及藥物、疾病診斷等超出 AI 處理範疇時,系統即自動提醒使用者就醫或真人諮詢,避免誤導。

為了讓整體設計貼近使用者,VITABOX® 將 AI 健康配速員直接整合在 LINE 平台上,無需額外下載 App 或開啟網站。「我們並不改變使用者的習慣,而是在他們最自在的地方,陪伴他們開始健康對話。」

「AI 健康配速員」於 2024 年九月正式上線,初期封測滿意度不到五成,經三個月優化調整後,2025 年第一季提升至 98.7%。溜溜分享:「我們收到很多令人印象深刻的用戶回饋,有顧客表示被『一秒就收到回覆』嚇到,覺得回覆既『精準』又『貼心』;也有顧客雖然猜到是機器人,卻仍感謝 AI 的『悉心回應』,甚至有人說:『你們的服務系統真的很好,跟真人營養師一樣厲害!』這些回饋顯示,AI 的回覆品質已能與真人營養師無縫銜接,讓顧客在體驗上幾乎沒有落差。」

最令人驚喜的,是品牌導入 AI 後,整體轉換率提升了 13%。「原本只是想減輕客服壓力、解決顧客的問題,沒想到竟然也助攻銷售轉換,真的是意料之外!」

愈簡單、愈不容易,VITABOX® 的選擇與堅持

AI 強大而即時,那還需要營養師嗎?溜溜給出的答案是肯定的。「AI 是輔助,不是替代。它能處理多數標準問題,但人與人之間的細膩互動與臨床判斷,是 AI 做不到的。」她舉例,曾有使用者一開始以為是退化性問題,後來經過營養師協助釐清生活與補充習慣後,才發現另有可能的影響因素。這類交叉比對與個別化觀察,仍需仰賴營養師的經驗和引導。

因此,VITABOX® 保留「一鍵切換真人諮詢」的設計,當問題超出 AI 範圍,系統會即時轉由專業營養師接手。AI 專注於初步引導與問題分流,營養師則投入更具判斷力與價值的個案管理與產品研究。

VITABOX® 也是目前業界少數以 AI 提供「專業智能健康輔助」的品牌,跳脫傳統 FAQ chatbot,真正落實「以人為本」的對話設計。「健康的選擇,就是多問一點。多問一點,就能往健康的理想更靠近一點。」溜溜笑說,有了 AI,就不用擔心麻煩別人,什麼問題都能安心提問。「當營養師不用再回答重複問題,就能更聚焦在專案開發、營養規劃、檢測優化等工作。」

這樣的設計思維,也與一直以來的品牌理念相呼應。不上通路、不靠代言的 VITABOX®,始終專注於天然成分(A.A. Clean Label 無添加)、加乘配方(VITASYNERGY®)、安全驗證(SGS、BSI)與永續包裝(FSC 紙材、環保油墨)。從產品研發到服務設計,一以貫之地實踐「Make it Simple」的初衷。如今,「AI 健康配速員」更讓「今天開始享受健康生活」成為每個人都能實踐的行動起點,把保健變簡單,也更容易開始。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
蘋果能再次偉大?
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓