ChatGPT背後「血汗工廠」:時薪40、每小時標註2萬單詞,數據標註員有多慘?
ChatGPT背後「血汗工廠」:時薪40、每小時標註2萬單詞,數據標註員有多慘?
2023.02.13 | AI與大數據

ChatGPT被譽為當年最具創新性的人工智慧工具之一。這項強大的AI聊天機器人幾乎可以生成任何問題的文本,從莎士比亞的十四行詩,到用5歲孩子都能理解語言描述的複雜數學問題,可謂「無所不能」。

瑞銀此前發布的一份研究報告顯示,ChatGPT的月活躍用戶在今年1月份預計達到了1億,這距離其推出只有2個月時間,成為史上增長最快的消費者應用。

然而,在ChatGPT掀起的這場人工智慧「革命」和資本市場狂歡的背後,有一個被邊緣化的、被遺忘的卻又至關重要的群體,值得所有人關注,他們就是 數據標註員

為了訓練ChatGPT,大量數據標註員時薪不到2美元

據美國《時代周刊》上月中旬的報導,為了訓練ChatGPT,OpenAI僱傭了時薪不到2美元的肯尼亞外包勞工,他們所負責的工作就是對龐大的數據庫手動進行數據標註。

從當下看來,OpenAI已經成為「生成式人工智慧」行業無可爭議的領頭羊。

最樂觀的投資者認為,計算機生成的文本、圖像、視頻和音頻將改變無數行業的經營方式,從創意藝術到法律,再到計算機編程,該技術都將提高人類的工作效率。

然而,數據標籤員工的工作條件揭示了行業背後「黑暗」的部分: 儘管人工智慧魅力無限,但它往往依賴於全球最廉價的勞動力,他們往往被大幅剝削。儘管他們為數十億美元的產業作出了傑出貢獻,但這些幾乎「隱形」的工人仍然處於最邊緣的地帶

時薪1.32~2美元,每小時或標註超2萬個單詞

《時代周刊》查閱的文件顯示,OpenAI在2021年底與Sama簽署了三份總價值約20萬美元的合約,為數據庫中有害的內容進行標記。

Sama是一家總部位於美國舊金山的公司,該公司僱傭了肯尼亞、烏干達和印度的外包員工。

大約30多名工作人員被分成三個小組,每個小組都專注於一個主題。三名員工對《時代周刊》表示,他們每9個小時要閱讀和標註150~200段文字。這些段落的範圍從100個單詞到1000多個單詞不等。如此計算,平均每小時他們最多要閱讀和標註超2萬個單詞。

接受《時代周刊》採訪的四名員工都表示,這份工作給他們留下了持久的心理創傷。儘管他們有權參加健康諮詢師課程,但四人都表示,由於對工作效率的要求很高,他們只能選擇參加小組會議。其中還有一人表示,他們要求以一對一的方式與心理諮詢師會面的請求,被Sama管理層多次拒絕。

Sama官網截圖
在ChatGPT掀起的人工智慧「革命」和資本市場狂歡的背後,有一個被邊緣化的、被遺忘的卻又至關重要的群體,他們是數據標註員。
圖/ Sama官網截圖

合約規定,OpenAI將為該項目向Sama支付每小時12.50美元的報酬,這是該項目員工時薪的6~9倍。

《時代周刊》稱,其查閱了數百頁Sama和OpenAI的內部文件(包括工人工資單),並採訪了Sama四名參與該項目的員工,驚人的內幕顯示, Sama為OpenAI僱傭的數據標籤員工支付的時薪在1.32美元~2美元之間(約新台幣39.9元~60.5元),具體取決於資歷和表現

據Sama員工透露,「代理商」是三個小組中最初級的數據標籤人員,他們的基本工資為每月2.1万肯尼亞先令(約170美元、新台幣5,140元)。此外,他們每月還能獲得約70美元的獎金,如果達到準確性和速度等關鍵績效指標,他們還可以獲得佣金。

按此計算,一名每天工作9小時的員工預計稅後時薪至少能拿1.32美元,如果超額完成所有目標,則最高可達到1.44美元(約新台幣43.5元)。質量分析師是資歷更深的數據標籤員工,他們的工作是檢查「代理商」的工作,如果他們達到了所有績效目標,時薪可以拿到2美元。

公開資料顯示,肯尼亞並沒有統一的最低工資標準,但當這些外包員工受僱時,肯尼亞首都內羅畢的最低時薪是1.52美元。

生成式AI煉成的背後:血汗工廠違法嗎?

據《時代周刊》報導,Sama的一名發言人在一份聲明中稱,公司對工人的要求是在9小時的工作中標註70段文字,而非200段。此外,工人們的稅後時薪是1.46美元~3.74美元,不過這位發言人拒絕透露哪類崗位會達到其所述時薪區間的上限。

OpenAI的一位發言人則在另一份聲明中稱,該公司沒有發布任何的業績目標,且外包員工的工資和心理健康由Sama的管理層負責。

2022年2月,Sama開始為OpenAI的另一個項目進行試點工作,但工作內容根據美國的法律是非法的。儘管這項試點工作似乎與ChatGPT無關,但僅僅在幾週之內,Sama便叫停了與OpenAI的所有項目,比合同中約定的時間提前了8個月。

Sama當時在一份聲明中稱,其為OpenAI收集的圖像協議中不包括任何涉及非法的內容,直到相關工作開始後,OpenAI才發來「附加指示」,提到了「一些非法的類別」,隨後肯尼亞團隊的高管立即提出了擔憂並結束了該項目。

Sama曾向多家矽谷大廠提供類似服務,自稱是「有道德的AI公司」

訓練ChatGPT對OpenAI來說至關重要。

ChatGPT的前身GPT-3已經展示了非常強大的語句串聯的能力。然而,當時的GPT-3卻存在很多弊端,例如內容容易出現暴力、性別歧視等言論。之所以會出現這樣的不足之處,是因為AI工具從互聯網抓取了數千億個單詞來訓練,這也是一把雙刃劍——由於互聯網的詞彙有不少帶有偏見及負面的詞彙,因此單純憑藉學習能力無法來清除這些訓練數據。

《時代周刊》的報導顯示,即使是一個由數百人組成的團體,也需要幾十年的時間才能手動搜索龐大的數據庫。OpenAI只能透過建立一個額外的、AI驅動的安全機制,才能控制上述弊端,創造出適合人們日常使用的聊天機器人。

《時代周刊》報導截圖
《時代周刊》查閱了數百頁Sama和OpenAI的內部文件,並採訪了Sama四名參與該項目的員工,內幕顯示, Sama為OpenAI僱傭的數據標籤員工支付的時薪在1.32美元~2美元之間,具體取決於資歷和表現。
圖/ 《時代周刊》報導截圖

據報導,為了建立這個安全系統,OpenAI借鑒了Facebook(現Meta)等社交媒體公司的做法。此前,Facebook已經證明其可以構建能夠檢測仇恨言論等的AI工具,並將這些內容從其平台上移除。這項工作也很簡單:給AI提供標有暴力、仇恨語言等標籤,AI工具就可以學會檢測這些內容。目前類似的工具已經內置到ChatGPT當中,以檢測它是否與訓練數據的內容相呼應,並在它觸及到用戶之前將不良內容過濾掉。

《時代周刊》報導稱,為了獲得這些有害內容的標籤,OpenAI從2021年11月開始便向一家外包公司發送了數萬條文本片段。其中大部分文字似乎都是從互聯網「最黑暗的角落」挖掘出來的。

據報導,OpenAI發言人曾在一份聲明中證實,Sama在肯尼亞的員工為該公司正在開發的監測有害內容的工具作出了貢獻,該工具最終被內建到ChatGPT中。

除了OpenAI,Sama還為谷歌、Mate和微軟等矽谷科技巨頭標註數據。此外,Sama還標榜其是一家「有道德的人工智能公司」,並稱其已經幫助5萬多人脫貧。

人工智慧組織聯盟Partnership on AI表示,「儘管這些豐富數據的專業人士發揮了基礎作用,但越來越多的研究表明,這些工人都面臨著不穩定的工作條件。這可能是慶祝技術效率提升的同時,試圖掩蓋人工智慧對龐大勞動力依賴的結果。」

本文授權轉載自:36kr

責任編輯:傅珮晴、林美欣

關鍵字: #AI #Chatbot
往下滑看下一篇文章
從智慧助手到自主代理:博弘雲端如何帶領企業走上 AI 實踐之路
從智慧助手到自主代理:博弘雲端如何帶領企業走上 AI 實踐之路

「代理式 AI 」(Agentic AI)的創新服務正在重新塑造企業對AI的想像:成為內部實際運行的數位員工,提升關鍵工作流程的效率。代理式AI的技術應用清楚指向一個核心趨勢:2025 年是 AI 邁向「代理式 AI」的起點,讓 AI 擁有決策自主權的技術轉型關鍵,2026 年這股浪潮將持續擴大並邁向規模化部署。

面對這股 AI Agent 浪潮,企業如何加速落地成為關鍵,博弘雲端以雲端與數據整合實力,結合零售、金融等產業經驗,提出 AI 系統整合商定位,協助企業從規劃、導入到維運,降低試錯風險,成為企業佈局 AI 的關鍵夥伴。

避開 AI 轉型冤枉路,企業該如何走對第一步?

博弘雲端事業中心副總經理陳亭竹指出,AI 已經從過去被動回答問題、生成內容的智慧助手,正式進化為具備自主執行能力、可跨系統協作的數位員工,應用場景也從單一任務延伸至多代理協作(Multi-Agent)模式。

「儘管 AI 前景看好,但這條導入之路並非一帆風順。」博弘雲端技術維運中心副總經理暨技術長宋青雲綜合多份市場調查報告指出,到了 2028 年,高達 70% 的重複性工作將被 AI 取代,但同時也有約 40% 的生成式 AI 專案面臨失敗風險;關鍵原因在於,企業常常低估了導入 GenAI 的整體難度——挑戰不僅來自 AI 相關技術的快速更迭,更涉及流程變革與人員適應。

2-RD096270.jpg
博弘雲端事業中心副總經理陳亭竹指出,AI 已經從過去被動回答問題的智慧助手,正式進化為具備自主執行能力、可跨系統協作的數位員工。面對這樣的轉變,企業唯有採取「小步快跑、持續驗證」的方式,才能在控制風險的同時加速 AI 落地。
圖/ 數位時代

正因如此,企業在導入 AI 時,其實需要外部專業夥伴的協助,而博弘雲端不僅擁有導入 AI 應用所需的完整技術能力,涵蓋數據、雲端、應用開發、資安防禦與維運,可以一站式滿足企業需求,更能使企業在 AI 轉型過程中少走冤枉路。

宋青雲表示,許多企業在導入 AI 時,往往因過度期待、認知落差或流程改造不全,導致專案停留在測試階段,難以真正落地。這正是博弘雲端存在的關鍵價值——協助企業釐清方向,避免踏上產業內早已被證實「不可行」的方法或技術路徑,縮短從概念驗證到正式上線的過程,讓 AI 真正成為可被信賴、可持續運作的企業戰力。

轉換率提升 50% 的關鍵:HAPPY GO 的 AI 落地實戰路徑

博弘雲端這套導入方法論,並非紙上談兵,而是已在多個實際場域中驗證成效;鼎鼎聯合行銷的 HAPPY GO 會員平台的 AI 轉型歷程,正是其最具代表性的案例之一。陳亭竹說明,HAPPY GO 過去曾面臨AI 落地應用的考驗:會員資料散落在不同部門與系統中,無法整合成完整的會員輪廓,亦難以對會員進行精準貼標與分眾行銷。

為此,博弘雲端先協助 HAPPY GO 進行會員資料的邏輯化與規格化,完成建置數據中台後,再依業務情境評估適合的 AI 模型,並且減少人工貼標的時間,逐步發展精準行銷、零售 MLOps(Machine Learning Operations,模型開發與維運管理)平台等 AI 應用。在穩固的數據基礎下,AI 應用成效也開始一一浮現:首先是 AI 市場調查應用,讓資料彙整與分析效率提升約 80%;透過 AI 個性化推薦機制,廣告點擊轉換率提升 50%。

3-RD096215.jpg
左、右為博弘雲端事業中心副總經理陳亭竹及技術維運中心副總經理暨技術長宋青雲。宋青雲分享企業導入案例,許多企業往往因過度期待、認知落差或流程改造不全,導致專案停留在測試階段,難以真正落地。這正是博弘雲端存在的關鍵價值——協助企業釐清方向,避免踏上產業內早已被證實「不可行」的方法或技術路徑,縮短從概念驗證到正式上線的過程,讓 AI 真正成為可被信賴、可持續運作的企業戰力。
圖/ 數位時代

整合 Databricks 與雲端服務,打造彈性高效的數據平台

在協助鼎鼎聯合行銷與其他客戶的實務經驗中,博弘雲端發現,底層數據架構是真正影響 AI 落地速度的關鍵之一,因與 Databricks 合作協助企業打造更具彈性與擴充性的數據平台,作為 AI 長期發展的基礎。

Databricks 以分散式資料處理框架(Apache Spark)為核心,能同時整合結構化與非結構化資料,並支援分散式資料處理、機器學習與進階分析等多元工作負載,讓企業免於在多個平台間反覆搬移資料,省下大量重複開發與系統整合的時間,從而加速 AI 應用從概念驗證、使用者驗收測試(UAT),一路推進到正式上線(Production)的過程,還能確保資料治理策略的一致性,有助於降低資料外洩與合規風險;此對於金融等高度重視資安與法規遵循的產業而言,更顯關鍵。

陳亭竹認為,Databricks 是企業在擴展 AI 應用時「進可攻、退可守」的重要選項。企業可將數據收納在雲端平台,當需要啟動新型 AI 或 Agent 專案時,再切換至 Databricks 進行開發與部署,待服務趨於穩定後,再轉回雲端平台,不僅兼顧開發效率與成本控管,也讓數據平台真正成為 AI 持續放大價值的關鍵基礎。

企業強化 AI 資安防禦的三個維度

隨著 AI 與 Agent 應用逐步深入企業核心流程,資訊安全與治理的重要性也隨之同步提升。對此,宋青雲提出建立完整 AI 資安防禦體系的 3 個維度。第一是資料治理層,企業在導入 AI 應用初期,就應做好資料分級與建立資料治理政策(Policy),明確定義高風險與隱私資料的使用邊界,並規範 AI Agent「能看什麼、說什麼、做什麼」,防止 AI 因執行錯誤而造成的資安風險。

第二是權限管理層,當 AI Agent 角色升級為數位員工時,企業也須比照人員管理方式為其設定明確的職務角色與權限範圍,包括可存取的資料類型與可執行的操作行為,防止因權限過大,讓 AI 成為新的資安破口。

第三為技術應用層,除了導入多重身份驗證、DLP 防制資料外洩、定期修補應用程式漏洞等既有資安防禦措施外,還需導入專為生成式 AI 設計的防禦機制,對 AI 的輸入指令與輸出內容進行雙向管控,降低指令注入攻擊(Prompt Injection)或惡意內容傳遞的風險。

4-RD096303.jpg
博弘雲端技術維運中心副總經理暨技術長宋青雲進一步說明「AI 應用下的資安考驗」,透過完善治理政策與角色權限,並設立專為生成式 AI 設計的防禦機制,降低 AI 安全隱私外洩的風險。
圖/ 數位時代

此外,博弘雲端也透過 MSSP 資安維運託管服務,從底層的 WAF、防火牆與入侵偵測,到針對 AI 模型特有弱點的持續掃描,提供 7×24 不間斷且即時的監控與防護。不僅能在系統出現漏洞時主動識別並修補漏洞,更可以即時監控活動,快速辨識潛在威脅。不僅如此,也能因應法規對 AI 可解釋性與可稽核性的要求,保留完整操作與決策紀錄,協助企業因應法規審查。

「AI Agent 已成為企業未來發展的必然方向,」陳亭竹強調,面對這樣的轉變,企業唯有採取「小步快跑、持續驗證」的方式,才能在控制風險的同時,加速 AI 落地。在這波變革浪潮中,博弘雲端不只是提供雲端服務技術的領航家,更是企業推動 AI 轉型的策略戰友。透過深厚的雲端與數據技術實力、跨產業的AI導入實務經驗,以及完善的資安維運託管服務,博弘雲端將持續協助企業把數據轉化為行動力,在 AI Agent 時代助企業實踐永續穩健的 AI 落地應用。

>>掌握AI 應用的新契機,立即聯繫博弘雲端專業顧問

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
2026 大重啟
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓