ChatGPT背後「血汗工廠」:時薪40、每小時標註2萬單詞,數據標註員有多慘?
ChatGPT背後「血汗工廠」:時薪40、每小時標註2萬單詞,數據標註員有多慘?
2023.02.13 | AI與大數據

ChatGPT被譽為當年最具創新性的人工智慧工具之一。這項強大的AI聊天機器人幾乎可以生成任何問題的文本,從莎士比亞的十四行詩,到用5歲孩子都能理解語言描述的複雜數學問題,可謂「無所不能」。

瑞銀此前發布的一份研究報告顯示,ChatGPT的月活躍用戶在今年1月份預計達到了1億,這距離其推出只有2個月時間,成為史上增長最快的消費者應用。

然而,在ChatGPT掀起的這場人工智慧「革命」和資本市場狂歡的背後,有一個被邊緣化的、被遺忘的卻又至關重要的群體,值得所有人關注,他們就是 數據標註員

為了訓練ChatGPT,大量數據標註員時薪不到2美元

據美國《時代周刊》上月中旬的報導,為了訓練ChatGPT,OpenAI僱傭了時薪不到2美元的肯尼亞外包勞工,他們所負責的工作就是對龐大的數據庫手動進行數據標註。

從當下看來,OpenAI已經成為「生成式人工智慧」行業無可爭議的領頭羊。

最樂觀的投資者認為,計算機生成的文本、圖像、視頻和音頻將改變無數行業的經營方式,從創意藝術到法律,再到計算機編程,該技術都將提高人類的工作效率。

然而,數據標籤員工的工作條件揭示了行業背後「黑暗」的部分: 儘管人工智慧魅力無限,但它往往依賴於全球最廉價的勞動力,他們往往被大幅剝削。儘管他們為數十億美元的產業作出了傑出貢獻,但這些幾乎「隱形」的工人仍然處於最邊緣的地帶

時薪1.32~2美元,每小時或標註超2萬個單詞

《時代周刊》查閱的文件顯示,OpenAI在2021年底與Sama簽署了三份總價值約20萬美元的合約,為數據庫中有害的內容進行標記。

Sama是一家總部位於美國舊金山的公司,該公司僱傭了肯尼亞、烏干達和印度的外包員工。

大約30多名工作人員被分成三個小組,每個小組都專注於一個主題。三名員工對《時代周刊》表示,他們每9個小時要閱讀和標註150~200段文字。這些段落的範圍從100個單詞到1000多個單詞不等。如此計算,平均每小時他們最多要閱讀和標註超2萬個單詞。

接受《時代周刊》採訪的四名員工都表示,這份工作給他們留下了持久的心理創傷。儘管他們有權參加健康諮詢師課程,但四人都表示,由於對工作效率的要求很高,他們只能選擇參加小組會議。其中還有一人表示,他們要求以一對一的方式與心理諮詢師會面的請求,被Sama管理層多次拒絕。

Sama官網截圖
在ChatGPT掀起的人工智慧「革命」和資本市場狂歡的背後,有一個被邊緣化的、被遺忘的卻又至關重要的群體,他們是數據標註員。
圖/ Sama官網截圖

合約規定,OpenAI將為該項目向Sama支付每小時12.50美元的報酬,這是該項目員工時薪的6~9倍。

《時代周刊》稱,其查閱了數百頁Sama和OpenAI的內部文件(包括工人工資單),並採訪了Sama四名參與該項目的員工,驚人的內幕顯示, Sama為OpenAI僱傭的數據標籤員工支付的時薪在1.32美元~2美元之間(約新台幣39.9元~60.5元),具體取決於資歷和表現

據Sama員工透露,「代理商」是三個小組中最初級的數據標籤人員,他們的基本工資為每月2.1万肯尼亞先令(約170美元、新台幣5,140元)。此外,他們每月還能獲得約70美元的獎金,如果達到準確性和速度等關鍵績效指標,他們還可以獲得佣金。

按此計算,一名每天工作9小時的員工預計稅後時薪至少能拿1.32美元,如果超額完成所有目標,則最高可達到1.44美元(約新台幣43.5元)。質量分析師是資歷更深的數據標籤員工,他們的工作是檢查「代理商」的工作,如果他們達到了所有績效目標,時薪可以拿到2美元。

公開資料顯示,肯尼亞並沒有統一的最低工資標準,但當這些外包員工受僱時,肯尼亞首都內羅畢的最低時薪是1.52美元。

生成式AI煉成的背後:血汗工廠違法嗎?

據《時代周刊》報導,Sama的一名發言人在一份聲明中稱,公司對工人的要求是在9小時的工作中標註70段文字,而非200段。此外,工人們的稅後時薪是1.46美元~3.74美元,不過這位發言人拒絕透露哪類崗位會達到其所述時薪區間的上限。

OpenAI的一位發言人則在另一份聲明中稱,該公司沒有發布任何的業績目標,且外包員工的工資和心理健康由Sama的管理層負責。

2022年2月,Sama開始為OpenAI的另一個項目進行試點工作,但工作內容根據美國的法律是非法的。儘管這項試點工作似乎與ChatGPT無關,但僅僅在幾週之內,Sama便叫停了與OpenAI的所有項目,比合同中約定的時間提前了8個月。

Sama當時在一份聲明中稱,其為OpenAI收集的圖像協議中不包括任何涉及非法的內容,直到相關工作開始後,OpenAI才發來「附加指示」,提到了「一些非法的類別」,隨後肯尼亞團隊的高管立即提出了擔憂並結束了該項目。

Sama曾向多家矽谷大廠提供類似服務,自稱是「有道德的AI公司」

訓練ChatGPT對OpenAI來說至關重要。

ChatGPT的前身GPT-3已經展示了非常強大的語句串聯的能力。然而,當時的GPT-3卻存在很多弊端,例如內容容易出現暴力、性別歧視等言論。之所以會出現這樣的不足之處,是因為AI工具從互聯網抓取了數千億個單詞來訓練,這也是一把雙刃劍——由於互聯網的詞彙有不少帶有偏見及負面的詞彙,因此單純憑藉學習能力無法來清除這些訓練數據。

《時代周刊》的報導顯示,即使是一個由數百人組成的團體,也需要幾十年的時間才能手動搜索龐大的數據庫。OpenAI只能透過建立一個額外的、AI驅動的安全機制,才能控制上述弊端,創造出適合人們日常使用的聊天機器人。

《時代周刊》報導截圖
《時代周刊》查閱了數百頁Sama和OpenAI的內部文件,並採訪了Sama四名參與該項目的員工,內幕顯示, Sama為OpenAI僱傭的數據標籤員工支付的時薪在1.32美元~2美元之間,具體取決於資歷和表現。
圖/ 《時代周刊》報導截圖

據報導,為了建立這個安全系統,OpenAI借鑒了Facebook(現Meta)等社交媒體公司的做法。此前,Facebook已經證明其可以構建能夠檢測仇恨言論等的AI工具,並將這些內容從其平台上移除。這項工作也很簡單:給AI提供標有暴力、仇恨語言等標籤,AI工具就可以學會檢測這些內容。目前類似的工具已經內置到ChatGPT當中,以檢測它是否與訓練數據的內容相呼應,並在它觸及到用戶之前將不良內容過濾掉。

《時代周刊》報導稱,為了獲得這些有害內容的標籤,OpenAI從2021年11月開始便向一家外包公司發送了數萬條文本片段。其中大部分文字似乎都是從互聯網「最黑暗的角落」挖掘出來的。

據報導,OpenAI發言人曾在一份聲明中證實,Sama在肯尼亞的員工為該公司正在開發的監測有害內容的工具作出了貢獻,該工具最終被內建到ChatGPT中。

除了OpenAI,Sama還為谷歌、Mate和微軟等矽谷科技巨頭標註數據。此外,Sama還標榜其是一家「有道德的人工智能公司」,並稱其已經幫助5萬多人脫貧。

人工智慧組織聯盟Partnership on AI表示,「儘管這些豐富數據的專業人士發揮了基礎作用,但越來越多的研究表明,這些工人都面臨著不穩定的工作條件。這可能是慶祝技術效率提升的同時,試圖掩蓋人工智慧對龐大勞動力依賴的結果。」

本文授權轉載自:36kr

責任編輯:傅珮晴、林美欣

關鍵字: #AI #Chatbot
往下滑看下一篇文章
打造AI無法取代的人才力,聯發科技攜手Hahow for Business培育跨域人才成果豐碩
打造AI無法取代的人才力,聯發科技攜手Hahow for Business培育跨域人才成果豐碩

在AI新世代浪潮下,兼具軟實力與硬實力的「T型人才」已躍升為企業人才培訓的新焦點。以聯發科技攜手 Hahow for Business 推出的「SPARK 實習生跨域軟實力學習計畫」為例,正是企業積極布局未來、培育全方位新世代人才的具體行動。

人工智慧的快速演進,正全面重塑我們對「學習」與「人才」的想像。隨著知識獲取門檻變低、學習方式持續翻轉,企業人才培育模式也迎來嶄新變革。在這波轉型浪潮中,擅長單一領域的「I型專才」往往難以應對多元挑戰,相反的,具備專業深度與跨域協作能力的「T型人才」成為企業招募與培育的核心焦點。

以理工科學生為例,雖然在校期間累積了紮實的專業知識與技術基礎,但往往在進入職場後,因為溝通表達、協同合作與專案管理等軟實力相對薄弱,面臨諸多挑戰、無法發揮潛力。為縮短「學用落差」與提升新鮮人的職場適應力,聯發科技攜手Hahow for Business在2025年共同推出「SPARK 實習生跨域軟實力學習計畫」,將工程師的個人效能訓練藍圖,提前至實習階段。計畫透過Learn-Apply-Reflect與10%-20%-70%學習策略,打造出「自主學習→練習→實際應用」的學習循環,全面加速準聯發人的培養、為企業注入新世代的競爭力。

聯發科技與Hahow for Business以「SPARK 實習生跨域軟實力學習計畫」加速培育人才

聯發科技始終堅信,每一位年輕人都蘊含著無限的發展潛力,只要能匯聚多元能力,即可激盪出創新火花、點燃成長的力量。這樣的理念也體現在「SPARK 實習生跨域軟實力學習計畫」logo設計:6道光芒象徵聯發科技永續經營的六大基石–全球觀、創新、人才、公司治理、綠色營運與在地實踐;而5道光芒則代表個人效能聚焦的5項關鍵能力:問題分析與解決、溝通簡報與影響力、專案管理、創意思維與成長心態。

SPARK計畫為實習生提供清晰的學習路徑,結合豐富的線上學習資源、個人練習與小組作業,同時搭配實體知識萃取工作坊,形成自主學習、同儕學習與應用及反思的學習循環。讓實習生不僅可以學習知識與實用技能,並真正將軟實力應用於工作場域。舉例來說,線上課程學習涵蓋「金字塔表達法」、「定錨點架構」、「ANSVA結構」與「SMART原則」等工具,並在為期兩個月的實習中,透過每週的應用練習、知識萃取工作坊與同儕小組報告,系統化強化關鍵軟實力,讓學習不僅止於「知識的獲取」更是「行為的展現」。

hahow
圖/ 數位時代

來自國立清華大學通訊工程研究所的實習生彭同學深有感觸的說:「能進入同一間公司,代表大家的硬實力相差不大,真正決定我們能否做對事情、把事情做好,是有沒有足夠的軟實力協同合作與向上管理,建議從大學三年級開始培養,並且持續不斷精進。」

國立清華大學半導體研究學院的實習生鄭同學同樣肯定軟實力的重要性。她說:「在學校,教授指派任務通常有明確的評分指標,但在實習時,主管交付的任務往往保留很大的自由發揮空間,為確保彼此有共識,我的作法是主動思考任務的目的,以手寫筆記進行結構性思考與建立清晰的表達邏輯,在與主管進行口頭報告時,則是以『金字塔表達法–先結論、後細節』的方式進行溝通,持續修正與取得共識、精準展開下一步。」

「理工科學生很容易陷入技術細節、分享時不自覺就是滿滿的專業術語,但這樣的溝通模式未必有助於專案進展。」來自國立陽明交通大學資訊網路工程學系的實習生洪同學表示,有效的溝通應該要跳脫技術本位,站在對方角度,說出讓目標聽眾共鳴的話,才能推進合作。「透過這次實習,我學會以『定錨點架構』讓溝通內容更有邏輯與說服力,以及透過『ANSVA–Attention /Need /Solution /Visualization /Action–架構』強化提案表達,就算面對全新的領域,也能快速盤點重點,並與團隊展開更有效的協作。」

「SPARK 實習生跨域軟實力學習計畫」創造的成效十分亮眼。活動期間在校園舉辦的多元跨域校園講座滿意度高達 94.6%;而在實習階段,儘管實習生同時承擔主管指派的專案任務,平均完課率仍高達 87%,並獲得大量正面回饋。許多實習生分享:「無論未來職涯選擇何種方向,這段期間累積的軟實力,都將成為持續突破與創新的關鍵資產。」

三大學習目標,支持年輕人才快速適應跨部門協作及全球化職場環境

聯發科技長期深耕技術創新與人才培育,積極推動學生硬實力與軟實力的緊密整合,以加速新世代人才的成長與轉型。此次首度與Hahow for Business合作「SPARK 實習生跨域軟實力學習計畫」實踐三大學習目標:首先建立創新與成長心態;其次強化簡報與溝通影響力及團隊合作;最後,培養問題解決、專案管理與行動決策能力。

Hahow
圖/ 數位時代

同時參加「SPARK 實習生跨域軟實力學習計畫」與3個不同專案計畫的國立清華大學資訊工程研究所實習生李同學表示:「實習期間,我必須同時處理三個專案,時間被各種會議切割得十分零碎,參加每場會議前,我至少得花費10分鐘翻閱紀錄或回想進度,改用實習期間學會的心智地圖追蹤專案進度後,只要 1 分鐘就能快速掌握最新狀況,執行效率大幅提升。」

國立台灣科技大學電機工程研究所的實習生董同學則認為:「軟實力之所以重要,不僅因為它能幫助我們在事前做好規劃、提升溝通的精準度,更關鍵的是,隨著這些能力不斷累積,將更有勇氣面對挫折與挑戰,不會輕易喪失對科技或對人的熱情。」

整體而言,聯發科技攜手 Hahow 好學校的合作,不僅著眼於短期彌補能力缺口,更展現企業對未來人才的前膽佈局與長期投資。當理工學生兼具專業深度與跨域軟實力,學用落差得以有效縮減,人才成長曲線隨之加速,產業也能在新世代人才的驅動下持續創新,形成良性循環,進一步鞏固組織的核心競爭力。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
一次搞懂Vibe Coding
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓