他是ChatGPT 背後的數據訓練師:時薪460元起跳,但賺的都是辛苦錢、整天在幫各種照片上標籤

他是ChatGPT 背後的數據訓練師:時薪460元起跳,但賺的都是辛苦錢、整天在幫各種照片上標籤

OpenAI 的聊天機器人 ChatGPT 靠外包人員的訓練工作才能成就輝煌。這些工人為訓練資料打標籤,和機器人來回對話並糾正系統生成的答案。這些美國外包工人的時薪超過 15 美元(約台幣460元),而從事這份外包工作的人,有些人只為了養家活口,但也有人是想搶先一步,在第一線瞭解人工智慧發展狀況。

現年 34 歲的阿列克謝・薩夫勒(Alexej Savreux)住在密蘇里州堪薩斯城,他說自己這些年來做過各種各樣的工作:賣過快餐三明治、當過保管員、垃圾搬運工,還曾為劇場安裝過音響,做的多半都是體力活。

現在,他成了一名AI數據訓練師,不再需要從事體力勞動。

作為人工智慧行業眾多外包大軍中的一員,薩夫勒等人一直在幕後訓練人工智慧系統如何分析資料,以便讓人工智慧最終生成各種讓使用者驚嘆不已的文字和圖像。為了提高人工智慧的精準性,薩夫勒會為各種照片貼上標籤,並預估應用程式接下來應該生成什麼文字。

雖然他們的時薪超過 15 美元,但與矽谷那些工程師相比根本不算什麼,而且他們並沒有任何福利。

在過去幾年中,薩夫勒和其他外包人員花費了大量時間來訓練 OpenAI 的人工智慧系統,以便讓 ChatGPT 能夠更好地回答用戶的問題。這些工人提供了 OpenAI 等人工智慧企業所需的文字、標籤及其他資訊,滿足了企業們無休止的迫切需求。

如果沒有標籤,再好的AI模型也沒用

去年 11 月份,OpenAI 發佈了人工智慧聊天機器人 ChatGPT,引起了生成式人工智慧領域的熱潮。薩夫勒說:「我們做的都是苦力活,但如果沒有我們,就不會有人工智慧語言系統。」

薩夫勒說:「你可以設計所有你想要的神經網路,你可以讓所有你想要的研究人員參與進來,但如果沒有標籤,你就沒有 ChatGPT。你什麼都沒有。」

這份工作不會給薩夫勒帶來多少名聲或財富,但在人工智慧領域中,這是一份容易被忽視的重要工作,外包人員付出的勞力,在新技術的魔力面前黯然失色。

總部位於舊金山的非營利組織人工智慧夥伴關係 (Partnership on AI) 致力於推動人工智慧方面的研究和教育。該組織的人工智慧、勞工和經濟項目負責人索南・金達爾 (Sonam Jindal) 表示:「很多人在慶祝人工智慧的成就,但我們忽略了一個重要組成部分,那就是如今人工智慧仍然非常依賴於大量人力。」

多年來,科技行業一直依賴於成千上萬的低技能、低收入工人來支撐其龐大的電腦業務,從 20 世紀 50 年代的穿孔卡操作員到最近抱怨自己在公司是二等公民的Google約聘人員都是如此。隨著各種外包平台的興起,很多線上零工工作也更受人歡迎。

如今,蓬勃發展的人工智慧行業也在上演類似的劇情。

外包員工付出最多,但職位沒有保障

這種外包工作通常不穩定,隨時隨地都可能因為需求變化而變動。從事此類工作的員工要麼直接與公司簽訂書面合同,要麼被專門從事臨時工或外包業務的第三方供應商僱用。他們能獲得的醫療保險等福利很少或根本不存在,這意味著科技公司的人力成本更低。此外,這些工作通常是匿名的,所有的功勞都被歸功於科技公司的高層和研究人員。

人工智慧夥伴關係在 2021 年的一份報告中警告稱,通過新增、更新、清洗和處理來自外部資料來源的資料,以改進現有資料集的「資料擴充工作」(data enrichment)的需求即將激增。

該組織建議人工智慧行業致力於推動公平薪酬和其他改進做法。去年,他們發佈了企業自願遵守的指導方針。

目前,Google旗下的人工智慧公司 DeepMind 是迄今唯一一家公開承諾遵守這些準則的科技公司。

金達爾表示:「很多人已經認識到這一點很重要。現在的挑戰是讓公司能夠真正踐行。」

「這是一個由人工智慧創造的新工作領域,」她補充說。「我們有可能讓這份工作成為高品質的工作,從業者因他們為實現技術進步所做的貢獻而受到尊重和重視。」

最近,工作需求已經出現激增,而一些從事人工智慧外包工作的工人開始要求提高待遇。

據報導,上週一,肯亞有 150 多名在 Facebook、TikTok 和 ChatGPT 從事人工智慧工作的工人已成立工會,理由是他們認為工資低,而且工作對精神造成一定程度的傷害。Facebook 和 TikTok 沒有立即回應置評請求。OpenAI 拒絕置評。。

到目前為止,美國從事人工智慧外包工作的員工還沒有類似動作,他們還在逐字逐句為開發人工智慧系統默默做貢獻。

AI數據訓練師需求越來越大,但工作狀況不透明

薩夫勒是通過網上招聘廣告進入這個行業的,現在在家裡使用筆電工作。薩夫勒認為,AI領域的這種零工幫助他擺脫了無家可歸的境地,畢竟每小時 15 美元的工資比堪薩斯城的最低工資要高。雖然有些人可能認為這些工作微不足道,但薩夫勒認為這是機器學習領域必不可少的初級工作。

人工智慧外包工作的招聘資訊既說明行業需求激增,也反映出這項工作有時會讓人筋疲力盡。

知名的AI訓練外包仲介公司 Invisible Technologies 在招聘廣告中聲稱,他們正在尋找「高級人工智慧資料訓練師」,這份工作是初級工種,每小時起薪 15 美元,但也可能「有益於人們」。招聘啟事上這樣寫道:「你可以把這份工作看成是語言藝術老師,或者是最具影響力的技術私家教練。」 Invisible Technologies 表示,新員工將「在世界領先人工智慧研究人員制定的協議下」工作,但沒有透露所服務客戶的名字。

雖然目前尚未有確切資料表明有多少外包人員在為人工智慧公司工作,但這種工作形式在全球變得越來越普遍。今年 1 月份的報導稱,OpenAI 僱用來自肯亞的低薪工人來標記包含各種不良內容的文字,以幫助應用程式更好地識別。

此外今年年初有報導稱,OpenAI 已經還在東歐和拉丁美洲等地僱傭了大約 1000 名遠端外包工人,專門為資料打標籤或訓練公司軟體。儘管 OpenAI 首席執行長薩姆・奧爾特曼 (Sam Altman) 在推特上表示,截至今年 1 月份,OpenAI 仍然是一家小公司,大約只有 375 名員工,但這個數字並不包括外包工人,也無法完全反映公司的營運規模。OpenAI 一位發言人表示,沒人可以回答有關使用人工智慧外包工人的問題。

進入AI世界的最低門檻

創造資料來訓練人工智慧模型的工作並不總是那麼簡單,有時也相當複雜,但足以吸引那些想在人工智慧行業領域創業的人士。

22 歲的賈京・庫馬爾 (Jatin Kumar) 來自德州奧斯汀,畢業於電腦科學專業,從事人工智慧工作已經有一年時間。他表示,這讓他瞭解到生成式人工智慧技術的最新發展方向。

庫馬爾說:「這讓你有機會在公眾接觸到這項技術之前,就開始考慮如何運用它。」此外,他還創立了一家名為 Bonsai 的科技初創公司,專門為醫院開發計費軟體。

作為一名人工智慧會話培訓師,庫馬爾的主要工作是與聊天機器人進行對話,提出各種問題,這是訓練人工智慧系統漫長過程的一部分。他說,開始時這很簡單,但隨著經驗的積累,這些任務變得越來越複雜。

「每隔 30 到 45 分鐘,你就會接到一個新任務,要提出新的問題,」庫馬爾說,開始提示可能很簡單,比如「法國的首都是哪裡?」

庫馬爾說,他與其他約 100 名外包人員合作生成訓練資料,糾正答案,並通過對答案進行反饋來微調模型。

庫馬爾表示,其他工作人員會處理「標記過」的對話內容。有些使用者會將聊天機器人的答案反饋給公司進行審查,工作人員會閱讀 ChatGPT 使用者提交的對話。當有一個被標記的對話出現時,工作人員會根據所涉及的錯誤類型進行分類,然後用於進一步訓練人工智慧模型。

庫馬爾說:「這是我能 OpenAI 幫助解決問題,學習現有技術的一種方式。」

 

cnBeta
作者

cnBeta.COM(被網友簡稱為CB、cβ),官方自我定位「中文業界資訊站」,是一個提供IT相關新聞資訊、技術文章和評論的中文網站。其主要特色為遊客的匿名評論及線上互動,形成獨特的社群文化。

使用 Facebook 留言

發表回應

謹慎發言,尊重彼此。按此展開留言規則