AI外包正轉向歐美地區,尋找各類專業人才訓練大模型

2月21日消息,隨着傳統職業人員如語言專家、創意作家和核物理學家等逐漸成爲“數據標註工”,他們的職業前景正變得岌岌可危,最終可能被他們所培訓的人工智能系統所取代。

以下是翻譯內容:

傑伊(Jay)高中時愛上了數學,他的物理老師向他展示了複雜微積分的樂趣。大學時期,傑伊專攻物理和數學,夢想有朝一日能將自己的知識傳授給下一代。這個機會出現在2022年10月,當時25歲的傑伊加入了一個在線平臺,以數學專家的身份爲方程式打分。但他的工作不同於傳統教師,他的工作重心將聚焦於訓練一個人工智能系統,而這恰恰可能使他的專業知識變得不再那麼重要。

爲了保護自己的隱私,傑伊選擇了使用化名。他透露,他當時幫助培訓的系統由OpenAI開發,他的工作是爲該公司的大語言模型(LLM)提供專家指導。這一機器學習系統具備聊天機器人的會話能力,並試圖提升其在數學領域的解題能力。在葡萄牙的家中,傑伊負責評估人工智能模型在解決數學問題時的步驟是否正確,通過添加點贊或不滿的表情符號來提供反饋,甚至在必要時解釋模型出錯的原因。

傑伊知道,他是在爲薩姆·奧特曼(Sam Altman)領導的OpenAI訓練算法,因爲他被邀請加入OpenAI的Slack工作頻道。在與《連線》分享的截圖顯示,傑伊是名爲“數學培訓師”的小組成員,該小組是由OpenAI研究員尤里·布爾達(Yuri Burda)建立的。但傑伊並非直接爲OpenAI工作,他的僱主是全球最大的數據勞動平臺之一Remotasks。這家公司是美國初創公司ScaleAI的子公司,2021年的估值已超70億美元,其客戶涵蓋了OpenAI、Meta、微軟和美國陸軍等。

Scale AI與客戶密切合作,提供和管理他們需要的訓練數據,以建立自動駕駛汽車或大語言模型背後的人工智能模型。通常情況下,這些寶貴的數據往往來源於與Scale AI緊密合作的Remotasks簽約員工。自2017年成立以來,這家數據巨頭已與全球數十萬名員工建立合作關係,尤其是在勞動力成本相對較低的國家,如菲律賓。Remotasks表示,菲律賓員工主要致力於自動駕駛汽車的計算機視覺訓練,幫助車輛精準識別周圍環境。

然而,在過去的一年裡,Scale AI的重點已轉向美國和歐洲。他們正積極招募白領和語言專家,爲日益興起的大語言模型提供訓練數據。這一轉變無疑加劇了人們對未來職業的擔憂,這些白領和語言專家正在訓練將來可能取代他們職業的人工智能競爭對手。

傑伊對自己在未來工作中充當的角色進行了深入反思。他承認自己在傳遞知識給人工智能,但他堅信,人工智能模型難以複製人類在解決複雜數學問題時的獨特能力。他期望自己參與的工作能夠創造出與他水平相當的聊天機器人,共同探索數學的奧秘,而非取代他的人工智能。他說:“當我開始訓練這些模型時,這正是我所期待的。”

面對人工智能系統的崛起,Scale AI負責數據運營的副總裁威洛·普里馬克(Willow Primack)強調,隨着AI系統開始生成知識和內容,Remotasks等公司正尋求不同領域的專家幫助,以確保人工智能應用的準確性和可靠性。隨着生成式人工智能在科技行業的廣泛應用,數據提供商急需一批能夠進行“專家事實覈查”的新承包商。

傑伊的時薪高達60美元,他在OpenAI推出ChatGPT之前的一個月加入了Remotasks。自那時起,該公司加速招聘專業“數據標註工”。據《連線》雜誌報道,2024年1月,Remotasks發佈了招聘廣告,尋找能夠掌握20多種歐洲語言的人才,以及美國的創意作家、體育記者、化學專家和核物理學家。

普里馬克說:“如果讓生成性人工智能完全依賴自身,它們可能會產生幻覺。即便它們提供的答案是事實,也有辦法改進,使其更加全面。專家的參與至關重要,他們提供的數據能夠真正提升人工智能的能力。”

普里馬克表示,儘管Scale AI在菲律賓擁有龐大的運營規模,但該公司正逐步將重心轉向美國和以英語爲母語的歐洲地區,尋求更多專業承包商的加入。普里馬克不太願意透露到底是什麼促使了這種轉變,是特定的Scale AI客戶要求更多的專家數據,還是該公司試圖預測下一代AI需要什麼?她稱兩者兼而有之,並解釋說,專業承包商正爲衆多客戶培訓數據,而不僅僅是爲單一客戶服務。

對於這一轉變的影響,行業研究人員給出了自己的解釋。德國魏森鮑姆研究所的數據、算法系統和倫理研究小組負責人米拉格羅斯·米塞利(Milagros Miceli)指出,過去大多數人工智能技術都是在大型、多樣化的數據集上進行訓練的。然而,隨着版權問題的日益突出,許多知名出版商開始禁止數據收集,這使得數據收集變得更加困難。因此,付錢給專業承包商成爲了一種可行的解決方案。

“去年,很多公司都在創建新的數據,以避免版權投訴。”米塞利解釋道,“如果你僱傭一名作家專門爲訓練你的模型而寫故事,並支付他們薪水,那麼你就擁有了這些文本的所有權,也就解決了版權問題。”

自ChatGPT等生成式人工智能技術亮相以來,越來越多的研究預測,在美國和歐洲,那些通常由受過大學教育的人佔據的職業將面臨顛覆性的變革,而這些人以前通常被認爲不會受到技術變革的影響。儘管存在這些擔憂,但專業承包商提供的高薪工作仍然極具吸引力,可能讓一些人難以放棄可能導致他們失業的培訓工作。

目前,專業職位的薪酬因專業知識而異。根據最新的招聘信息,傳染病專家在遠程培訓任務上的時薪最高可達40美元,而歷史學家的時薪爲32美元。然而,受僱於特定語言訓練算法的人往往得到的報酬更少。例如,一份招聘保加利亞作家的廣告給出的時薪爲5.64美元,而會說芬蘭語的專家的時薪幾乎是保加利亞作家的五倍,達到23美元。

最近剛大學畢業的安娜(Ana)住在西班牙,她認爲Remotasks爲像她這樣的作家提供17美元時薪“非常高”。這項工作包括監督名爲Catalan的聊天機器人,然後對其回答進行排序或糾正。安娜說:“我們必須糾正拼寫錯誤,還要看看答案是否過於美國化。”

當提示與色情或暴力有關時,由安娜來確保機器人拒絕回答。她還被要求確保人工智能不能回答諸如“我應該把畢生的積蓄投資在哪裡?”之類的問題。

對安娜來說,這份工作很划算。因爲地處偏遠,她可以在媽媽靠近海灘的房子裡工作。“我度過了最美好的夏天,”她說,並解釋了她在2023年5月、6月和7月爲遠程任務採用的靈活時間表。“在20個小時內,我賺的錢比以前工作40個小時還多。”她被告知要工作六個月左右。但到了8月焚滅,僅僅三個半月後,任務開始減少。最終,她的經理也不再回復她的信息。

安娜的經歷表明,雖然白領“數據標註工”的薪資可能高於東南亞同行,但他們仍然面臨着不確定性。傑伊和安娜都說,Remotasks突然切斷了他們的聯繫,他們覺得自己被拋棄了,而原因他們並不完全瞭解。工作了一年之後,傑伊說他突然無法再領取平臺上的任務了。普里馬克也稱,當被問及項目爲何突然終止時,Remotasks的解釋是,他們有時會暫停一個項目,以評估數據集的質量。但普里馬克承認,這種情況相當罕見。

那年夏天,安娜的朋友們圍繞她的新職業展開了深入的討論,擔憂這一趨勢是否預示着人工智能將逐漸取代他們的工作。但今天,她認爲這只是人類進步的又一個篇章,一個她也可以利用的篇章。對她而言,人工智能不是威脅,而是助力,是她可以積極利用的工具。她說:“假設你不想在烈日下在土豆地裡工作9個小時。你要想出一種技術,讓它變得更容易。”

安娜現在把這些反思運用到自己的工作中,成爲一名文案,利用人工智能來爲她出謀劃策。(小小)