報(bào)告服務(wù)熱線400-068-7188

AI苦工卷向高學(xué)歷,美國博士正在搶走印度人工作

分享到:
20 字母榜 ? 2024-07-01 10:05:29  來源:字母榜 E7237G0

2

(圖片來源:攝圖網(wǎng))

作者|畢安娣 來源|字母榜(ID:wujicaijing)

美國人馬特?fù)碛型ㄐ挪┦繉W(xué)位,他最近喜提一份自由職業(yè):成為Scale AI公司的一員,在家訓(xùn)練AI模型。

“通信博士”“訓(xùn)練AI模型”,馬特是不是成了一名光榮的AI程序員?事實(shí)并非如此。馬特的工作很無聊:他在Scale AI的系統(tǒng)中“接活”,以用戶的角度瀏覽AI模型給用戶的各種回復(fù),判斷AI有沒有說錯(cuò),然后提供反饋。比如為谷歌的AI訓(xùn)練預(yù)訂航班,審核哪些ChatGPT的答案會(huì)得到用戶的差評(píng)。

Scale AI自己不生產(chǎn)大模型,它和谷歌母公司Alphabet、OpenAI、Meta等眾多AI生產(chǎn)商達(dá)成合作,為它們提供“人類”。

只不過,來自非洲、印度、菲律賓等地的廉價(jià)勞動(dòng)力,已經(jīng)不足以滿足客戶的需求。Scale AI已經(jīng)開始收縮其海外業(yè)務(wù),在美國本土雇傭數(shù)十萬勞動(dòng)力,其中不乏像馬特一樣的高知人士。

這家成立了8年的大模型數(shù)據(jù)標(biāo)注公司,在今年5月剛剛完成了10億美元F輪融資,由Accel領(lǐng)投,亞馬遜、英特爾、AMD、思科、Meta、老虎全球基金等全球知名公司跟投。公司預(yù)計(jì)今年銷售額將超過10億美元,使其成為生成式AI公司中銷售額排名靠前的公司之一。

而它的最新估值,已經(jīng)達(dá)到了138億美元。這放在所有AI初創(chuàng)公司中,都是一份不俗的成績,遠(yuǎn)遠(yuǎn)超過硅谷明星公司Hugging Face去年8月融資后的45億美元估值,更接近埃隆·馬斯克(Elon Musk)的xAI,其最新一輪融資后估值180美元。

讓人類給AI打苦工的Scale AI,已經(jīng)是當(dāng)下AI競賽中很關(guān)鍵的彈藥庫。

當(dāng)我們提到“大模型訓(xùn)練”時(shí),會(huì)想到的是用數(shù)千個(gè)先進(jìn)芯片驅(qū)動(dòng)大模型,讓其分析數(shù)百億字節(jié)的文本,其實(shí)這只是第一步——預(yù)訓(xùn)練。

但僅靠這些,不足以確保像Anthropic的Claude、OpenAI的ChatGPT、Meta的Llama和谷歌的Bard這樣的系統(tǒng)提供以人類風(fēng)格編寫的正確答案。

為了實(shí)現(xiàn)這一點(diǎn),需要進(jìn)行第二步:微調(diào)。這就涉及大量的人力,有可能是AI生產(chǎn)商在公司內(nèi)部雇傭,也有可能是來自Scale、Surge AI、Labelbox、Telus International等公司。這些公司提供大量的人,為客戶的聊天機(jī)器人寫下理想的回應(yīng),手把手教機(jī)器人提供更“完美”的答案。

為AI模型提供數(shù)據(jù)標(biāo)注服務(wù)的公司并非全新的存在,上一次讓這類公司起飛的風(fēng)是自動(dòng)駕駛。

Scale AI就成立于2016年。事實(shí)上,Scale AI從一開始就和OpenAI頗有淵源,其孵化于Y Combinator(下稱YC)的初創(chuàng)企業(yè)賽馬項(xiàng)目,項(xiàng)目還未結(jié)束就已經(jīng)獲得了YC的支持。而YC彼時(shí)的總裁,正是后來聯(lián)合創(chuàng)辦了OpenAI的山姆·奧特曼(Sam Altman)。

不過,彼時(shí)“千模大戰(zhàn)”還未開始,Scale AI首先趕上的是席卷硅谷的自動(dòng)駕駛技術(shù)熱潮。實(shí)現(xiàn)自動(dòng)駕駛,需要訓(xùn)練AI算法,而當(dāng)時(shí)沒有其他外包公司擁有對(duì)自動(dòng)駕駛汽車的雷達(dá)和傳感器生成的三維圖像進(jìn)行數(shù)據(jù)標(biāo)注的能力。

Scale AI的工程師最初花了幾個(gè)月,為自動(dòng)配送初創(chuàng)公司Nuro建立了3D標(biāo)注產(chǎn)品。很快,Alphabet的Waymo和通用汽車的Cruise,甚至是蘋果,都成了Scale AI的客戶。

在2017年底,Scale AI雇傭了1000多名標(biāo)注員,主要在菲律賓。平均來說,這些合同工的時(shí)薪是1.5美元,每周工作10個(gè)小時(shí)。

到了2019年,OpenAI也已經(jīng)成立幾年,并且將方向主要專注在了開發(fā)AI大模型上,隨后成為Scale AI的客戶。只不過彼時(shí)AI大模型客戶對(duì)于Scale AI來說并不是關(guān)鍵收入來源。

隨著自動(dòng)駕駛技術(shù)的熱潮漸漸回落,市場回歸理智,Scale AI也遭遇了危機(jī)。在2022年,Scale AI的收入增長已經(jīng)下降了50%,讓投資人頗為失望。

然而,2022年年底,OpenAI發(fā)布了ChatGPT,Scale AI的“第二春”瞬間綻放。

除了OpenAI之外,Scale AI也與Meta和谷歌母公司Alphabet達(dá)成了圍繞大模型的合作。公司的收入從2022年的2.27億美元,飆升到2023年的6.8億美元。

站在風(fēng)口之上,Scale AI喊出2024年收入增長206%的目標(biāo),并希望實(shí)現(xiàn)盈利。

在這個(gè)節(jié)點(diǎn),Scale AI也開始做出一些改變,來自海外的廉價(jià)勞動(dòng)力只能負(fù)擔(dān)很基礎(chǔ)的任務(wù),但大模型驅(qū)動(dòng)的產(chǎn)品在寫作、編程、專業(yè)知識(shí)等方面都開始“卷”,Scale AI需要升級(jí)手里的“雇傭兵”。

在一份投資者演示文稿中,Scale說它正在建設(shè)的是至關(guān)重要的AI基礎(chǔ)設(shè)施。該公司開始將自己打造成一個(gè)“AI的數(shù)據(jù)鑄造廠”,讓人聯(lián)想到半導(dǎo)體公司。

Scale AI的創(chuàng)始人也開始公開談?wù)摮钟胁┦繉W(xué)位的人,或者醫(yī)生、律師等在訓(xùn)練AI系統(tǒng)上的貢獻(xiàn):“我們需要最優(yōu)秀和最聰明的頭腦來貢獻(xiàn)數(shù)據(jù)。”

根據(jù)Rest of World的報(bào)道,Scale AI最近關(guān)閉了肯尼亞、尼日利亞和巴基斯坦的承包商站點(diǎn)。公司的焦點(diǎn)轉(zhuǎn)向美國本土,招募高知人士,來幫助訓(xùn)練大模型的專業(yè)知識(shí)。

大約有30萬人通過Scale AI子公司Outlier運(yùn)行的工作群等著“派活兒”。

美國本土的Scale AI“雇傭兵”并不廉價(jià),平均時(shí)薪可以達(dá)到40美元。不過這份工作仍然擺脫不了“苦工”的體驗(yàn)感。

在美國馬薩諸塞州的梅麗莎·夸西(Melissa Quashie)就以每個(gè)小時(shí)40美元的薪酬在Scale AI接活,她是一位自由職業(yè)者和編輯。她的任務(wù)包括評(píng)估由大模型生成的不同響應(yīng),根據(jù)模型回答問題的方式以及回答的內(nèi)容質(zhì)量來給出評(píng)分。

對(duì)夸西來說,在Scale AI的工作就像是“我玩過的最呆的電子游戲”。她曾經(jīng)花了兩個(gè)小時(shí)編寫一個(gè)“三天餐譜”,只是為了給聊天機(jī)器人改進(jìn)答案。

此外,隨著Scale AI積累大量的勞動(dòng)力,供求關(guān)系已經(jīng)開始不平衡。很多時(shí)候,Scale AI派發(fā)的客戶任務(wù)已經(jīng)難以滿足“雇傭兵”的需求。很多人發(fā)現(xiàn),這份工作雖然時(shí)間靈活且薪水誘人,但許多時(shí)候都會(huì)無事可做。The Information采訪的10位Scale AI“雇傭兵”中,大部分人都有相同的抱怨。

也許是在AI浪潮下公司業(yè)務(wù)擴(kuò)展的速度太快,也許是比起勞力們的工作體驗(yàn),Scale AI更專注于服務(wù)好客戶??傊琒cale AI也開始暴露其他的問題,除了吐槽派的活不夠做之外,人們也抱怨其培訓(xùn)不足以及系統(tǒng)經(jīng)常崩潰。

更惱人的還要數(shù)薪酬結(jié)算,即便是在美國本土為Scale AI提供勞力的“高知人士”,也沒有什么話語權(quán)。開頭提到的博士馬特就表示,他被Scale AI無故踢出平臺(tái)。

薪酬的結(jié)算不看工作量,而是要考核質(zhì)量,而最終解釋權(quán)自然歸Scale AI所有。而且即便理應(yīng)收到報(bào)酬,也可能因?yàn)榭蛻暨t遲不確認(rèn)而沒有著落。

根據(jù)工作質(zhì)量而不是工作量為苦力們結(jié)算,這有助于Scale AI控制成本,而這對(duì)于Scale AI來說是現(xiàn)階段的關(guān)鍵卡點(diǎn)。

隨著公司將焦點(diǎn)從提供廉價(jià)勞動(dòng)力的海外市場轉(zhuǎn)移到美國,Scale AI的成本也更難控制。根據(jù)The Information獲取的財(cái)務(wù)數(shù)據(jù),Scale AI的毛利率(包括支付給人類苦工的成本),從2022年的59%下降到了2023年的49%。

與此同時(shí),Scale AI告訴投資者,它正在努力降低成本。該公司預(yù)測,今年將提高毛利潤率5個(gè)百分點(diǎn),然后到2025年提高到60%。

公司告訴投資者,它正在通過使用內(nèi)部工具自動(dòng)識(shí)別“高效專家”來降低人工訓(xùn)練模型的成本,以及依靠計(jì)算機(jī)生成的數(shù)據(jù)來增加人類工作的效率。

另一個(gè)壓縮成本的方式是減少內(nèi)部員工(和“雇傭兵”不同,此處指的是在Scale AI工作的正式員工),2023年2月,Scale AI一方面已經(jīng)看到了AI浪潮的來臨,另一方面也看到了宏觀經(jīng)濟(jì)的影響以及硅谷的裁員潮,它抓住機(jī)會(huì),也大刀闊斧裁員20%。

除了盡力壓縮成本之外,Scale AI也在想方設(shè)法拓展業(yè)務(wù)。

雖然很多員工反對(duì),但Scale AI早已把不與政府合作的承諾拋之腦后。最近幾個(gè)月,Scale AI的聯(lián)合創(chuàng)始人亞歷山大·王(Alexandr Wang)與美國陸軍將領(lǐng)在華盛頓共同登臺(tái),公司每年從政府合同中獲得超過1億美元的收入。此外,他還前往卡塔爾,與政府官員進(jìn)行閉門會(huì)議,卡塔爾也熱衷于開發(fā)自己的大語言模型。

在為AI生產(chǎn)商提供大量人力之外,Scale AI也提供AI生成的合成數(shù)據(jù)集——用AI生成的數(shù)據(jù),訓(xùn)練AI,以滿足AI大模型訓(xùn)練中不斷膨脹的胃口。

現(xiàn)階段“高質(zhì)量的人類”依舊是Scale AI最賴以生存的“資源”,因此公司也在采取措施維護(hù)“高質(zhì)量人類”中的那些佼佼者。

在美國德克薩斯州奧斯汀和佛羅里達(dá)州的杰克遜維爾,Scale AI曾舉辦為期數(shù)天的研討會(huì),邀請(qǐng)幾十名“頂級(jí)苦力”前往參加。

一位參加奧斯汀研討會(huì)的人說,大約有50名訓(xùn)練師參與了一個(gè)據(jù)悉Alphabet的Bard聊天機(jī)器人相關(guān)的項(xiàng)目。他們討論了每個(gè)人為不同提示寫下的回應(yīng),并在晚上一起唱卡拉OK。

在杰克遜維爾,夸西遇到了大學(xué)教授、博士生、編劇和播客主持人。“我們連續(xù)工作六個(gè)小時(shí),然后喝杯葡萄酒。”

“每個(gè)人都非常興奮地改善大語言模型。但沒有人談?wù)摰氖?,因?yàn)槲覀冊(cè)谧鲞@份工作,誰會(huì)失去他們的工作?”

諷刺的是,數(shù)以十萬計(jì)的人類在為AI打工,就是為了讓AI的表現(xiàn)越來越好。而當(dāng)AI足夠好的時(shí)候,這些苦力也許也是會(huì)被首先拋棄的那批人。畢竟如果AI能自產(chǎn)自銷,何必依靠每小時(shí)需要40美元的“高知苦力”?

也許更進(jìn)一步的問題是,為AI販賣人類勞動(dòng)力的日子還能持續(xù)多久,而這也是懸在Scale AI頭上的一把劍。

編者按:本文轉(zhuǎn)載自微信公眾號(hào):字母榜(ID:wujicaijing),作者:畢安娣 

本文來源字母榜,內(nèi)容僅代表作者本人觀點(diǎn),不代表前瞻網(wǎng)的立場。本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。(若存在內(nèi)容、版權(quán)或其它問題,請(qǐng)聯(lián)系:service@qianzhan.com) 品牌合作與廣告投放請(qǐng)聯(lián)系:0755-33015062 或 hezuo@qianzhan.com

p48 q0 我要投稿

分享:
標(biāo)簽: 人工智能 工作

品牌、內(nèi)容合作請(qǐng)點(diǎn)這里:尋求合作 ››

前瞻經(jīng)濟(jì)學(xué)人

專注于中國各行業(yè)市場分析、未來發(fā)展趨勢等。掃一掃立即關(guān)注。

前瞻產(chǎn)業(yè)研究院

中國產(chǎn)業(yè)咨詢領(lǐng)導(dǎo)者,專業(yè)提供產(chǎn)業(yè)規(guī)劃、產(chǎn)業(yè)申報(bào)、產(chǎn)業(yè)升級(jí)轉(zhuǎn)型、產(chǎn)業(yè)園區(qū)規(guī)劃、可行性報(bào)告等領(lǐng)域解決方案,掃一掃關(guān)注。

前瞻數(shù)據(jù)庫
企查貓
作者 字母榜
科技自媒體
584870
關(guān)注
1090
文章
前瞻經(jīng)濟(jì)學(xué)人App二維碼

掃一掃下載APP

與資深行業(yè)研究員/經(jīng)濟(jì)學(xué)家互動(dòng)交流讓您成為更懂趨勢的人

研究員周關(guān)注榜

企查貓(企業(yè)查詢寶)App
×

掃一掃
下載《前瞻經(jīng)濟(jì)學(xué)人》APP提問

 
在線咨詢
×
在線咨詢

項(xiàng)目熱線 0755-33015070

AAPP
前瞻經(jīng)濟(jì)學(xué)人APP下載二維碼

下載前瞻經(jīng)濟(jì)學(xué)人APP

關(guān)注我們
前瞻產(chǎn)業(yè)研究院微信號(hào)

掃一掃關(guān)注我們

我要投稿

×
J