人們在一個行業(yè)上積累的經(jīng)驗、學到的技巧、掌握的訣竅,一方面使這些職業(yè)看起來有更強的“成長性”,但另一方面也是被大語言模型首先替代掉的東西??雌饋聿⒉恍枰邔W歷、工資也不算最高的這些職業(yè),反而成了最難被AI替代的職業(yè)
我們所使用的招聘數(shù)據(jù),截止時間是到2022年年末。但2023年,似乎進入到了一個新的紀元,各種生成式AI的快速推出,帶來了前所未有的沖擊。
生成式AI中最有代表性的,要數(shù)OpenAI的大語言模型——ChatGPT,很多人通過親身嘗試,在被科技震撼的同時,也都感到了深深的危機,似乎自己的工作很容易就能被AI替代。這種情緒迅速地被各類媒體和營銷號捕捉到,通過個案的采訪,以及文學化的解讀,又被傳播放大到了婦孺皆知的程度。
但是,迄今為止,關于生成式AI(或者狹義到大模型)對就業(yè)市場影響的真正的嚴肅研究還屈指可數(shù)。
目前比較有參考意義的研究,其實還是來自OpenAI自身。OpenAI在他們最新的工作論文《GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large Language Models》中,深入討論了AI對勞動力市場可能的影響。
在這篇文章中,研究者發(fā)現(xiàn),在大語言模型(LLM)愈發(fā)普及的沖擊下,至少80%的美國勞動力會受到影響,他們的工作的10%會被LLM所替代。其中有19%的美國勞動力有超過50%的工作會被替代。
注意,以上研究也僅僅限于美國的就業(yè)市場。
那么,中國呢?
這是一個超巨大的但與美國截然不同的勞動力市場,同時又面臨人口老齡化和各種勞資矛盾;在中國的各種崗位,又有多少會因為大語言模型的沖擊,被替代、甚或是消失呢?
本文我們將借鑒OpenAI工作論文的思路,利用來自中國的招聘數(shù)據(jù),用我們獨立設計的方法,嘗試對于這個大眾關切的問題給出一個超越感性認識的、覆蓋所有職業(yè)的、全面性的數(shù)據(jù)答案。
要分析一個崗位在多大程度上能夠被GPT或者衍生的其他AI模型所替代,首先需要明確一個最關鍵的問題:
每個職業(yè)究竟都在做哪些事情?
我們看到營銷號里經(jīng)常提到,AI會取代秘書、AI會取代程序員,諸如此類。但這是一個非常模糊的表達。在本質上,AI所替代的,并不是一個大眾認知的泛泛的職業(yè)名字,而是這個職業(yè)中所包含的職能和工作內容。
那么,什么是職業(yè)中所包含的職能呢?在招聘網(wǎng)站上,我們會看到“崗位描述”,比如一個典型的人力資源部員工的崗位描述可能包括以下內容:
1.新員工的招聘,員工入職手續(xù)辦理
2.安排以及開展新員工入職培訓
3.考勤及工資績效的核算
4.維護和拓展公司招聘渠道,協(xié)助社招及其他招聘活動
……
大家可以看到,其中每一條都是人力資源部員工的職能。而每一條職能又包括了更豐富的工作內容。比如“安排以及開展新員工入職培訓”,又包含了下列具體工作內容——1.撰寫、準備培訓材料;2.交流、溝通并安排計劃時間表;3.演講、培訓,提升員工技能……等具體工作內容。
當“人力資源專員”這個職業(yè)的工作結構被拆解成了數(shù)個甚至數(shù)十個職能和工作內容后,單獨判斷“撰寫、準備培訓材料”這一項內容有多大可能會被AI沖擊,這樣才能產(chǎn)生具體的、可量化的、有切實意義的答案。
好的,那么問題來了,我們怎么才能獲取每個職業(yè)的職能和工作內容信息呢?
為了獲得各種職業(yè)的任務拆解信息,OpenAI的論文中使用了O*net數(shù)據(jù)庫。O*net,全稱為職業(yè)信息網(wǎng)絡(Occupational Information Network),是一個基于美國標準化職業(yè)的免費在線數(shù)據(jù)庫。這個數(shù)據(jù)庫已經(jīng)完成了所有的(美國)職業(yè)拆解。
那么中國有沒有O*net這樣的數(shù)據(jù)庫呢?很遺憾,目前并沒有,而且由于中美對于職業(yè)的定義存在一定差異,O*net數(shù)據(jù)庫的職業(yè)也很難與中國職業(yè)大典中的標準職業(yè)形成準確的映射關系。
所以我們采用了一種間接的匹配方式,采用市場上真實招聘數(shù)據(jù)作為媒介,每一條招聘數(shù)據(jù),通過前篇(《打工十年,能得幾錢:5億條招聘信息中的職業(yè)生涯密碼》)中的方法,同時映射到中國標準職業(yè)和O*net標準職業(yè)后,再按照中國標準職業(yè)匯總,從而就得到了每一個中國標準職業(yè)下的工作任務和具體工作內容。
經(jīng)過匯總和抽象合并,我們共計匹配產(chǎn)生了1639種職業(yè)、19265條職能和23534種工作內容。
獲得了上述數(shù)據(jù),也就是明確了每個職業(yè)具體的工作任務和工作內容后,按照OpenAI的方法,下一步就是給每個工作任務和具體工作內容進行打標,具體判斷其是否會被AI替代。
在此,需要標注的數(shù)據(jù)大約幾萬條,那么,如何完成這個工作呢?
在過去,我們就需要聘用大量人工數(shù)據(jù)標注員,對19265條工作任務和23534種工作內容打標,讓標注員們判斷每一個任務被AI替代的可能性是多少,是30%,還是70%,再將這些標注員的工作合并在一起求平均,得到每一個職業(yè)被AI替代的可能性。
數(shù)據(jù)標注員,其實是一種很新穎的職業(yè),在2022年版的《中國職業(yè)大典》中才首次出現(xiàn),職業(yè)代碼為4-04-05-05-01,在細類“人工智能訓練師”的類目下,主要工作內容包括“標注和加工圖片、文字、語音等業(yè)務的原始數(shù)據(jù)”。判斷每一個職業(yè)的具體任務和工作內容是否會被AI所替代,自然也是數(shù)據(jù)標注員工作的一種。
——是的,原本確實應該是這么做的,過去這么多年來也一直是這么做的。但我們現(xiàn)在有了大語言模型,有了GPT,事情開始變得不一樣。
在OpenAI的那篇工作論文中,作者確實聘用了人類來為這些工作內容打標,但他們同時請來了另外一位更高效的助手,那就是GPT自己,通過一個復雜的prompt使GPT理解打標任務背景后,讓GPT自己出手,判斷每一條工作內容被自己替代的可能性究竟有多少。
![]() |
結果有些出人意料,細想?yún)s又很合理——GPT的標注結果,和人類的標注結果高度一致,有81%以上的標注是完全一樣的。論文中讓GPT用不同的prompt標注了兩次,其結果也很類似,兩次標注之間有91.1%的結果一樣。論文最后選了其中一次GPT的標注結果來進行研究,人類的標注結果,僅僅用來判斷GPT的合理性,并沒有被用在論文中。
是的,讓GPT來標注“某一項工作內容會被GPT替代的可能性”。讓魔法來審判魔法。
我們自然也使用了這種方法,直接使用GPT-4的API,對于每一種職業(yè)的每一類工作內容進行打標,具體的prompt類似這樣(我們最終使用的prompt與之不完全一致,可以根據(jù)需求自行修改):
你是一名“大型語言模型替代勞動力評估師”。大型語言模型,是一種用于處理和生成自然語言文本的深度學習模型,最新的大型語言模型能夠基于自然語言文本生成、描述創(chuàng)建圖像與視頻。在這樣的背景下,你需要從“該任務是否能夠在大語言模型幫助下,在同樣時間達成同樣產(chǎn)出或者同樣效果的前提下,減少人類勞動時間的參與”的角度,給下列每一個任務打分。
評分從0到5分,0代表該任務不能通過大語言模型的幫助減少人類勞動投入,1代表可以減少20%人類勞動投入,2代表可以減少40%的人類勞動投入,3代表可以減少60%的人類勞動投入,4代表可以減少80%的人類勞動投入,5代表可以減少100%的人類勞動投入,即該任務不再需要人類勞動參與。
你的評分,代表著大語言模型可以在每一個任務中節(jié)省多少比例的勞動投入,請根據(jù)當前大語言模型的進步情況和你認為未來可能的發(fā)展狀況,謹慎評分。請按照“id,評分”的格式,每一行返回一條任務的評分結果。
在API中,以上內容被作為背景輸入,接下來具體的內容便可輸入具體的工作任務和工作內容,一次可輸入多條,但由于輸入token限制,一次我們最多能輸入100條左右讓GPT幫助打標。
接下來,GPT-4的API就會快速返回結果。由于任務已經(jīng)被拆解得比較細致,對于每一條任務的打標十分準確,穩(wěn)健性也極高。
更重要的是,使用GPT打標,成本之低令人發(fā)指。標注4萬條內容,每次標注100條,只需要400次,使用GPT-4的模型,每標注100條,僅需要0.12美元。也就是說,一共只需要耗費48美元,合人民幣300多元。如果使用不那么精確,但速度更快且更便宜的GPT-3.5-tubo模型,4萬條只需要耗費3美元,約合20多元。在這樣簡單的任務上,GPT-4和gpt-3.5-turbo的表現(xiàn)幾乎沒有差異。
而人類數(shù)據(jù)標注員要完成4萬條內容的標注,需要至少1萬元,一星期。GPT只需要半小時,一杯奶茶的錢。而兩者的質量是幾乎一樣的。
我們必須正視這樣一個似乎有些諷刺的事實——
剛剛出現(xiàn)沒幾年的全新職業(yè)——人類標注員,他們喂養(yǎng)出來的大型語言模型GPT,在完成一項“GPT能夠替代哪些職業(yè)”的標注工作任務時,首先替代掉了把GPT訓練成材的人類數(shù)據(jù)標注員。
使用GPT標注的結果,我們可以計算什么樣的職業(yè)最容易被大語言模型以及其他AI相關的衍生職業(yè)替代。具體計算過程是這樣的:
![]() |
將所有的工作權重(來自O*net數(shù)據(jù))和替代率全部相乘后求和,就得到了該職業(yè)的AI替代率,可以理解為這份工作總共有百分之多少的工作內容可能被AI替代。我們已經(jīng)將所有標注結果匯總到了中國職業(yè)上,并在數(shù)據(jù)團+小程序中給出了每個職業(yè)的“AI替代系數(shù)”(感謝加州大學圣迭戈分校(UCSD)楊陽提供相關數(shù)據(jù)與計算)。
下表列出了在招聘達到一定規(guī)模的職業(yè)中AI替代率最高和最低的各25個職業(yè)。
![]() |
上表的這50個職業(yè),可以理解為未來職業(yè)發(fā)展的晴雨表。
AI替代率最高的職業(yè)是翻譯,其次是保險核保專業(yè)人員以及劇作家。這三個職業(yè),有90%以上的工作任務和內容都暴露在AI替代的風險中。
接下來,視覺傳達設計人員、裝飾美工、美術編輯、廣告設計師、剪輯師,這些與美術、視頻、作圖相關的職業(yè),被AI替代的工作內容也超過了80%。
文字編輯、網(wǎng)絡編輯、文學作家、文字記者,這些與文字生成和修改高度相關的職業(yè),被替代的工作內容也超過了75%。
呼叫中心服務員、前廳服務員(即為賓客提供咨詢、迎送、入住登記、結賬等前廳服務的人員)、節(jié)目主持人、秘書……這些職業(yè),也出現(xiàn)在了前25名中。
當然,不能忘記排名第25的計算機程序設計員,平均來說,程序員有75%的工作內容,面臨被AI替代的風險。
AI替代率最低的職業(yè)主要是各種制造業(yè)相關藍領人員。這并不意外,因為我們讓GPT評分標注時扮演的角色就是“大型語言模型替代勞動力評估師”,它自然無法評估可能被其他機器所替代的職業(yè)。但仍然有幾個制造業(yè)工人以外的人員值得注意——綠化工、保潔員、洗衣師、按摩師、美甲師、中式面點師……看起來并不需要太高學歷、工資也不算最高的這些職業(yè),反而成了最難被AI替代的職業(yè)。
在OpenAI的那篇工作論文中,研究者發(fā)現(xiàn)了穩(wěn)定的正相關關系——工資越高的職業(yè),被GPT們替代的可能性越高。這個趨勢在年收入大于10萬美元的職業(yè)之后才區(qū)域相反,見下圖。
![]() |
那么中國的情況呢?請看下圖:
![]() |
可以看到,美國的現(xiàn)象在中國似乎并未出現(xiàn)。職業(yè)的工資高低和職業(yè)的AI替代率之間并不存在顯著的正相關關系。
但是,正如上一篇文章中提到的,對于每一個職業(yè),當前的工資只是一部分內容,更重要的是從業(yè)年限增長率。一些工作可能入職時工資更低,但隨著工資年限上升卻有更高的上升空間,從而有更高的十年總收入。
那么,從業(yè)年限的工資增長率和每個職業(yè)的AI替代率之間存在什么關系?可見下圖:
![]() |
可以看到,各職業(yè)的AI替代率,確實和每個職業(yè)的年限工資增長率有著非常顯著的關系,兩者之間存在正相關的顯著性水平在0.001以下。如果我們將上圖改為分段柱狀圖,我們將可以看到更明顯的趨勢。請看下圖:
![]() |
從上圖可以看到,每增加一年從業(yè)年限工資增長最慢,低于8%的職業(yè),相對最不容易被AI替代的。但如果一個職業(yè)每工作一年工資增長超過20%,被AI替代的可能性平均將大于60%。
這個趨勢,說明的是在本輪大語言模型和其衍生出來的相關AI的一個顯著特征,那就是:
人們在一個行業(yè)上積累的經(jīng)驗、學到的技巧、掌握的訣竅,一方面使這些職業(yè)看起來有更強的“成長性”,但另一方面也是被大語言模型首先替代掉的東西。
反過來,那些不需要精深學習就能掌握的人類能力,反而成了不會被AI替代掉的技能。
為什么AI替代掉的是這些?我們?yōu)槭裁词俏覀儯?/p>
各種工作中被AI替代掉的,為什么是上文的這些?
第一種可能,是因為那些學習、工作后能積累更多經(jīng)驗,更快提高生產(chǎn)率的職業(yè),本身勞動力成本更高,因此更促使人們去找到能替代這類勞動力的AI,給這樣的AI產(chǎn)品更大的投資,因此這些職業(yè)就成了第一批犧牲品。
這樣的說法有一定道理,但我們也能找到很多反例,例如自動駕駛。駕駛這個技能,人們學習幾個小時至多十幾個小時就能掌握;另一方面,自動駕駛方面的投資在領域內數(shù)一數(shù)二,但目前的效果距離全路況自動駕駛依然有很長一段距離。
反過來,一些生物、化學方面的技能,化合物尋找、蛋白質折疊,或者是在實驗流程上的全自動化,這些人們需要數(shù)年專業(yè)訓練才能掌握的知識,盡管資本的介入比起自動駕駛只能算九牛一毛,卻已經(jīng)有了非常不錯的替代AI。
從這點看,勞動力價格更貴——吸引更多投資——替代性AI更容易出現(xiàn)的邏輯似乎并不完全正確。
那么,我們不得不考慮第二種可能——人類通過后天的實踐學習知識、積累經(jīng)驗和訣竅的技能,AI確實已經(jīng)實現(xiàn)甚至完成了超越。
是的,不是單個技能,也不是一組技能,而是那種通過艱苦的學習實踐來獲取知識、積累經(jīng)驗的技能,人類已經(jīng)落后于AI。那些高成長性的職業(yè),不管現(xiàn)在是否還處在安全區(qū),出現(xiàn)替代AI,也許就是這幾年,甚至幾個月之內的事。
到頭來,那些人類孩提時期甚至出生時就已經(jīng)掌握的技能,那些精巧的人類生物學本能,似乎反而是AI最難模仿和替代的部分。
而那些后天學習到的知識,花上好長時間學會算術、學會寫作,學會畫畫,學會編程、學會做好看的ppt、學會看X光片、學會寫法律文書,學會很多種語言并且自如地交流……人類學會了各種各樣以此為傲的東西,并覺得這些特征似乎使人類和其他生物產(chǎn)生了哲學上的差異。
但在AI看來,這些東西一文不值。
本文轉自于 財新網(wǎng)