黃土高原的縣城里,一群全職寶媽成了AI訓練師
在一塊電腦屏幕前,她想象2000公里外的大自然。“將來有沒有機會我也去那看看?”?
做了數(shù)據(jù)標注員后,她說自己學到了不少東西。“我做過一次旅游相關(guān)的業(yè)務(wù),標注景區(qū)的不同級別、類型等,對這種不太懂的領(lǐng)域,我們經(jīng)常要去查關(guān)鍵詞到底是什么意思。我搜索過西雙版納、玉龍雪山的景區(qū)資料,很美。”在一塊電腦屏幕前,她想象2000公里外的大自然。“將來有沒有機會我也去那看看?”
記者 | 李曉潔
電腦屏幕上在播放一則短視頻,球星內(nèi)馬爾穿著黃色的巴西隊服正帶球過人。視頻右側(cè)是一些選擇題,內(nèi)馬爾、梅西、世界杯等詞匯下方有幾個選項:強相關(guān)、弱相關(guān)、不相關(guān)。屏幕前的員工戴著耳機,判斷視頻內(nèi)容與詞匯的相關(guān)度:出現(xiàn)了內(nèi)馬爾,選強相關(guān);沒出現(xiàn)梅西,選不相關(guān);至于什么是弱相關(guān),有時需要員工自己判斷。選中相關(guān)度后提交到系統(tǒng),這就算是完成了一條標注工作。速度快的員工,一天能標注1000多條類似的視頻。
在山西省臨汾市永和縣的愛豆科技有限公司,有158個數(shù)據(jù)標注工在從事類似的工作。一排排黑色電腦前,有人框定圖片里出現(xiàn)的所有飲品,有人給一張張圖片歸類,有人查詢某家商鋪是否還在經(jīng)營,并標注是否為“死店”……這樣的數(shù)據(jù)標注工作,在2020年3月正式成為國家職業(yè)分類目錄中的一個新職業(yè)——AI訓練師(人工智能訓練師)。其中,數(shù)據(jù)標注員、人工智能算法測試員是AI訓練師職業(yè)下的兩個工種。
王麗娜是公司158個數(shù)據(jù)標注員之一,工作兩年半后,她成為項目經(jīng)理。她對數(shù)據(jù)標注員的理解,從一開始“操作電腦的”,變?yōu)楝F(xiàn)在“人工智能產(chǎn)品的數(shù)據(jù)訓練師”。她舉了個例子,“比如一個機器人要識別水果種類,就要有人在前期大量的水果圖片數(shù)據(jù)中,標注出什么是蘋果什么是梨。無人駕駛需要讓汽車自動識別馬路,也需要人在視頻中將道路框出”。王麗娜熟悉圖片、文字、音視頻的各項標注業(yè)務(wù),但數(shù)據(jù)標注后具體用在哪一個人工智能產(chǎn)品?她說不上來。因為標注業(yè)務(wù)的保密性,她和100多名員工一樣,“只能猜出個大概”。她記得有段時間,接到的業(yè)務(wù)是識別、標注出大量的“福”字。“手寫的、春聯(lián)上的、各種類型的福字,我們就猜產(chǎn)品應(yīng)該是跟支付寶過年‘掃五福’相關(guān),你沒發(fā)現(xiàn)這幾年用手機掃福后,反應(yīng)速度都快了點嗎?”

公司員工超過80%為女性,大部分是年輕“寶媽”。項目經(jīng)理王麗娜覺得,“寶媽”員工更穩(wěn)定,流失率低
靠著這種猜測,王麗娜經(jīng)常覺得,生活中使用的智能語音產(chǎn)品、短視頻平臺的推薦功能等,都跟自己的標注工作有關(guān),這讓她有種模糊的成就感。 甚至最近,她聽說自己做的數(shù)據(jù)標注跟目前行業(yè)內(nèi)最智能的AI產(chǎn)品ChatGPT——一款智能聊天產(chǎn)品——也有關(guān)聯(lián)。只是她說不清具體有什么關(guān)聯(lián),“應(yīng)該是都需要數(shù)據(jù)標注吧?”
是的,ChatGPT也需要數(shù)據(jù)標注。 胡希塔是一家數(shù)據(jù)標注平臺公司的創(chuàng)始人,關(guān)注數(shù)據(jù)標注行業(yè)多年。他告訴本刊記者:“人工標注數(shù)據(jù)是繞不開的步驟,ChatGPT和很多人工智能產(chǎn)品研發(fā)的流程相似,前期都需要大量的數(shù)據(jù)采集與標注,只不過ChatGPT更注重的是文本標注,之后再進行數(shù)據(jù)處理、模型訓練等流程。它跟國內(nèi)現(xiàn)有的智能聊天產(chǎn)品的區(qū)別,主要在于算法模型訓練,研發(fā)人員更注重ChatGPT的自主強化學習能力,所以很大一部分數(shù)據(jù)未經(jīng)標注就投進模型,等待它生成結(jié)果后再多次訓練和調(diào)整。”根據(jù)公開資料,ChatGPT前期使用的數(shù)據(jù)來源于互聯(lián)網(wǎng)文本、公開的數(shù)據(jù)集、各種百科資料等,包含幾十億個文本文檔。
王麗娜從事的就是這類人工智能產(chǎn)品鏈條上最前端的工作,雖然他們工作的地點在一個看起來和人工智能完全搭不上邊的偏僻貧困縣城。作為曾經(jīng)的國家扶貧開發(fā)重點縣,永和縣直到2020年初才完成脫貧??h城與陜西省交界,地處呂梁山脈南端,距離臨汾市200多公里,駕車需要至少兩個半小時。“到了永和,就到山溝溝了。”這是當?shù)厮緳C常掛在嘴邊的話。一位司機說,位于黃土高坡上的永和縣交通條件不好,2018年才開通去往太原市的高速路,再往前數(shù)幾年,永和到臨汾市的高速才完工。更早的時候,過年前遇到大雪、不能開車,在外打工的年輕人都沒法回家。

永和縣四面環(huán)山,居民大多住在自建的平房和石窯洞里,縣里近幾年才開始建小區(qū)樓
交通條件差,影響著縣城的經(jīng)濟和就業(yè),沒有多少工作機會,很多勞動力去臨汾、太原打工。一位接近政府機關(guān)的工作人員告訴本刊記者,雖然當?shù)貙ν饨榻B縣域常住人口4萬多,但新冠肺炎疫情時期,全民核酸數(shù)據(jù)顯示常住人口不足3萬??h里也沒有什么資源,2015年才探測出天然氣,幾個氣站分散在縣城外幾十公里,慢慢吸納了近千名勞動力,成為當?shù)刈畲蟮钠髽I(yè)。女性的就業(yè)選擇更少,除了公務(wù)員、老師,就是服務(wù)員、售貨員。王麗娜記得,八九年前,縣城看上去還是“平平的”,沒有一棟像樣的商品樓,2019年底,她家才住進縣城建好的第一棟小區(qū)。
現(xiàn)在,四面環(huán)繞著黃土山的縣城雖然還是很小,但比四五年前“繁榮”了一些,這里建好了七八個十多層高的小區(qū),城中心有條一公里多長的主街,主街上開了家飲品店,每到周末,中小學生能把店里的冰淇淋買光。本刊記者到達的時候,正月還沒過去,主街兩邊行道樹上纏著的燈帶還沒取下,到了晚上,彩燈亮起來,透出一股小城的喜慶蓬勃。
愛豆科技有限公司就在主街的盡頭,再往前走100多米,一幢四層小樓的下兩層是公司的辦公區(qū)。2019年,螞蟻集團與中國婦女基金會等組織發(fā)起了數(shù)字產(chǎn)業(yè)扶貧項目,在國家衛(wèi)健委的協(xié)調(diào)下,永和縣成為該項目在欠發(fā)達縣城的第二批試點。2020年8月,這家山區(qū)里的數(shù)據(jù)標注公司成立。
這個數(shù)字產(chǎn)業(yè)扶貧項目的總監(jiān)黃慶委告訴本刊記者,他們在項目發(fā)起前做過調(diào)研,發(fā)現(xiàn)農(nóng)村主要人口構(gòu)成是兒童、婦女和老人,其中婦女是農(nóng)村占比最大的勞動人群。在呂梁山區(qū)的五個數(shù)字標注基地里,所有基地都是女性員工占多數(shù)。但永和縣的女性員工占比最多,超過80%。黃慶委覺得,這跟縣城本身的經(jīng)濟狀況有關(guān)。“永和縣面積小、就業(yè)機會少,男性勞動力大多外出謀生。”
2月下旬,在永和縣的兩層辦公樓里,本刊記者看到數(shù)據(jù)標注員多為年輕婦女,她們稱自己為“寶媽”。辦公區(qū)設(shè)計也盡量為女性設(shè)想,在一個休閑區(qū)的角落,柜子上放了衛(wèi)生巾、紅糖、暖寶寶等免費用品,二樓的洗手間還有熱水。
白丁轉(zhuǎn)是這群“寶媽”之一,也是公司成立后招入的第一批員工。她今年32歲,女兒剛上幼兒園小班。她有個大臉盤,大眼睛,化了淡妝后,雙頰還能看到密密的斑點。辦公室里,她用手指在白墻壁上畫出一個個框,試圖解釋清楚電腦上的圖片標注步驟。她的手指有點粗,手面皮膚黑黑的,堆出了皺紋,這是她過去在鄉(xiāng)村、在家庭中勞作的痕跡。
成為數(shù)據(jù)標注員之前,白丁轉(zhuǎn)將近六年沒接觸過工作,其中大約三年在做家庭主婦。說起以前的生活,尤其是生完孩子后的生活,她偶爾噘起嘴唇,眼睛濕漉漉的,表示自己的不滿。“那會兒真的累,不只是要帶孩子,家里洗洗刷刷,所有家務(wù)我一個人包。抱著孩子蒸饅頭、做家務(wù),胳膊酸得抬不起來,還要在老公到家前把飯做好,比打工還辛苦。”她的丈夫在縣城做裝潢,工作不固定,經(jīng)常干三天歇兩天,即使這樣,丈夫也不會分擔家務(wù)。她解釋說,丈夫是家里唯一的兒子,“從小沒干過家務(wù)”。她也不放心把嬰兒交給他看管。
有段時間,她覺得自己“很壓抑,脾氣很差,看什么都不順眼”。一扇門沒關(guān)緊,一句話沒說好,她就想對丈夫發(fā)火。她不知道自己怎么了,也不知道有“產(chǎn)后抑郁”這個詞。她只能把原因歸結(jié)于經(jīng)濟狀況:丈夫生意一般,自己沒有收入,經(jīng)濟拮據(jù),她想買套好點的護膚品、想給爸媽買點東西都要猶豫。不是沒看過工作,縣城里只有服務(wù)員比較合適,但服務(wù)員工作時間長,沒有雙休,而她的孩子還沒斷奶。種種不順,讓她開始懷念過去,以前的她脾氣很好,幾乎不與人爭吵,更重要的是,以前她有工作。
白丁轉(zhuǎn)的家在縣城邊上的山腳下,是兩層自建的平房。她入職一年多后,成為辦公室一個31人小組的組長
雖然第一份工作只有短暫的半年,白丁轉(zhuǎn)還是能回憶起不少細節(jié)。那是她第一次離開鄉(xiāng)村,去“大城市”蘇州做電子廠的流水線女工。做女工前,她是家里五個兄妹中的“老三”,有兩個姐姐、兩個弟弟,再加上爺爺奶奶,一家九口人住在村里兩孔土窯洞里,父母靠在黃土高坡上種的40畝玉米、谷子和高粱養(yǎng)活九口人。白丁轉(zhuǎn)跟兩個姐姐一樣,讀到高中后輟學,省錢給兩個成績更好點的弟弟讀書。盡管她自己成績中上,對大學也有期待,但她“很懂事地選了打工”。
到蘇州的第一個不同是講普通話。以前只在電視節(jié)目、語文書本這兩個場景中出現(xiàn)的普通話,開始需要白丁轉(zhuǎn)自己主動說。這個倒也好克服,她最不習慣的是飲食,“整天吃米飯,面條很細很軟”。剛?cè)ヌK州一個多月,她瘦了十多斤,臉上長滿了青春痘。
也有美好的回憶。比如周末,她和三四個同鄉(xiāng)同學(后來同為廠區(qū)女工)去逛園林,穿古裝拍了些照片。她還記得當時在路邊遇到拿碗乞討的乞丐,幾個女孩掏出硬幣,之后乞丐頻頻經(jīng)過她們,她們給了好幾次一塊錢。“當時就覺得自己能掙錢,乞丐比我們可憐多了。”白丁轉(zhuǎn)說,在電子廠包吃住,每月工資不到2000塊,還有雙休,不算特別辛苦。但第一次離家的她太不適應(yīng)南方的氣候和飲食,臨近年關(guān),她尤其想家,最后跟幾個同鄉(xiāng)一起辭職,提前回了老家。
第二份工作,白丁轉(zhuǎn)沒有離家太遠。她去太原學習兒童攝影,因為二姐也在太原,倆人能有個照應(yīng)。這一次,白丁轉(zhuǎn)從學徒到店長,一共在這家店工作了四年。她穩(wěn)定地工作,每個月工資不到3000塊,可以給正上學的弟弟補貼生活費。但工作到第四年,白丁轉(zhuǎn)的奶奶得了癡呆,如果沒人隨時看著,很容易在山里到處亂走,遇到危險。當時她兩個姐姐已經(jīng)出嫁,弟弟們還在讀書,爸媽農(nóng)活閑不下。“我從小跟奶奶感情好,就主動辭職回家照顧老人。”白丁轉(zhuǎn)說。
從那之后,白丁轉(zhuǎn)遠離了工作。村里沒有工作機會,窯洞里連手機信號都時有時無,她沒別的事兒干,就在照顧奶奶的同時擔負起所有家務(wù)。一年多后奶奶去世,“人家說我歲數(shù)也不小了,經(jīng)過介紹,認識了附近村的老公。”之后,她按部就班地結(jié)婚、懷孕生子,做家庭主婦,為家庭經(jīng)濟、育兒和夫妻關(guān)系焦慮。
白丁轉(zhuǎn)脫離工作、成為家庭婦女的經(jīng)歷,也是縣城大部分女性的縮影。 回歸家庭,成了很多女性的命運。多位女性數(shù)據(jù)標注員告訴本刊記者,她們回到縣城的最大原因是“結(jié)婚生子”,她們大都做過幾年家庭主婦,即使家中有老人幫忙帶孩子,但縣城本身很小、工作機會不多,也只能待在家里。一部分嫁到外地的女性,就在外地做家庭主婦。白丁轉(zhuǎn)說,在家里待久了,她偶爾會心慌,覺得自己一點進步也沒有,她“強烈地想要工作”。直到2020年7月,跟很多女性一樣,她在手機朋友圈看到別人轉(zhuǎn)發(fā)的AI訓練師招聘通知。

公司上午11:30開始午休,方便一些女員工中午回去接孩子,關(guān)系近的同事還會到附近的餐館一起吃個飯
縣城里很多年輕婦女被招聘通知上的“雙休”“辦公室工作”幾個條件吸引,白丁轉(zhuǎn)也一樣。她做兒童攝影時有電腦操作基礎(chǔ),打算去面試。當時女兒即將一周歲,還沒斷奶,家人以為她“不想帶孩子”。但她這次很堅定,推著嬰兒車就去縣城廣場上報名。通過初試后,她進行十天的數(shù)據(jù)標注培訓,期間把女兒交給丈夫帶,“女兒從沙發(fā)上掉下來至少兩次”。
2020年8月3日,白丁轉(zhuǎn)到現(xiàn)在還能清楚記得自己的入職時間。那一天,她成了一名有工作的人。在這前兩天,收到復試通過后的消息,她立馬打電話給婆婆,把女兒托付給30公里外住在農(nóng)村的公婆。她還買了輛電動摩托車,一是通勤用,更重要的作用是每周五下午6點下班后,她可以騎上電動摩托回村看女兒,周日晚上再回縣城。就這樣,她從第一批約120人的報名者里留下,成了19名正式的數(shù)據(jù)標注員之一。
白丁轉(zhuǎn)和同事們進入數(shù)據(jù)標注行業(yè)時,已經(jīng)過了行業(yè)發(fā)展的第一個爆發(fā)期。丁威在2017年底成立了自己的數(shù)據(jù)標注公司,過去五年多,他看見行業(yè)內(nèi)“一波又一波公司涌入”,又因為各種原因倒閉,如今,他的公司還保留100多個數(shù)據(jù)標注員,他覺得自己在行業(yè)內(nèi)“算好的了。”
往前看,數(shù)據(jù)標注成為一門行業(yè)的時間并不長。丁威告訴本刊記者,數(shù)據(jù)標注的起步期可以追溯到2012年。那一年,華裔科學家李飛飛團隊組織了第三屆ImageNet競賽——衡量哪些算法能以最低的錯誤率識別ImageNet數(shù)據(jù)集圖像中的物體。比賽的冠軍團隊提交了一個卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)(英文簡稱為CNN),這一架構(gòu)使圖像識別準確率大幅提升。到今天,國內(nèi)外各大社交網(wǎng)絡(luò)平臺、無人駕駛等幾乎任何識別圖像和視頻的系統(tǒng)都使用卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)。所以,把人工智能的繁榮歸功于2012年ImageNet競賽結(jié)果的公布——這幾乎是業(yè)內(nèi)的共識。也是這一年起,人工智能具備了走出實驗室,走向市場的能力。
在國內(nèi),頭部的互聯(lián)網(wǎng)公司也開始基于CNN技術(shù)建立屬于自己的數(shù)據(jù)集,并進行數(shù)據(jù)標注。2016年,谷歌研發(fā)的深度學習人工智能產(chǎn)品AlphaGo 3∶0戰(zhàn)勝世界頂級圍棋手李世石。人工智能產(chǎn)品在一項極度需要腦力、耐力的比賽中獲勝,比四年前的ImageNet競賽引發(fā)更大反響。國內(nèi)的互聯(lián)網(wǎng)公司迫不及待要推出同類產(chǎn)品,數(shù)據(jù)標注行業(yè)迎來了“風口期”。丁威記得,當時各種資本涌入市場,甚至出現(xiàn)很多公司找不到一家合適的數(shù)據(jù)標注企業(yè)的情況。
之后,數(shù)據(jù)標注行業(yè)經(jīng)歷了一段“粗放期”。當時數(shù)據(jù)標注工作的質(zhì)量要求不高,對圖片進行重復框定就能實現(xiàn)項目需求,一張圖的價格不過幾分錢,全靠數(shù)量獲取微薄利潤。丁威在這一時期進入行業(yè),“慢慢摸索”成立了自己的公司。丁威說,他剛好趕上2017~2019年行業(yè)的爆發(fā)期,他公司的數(shù)據(jù)標注工從10多個擴展到最多時的四五百個。“那段時間也是我壓力最大的時候,天天擔心有業(yè)務(wù)沒人做,或者有人沒業(yè)務(wù)做,特別不穩(wěn)定。”也是在2018年,百度在山西太原落地了第一座人工智能數(shù)據(jù)標注產(chǎn)業(yè)基地,現(xiàn)在擁有超過5000名數(shù)據(jù)標注師。
一位同樣在2017年入行的數(shù)據(jù)公司創(chuàng)始人胡希塔告訴本刊記者,數(shù)據(jù)標注業(yè)務(wù)涵蓋了語音、圖像、視頻、文本四種主流的類型,行業(yè)爆發(fā)期那幾年,自動駕駛業(yè)務(wù)也進入,為行業(yè)帶去了更多業(yè)務(wù)量。“自動駕駛對數(shù)據(jù)標注的需求量更大,因為它要求接近100%的精準度。”胡希塔說,大部分人工智能產(chǎn)品對模型精準度的要求都高于90%,但當精準度想從90%提升到95%,或者從95%再往上提升一點時,對背后數(shù)據(jù)量的要求可能是百萬甚至千萬級。“精準度要求越高,需要的數(shù)據(jù)量成倍增加,意味著數(shù)據(jù)標注數(shù)量同樣加倍。”
也是那幾年,丁威看到無數(shù)個數(shù)據(jù)標注公司像潮水一樣涌入,很快又退去。“一般來說,做得不好的數(shù)據(jù)標注公司熬不過頭一年。”丁威解釋,當時正處于行業(yè)的不穩(wěn)定期,公司業(yè)務(wù)可能上個月是波峰,下個月就到了波谷,“波谷時養(yǎng)不起員工,很多公司賠不起錢,就倒閉了”。他總結(jié),培養(yǎng)一個成熟的數(shù)據(jù)標注工大概需要3~5個月,很多數(shù)據(jù)公司的員工沒有底薪,丁威就給自己團隊的員工支付前三個月的保底工資,等員工熟悉業(yè)務(wù)后再“自給自足”。另外,丁威也不僅僅依附于某一家互聯(lián)網(wǎng)公司,而是接不同平臺、不同類型的業(yè)務(wù),鍛煉員工的標注技能??窟@種方式,他的公司到現(xiàn)在還有多位員工是2017年公司初創(chuàng)時就加入的。
但到了2020年初,新冠肺炎疫情暴發(fā)后,丁威感覺行業(yè)受到了不小的影響。他了解到一家無人駕駛公司,在2022年消減了80%的數(shù)據(jù)標注業(yè)務(wù);另一家公司,上千萬的訂單取消了。“很多公司勒緊褲腰帶,減少標注業(yè)務(wù),造成我們也沒錢賺了。”另外,丁威覺得行業(yè)內(nèi)還有個問題是“賬期太長”,“我們把活兒干完了,開完發(fā)票等著到賬,有時候一等就是半年、一年,你起訴公司也沒辦法,我現(xiàn)在外面還飄著不少賬”。這讓一些規(guī)模更小、業(yè)務(wù)更散,同時抗風險能力更差的公司很難長久生存下去。這兩年,丁威發(fā)現(xiàn)新進入行業(yè)的小規(guī)模數(shù)據(jù)標注公司也變少了。原先存在的小公司則“學會抱團、共享業(yè)務(wù)了”。“對小企業(yè)來說,這也算是個趨勢,不然它接不了大單子,很難生存。”
跟丁威的感受不太一樣,永和縣愛豆科技有限公司的總經(jīng)理李林峰告訴本刊記者,公司沒受到太多疫情影響,因為公司本身起源于扶貧項目,有公益性質(zhì),所以縣政府免費提供了辦公場地,螞蟻公益基金會也在公司剛成立時,提供了幾個月的“員工成長期”資金支持。
過去三年,他們接到的業(yè)務(wù)訂單比較穩(wěn)定,大多來自螞蟻集團內(nèi)部,或者集團作為樞紐,為這些縣級小企業(yè)引入其他公司的業(yè)務(wù)。“總體上,我們的業(yè)務(wù)量不斷增加,去年11月拓展出一個無人駕駛項目部,現(xiàn)在有五六十人。標注業(yè)務(wù)的難度也在上升。”李林峰說,疫情對公司的影響,是2022年春上海疫情暴發(fā),上海是國內(nèi)最大的數(shù)據(jù)庫所在地之一,封城影響數(shù)據(jù)采集、業(yè)務(wù)交接等一系列流程,那段時間公司的業(yè)務(wù)變少,他就安排員工調(diào)休。另一次,是去年11月疫情放開前,全國各地新增感染病例,永和縣也封了城。“員工簽了保密協(xié)議,把電腦搬回自己家辦公。”兩周后,疫情管控放開,員工再把電腦搬回辦公室。
說起業(yè)務(wù)量變化,白丁轉(zhuǎn)也有體會,工資是最直觀的體現(xiàn)。 2021年11月,工作一年多后的白丁轉(zhuǎn)升為辦公室小組長,她所在的小組有31人,去年11月,小組人均工資第一次超過4000元。放在三年前剛?cè)肼殨r,她都沒敢想這個數(shù)字。數(shù)據(jù)標注行業(yè)很少有底薪,基本是計件工資,她記得自己第一個月業(yè)務(wù)不熟練,收入1700元,“已經(jīng)很滿意了,有雙休,還能坐在辦公室吹空調(diào)”。往后,她收入偶爾超過5000元,還開玩笑說,“也是能交稅的水平了”。
第一次,白丁轉(zhuǎn)成了小家庭里的經(jīng)濟支柱。 三年疫情,做裝潢的丈夫業(yè)務(wù)變動大,賬期長,總體收入不高,家里花銷的大頭是白丁轉(zhuǎn)負責。她發(fā)現(xiàn)夫妻二人地位漸漸平等,因為丈夫會在她工作忙的時候做飯、做家務(wù)了。去年夏天,女兒回縣城上幼兒園后,跟爸爸的相處時間更多,不像小時候那樣完全黏著她,父女關(guān)系也親近了點。跟白丁轉(zhuǎn)一樣,公司里不少年輕婦女成了家里的“頂梁柱”,一些員工家里的烘焙店、早餐店因疫情倒閉后,也只能靠妻子的收入支撐。
不只是家庭關(guān)系,她和同事們也變得“更關(guān)注自己”。 她告訴我,辦公室有許多寶媽,以前做家庭主婦,“在家可能一個星期都不用護膚品,隨便洗把臉就好”。有了工作后,同事閑下來經(jīng)常討論化妝、購物等話題,她們又開始描眉毛、染頭發(fā),買新衣。永和縣城內(nèi)沒有公園和景點可休閑,周末或者節(jié)假日,關(guān)系好的同事約著一起去二三十公里外的黃河灣邊野餐。滿目的黃土里,露出幾塊彩色的野餐墊和墊子上的草莓。
更重要的是,這群女性通過數(shù)據(jù)標注,覺得自己和更大的世界產(chǎn)生了關(guān)聯(lián)。 白丁轉(zhuǎn)現(xiàn)在還記得當年在流水線上的工作——坐在履帶旁、給一塊板子的固定位置插上電阻。她模仿當時的工作狀態(tài),手指在桌面上啄了幾下,“沒有任何可以發(fā)揮想象的空間,上廁所還要報備、請同事幫你照看著板子,很枯燥”。做了數(shù)據(jù)標注員后,她說自己學到了不少東西。“我做過一次旅游相關(guān)的業(yè)務(wù),標注景區(qū)的不同級別、類型等,對這種不太懂的領(lǐng)域,我們經(jīng)常要去查關(guān)鍵詞到底是什么意思。我搜索過西雙版納、玉龍雪山的景區(qū)資料,很美。”在一塊電腦屏幕前,她想象2000公里外的大自然。“將來有沒有機會我也去那兒看看?”
說起未來,永和縣很多數(shù)據(jù)標注員都很樂觀。公司的無人駕駛項目組,標注技術(shù)更復雜,最近一直在面試,吸引了好幾個本科學歷員工。人多了,辦公區(qū)場地不夠,二樓的經(jīng)理辦公室里擠著放進了財務(wù)、項目經(jīng)理的工位,李林峰跟政府協(xié)調(diào),希望有更大的場地。員工們覺得這些都是好事兒,說明公司正往好的方向發(fā)展,她們本身也吸引了不少親友來做數(shù)據(jù)標注。去年,高中學歷的王麗娜還跟幾個同事報名、上網(wǎng)課,獲得了函授大專學歷。
根據(jù)國際數(shù)據(jù)公司IDC發(fā)布的2021年《中國人工智能基礎(chǔ)數(shù)據(jù)服務(wù)市場研究報告》預測,國內(nèi)2025年市場規(guī)模將突破120億元。丁威也看到這個數(shù)據(jù),但他覺得扶貧性質(zhì)的數(shù)據(jù)標注企業(yè)未來并不是一片樂觀。
“集團不可能一直養(yǎng)著你,給你業(yè)務(wù),而且如果業(yè)務(wù)太過單一,離開集團后,這些公司如何增加市場競爭力?”丁威說,目前行業(yè)內(nèi)越簡單的標注業(yè)務(wù)利潤越薄,比如圖片、中文語音標注等等,已經(jīng)在前期有了大量標注基礎(chǔ),越往后需要的標注量越少。“市場競爭力跟員工的技能有關(guān),現(xiàn)在數(shù)據(jù)標注的發(fā)展方向也有了門檻。比如醫(yī)療類的標注需要基礎(chǔ)的病灶分析,有的業(yè)務(wù)方提要求,必須醫(yī)學碩士去做。語音標注也開始要求多語種,這些標注門檻都在變高。而掛靠于某一集團的數(shù)據(jù)標注公司依賴性太強,對市場的敏銳度也不夠,被淘汰的風險更大。”丁威說。
李林峰不是沒有這一層隱憂,前幾天,無人駕駛項目組里有幾個員工離職,“去大城市賺錢”。他打算今年自己也多走出大山,跟東部一些市場化的數(shù)據(jù)標注公司學習,盡量拓展集團外的業(yè)務(wù)。
他知道公司的基層員工要求不高,只希望手里有活兒。就像現(xiàn)在,雖然是周末,公司一樓的辦公區(qū)還有七八個女性在加班。她們大多化了妝,涂了口紅,在電腦屏幕前快速移送鼠標、敲擊鍵盤。屏幕上的圖片、視頻一個個閃過,讓人看著眼花。
(本文刊載于應(yīng)受訪對象要求,文中丁威為化名)
本文轉(zhuǎn)自于 三聯(lián)生活周刊
以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“才匯云網(wǎng)”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。