文|華商韜略 張靜波
美國好萊塢,16萬人宣布集體罷工,抗議AI入侵……
但與此同時,萬里之外的黃土高原上,很多沒念過大學的女人,卻因為AI找到了工作,改變了人生。
01 他們在喂養(yǎng)AI
陜西清澗,地處黃土高原。
過去,這里的特產(chǎn)只有紅棗。但近年來,隨著氣候變化,紅棗減產(chǎn),很多年輕人背井離鄉(xiāng),到外地謀生。
30歲的曹亞麗,卻屬于少有的逆行者。
2019年,因為家庭變故,她從西安回到清澗老家。但小縣城不好找工作,曹亞麗在家閑了一年多,非常焦慮。
直到2020年,一家叫清澗愛豆的公司,改變了她的命運。
《南風窗》雜志記者,通過走訪,記錄下了曹亞麗的故事。
在清澗愛豆,曹亞麗成了一名AI數(shù)據(jù)標注員。
她和同事每天的工作,就是通過畫框、貼標簽、排序、找不同等方式,為文字、圖像、視頻等做標注。
正是靠她們的辛勤工作,給AI喂養(yǎng)了大量的數(shù)據(jù),AI大模型才越來越聰明。
盡管這份工作并不輕松,平均每天要看3萬張圖。但一想到,從此告別面朝黃土背朝天的生活,曹亞麗還是很興奮。
“鼠標一點都是錢啊?!?/p>
與曹亞麗相比,34歲的王慧之所以選擇這份工作,更多是厭倦了全職媽媽的身份。
三年前,她還是一位全職媽媽,全身心撲在孩子上。這樣的生活,雖然也不錯,但總感覺缺點什么。
一次偶然的機會,王慧在朋友圈看到了清澗愛豆的招聘廣告,心動了。
“數(shù)據(jù)標注師是弄啥的?以前都沒聽說過?!睂τ谠诩依锎硕嗄甑耐趸鄱裕约哼€能不能出去工作,都是個問號,更別提這么新潮的工種。
但經(jīng)過培訓,加上自身努力,她很快就上手了。
“原來總覺得生活很難再有變化,現(xiàn)在我明白了,只要抓住機會,未來還有多種可能?!?/p>
不止曹亞麗、王慧,也不止陜西清澗。
近年來,隨著AI大爆發(fā),對數(shù)據(jù)標注員的需求激增。在山西、貴州……全國許多地方也都增加了這個新職業(yè),從業(yè)者眾多。
在互聯(lián)網(wǎng)大廠中,僅字節(jié)跳動在濟南、天津、武漢的數(shù)據(jù)標注員,就多達4萬人。
如果再加上第三方數(shù)據(jù)標注服務公司,比如全國最大的Testin云測,以及前面提到清澗愛豆等,從業(yè)者總數(shù)更是驚人。
據(jù)《科技日報》報道,僅北京一地,就有100多家從事數(shù)據(jù)標注的公司,全國從事這項工作的人可能超過千萬。
AI不但改變了很多人的命運,也在改變著中西部地區(qū)的經(jīng)濟面貌。
陜西清澗是著名的革命老區(qū)。
但受限于地理環(huán)境,這里的經(jīng)濟一直不太理想,期間曾嘗試過養(yǎng)豬、種果樹、畜牧業(yè)等很多產(chǎn)業(yè)。
“人們能想到的農(nóng)村能干的,我們縣都干過,幾乎都失敗了?!?/p>
相比之下,AI數(shù)據(jù)標注,成為少有在這里成功立足的產(chǎn)業(yè)。如今,清澗愛豆已成為當?shù)刈畲蟮挠霉て髽I(yè)。
重慶奉節(jié),是“朝辭白帝彩云間,千里江陵一日還”的白帝城所在地,也是李白、杜甫、白居易、蘇軾、蘇轍等上千詩人或旅居,或做官,留下上萬首詩篇的三峽門戶。
這里擁有如詩如畫的壯美與秀美山川,但卻長期現(xiàn)代化產(chǎn)業(yè)企業(yè)缺位,并且戴了多年的貧困縣帽子。
一個工廠都沒幾座的地方,引入百度、京東這類浪潮之巔的企業(yè),這在過去是想都不敢想的。但新一屆縣委、縣政府領導,目光敏銳,大膽想象,小心求證,決定在數(shù)字經(jīng)濟浪潮找到一席之地,并迎來百度、京東、網(wǎng)易等數(shù)字化企業(yè),融入了信息工業(yè)與數(shù)字經(jīng)濟時代。
其中的百度智能云數(shù)據(jù)產(chǎn)業(yè)基地,同樣在上演著寶媽成為數(shù)據(jù)標注師的故事,并在短短一年發(fā)展到超過500人的規(guī)模,成為當?shù)鼐蜆I(yè)新增長極。
02 AI背后,是大量的人工
人工智能,在很多人的潛意識里,意味著智能取代人工,以及大量的失業(yè)。
但鮮為人知的是,AI的背后,離不開大量無名英雄的喂養(yǎng),他們就是數(shù)據(jù)標注員。
為什么AI需要數(shù)據(jù)喂養(yǎng)呢?這涉及機器學習和人的區(qū)別。
我們知道,人有舉一反三的能力。舉個例子,我們看到一只貓,就能識別出它是貓,甚至是什么種類的貓。
但機器不一樣,它需要舉三反一,通過大量的數(shù)據(jù)來學習如何識別一只貓。
那么,誰來給AI喂養(yǎng)數(shù)據(jù)呢?答案是數(shù)據(jù)標注員。事實上,當投喂的數(shù)據(jù)質(zhì)量越高,AI就越強大。
因此,業(yè)界流傳著一句話:人工有多強大,智能才有多強大。
2005年,當人工智能還處在萌芽狀態(tài)時,業(yè)界大佬朱純松就從美國趕回故鄉(xiāng)湖北鄂州,在那里創(chuàng)辦了蓮花山研究院。
據(jù)說,那里有當時世界上最早的大數(shù)據(jù)標注團隊。
但彼時,數(shù)據(jù)質(zhì)量還未被廣泛關(guān)注,人工智能繼續(xù)沿著算法與模型的路徑,緩慢發(fā)展。直到2012年一個叫 AlexNet的AI模型,在ImageNet挑戰(zhàn)賽中一鳴驚人。
ImageNet是一個大型的數(shù)據(jù)庫,擁有1400萬張已被標注的圖片。
著名華裔計算機科學家李飛飛是該數(shù)據(jù)庫項目的發(fā)起人之一。在那之前,業(yè)內(nèi)普遍的研究方向是模型與算法。
李飛飛另辟蹊徑,從數(shù)據(jù)質(zhì)量入手。
今天,ImageNet已經(jīng)是世界上最大的圖像識別數(shù)據(jù)庫,它催生了2012年新一輪的人工智能浪潮。
在這個數(shù)據(jù)庫背后,是來自160多個國家的近5萬名數(shù)據(jù)標注員,他們足足花了三年時間才把這些圖片全部標注完。
沒有這些被標注的圖片,AI就不可能完成歷史性的一躍。
數(shù)據(jù)標注究竟有多重要?或許可以用業(yè)界流傳的一個故事來說明。
幾年前,在美國,一輛某品牌的自動駕駛汽車,鉆到了大卡車下邊,最終導致車毀人亡的慘劇。
事故調(diào)查顯示,車的攝像系統(tǒng)把白卡車誤認成了白云,原因是:數(shù)據(jù)標注沒有做好!
“我們就像AI的眼睛,帶它看世界,理解世界,快速成長。”對于數(shù)據(jù)標注的重要性,一位從業(yè)者如此形容。
正是成千上萬的數(shù)據(jù)標注員,日復一日地拉框,教會了人工智能理解人類世界。
不過,真正讓數(shù)據(jù)標注火了的,是ChatGPT。
2019年,OpenAI創(chuàng)始人山姆·奧特曼,向微軟提出一個大膽想法:構(gòu)建一個AI系統(tǒng),永遠改變?nèi)祟惻c計算機交互的方式。
這就是今天風靡全球的ChatGPT。
為了打造ChatGPT,OpenAI除了需要微軟大筆的投資支持,用來購買算力,同時還需要解決一個難題:
讓大模型學會識別暴力、仇恨等帶有攻擊性的言論。
這個過程需要大量的人力來給攻擊性言論做標注。于是,OpenAI找到外包公司Sama達成合作。
由OpenAI提供數(shù)據(jù),然后Sama在非洲肯尼亞雇人進行數(shù)據(jù)標注。
盡管Sama的行為,被很多媒體批評為血汗工廠,但數(shù)據(jù)標注卻給當?shù)貛砹舜罅康墓ぷ鳈C會。
今天,在人工智能大爆發(fā)的背景下,Sama儼然成為包括谷歌、微軟和OpenAI在內(nèi),全球許多AI巨頭的秘密武器。
這個過程,也在全球范圍內(nèi),催生了大量新的工作崗位。
03 不要做勒德分子
在人類歷史上,每一輪科技革命,幾乎都伴隨著人們的失業(yè)焦慮。
19世紀,隨著機器在英國工廠得到廣泛應用,大量的熟練工人被迫下崗。其中,一個叫勒德的人,一怒之下,帶領工人打砸機器。
這些人,后來成為被嘲笑的對象,經(jīng)濟學家給他們?nèi)×藗€外號:勒德分子。
法國人巴斯夏,更是無情地嘲諷道:
“你們說新技術(shù)摧毀就業(yè),那技術(shù)倒退是不是能增加財富呢?”
反問完后,巴斯夏還舉了個例子。如果你發(fā)現(xiàn)新的大斧頭太好用了,干脆把所有大斧頭都換成小斧頭,這樣原本一天可以砍斷的樹,就得三天才能砍斷。
這樣就能創(chuàng)造更多就業(yè),就能養(yǎng)活更多的伐木工人嗎?
巴斯夏的嘲諷,對勒德分子一擊致命。
事后,人類社會的發(fā)展,也進一步證明:勒德分子的焦慮,其實是杞人憂天。
機器的普及,不但沒有消滅人類的就業(yè),相反,技術(shù)進步讓人類分工更細密,生產(chǎn)效率越來越高,也需要更多的勞動力。
最新的一個例子是,很多人抱怨,互聯(lián)網(wǎng)電商把實體店鋪擠垮了。
但它同時,也催生了數(shù)量多到過去難以想象的快遞、外賣小哥、網(wǎng)約車司機、程序員等眾多新的崗位。
事實上,今天在中國,快遞員、外賣配送員等新就業(yè)形態(tài)勞動者,多達8400萬人。
AI同樣不例外。
它在取代一些傳統(tǒng)工作崗位的同時,也正在創(chuàng)造大量新的工作崗位。數(shù)據(jù)標注員,只是其中的冰山一角。
未來,社會對圖像識別、算法研究、深度學習等崗位,必然會產(chǎn)生大量需求,這都是人工智能產(chǎn)生的就業(yè)新機會。
這還沒包括因為AI,將被徹底重構(gòu)的千行百業(yè)。
對此,高盛集團曾發(fā)表了一份研究報告《AI對經(jīng)濟增長潛在的巨大影響》。在這份報告里,高盛上來就表明了自己的立場和觀點:
從歷史經(jīng)驗來看,AI取代的工作崗位,將被它創(chuàng)造的新的就業(yè)機會抵消!
然而,這并不意味著,我們可以高枕無憂。事實上,自從ChatGPT大火以來,它確確實實給很多人帶來了就業(yè)危機。
比如,好萊塢的演員、編劇、攝影師們,就坐不住了。
16萬人宣布集體罷工,這在好萊塢的歷史上,絕無僅有,也注定要被寫進影史。
但罷工阻擋不了人類步入AI時代的浩蕩大勢。對此,正確的做法,不是像勒德分子一樣砸掉機器,而是:
主動改變自己,去適應新的時代!
參考資料
[1]《人工智能背后人工力量:全國從事數(shù)據(jù)標注人數(shù)超千萬》科技日報
[2]《黃土高原上,沒上過大學的女人們在喂養(yǎng)AI》南風窗
[3]《訓練人工智能的中國縣城工人》,藍字計劃