界面新聞?dòng)浾?| 蔡木子
界面新聞編輯 | 鄭萃穎
建立更復(fù)雜的環(huán)境和氣候模型可以幫助人們理解氣候變化的機(jī)理,利用先進(jìn)的模型去優(yōu)化整合低碳能源系統(tǒng),用算法去判定天氣和農(nóng)作物的長(zhǎng)勢(shì)從而服務(wù)精準(zhǔn)農(nóng)業(yè)……在由OpenAI帶領(lǐng)的這一波人工智能熱潮中,AI能給社會(huì)經(jīng)濟(jì)帶來(lái)可持續(xù)發(fā)展的助力。AI的應(yīng)用因此被放在聚光燈下,引發(fā)許多未來(lái)的美好期待。
少有人知的是,在人工智能技術(shù)的基礎(chǔ)研究和產(chǎn)品設(shè)計(jì)過(guò)程中,需要耗費(fèi)大量的水電等自然資源,產(chǎn)生非常高的碳足跡和水足跡。就像AI給人類(lèi)社會(huì)帶來(lái)效率提升的同時(shí)也帶來(lái)治理和道德危機(jī)一樣,在環(huán)境影響和可持續(xù)發(fā)展命題上,AI亦是一把“雙刃劍”。
“在微軟最先進(jìn)的美國(guó)數(shù)據(jù)中心訓(xùn)練 GPT-3 ,可直接蒸發(fā)70萬(wàn)升清潔淡水,但這些信息一直被保密,這一點(diǎn)非常令人擔(dān)憂(yōu)?!奔又荽髮W(xué)河濱分校電氣與計(jì)算機(jī)工程系副教授任紹磊(Shaolei Ren)在接受界面新聞專(zhuān)訪時(shí)說(shuō)。任紹磊的研究主要聚焦于“人工智能+可持續(xù)性”,致力于使人工智能和計(jì)算技術(shù)帶領(lǐng)我們的社會(huì)走向更加可持續(xù)和公平的路徑。他尤其聚焦人工智能的用水問(wèn)題,并早在2013年起就開(kāi)始研究。
任紹磊介紹,人工智能(AI)模型,尤其是像 GPT-3、GPT-4 這樣的大型模型,其碳足跡越來(lái)越大,這點(diǎn)一直受到公眾關(guān)注。但人工智能模型同樣重要而巨大的水足跡仍未引起足夠重視。目前,淡水匱乏已成為全球共同面臨的最緊迫挑戰(zhàn)之一。到2027年,全球人工智能需求可能會(huì)產(chǎn)生42-66億立方米的取水量,這相當(dāng)于丹麥每年取水總量的4-6倍。
如何提高AI大廠在能耗方面的信息披露透明度、如何通過(guò)合理的數(shù)據(jù)中心地理布局來(lái)降低能耗?更重要的,如何將可持續(xù)的理念植入AI開(kāi)發(fā)設(shè)計(jì)階段,從而避免這個(gè)革命性行業(yè)重蹈老工業(yè)化時(shí)代“先污染再治理”覆轍?任紹磊透過(guò)對(duì)微軟和谷歌的案例分析試圖提供一些解決方案。對(duì)于同樣在人工智能領(lǐng)域迅猛布局的中國(guó)來(lái)說(shuō),也有啟發(fā)意義。
GPT-3一次對(duì)話(huà)至少要“喝”10毫升水
界面新聞:我讀過(guò)您的一篇研究,是關(guān)于GPT-3耗水量的,印象深刻。能跟我們?cè)敿?xì)介紹一下這個(gè)研究么?
任紹磊:我在2013年就做過(guò)數(shù)據(jù)中心耗水的研究,但當(dāng)時(shí)這個(gè)研究離普通人的生活太遠(yuǎn)了,沒(méi)有得到很多關(guān)注。由于AI行業(yè)發(fā)展迅猛,很多學(xué)者近幾年開(kāi)始關(guān)注AI的碳足跡,但是關(guān)注水足跡的人很少。我就想,是不是可以做AI水資源消耗的文章?根據(jù)我之前的研究基礎(chǔ),AI在水資源方面的消耗應(yīng)該是非常巨大的。
AI的發(fā)展都基于大規(guī)模的數(shù)據(jù)中心,而數(shù)據(jù)中心耗電量巨大,95%以上的電能會(huì)轉(zhuǎn)化成熱能。降熱降溫需要消耗大量的水?,F(xiàn)在主要有兩種方式降溫:一種是利用水蒸發(fā)帶走熱量,也就是利用冷卻塔,這個(gè)過(guò)程需要消耗大量的水;還有一種是直接用空氣流動(dòng)散熱,通俗地說(shuō)就是“用風(fēng)吹”,但在天氣熱的時(shí)候需要用水預(yù)涼,天氣干燥的時(shí)候需要用水加濕。
在微軟全球數(shù)據(jù)中心,平均來(lái)算大概每用一度電就要蒸發(fā)掉一升水。而這一度電大概能支撐數(shù)據(jù)中心一臺(tái)服務(wù)器工作20分鐘到一個(gè)小時(shí)。這一升水還只是數(shù)據(jù)中心直接用水。為了產(chǎn)生這一度電,在發(fā)電環(huán)節(jié)還要消耗大量的水。按照業(yè)界平均水平,每發(fā)一度電要消耗大約3-6升水。
根據(jù)微軟公布的官方數(shù)據(jù),GPT-3每產(chǎn)生100頁(yè)的對(duì)話(huà)內(nèi)容,要消耗0.4千瓦時(shí)的電。經(jīng)過(guò)我們的計(jì)算,GPT-3每進(jìn)行10-50次的基本詢(xún)問(wèn)對(duì)話(huà),就需要消耗500毫升的水。也就是說(shuō),每一次詢(xún)問(wèn)對(duì)話(huà),它至少要“喝”10毫升以上的水。在微軟最先進(jìn)的美國(guó)數(shù)據(jù)中心訓(xùn)練GPT-3可直接消耗70萬(wàn)升清潔淡水,足夠生產(chǎn) 370輛寶馬汽車(chē)或370輛奔馳汽車(chē)。而且,這些水不是“取水”,而是消耗掉并不可再生的。
界面新聞:現(xiàn)在數(shù)據(jù)中心耗水量的差別,主要是溫度引起的么?
任紹磊:是的,溫度和冷卻方式會(huì)對(duì)耗水量有較大影響。比如說(shuō),微軟宣布GPT-4是在美國(guó)愛(ài)荷華州進(jìn)行數(shù)據(jù)訓(xùn)練的,那里平均氣溫比較低。根據(jù)我們的研究,如果是在天氣較熱的美國(guó)亞利桑那州訓(xùn)練,耗水量將是愛(ài)荷華的11倍。
溫度的影響不難理解,相對(duì)較低溫有利于散熱。在冷卻方式方面,在氣溫適宜的地方,可以采用直接引入室外冷空氣降溫的辦法,不用冷卻塔水蒸發(fā)帶走熱量,也不需要預(yù)先冷卻空氣,就減少了大部分耗水。
界面新聞:因此,AI要減少耗水,可以在數(shù)據(jù)中心的地點(diǎn)選擇上做文章?
任紹磊:對(duì),我們?cè)谘芯恐芯吞岢隽私ㄗh,由于人工智能的工作是通過(guò)互聯(lián)網(wǎng)進(jìn)行的,因此可以很簡(jiǎn)單地采取諸如交換任務(wù)發(fā)送等方式,更加靈活地使用數(shù)據(jù)中心。將計(jì)算請(qǐng)求轉(zhuǎn)移到由清潔能源供電的數(shù)據(jù)中心,或者轉(zhuǎn)移到用水量較少的較冷地區(qū)的數(shù)據(jù)中心,這是一種對(duì)氣候有利的變化。而從用戶(hù)體驗(yàn)的角度來(lái)看,也沒(méi)有太大影響。
如何兼顧效率與公平?呼吁大廠提高能源消耗信息透明度
界面新聞:您的另一項(xiàng)研究探討了人工智能模型的加速增長(zhǎng)可能加劇環(huán)境不平等,能跟我們介紹一下這項(xiàng)研究么?
任紹磊:總的來(lái)說(shuō),人工智能的環(huán)境足跡在某些地區(qū)比其他地區(qū)高得多。這是因?yàn)樵趯?shí)際建設(shè)數(shù)據(jù)中心或相關(guān)大型基礎(chǔ)設(shè)施時(shí),公司大多選擇相對(duì)偏遠(yuǎn)的地區(qū)。比如在美國(guó),很多數(shù)據(jù)中心的選址都是經(jīng)濟(jì)相對(duì)沒(méi)那么發(fā)達(dá),人口沒(méi)那么稠密的地區(qū)。反過(guò)來(lái)說(shuō),如果是在經(jīng)濟(jì)實(shí)力比較強(qiáng)的社區(qū),數(shù)據(jù)中心往往會(huì)因?yàn)樵胍簟⒖諝?、水熱污染等?wèn)題招來(lái)強(qiáng)烈的民意反彈,導(dǎo)致建設(shè)計(jì)劃流產(chǎn)。
因此,這就導(dǎo)致了一個(gè)惡性循環(huán)。越是欠發(fā)達(dá)社區(qū),越有可能建設(shè)那些帶來(lái)負(fù)面環(huán)境影響的AI基礎(chǔ)設(shè)施,從而進(jìn)一步惡化當(dāng)?shù)氐沫h(huán)境,加劇環(huán)境不平等。
界面新聞:但是如我們之前討論的,從減少能耗角度看,數(shù)據(jù)中心也適宜建設(shè)在溫度比較低、地廣人稀的地方。如果這些地方恰好是比較薄弱的社區(qū),我們?cè)趺慈テ胶庑屎凸降膯?wèn)題?
任紹磊:是的,有時(shí)候很難兩全,需要去平衡。我們需要注意,環(huán)境要素不是免費(fèi)的,“涼快”不是免費(fèi)的。因?yàn)榘l(fā)電和數(shù)據(jù)中心運(yùn)行還無(wú)法做到100%清潔能源供電,怎么衡量環(huán)境要素投入的經(jīng)濟(jì)價(jià)值?怎么為負(fù)面環(huán)境影響,對(duì)當(dāng)?shù)鼐用褡龀錾鷳B(tài)補(bǔ)償?這些都是我們應(yīng)該思考的問(wèn)題。比如說(shuō)在美國(guó),微軟在很多地區(qū)會(huì)建設(shè)數(shù)據(jù)中心配套的污水處理廠或風(fēng)力發(fā)電廠,這就是對(duì)當(dāng)?shù)丨h(huán)境的一種補(bǔ)償。
我注意到許多美國(guó)科技公司已經(jīng)非常關(guān)注環(huán)境公平問(wèn)題,有時(shí)候甚至把公平放在效率和成本之前。比如Meta(Facebook)在自己的ESG報(bào)告里,就是把環(huán)境公平放在首要考慮位置,它的能源消耗的信息披露也是最全面的。微軟計(jì)劃在印度建設(shè)的數(shù)據(jù)中心,甚至已經(jīng)宣布不直接用水冷卻,而改用利用空氣冷卻的冷凝器,這可能是考慮到印度缺水又很熱。用冷凝器降溫可以避免在當(dāng)?shù)刂苯雍乃?,但卻大大增加了制冷能耗,導(dǎo)致發(fā)電環(huán)節(jié)用水大幅上升,因此總體用水量是否減少還不好判斷??傊?,在社會(huì)輿論壓力下,許多大廠都不得不更多地去考慮社會(huì)環(huán)境效益。
界面新聞:您的文章點(diǎn)名了一些大廠,所以產(chǎn)生了比較大的影響力。您的研究中還提到谷歌在2022年,僅自有數(shù)據(jù)中心就消耗近200億升水用于現(xiàn)場(chǎng)冷卻,其中大部分是飲用水,總體用水量較2021年增加約20%。您的研究都是基于公開(kāi)數(shù)據(jù)么?研究發(fā)表后,這些大廠跟您聯(lián)系過(guò)么?
任紹磊:微軟沒(méi)有聯(lián)系過(guò)我,但是在相關(guān)媒體報(bào)道出來(lái)之后,微軟有進(jìn)一步公布更詳細(xì)的提高水資源利用效率的方式。谷歌有間接聯(lián)系過(guò)我們大學(xué),對(duì)研究所用的數(shù)據(jù)提出了一些質(zhì)疑,但又拒絕提供自己更詳細(xì)的數(shù)據(jù)。我們最終版論文的所有數(shù)據(jù)均來(lái)自官方數(shù)據(jù)、政府?dāng)?shù)據(jù)或者業(yè)界知名的研究機(jī)構(gòu)數(shù)據(jù),去掉了所有我們自己根據(jù)模型推算的數(shù)據(jù)。
界面新聞:有意思。對(duì)于這些大廠的能源消耗信息披露,您是否覺(jué)得足夠透明呢?
任紹磊:還有提升空間。比如說(shuō)微軟披露了自己每個(gè)數(shù)據(jù)中心的用水效率,沒(méi)有披露相應(yīng)的用水量和用電量;谷歌披露了每個(gè)數(shù)據(jù)中心的用水量,又沒(méi)有披露用水效率。有一種解釋是,如果用水用電量和效率都披露了,就能算出它的實(shí)際用水用電量,從而得出企業(yè)部署在當(dāng)?shù)氐臉I(yè)務(wù)量。但這也不是什么商業(yè)機(jī)密,Meta就詳細(xì)公布了每個(gè)業(yè)務(wù)地點(diǎn)的用電量、用水量,有的地方甚至包括了發(fā)電環(huán)節(jié)的用水量。
只有更充分的信息披露,才能給公眾知情權(quán),也會(huì)給公司帶來(lái)更多的改進(jìn)壓力。從這方面看,高科技大廠特別是耗能較大的AI大廠應(yīng)該提高能耗披露透明度。
在軟件開(kāi)發(fā)階段引入可持續(xù)理念,才能“治本”
界面新聞:除了數(shù)據(jù)中心所在地溫度和冷卻方式會(huì)影響耗水量外,還有什么方法能改進(jìn)AI產(chǎn)業(yè)發(fā)展的可持續(xù)性呢?
任紹磊:另一個(gè)方法其實(shí)就是少用點(diǎn)兒能耗,也就是不用那么大的計(jì)算模型,用小一些的模型去構(gòu)建你的AI產(chǎn)品,用水用電自然會(huì)降低。其實(shí)在GPT的訓(xùn)練過(guò)程中,微軟也會(huì)使用大小不一樣的模型去模擬,小模型就是大模型壓縮出來(lái)的,去掉了一些不太重要的參數(shù),它也能回答絕大多數(shù)基本問(wèn)題。甚至小模型的響應(yīng)速度更快,也就是回答問(wèn)題更快,因?yàn)樗`活,計(jì)算量更小了。這就好比消費(fèi)者買(mǎi)車(chē),奔馳車(chē)和QQ車(chē)其實(shí)都能滿(mǎn)足基本需求,那也不一定任何消費(fèi)者都需要去買(mǎi)奔馳。
界面新聞:但是AI現(xiàn)在的發(fā)展階段,仿佛是各個(gè)大廠在搞算力上的“軍備競(jìng)賽”,追求更大、更強(qiáng)、更智能,基于實(shí)際需求的、可持續(xù)發(fā)展的理念似乎還很少在產(chǎn)品開(kāi)發(fā)階段被關(guān)注到。
任紹磊:對(duì),這就是我想說(shuō)的問(wèn)題。AI發(fā)展要可持續(xù),怎樣才是“治本”之道?現(xiàn)在大廠在數(shù)據(jù)中心選址上做文章,在大樓建設(shè)上做文章,其實(shí)都是治標(biāo)不治本。特別是考慮到AI的本質(zhì),就是“更聰明”、使用更少資源去做事。這些大廠其實(shí)在可持續(xù)開(kāi)發(fā)方面,根本沒(méi)有用到自己的專(zhuān)長(zhǎng)。在軟件開(kāi)發(fā)階段,碼農(nóng)們不會(huì)考慮能耗問(wèn)題,而是怎么高大上怎么來(lái);程序?qū)懗鰜?lái)了,先上線跑再說(shuō),先能賺到錢(qián)再說(shuō)。至于需要多少電、需要多少水,那就讓公司去買(mǎi);負(fù)面環(huán)境影響大了,公司再去想怎么抵消環(huán)境影響。
前幾天我剛?cè)ラ_(kāi)了一個(gè)會(huì)議,大家非常關(guān)注一個(gè)理念,叫做Software Sustainability by Design,也就是具有可持續(xù)性的軟件設(shè)計(jì),美國(guó)已經(jīng)有一些協(xié)會(huì)和組織在推行這個(gè)理念。很多人已經(jīng)注意到,不計(jì)環(huán)境成本的軟件開(kāi)發(fā)帶來(lái)了很多能源資源浪費(fèi)和不可逆的環(huán)境影響。這就好比第一步走錯(cuò)了,樓建歪了,你是可以再修補(bǔ),但修補(bǔ)成本就會(huì)很高。而如果在軟件設(shè)計(jì)階段就考慮到節(jié)能,綜合成本會(huì)低得多。
界面新聞:您說(shuō)的這個(gè)太重要了,也很有啟發(fā)性。因?yàn)榇蠹抑庇X(jué)上會(huì)覺(jué)得軟件開(kāi)發(fā)不是一個(gè)重自然資源消耗的行業(yè),也就容易忽視全產(chǎn)業(yè)鏈的環(huán)境負(fù)面影響,忽視了把可持續(xù)理念前移到開(kāi)發(fā)階段的重要性。您跟一些“碼農(nóng)”聊過(guò)么?他們?cè)趺纯碨oftware Sustainability by Design?
任紹磊:其實(shí)很難要求一些傳統(tǒng)的“碼農(nóng)”去注意節(jié)能問(wèn)題,因?yàn)閺乃麄兊膶W(xué)習(xí)、訓(xùn)練來(lái)看,都不會(huì)接觸到能源的議題。這需要企業(yè)從頂層設(shè)計(jì)上,引入一些專(zhuān)業(yè)人士,去平衡各方面的因素,也是一個(gè)比較復(fù)雜的決策過(guò)程,涉及到從ESG角度去做公司治理和生產(chǎn)流程的改變。
我觀察到微軟已經(jīng)引入了一些這方面的外部專(zhuān)家,比如說(shuō)前羅格斯大學(xué)的教授Ricardo Bianchini,以前我們一起做可持續(xù)計(jì)算方面的研究,現(xiàn)在在微軟負(fù)責(zé)數(shù)據(jù)中心能耗及綠色計(jì)算;去年底,微軟還挖來(lái)了前白宮總統(tǒng)能源助理Melanie Nakagawa任首席可持續(xù)發(fā)展官,她在微軟的主要工作之一就是負(fù)責(zé)水資源優(yōu)化。
界面新聞:您關(guān)注過(guò)中國(guó)的AI公司在可持續(xù)發(fā)展方面的情況么?有沒(méi)有什么建議?
任紹磊:中國(guó)的AI產(chǎn)業(yè)發(fā)展當(dāng)然也是非??斓模瑪?shù)據(jù)中心的產(chǎn)業(yè)規(guī)模也非常大。國(guó)內(nèi)很多數(shù)據(jù)中心的建設(shè)也已經(jīng)考慮了環(huán)境因素,比如貴州、內(nèi)蒙的數(shù)據(jù)中心比較多,這也在一定程度上減少了能耗。但與此同時(shí),國(guó)內(nèi)還有很多大廠委托的第三方數(shù)據(jù)中心,也有相當(dāng)一部分分布在長(zhǎng)三角、京津冀等地區(qū)。
在AI分配計(jì)算任務(wù)時(shí),也可以考慮更為靈活地在各個(gè)地方的數(shù)據(jù)中心轉(zhuǎn)換。以前可能更多考慮速度問(wèn)題,比如北京的用戶(hù)要看一個(gè)視頻,那當(dāng)然調(diào)用北京的數(shù)據(jù)中心最快;但現(xiàn)在的網(wǎng)絡(luò)延時(shí)已經(jīng)非常小了,考慮到能耗問(wèn)題,是不是也可以調(diào)用內(nèi)蒙的數(shù)據(jù)中心?這個(gè)時(shí)間差用戶(hù)是感受不到的,但是綜合起來(lái)對(duì)服務(wù)器的負(fù)載有很大影響。尤其是對(duì)AI的訓(xùn)練,這個(gè)太靈活了,全國(guó)各地?cái)?shù)據(jù)中心轉(zhuǎn)一圈兒都可以,要充分考慮環(huán)境成本來(lái)考慮選址。