文|IT時(shí)報(bào)記者 范昕茹
編輯|王昕 孫妍
3月23日,在英偉達(dá)的GTC大會(huì)上,英偉達(dá)CEO黃仁勛借由ChatGPT的成功向世界展示了一個(gè)無限寬廣的AI未來圖景。在這個(gè)宏大場(chǎng)景之下,AI不再是虛幻不可見的東西。它在芯片生產(chǎn)、醫(yī)療、文化創(chuàng)作等各個(gè)領(lǐng)域發(fā)揮著巨大的作用,給世界帶來天翻地覆的變化。
AI終于從幻影中走出,迎來了清晰的商業(yè)化之路,黃仁勛將之稱為“AI的iPhone時(shí)刻”。
2022年,在新一代顯卡的發(fā)布會(huì)上,黃仁勛直言“摩爾定律已死”,往后的芯片性能不會(huì)再遵循這個(gè)定律。而借由“AI的iPhone時(shí)刻來臨”的口號(hào),黃仁勛向世界宣告了“黃仁勛定律”的到來。
“黃仁勛定律”誕生
CuLitho計(jì)算光刻技術(shù)軟件庫是英偉達(dá)與全球最大晶圓代工廠臺(tái)積電、全球最大光刻機(jī)巨頭阿斯麥、全球最大EDA巨頭新思科技合作,秘密研發(fā)近四年的“核彈”。
根據(jù)黃仁勛的表述,CuLitho在GPU上運(yùn)行時(shí),可以將計(jì)算光刻加速40倍以上,為2nm及更先進(jìn)的工藝奠定基礎(chǔ)。他舉例,NVIDIA H100生產(chǎn)需要89塊掩膜板,在CPU上運(yùn)行時(shí),處理單個(gè)掩膜板需要4萬個(gè)CPU系統(tǒng)才能完成工作,如果在GPU上運(yùn)行CuLitho,這個(gè)過程只需要8小時(shí)。與此同時(shí),CuLitho還能助力降低耗電以及對(duì)環(huán)境的影響,將功率從35MW降至5MW。
在短期內(nèi),使用CuLitho的晶圓廠每天的光掩模產(chǎn)量可增加3~5倍,而耗電量可以比當(dāng)前配置降低9倍。原本需要兩周時(shí)間才能完成的光掩?,F(xiàn)在可以在一夜之間完成。
隨著光刻技術(shù)臨近物理極限,這項(xiàng)技術(shù)通過加速計(jì)算光刻流程,將有助于晶圓廠縮短原型周期時(shí)間、提高產(chǎn)量、減少碳排放,為2nm及更先進(jìn)的工藝奠定基礎(chǔ),并使得曲線掩模、high NA EUV、亞原子級(jí)光刻膠模型等新技術(shù)節(jié)點(diǎn)所需的新型解決方案和創(chuàng)新技術(shù)成為可能。
對(duì)英偉達(dá)而言,CuLitho展示了英偉達(dá)進(jìn)入芯片制造生產(chǎn)銷售全鏈路的野心。黃仁勛定律的核心在于利用GPU芯片算力大幅度提升芯片制造效率,以此來加速摩爾定律削減帶來的生產(chǎn)瓶頸。
對(duì)英偉達(dá)而言,當(dāng)它同時(shí)介入芯片的生產(chǎn)和銷售環(huán)節(jié),成為其中的一部分,CuLitho將給芯片產(chǎn)業(yè)帶來巨大的變化:AI芯片的生產(chǎn)環(huán)節(jié)本身也成為AI芯片消費(fèi)的一部分。GPU芯片將成為芯片行業(yè)主要的流通貨幣。
當(dāng)然,這一切發(fā)生的前提是“AI的iPhone時(shí)刻”真的已經(jīng)到來。
算力卡了大模型脖子
在GTC大會(huì)上,黃仁勛對(duì)軟硬件市場(chǎng)空間做過一個(gè)回應(yīng)。在他看來,人工智能軟件是一個(gè)比硬件大得多的市場(chǎng),而硬件的銷售機(jī)會(huì)主要來自基礎(chǔ)設(shè)施服務(wù)市場(chǎng)。也就是說,GPU芯片的市場(chǎng)多大,取決于AI軟件的商用程度。
如今,AI大模型公司不得不面臨的一個(gè)主要困境——算力。每一個(gè)AI大模型背后,都需要巨量算力的支撐。為了支撐OpenAI訓(xùn)練出ChatGPT,微軟專門為OpenAI打造了一臺(tái)由數(shù)萬個(gè)A100 GPU組成的AI超級(jí)計(jì)算機(jī)。TrendForce研究推測(cè),以A100的算力為基礎(chǔ),GPT-3.5大模型需要高達(dá)2萬枚GPU,未來商業(yè)化后可能需要超過3萬枚。
集之互動(dòng)CEO陸文斌告訴《IT時(shí)報(bào)》記者,1年半前,其所在公司采購了50多塊A100芯片,用于高精度數(shù)字人的研發(fā)。在數(shù)字孿生的應(yīng)用場(chǎng)景中,一位醫(yī)生可以只需錄制20分鐘左右的視頻,便可以“孿生”為一個(gè)數(shù)字人。之后,只要輸入相應(yīng)的數(shù)據(jù),便可以由“孿生人”自己演講、互動(dòng)或者授課,期間,無論是文字轉(zhuǎn)換為語音,還是互動(dòng)式的NLP(自然語言處理),亦或是數(shù)字人逼真的面部擬人化,每個(gè)環(huán)節(jié)都需要消耗巨量的算力,“精度越高,需要投入的算力越多,需要的資金也越多”。
陸文斌以最簡(jiǎn)單的“數(shù)字人說話”場(chǎng)景舉例,通常而言,人類的唇部大約有近千個(gè)神經(jīng)元,這些神經(jīng)元相互連接作用,當(dāng)人開口講話時(shí),每個(gè)字形成的唇形都不相同。他們公司制作的數(shù)字人,在其唇部部署了300個(gè)神經(jīng)元,這在國內(nèi)已經(jīng)是相當(dāng)高水平的精度,但要想做得更逼真,唯有投入更多的算力渲染。
這還只是在研發(fā)端的算力消耗,商用化的道路上,終端成了落地的絆腳石。在強(qiáng)大算力的支撐下,高精度數(shù)字人可以進(jìn)行流暢的表情演示,但目前市面上高性能的筆記本電腦卻難以支撐超高模數(shù)字人的流暢演示,更不用說手機(jī)。
更讓陸文斌擔(dān)心的是,此前購置第一批英偉達(dá)A100芯片時(shí),限售令還沒頒布。第二批入手在限令之后,價(jià)錢已上漲了50%。從公司的業(yè)務(wù)發(fā)展速度來看,加上芯片損耗,他擔(dān)心,可能2~3年后便買不起芯片了,也無更多算力可用。
但ChatGPT的成功,正吸引一批企業(yè)投身AI大模型市場(chǎng)。百度的“文心一言”已經(jīng)上線;騰訊總裁劉熾平表示會(huì)持續(xù)優(yōu)化混元AI大模型;字節(jié)跳動(dòng)則傳出了前達(dá)摩院大模型M6帶頭人入職,并參與語言生成大模型研發(fā)的消息。創(chuàng)新工場(chǎng)CEO李開復(fù)、前搜狗CEO王小川、原美團(tuán)聯(lián)合創(chuàng)始人王慧文、前京東AI掌門人周伯文、出門問問創(chuàng)始人李志飛、阿里技術(shù)副總裁賈揚(yáng)清,這些聲名赫赫的業(yè)界大佬,都紛紛入局大模型市場(chǎng)。
當(dāng)大廠入局,企業(yè)對(duì)算力的爭(zhēng)奪將更加激烈。而目前在AI芯片領(lǐng)域,英偉達(dá)舉著望遠(yuǎn)鏡也看不到敵人。對(duì)國內(nèi)企業(yè)來說,如果一直無法找到合適的替代方案,未來算力從何而來?
最近,陸文斌的數(shù)字人公司正在與國內(nèi)GPGPU芯片廠商合作調(diào)試,以便當(dāng)更大的“黑天鵝”來臨時(shí),可以提前防范部分風(fēng)險(xiǎn),“我們也在提前做一些研發(fā)布局,包括是否可以在低配置的硬件設(shè)備上,利用軟件跑出更好的效果。也很希望能和更多國內(nèi)芯片、智能硬件廠商合作,盡量降低算力‘卡脖子’對(duì)國產(chǎn)人工智能產(chǎn)業(yè)的影響”。
算力跨境,數(shù)據(jù)落地
針對(duì)中小企業(yè)算力缺失的問題,英偉達(dá)也給出了自己的答案——DGX Cloud算力平臺(tái)。DGX Cloud背后是DGX(AI超級(jí)計(jì)算機(jī))的算力能力。通過這個(gè)平臺(tái),企業(yè)無須購買硬件,可以通過網(wǎng)頁瀏覽的方式獲取高性能算力,享受到和Open AI同樣的算力引擎,擴(kuò)展多節(jié)點(diǎn)AI訓(xùn)練。企業(yè)可以通過月租的方式獲取算力,每月租金36999美元??梢哉f,DGX Cloud云平臺(tái)降低了用戶使用算力的門檻。
然而,跨過了使用門檻,即便云能力可以跨境,但數(shù)據(jù)不行。隨著各個(gè)國家對(duì)數(shù)據(jù)管控的加強(qiáng),跨境數(shù)據(jù)傳輸也成為云平臺(tái)跨境運(yùn)營的壁壘。美國《國家安全戰(zhàn)略報(bào)告》將數(shù)據(jù)安全作為維護(hù)國家安全的核心戰(zhàn)略要素,強(qiáng)調(diào)要保持美國在網(wǎng)絡(luò)空間和數(shù)據(jù)資源上的優(yōu)勢(shì)。歐盟的《數(shù)字化單一市場(chǎng)戰(zhàn)略》中也指出,歐盟將采取“內(nèi)松外緊”的數(shù)據(jù)跨境流動(dòng)管理思路。2022年9月1日,我國《數(shù)據(jù)出境安全評(píng)估辦法》正式施行,對(duì)涉及個(gè)人信息的跨境數(shù)據(jù)傳輸進(jìn)行管控。
互聯(lián)網(wǎng)企業(yè)跨境運(yùn)營面臨的數(shù)據(jù)安全壓力也日漸凸顯。在數(shù)據(jù)安全的壓力下,蘋果將數(shù)據(jù)中心交由“云上貴州”托管,將國內(nèi)數(shù)據(jù)存放在我國本土。字節(jié)跳動(dòng)旗下的TikTok則不斷面臨著來自美國的政策壓力。3月23日,字節(jié)跳動(dòng)海外短視頻平臺(tái)TikTok CEO周受資參加主題為“TikTok:國會(huì)如何保護(hù)美國數(shù)據(jù)隱私,保護(hù)兒童免受網(wǎng)絡(luò)傷害”的美國眾議院能源與商務(wù)委員會(huì)聽證會(huì)。
這意味著,DGX Cloud想要商用,勢(shì)必要將數(shù)據(jù)中心本土化。目前,英偉達(dá)對(duì)此采取的策略是與云廠商合作,采用托管的形式進(jìn)行。黃仁勛表示,未來中國也可以采用這項(xiàng)服務(wù),中國創(chuàng)業(yè)公司可以期待阿里、百度、騰訊提供的底層算力服務(wù),但在算力需求急速增長的現(xiàn)在,服務(wù)得以開展的時(shí)間和定價(jià)都還很難判斷。
作為軟件端的ChatGPT其實(shí)也面臨著同樣的數(shù)據(jù)風(fēng)險(xiǎn)。即便如今ChatGPT被接入微軟Office全家桶,其能力也讓C端用戶大為震驚,但對(duì)企業(yè)用戶而言,由于其生產(chǎn)力的獲取需要通過數(shù)據(jù)的投喂進(jìn)行,騰訊、阿里等企業(yè)已經(jīng)明令禁止員工向其投喂數(shù)據(jù),ChatGPT的商業(yè)化之路仍模糊難辨。
人工智能面臨政策拷問
除開數(shù)據(jù)帶來的安全隱患,“AI的iPhone時(shí)刻”還將因相關(guān)政策監(jiān)管而推遲到來。
自人工智能誕生以來,治理問題就一直是全球監(jiān)管機(jī)構(gòu)關(guān)注的熱點(diǎn)。歐盟正著手準(zhǔn)備創(chuàng)建一個(gè)新的監(jiān)管部門來負(fù)責(zé)AI的治理,以應(yīng)對(duì)ChatGPT這類人工智能可能帶來的挑戰(zhàn)。
英國正在計(jì)劃如何分配監(jiān)管機(jī)構(gòu)管理人工智能的職責(zé)。英國政府3月29日發(fā)布了一項(xiàng)計(jì)劃,將不會(huì)專門成立一個(gè)負(fù)責(zé)人工智能技術(shù)監(jiān)管的部門,并將避免可能扼殺創(chuàng)新的嚴(yán)厲立法,而是會(huì)根據(jù)安全、透明、公平和問責(zé)制等廣泛原則采取適應(yīng)性強(qiáng)的監(jiān)管方法。而國內(nèi)針對(duì)ChatGPT這類人工智能治理相關(guān)的討論也在業(yè)內(nèi)不斷增加。
不僅如此,人工智能大模型帶來的風(fēng)險(xiǎn)已經(jīng)引發(fā)了多位科技領(lǐng)袖的深切擔(dān)憂。近日,OpenAI的共同發(fā)起人伊隆·馬斯克和一群人工智能專家及行業(yè)高管在一封最新發(fā)布的公開信中呼吁,在未來六個(gè)月暫停對(duì)GPT模型的訓(xùn)練,以免該模型變得更加強(qiáng)大,從而對(duì)社會(huì)和人類造成潛在風(fēng)險(xiǎn)。這封公開信如今已經(jīng)獲得1000多人署名,呼吁在GPT進(jìn)一步強(qiáng)大之前,需要首先就此類大模型達(dá)成由獨(dú)立專家開發(fā)、實(shí)施并審核的共享安全協(xié)議。
當(dāng)英偉達(dá)用“黃仁勛定律”迎接一個(gè)屬于GPU的時(shí)代來臨時(shí),“AI的iPhone時(shí)刻”或許將首先面臨政策、數(shù)據(jù)、安全的拷問,而唯有邁過這些門檻,“AI的iPhone時(shí)刻”或才終將來臨。
排版/ 季嘉穎
圖片/ 英偉達(dá)
來源/《IT時(shí)報(bào)》公眾號(hào)vittimes