文|劉曠
隨著人工智能、云計(jì)算、物聯(lián)網(wǎng)、自動(dòng)駕駛、大數(shù)據(jù)等前端科技的不斷延伸和發(fā)展,作為數(shù)字經(jīng)濟(jì)底座的算力資源,正日漸發(fā)展成為衡量國家生產(chǎn)力的新晉指標(biāo)。據(jù)中國信息通信研究院測(cè)算,截至2021年底,中國算力核心產(chǎn)業(yè)規(guī)模超過1.5萬億元,關(guān)聯(lián)產(chǎn)業(yè)規(guī)模超過8萬億元。其中,云計(jì)算市場(chǎng)規(guī)模超過3000億元,互聯(lián)網(wǎng)數(shù)據(jù)中心(服務(wù)器)市場(chǎng)規(guī)模超過1500億元,AI 核心產(chǎn)業(yè)規(guī)模超過4000億元。
據(jù)工信部在中國首屆算力大會(huì)上披露的數(shù)據(jù)顯示,國內(nèi)算力產(chǎn)業(yè)近五年平均增速超過30%,算力規(guī)模超過150EFlops(每秒15000京次浮點(diǎn)運(yùn)算次數(shù)),排名全球第二,第一是美國。實(shí)際上作為國內(nèi)算力建設(shè)的重要參與方,包括阿里云、騰訊云、百度云、浪潮云等在內(nèi)的各路云巨頭,早已經(jīng)圍繞算力市場(chǎng)展開了競賽。
云巨頭開啟算力競賽
作為云計(jì)算產(chǎn)業(yè)的底層核心基礎(chǔ)設(shè)施,數(shù)據(jù)中心也是云計(jì)算廠商布局的重要抓手。近年來伴隨著數(shù)字新基建浪潮的來臨,阿里云、騰訊云、百度智能云和華為云等廠商都相繼宣布,數(shù)據(jù)中心建設(shè)將成為今后數(shù)年的重點(diǎn)投資領(lǐng)域。
早在2020年各云巨頭對(duì)外公布的數(shù)據(jù)中心投資計(jì)劃中,阿里宣布未來三年再投2000億元,用于云操作系統(tǒng)、服務(wù)器、芯片、網(wǎng)絡(luò)等重大核心技術(shù)研究和面向未來的數(shù)據(jù)中心建設(shè);同一時(shí)期,騰訊也宣布未來五年再投入5000億元,用于云計(jì)算、超算中心、人工智能、網(wǎng)絡(luò)安全、量子計(jì)算和物聯(lián)網(wǎng)系統(tǒng)等方面;百度計(jì)劃未來十年將繼續(xù)加大在人工智能、芯片、云計(jì)算、數(shù)據(jù)中心等新基建領(lǐng)域的投入,并預(yù)計(jì)到2030年,百度智能云服務(wù)器臺(tái)數(shù)將超過500萬臺(tái)。
除了BAT之外包括華為、中國移動(dòng)等在內(nèi)的ICT、通訊運(yùn)營商等企業(yè),也紛紛參與到數(shù)據(jù)中心的建設(shè)中來。比如,華為云已經(jīng)先后在烏蘭察布、蘇州、廊坊、貴安等地,建立了多個(gè)數(shù)據(jù)樞紐中心,這些地方也有中國移動(dòng)、聯(lián)通等通訊運(yùn)營商企業(yè)的身影。
除了國內(nèi)之外,巨頭的云數(shù)據(jù)中心還廣泛分布于全世界各地。比如,目前阿里云的全球云數(shù)據(jù)中心已經(jīng)有數(shù)百個(gè),基本覆蓋超過200多個(gè)國家;騰訊云、華為云也分別在各自的海外市場(chǎng)如東南亞、北美、歐洲、中東等地修建本地?cái)?shù)據(jù)中心……不難發(fā)現(xiàn),在多重因素推動(dòng)下一場(chǎng)云巨頭的算力競賽已經(jīng)拉開了帷幕。
從產(chǎn)業(yè)發(fā)展現(xiàn)狀來看,最近十年行業(yè)算力的增長,嚴(yán)重滯后于數(shù)據(jù)的增長的局面亟待改變。半個(gè)世紀(jì)之前,人類第一次將阿波羅11號(hào)飛船送上太空時(shí)所搭載的電腦,CPU主頻只有0.043MHz,今天一部智能機(jī)的主頻都在2500MHz,是五十年前的5萬倍,如今在物聯(lián)網(wǎng)的作用下,數(shù)以千億計(jì)的聯(lián)網(wǎng)設(shè)備疊加復(fù)雜的場(chǎng)景正在引發(fā)產(chǎn)業(yè)數(shù)據(jù)大爆炸。在此背景下,算力滯后的問題將變得愈加尖銳,因此云巨頭投身算力基礎(chǔ)設(shè)施建設(shè)無非是未雨綢繆,為其接下來的云服務(wù)、AI等數(shù)據(jù)應(yīng)用做鋪墊。
從政策方面來看,國家關(guān)于數(shù)字新基建的政策不斷出臺(tái),正在推動(dòng)數(shù)字基建進(jìn)入全新的發(fā)展階段。近年來國家陸續(xù)推出了包括“東數(shù)西算”等在內(nèi)的一系列數(shù)字新基建建設(shè)計(jì)劃,大力推動(dòng)國家算力網(wǎng)絡(luò)的建設(shè),為算力基礎(chǔ)設(shè)施的建設(shè)提供了外部助力。
從算力產(chǎn)業(yè)本身的產(chǎn)業(yè)鏈情況來看,它具有規(guī)模大、技術(shù)密集、覆蓋范圍廣等特點(diǎn),成為當(dāng)下國內(nèi)經(jīng)濟(jì)轉(zhuǎn)型背景下重要的推動(dòng)型產(chǎn)業(yè)。如今,小到芯片、手機(jī)、PC,大到汽車、互聯(lián)網(wǎng)、超算中心、區(qū)塊鏈、超級(jí)計(jì)算機(jī)、元宇宙等產(chǎn)業(yè),都離不開算力的加持。據(jù)中國信通院預(yù)計(jì),每1元的算力投入,可以帶動(dòng)3-4元的GDP經(jīng)濟(jì)產(chǎn)出。
據(jù)預(yù)計(jì),今年國家將開工25個(gè)國家數(shù)據(jù)中心項(xiàng)目,帶動(dòng)各方面投資將在1900億元,預(yù)計(jì)在“十四五”期間該項(xiàng)投資還將以年均20%的增速增長,累計(jì)帶動(dòng)投資達(dá)到3萬億元??傊?,基于種種有利因素,各路云巨頭紛紛按下算力競賽加速鍵。
安全、低碳成競逐方向
不過,隨著數(shù)據(jù)中心等基礎(chǔ)設(shè)施的逐步擴(kuò)大,其面臨的挑戰(zhàn)也越發(fā)顯著。此前,阿里云因發(fā)現(xiàn)阿帕奇log4j2組件安全漏洞,未及時(shí)告知工信部而被罰暫停合作6個(gè)月,此事曾一度引發(fā)外界對(duì)于算力安全的關(guān)注;另外,數(shù)據(jù)中心高功耗的行業(yè)特性,使其一直面臨越來越多的低碳環(huán)保質(zhì)疑。不難看出,在數(shù)據(jù)大規(guī)模上云、低碳經(jīng)濟(jì)加速推行的大背景下,低碳、安全等因素日益成為影響算力行業(yè)發(fā)展的重要因素。
一方面,各個(gè)巨頭都在圍繞著云安全、算力安全做布局,以較強(qiáng)的產(chǎn)品安全設(shè)計(jì)來獲取用戶對(duì)品牌的信賴。
比如,騰訊云為了推動(dòng)安全算力落地,推出了自研的基于安全算力的算法,以及全局威脅檢測(cè)與全網(wǎng)全出口攔截的防御解決方案—騰訊天幕;阿里云也推出了阿里云原生安全SOC,由此構(gòu)建起了一個(gè)實(shí)時(shí)識(shí)別、分析、預(yù)警安全威脅的統(tǒng)一安全管理系統(tǒng),通過防篡改、防勒索、防病毒、鏡像安全掃描等安全能力,實(shí)現(xiàn)從檢測(cè)掃描、響應(yīng)、溯源的自動(dòng)化安全運(yùn)營閉環(huán),保護(hù)云上資產(chǎn)和本地服務(wù)器安全;華為云則圍繞云安全提出了“正向建、反向查、云邊端網(wǎng)一體防御”的云安全理念,并在今年提出了全新的HiSec3.0安全解決方案,該方案具有“全流程安全可信、全智能威脅分析、全云網(wǎng)邊端協(xié)同、全新安全云服務(wù)”的特征。
另一方面,基于降低能耗實(shí)現(xiàn)低碳運(yùn)營的考慮,降低功耗成了各個(gè)云巨頭推動(dòng)產(chǎn)業(yè)發(fā)展的核心指向。
以電能利用效率(PUE)的指標(biāo)來看,目前國內(nèi)的頭部云服務(wù)巨頭,阿里云、騰訊云、百度云均已滿足國家標(biāo)準(zhǔn)。按照國家規(guī)定來算,2021年底新建數(shù)據(jù)中心電能利用效率要達(dá)到1.35以下,2023年要達(dá)到1.3以下,寒冷地區(qū)達(dá)到1.25以下。而截止2021年,百度云、阿里云、騰訊云等的電能利用效率,均已經(jīng)達(dá)到了1.3的指標(biāo),最低值甚至可以達(dá)到1.06,已經(jīng)遠(yuǎn)遠(yuǎn)超越現(xiàn)行國家標(biāo)準(zhǔn)了。
總的來看,未來隨著技術(shù)的發(fā)展和碳中和的推進(jìn),圍繞安全、低碳等要素的新算力中心建設(shè)將會(huì)是核心指標(biāo),并將成為云巨頭未來在算力市場(chǎng)競爭的關(guān)鍵點(diǎn)。
服務(wù)器、芯片成關(guān)鍵強(qiáng)化環(huán)節(jié)
作為數(shù)據(jù)中心中的重要組成部分,服務(wù)器中的CPU、GPU決定了服務(wù)器的算力。據(jù)信通院數(shù)據(jù)顯示,服務(wù)器在數(shù)據(jù)中心中的硬件成本占到了70%左右,而芯片成本則占據(jù)服務(wù)器成本的絕大部分。根據(jù)IDC的研究數(shù)據(jù)顯示,CPU(中央處理器)、GPU(圖像處理器)、DRAM(動(dòng)態(tài)隨機(jī)存取處理器)三個(gè)模塊中的芯片成本在基礎(chǔ)型服務(wù)器中占比約30%,在更高性能的服務(wù)器中占比高達(dá)50%-80%。正因?yàn)槿绱?,服?wù)器、芯片逐漸成了巨頭們選擇重點(diǎn)強(qiáng)化的領(lǐng)域。
一方面,巨頭紛紛通過自研來提升自身服務(wù)器產(chǎn)品的性價(jià)比,優(yōu)化其產(chǎn)品體驗(yàn)。目前,阿里云的五大超級(jí)數(shù)據(jù)中心已經(jīng)部署了其自研架構(gòu)的神龍?jiān)品?wù)器,并應(yīng)用了阿里巴巴自研的AI芯片含光800。此外,阿里巴巴旗下平頭哥半導(dǎo)體有限公司于2021年10月發(fā)布了首顆ARM服務(wù)器芯片倚天710,也已經(jīng)在阿里云數(shù)據(jù)中心部署使用。
與此同時(shí),騰訊云面向云計(jì)算數(shù)據(jù)中心場(chǎng)景發(fā)布了星星海自研服務(wù)器,并分別發(fā)布了AI推理芯片“紫霄”、視頻轉(zhuǎn)碼芯片“滄海”和智能網(wǎng)卡芯片“玄靈”等三款自研芯片,并已經(jīng)取得進(jìn)展。百度的昆侖芯片一代、二代,也都已經(jīng)應(yīng)用于自己的人工智能算力中心之中了;在研發(fā)方面一向用心的華為,也發(fā)布了自己的鯤鵬處理器,適用于自己的TaiShan服務(wù)器。
據(jù)公開數(shù)據(jù)來看,這些新推出的芯片、服務(wù)器均實(shí)現(xiàn)了穩(wěn)步的降本增效??傊?,通過推動(dòng)自研服務(wù)器、芯片,目前國產(chǎn)云巨頭們都已經(jīng)開始在降功耗、降成本、提升用戶體驗(yàn)方面,邁出了重要一步。
另一方面,在數(shù)據(jù)大爆發(fā)的背景下,各大巨頭紛紛轉(zhuǎn)向以ARM、FPGA、ASIC等為核心的低功耗計(jì)算架構(gòu),避免對(duì)單一架構(gòu)的過度依賴。
過去數(shù)十年,全球算力基本上是CPU一家獨(dú)大,然而近年來隨著半導(dǎo)體工藝制程逼近極限,CPU算力愈加陷入瓶頸。隨著人工智能時(shí)代的到來,具有更低成本更高效率的GPU,逐漸成為了首選。不過,從行業(yè)來看,GPU并不是唯一選擇,但它代表了大數(shù)據(jù)、云服務(wù)時(shí)代,廠商對(duì)于高效、低功耗、低成本的專用芯片的追求。在外部場(chǎng)景日益復(fù)雜的背景下,非X86的算力架構(gòu)百花齊放,日益承擔(dān)起更大算力場(chǎng)景的“重任”。
以FPGA和ASIC兩個(gè)專業(yè)芯片來說,它們沒有傳統(tǒng)CPU的指令集,無需共享內(nèi)存,而是直接以流水線的方式處理數(shù)據(jù),不僅速度快而且功耗低的驚人,當(dāng)然代價(jià)是它僅用于特定目的,基本只能走定制或者半定制路線。
但在大數(shù)據(jù)算力場(chǎng)景之中,廣泛的數(shù)據(jù)處理需求與追求效率的“KPI”使其專業(yè)價(jià)值更被看重,大量的廠商研發(fā)、使用這些專用芯片就證明了這一點(diǎn)。比如,如今微軟在自家一半以上的數(shù)據(jù)中心的服務(wù)器中,使用了FPGA加速卡;谷歌更是基于ASIC架構(gòu),開發(fā)了專用于加速神經(jīng)網(wǎng)絡(luò)計(jì)算的TPU芯片,亞馬遜、IBM等業(yè)界大佬也都紛紛跟進(jìn)。
從長遠(yuǎn)來看,異構(gòu)、安全、綠色、集約化等特征,將成為未來算力發(fā)展的核心指標(biāo),也將是各路巨頭強(qiáng)化自身實(shí)力所要補(bǔ)足的核心環(huán)節(jié)。
算力革命下的新機(jī)遇與新挑戰(zhàn)
如前文所述,作為支持?jǐn)?shù)字經(jīng)濟(jì)以及智能化的核心基座,以數(shù)字新基建為代表的算力革命,正在催生出前所未有的新機(jī)遇,同時(shí)也將帶來一些不可避免的現(xiàn)實(shí)挑戰(zhàn)。
從機(jī)遇來說,目前國內(nèi)四大云巨頭雖然目標(biāo)不同、生態(tài)不同,但都在以推動(dòng)算力投資為抓手打開自己的新邊界。
以騰訊和華為為例,騰訊正在通過算力基礎(chǔ)設(shè)施投資,為其推動(dòng)空間從平面向立體、實(shí)景網(wǎng)絡(luò)與虛擬網(wǎng)絡(luò)的數(shù)字孿生、三維視覺網(wǎng)絡(luò)提供算力支持,加速一體化的數(shù)字技術(shù)與真實(shí)世界融合的全真互聯(lián)網(wǎng)時(shí)代的到來;身為ICT通訊技術(shù)大佬的華為則聚焦數(shù)字基建,推動(dòng)全光終端(全場(chǎng)景)、全光錨點(diǎn)(就近接入)、全光網(wǎng)關(guān)(無縫銜接)、全光調(diào)度(低時(shí)延)的全鏈條算力聯(lián)通,努力做數(shù)字基建的“擺渡人”。
不過,目前國內(nèi)搭建算力網(wǎng)絡(luò)也依舊面臨諸多挑戰(zhàn),其具體體現(xiàn)在以下2個(gè)方面:一是網(wǎng)絡(luò)方面仍面臨較多的問題,如實(shí)時(shí)性缺乏保障、寬帶太小,互聯(lián)互通不足等;二是算力產(chǎn)業(yè)鏈“關(guān)鍵環(huán)節(jié)”的國產(chǎn)化依舊比較低,包括服務(wù)器整機(jī)、操作系統(tǒng)、算力數(shù)據(jù)庫等領(lǐng)域,依舊較多受外部因素制約。
網(wǎng)絡(luò)方面以寶鋼為例,其內(nèi)部提到的云化問題就包括:存在大量非云化設(shè)備、協(xié)議不開放、工業(yè)連接不豐富、多網(wǎng)并存網(wǎng)絡(luò)安全無法保障等,就很直觀地體現(xiàn)了當(dāng)下算力網(wǎng)絡(luò)發(fā)展應(yīng)用所面臨的窘境。另外,諸如實(shí)時(shí)性差,對(duì)于產(chǎn)業(yè)數(shù)字化帶來的挑戰(zhàn)也很大。比如,生產(chǎn)中因?yàn)榫W(wǎng)絡(luò)慢了一秒,就有可能導(dǎo)致整個(gè)生產(chǎn)的連續(xù)性遭到破壞,進(jìn)而引發(fā)大規(guī)模返工造成企業(yè)巨大虧損。
國產(chǎn)化方面,目前服務(wù)器、操作系統(tǒng)以及數(shù)據(jù)庫等關(guān)鍵環(huán)節(jié),仍然為國外巨頭所壟斷。近年來國內(nèi)巨頭雖然都在研究自己的服務(wù)器和專屬芯片,但業(yè)內(nèi)人士認(rèn)為互聯(lián)網(wǎng)“造芯”(多為滿足自用),很難從根本上解決國內(nèi)服務(wù)器依賴芯片進(jìn)口的現(xiàn)狀。
因此從長遠(yuǎn)來看,要想保持國內(nèi)算力網(wǎng)絡(luò)建設(shè)的持續(xù)健康發(fā)展,還需要繼續(xù)加大力度補(bǔ)齊短板,通過產(chǎn)學(xué)研并舉掌握核心技術(shù),在高端芯片、核心算法等關(guān)鍵領(lǐng)域取得突破,才有望在未來實(shí)現(xiàn)國內(nèi)算力網(wǎng)絡(luò)資源的自主可控,進(jìn)而避免算力網(wǎng)絡(luò)陷入被“卡脖子”的風(fēng)險(xiǎn)之中。