文|Alter
東數(shù)西算工程啟動小半年后,算力服務(wù)網(wǎng)絡(luò)的概念正在加速升溫,頻頻成為行業(yè)論壇上的討論焦點,參與者也越來越多。
按照一些算力白皮書中的說法:要推動算力像水電一樣,可以“一點接入、即取即用”。想要達成“算力無所不在、網(wǎng)絡(luò)無所不達、智能無所不及”的遠大愿景,就需要算為中心、網(wǎng)為載體、多要素融合的算力服務(wù)網(wǎng)絡(luò)。
“算力服務(wù)網(wǎng)絡(luò)”的本質(zhì)似乎并不復(fù)雜,即通過系統(tǒng)化的方式解決算力的需求和供給問題。只是在算力成為水電一樣的基礎(chǔ)設(shè)施的過程中,仍然有很多待解的問題,有很多棘手的挑戰(zhàn),很多未知的探索和試錯。
而能否找到一條正確的路徑,直接關(guān)系著算力服務(wù)網(wǎng)絡(luò)的底色。
01 單一算力or多元算力
算力服務(wù)網(wǎng)絡(luò)的概念很熱,可外界對算力服務(wù)網(wǎng)絡(luò)的定義尚未統(tǒng)一。
不同企業(yè)對算力服務(wù)網(wǎng)絡(luò)的定義并不相同。有人理解為人工智能算力中心的聯(lián)網(wǎng)調(diào)度,也有人將算力服務(wù)網(wǎng)絡(luò)視為云化網(wǎng)絡(luò)的演變……現(xiàn)階段仍處于自圓其說的“狹義”階段,潛移默化地混淆了算力服務(wù)網(wǎng)絡(luò)的認(rèn)知。
算力服務(wù)網(wǎng)絡(luò)作為一個新興概念,上下游的參與者不計其數(shù),不排除一些企業(yè)或個人存在認(rèn)知上的局限性,遵循傳統(tǒng)的思維定式去理解新事物??苫氐剿懔Ψ?wù)網(wǎng)絡(luò)的初衷,左右行業(yè)潮向的可能不是哪一家企業(yè),甚至不是哪一個機構(gòu),而是真實存在的市場需求,市場需要什么樣的計算服務(wù),深切影響著算力服務(wù)網(wǎng)絡(luò)的內(nèi)涵。
中石油BGP處理中心原總工程師賴能和在2022中國算力發(fā)展研討會上,談及油氣勘探的算力需求:油氣勘探簡單地說就是給地表做CT,一個項目的原始數(shù)據(jù)往往超過100TB,甚至有些項目的原始數(shù)據(jù)超過1個PB,就需要巨大的算力作為支撐。由于油氣勘探是個龐大的系統(tǒng)工程,流程常常由幾百個模塊組成,整體的算力要求很高,且每個模塊的算力需求、運行精度等也有所不同。
賴能和在石油勘探中遇到的問題,無疑為算力服務(wù)網(wǎng)絡(luò)服務(wù)提供了一個重要啟示:在真實的應(yīng)用場景中,對算力的需求絕非是單一的,而是多元算力的融合,涉及到不同的計算場景、不同的計算架構(gòu)。
有別于電力服務(wù)中的統(tǒng)一標(biāo)準(zhǔn),不同行業(yè)、不同領(lǐng)域、不同場景、不同企業(yè)對算力的需求并不完全相同,以至于算力需求可以細分為幾百上千種。同時CPU算力、GPU算力、專用芯片產(chǎn)生的算力,不僅計算架構(gòu)不同,算力的精度也不同。算力服務(wù)網(wǎng)絡(luò)的出現(xiàn),絕不是基于算力屬性的連網(wǎng),而是輸出多元融合的算力。
倘若只是將單一的智算或超算編織成網(wǎng),或許可以滿足客戶在特定場景下的需求,可不同算力平臺的接口不規(guī)范、調(diào)用方式不統(tǒng)一、互相不兼容,等同于人為制造了一個個新的煙囪系統(tǒng),客戶需要花費額外的精力進行適配打通,以解決底層數(shù)據(jù)的互聯(lián)互通問題,儼然違背了算力服務(wù)網(wǎng)絡(luò)的初衷。
也就是說,算力服務(wù)網(wǎng)絡(luò)的正確理解應(yīng)該是多元算力的融合,是一項AI、Big Data、HPC深度融合調(diào)度的系統(tǒng)工程。一個算力服務(wù)網(wǎng)絡(luò)既要容納多元化的算力,滿足不同業(yè)務(wù)場景的算力需求,也要改變傳統(tǒng)的服務(wù)范式,按需按量為客戶提供計算、應(yīng)用、數(shù)據(jù)、調(diào)優(yōu)、咨詢、運營、運維等一站式服務(wù)。
02 算力服務(wù)網(wǎng)絡(luò)的“三座大山”
厘清了算力服務(wù)網(wǎng)絡(luò)的價值,還需要正視算力服務(wù)網(wǎng)絡(luò)面臨的挑戰(zhàn)。
就像水電之所以在日常生活和工業(yè)生產(chǎn)中扮演了不可或缺的角色,離不開國家電網(wǎng)等企業(yè)鋪設(shè)的一張張密密麻麻的電力網(wǎng)。算力服務(wù)網(wǎng)絡(luò)所肩負的使命,正是讓客戶能夠像購買電力一樣購買算力服務(wù)“套餐”。
算力服務(wù)網(wǎng)絡(luò)的愿景不可謂不明確,可想要將理想中的愿景變成現(xiàn)實,現(xiàn)階段至少存在三個方面的挑戰(zhàn)。
首先是算力分布的不均衡。
算力不是基礎(chǔ)的自然資源,對電力有著極高的依賴性,而國內(nèi)的電力資源又有著東西部分布不均衡的特點。再加上不同行業(yè)、不同領(lǐng)域?qū)λ懔Φ男枨蟛煌?,?dǎo)致數(shù)據(jù)中心的分布出現(xiàn)了行業(yè)、區(qū)域、領(lǐng)域的分布不均,國內(nèi)計算產(chǎn)業(yè)的復(fù)雜程度和局限性,已然超過了水和電。東數(shù)西算工程想要解決的就是這一問題,也因此經(jīng)常與西氣東輸、南水北調(diào)等大型工程相提并論。
然后是算力資源的不標(biāo)準(zhǔn)。
電力服務(wù)中雖然存在380V、220V、110V等不同的電壓,仍然可以用“多少度電”描述對電力的需求量,但算力服務(wù)中類似的標(biāo)準(zhǔn)還比較模糊,用戶很難精準(zhǔn)把握需要多少FLOPS的算力。算力服務(wù)網(wǎng)絡(luò)需要同步解決標(biāo)準(zhǔn)化的問題,不斷優(yōu)化算力的度量衡,結(jié)合傳輸、存儲等服務(wù)的不同需求,對波峰波谷不同時間的算力差異化定價。同樣是一個非常復(fù)雜的系統(tǒng)級工程。
再次是算力供需的不匹配。
隨著數(shù)字化轉(zhuǎn)型的持續(xù)深入,算力需求正在加速迭代:數(shù)據(jù)量負載從單一負載轉(zhuǎn)向混合負載、應(yīng)用場景也在經(jīng)歷簡單到復(fù)雜的演變。即使是工程量不算龐大的圖像訓(xùn)練,就包括數(shù)據(jù)轉(zhuǎn)發(fā)、壓縮存儲、加密解密、文件系統(tǒng)、數(shù)據(jù)查詢、圖像渲染等對個計算模塊,涉及到多種芯片的算力,一些長尾且剛需的計算場景,可能還需要提供定制的專屬服務(wù)。
做一個總結(jié)的話,將分布在國內(nèi)各地的數(shù)據(jù)中心進行統(tǒng)籌和連接,不過是算力服務(wù)網(wǎng)絡(luò)的第一步,能否通過算力調(diào)度系統(tǒng)合理調(diào)配、協(xié)調(diào)一致地提供算力服務(wù),能否基于場景需求向市場輸出算力、算法、數(shù)據(jù)、應(yīng)用高度協(xié)同的一體化資源,同樣是算力服務(wù)網(wǎng)絡(luò)服務(wù)商必須要應(yīng)對的問題。
算力服務(wù)網(wǎng)絡(luò)的根基不在于有多少家企業(yè)參與,而是有沒有專業(yè)的機構(gòu)或團隊對算力服務(wù)網(wǎng)絡(luò)進行標(biāo)準(zhǔn)化、精細化的管理,跳出某項業(yè)務(wù)升級為算力服務(wù)網(wǎng)絡(luò)的思維陷阱,通過專業(yè)的算力服務(wù)為數(shù)字產(chǎn)業(yè)提速增效。
03 算力生態(tài)正照進現(xiàn)實
沿循這樣的邏輯,算力服務(wù)網(wǎng)絡(luò)的進化可以粗略分為兩個階段。
第一個階段是平臺化,目的是降低算力服務(wù)的成本和門檻,就像是一條條高壓線將電力輸送給一家家工廠;第二個階段是生態(tài)化,也是目前計算市場所處的階段,目的是產(chǎn)業(yè)鏈協(xié)同釋放計算服務(wù)的內(nèi)生力量。第一階段解決了算力服務(wù)網(wǎng)絡(luò)的“可用”問題,第二階段則是算力服務(wù)網(wǎng)絡(luò)“好用”的不二法門。
借用中國信通院云計算與大數(shù)據(jù)研究所所長何寶宏的觀點:算力的資源描述、管理、調(diào)度和分配,不單單是技術(shù)問題,要構(gòu)建面向市場的經(jīng)濟型的生態(tài),如果沒有面向市場的激勵機制,沒有經(jīng)濟運算系統(tǒng),這個事情是做不成的。目前已經(jīng)有企業(yè)在做算力的輕結(jié)算,也出現(xiàn)了一些方法和工具,仍然有很多問題需要探討。
中科曙光副總裁曹振南有著同樣的洞察:光有算力并不能產(chǎn)生價值,只有把應(yīng)用支持好、服務(wù)好才能發(fā)揮它的價值。比算力平臺更重要的是做好算力生態(tài),譬如建立上下游互利共盈的商業(yè)模式。
這些業(yè)內(nèi)專家的觀點,傳遞出的不僅僅是一線參與者對算力服務(wù)網(wǎng)絡(luò)的思考,也再度印證了ABC融合的趨勢,即算力服務(wù)網(wǎng)絡(luò)整合的除了多元化的算力,還應(yīng)包括存儲、網(wǎng)絡(luò)、數(shù)據(jù)等分散性的資源,以資源池的方式重構(gòu)算力服務(wù)的基礎(chǔ)設(shè)施,并通過開放API等方式鏈接上下游伙伴形成廣闊的生態(tài)。
其中的底層邏輯在于,算力想要進一步和生產(chǎn)力劃上等號,勢必要和應(yīng)用產(chǎn)生更加緊密的聯(lián)系。農(nóng)業(yè)時代的水力、工業(yè)時代的電力、信息時代的網(wǎng)絡(luò)……這些在人類文明史中留下了濃墨重彩的通用技術(shù),無不依賴于形形色色的應(yīng)用。
算力“網(wǎng)絡(luò)”在某種程度上解決了算力的需求和供給,但在算力交付給用戶并產(chǎn)生價值的過程中,需要算力提供商、基礎(chǔ)軟件提供商、應(yīng)用軟件開發(fā)商、數(shù)據(jù)提供商、設(shè)計方、用戶等上下游的共同參與,尤其是那些有能力將算力服務(wù)開放出去的實力派,不應(yīng)缺席對應(yīng)用場景的滲透。
其實也為我們提供了一個新的視角,在算力服務(wù)網(wǎng)絡(luò)方興未艾的當(dāng)下,衡量一家企業(yè)競爭力的標(biāo)準(zhǔn),應(yīng)該上升到多元化算力的調(diào)度能力、一體化的算力運營力以及生態(tài)整合的綜合能力,這是連接算力價值的必備因素,也是算力服務(wù)網(wǎng)絡(luò)爭奪賽的勝負手。
當(dāng)然,任何生態(tài)都不是一朝一夕形成的,現(xiàn)階段算力服務(wù)網(wǎng)絡(luò)被討論最多的可能還是“削峰填谷”技術(shù)為核心算力按需調(diào)度,但對賽場上的玩家們來說,需要有腳踏實地的耐心,也需要有仰望星空的信心。
04 寫在最后
按照中國信通院的測算,算力發(fā)展指數(shù)每提高一個點,GDP增長約為1293億元,占到整個GDP的1.3‰。算力規(guī)模和經(jīng)濟增長所呈現(xiàn)出的正相關(guān)關(guān)系,無疑為計算產(chǎn)業(yè)的蓬勃發(fā)展埋下了伏筆。
何況十四五規(guī)劃和2035年遠景目標(biāo)中早已明確提出:“加快構(gòu)建全國一體化大數(shù)據(jù)中心體系,強化算力統(tǒng)籌智能調(diào)度?!痹趪鴥?nèi)經(jīng)濟換擋增長的窗口期,一場系統(tǒng)性的計算服務(wù)革命幾乎是可以預(yù)期的結(jié)果。