文|半導(dǎo)體產(chǎn)業(yè)縱橫
曾經(jīng),作為電腦的大腦,計(jì)算機(jī)需要CPU。計(jì)算機(jī)內(nèi)存儲的數(shù)據(jù)、外圍的設(shè)備和其他組建要么將數(shù)據(jù)輸入CPU,要么接受CPU的指令。
后來,為了減輕CPU的壓力,GPU應(yīng)運(yùn)而生。雖然GPU的出現(xiàn)是為了減輕CPU在圖像處理方面的壓力,但是由于其優(yōu)秀的并行處理能力,如今GPU不局限于圖像渲染,還應(yīng)用于人工智能、深度學(xué)習(xí)、大數(shù)據(jù)分析等領(lǐng)域。
到了現(xiàn)在,隨著核心網(wǎng)、匯聚網(wǎng)朝著100G、200G發(fā)展,接入網(wǎng)也達(dá)到50G、100G,CPU無法提供足夠的算力來處理數(shù)據(jù)包。因此,出現(xiàn)了“性能帶寬增速比失調(diào)”的問題。AWS形象地稱之為“數(shù)據(jù)中心稅”——還未運(yùn)行業(yè)務(wù)程序,接入網(wǎng)絡(luò)數(shù)據(jù)就要占去許多計(jì)算資源。
舉一個(gè)例子,在云計(jì)算場景下,虛擬機(jī)之間的數(shù)據(jù)轉(zhuǎn)發(fā),通常而言20個(gè)VM需要消耗的算力,如果用Xeon的多核CPU來處理大概需要5個(gè)核的算力,這是將一筆比很大的開銷。
阿里云彈性計(jì)算產(chǎn)品線負(fù)責(zé)人張獻(xiàn)濤曾經(jīng)算了一筆賬,阿里云營收規(guī)模已經(jīng)達(dá)到上百億元,如果存儲、網(wǎng)絡(luò)占用約10%的CPU資源,則意味著年損失10多億元。
因此,為了繼續(xù)減輕CPU的負(fù)擔(dān),DPU登上舞臺。對于CPU處理效率低下同時(shí)GPU也處理不了的負(fù)載,就可以卸載到專用的DPU進(jìn)行處理。
DPU的概念是由英偉達(dá)帶火的。在2020年上半年,英偉達(dá)以69億美元的對價(jià)收購以色列網(wǎng)絡(luò)芯片公司 Mellanox Technologies,并與同年推出BlueField-2 DPU,從此拉開了DPU發(fā)展的序幕。
英偉達(dá)首席執(zhí)行官黃仁勛表示:“DPU將是未來計(jì)算的三大支柱之一。CPU用于通用計(jì)算、GPU用于加速計(jì)算,而DPU在數(shù)據(jù)中心移動數(shù)據(jù),進(jìn)行數(shù)據(jù)處理?!?/p>
DPU競爭開始
DPU最早落地的領(lǐng)域是云計(jì)算,很多云服務(wù)商早就意識到了問題,AWS從2015年就已經(jīng)探索DPU的發(fā)展,收購芯片廠商Annapurna Labs,推出Nitro芯片。雖然當(dāng)時(shí)還沒有“DPU”這一名字,但Nitro被公認(rèn)為是DPU的早期形態(tài)。之后,2017年AWS正式推出了Nitro,將網(wǎng)絡(luò)、存儲和安全任務(wù)卸載到基于Arm架構(gòu)的專用設(shè)備上。
同樣是2017年,為了解決隨著云計(jì)算業(yè)務(wù)規(guī)模的擴(kuò)大,資源爭搶、算力損失的問題,阿里云推出了神龍(X-Dragon),通過虛擬化來達(dá)到轉(zhuǎn)接CPU存儲、網(wǎng)絡(luò)等基礎(chǔ)功能的目的。很快,阿里云就把天貓雙十一當(dāng)做試驗(yàn)場并成功運(yùn)營,后來上汽成了第一家神龍架構(gòu)的試驗(yàn)客戶。
回看過去,我們可以將2017這一年稱之為DPU元年。
三年后英偉達(dá)將其命名為DPU之后,才有了一個(gè)統(tǒng)一的叫法。目前來看,真正實(shí)現(xiàn)大規(guī)模商用DPU架構(gòu)的,全球只有兩家:亞馬遜的AWS,以及阿里云。
而云服務(wù)商中,不止亞馬遜與阿里云布局DPU,同樣看中云服務(wù)的騰訊云也加入了DPU的研發(fā)。以統(tǒng)一算力底座,降低總體成本為目的,騰訊自研了水杉和銀杉兩代DPU。目前,騰訊自研DPU已經(jīng)支撐公有云外部客戶,以及微信、QQ、騰訊會議等自研業(yè)務(wù)上云。
去年加入云計(jì)算的新成員字節(jié)跳動也宣布將自研DPU,計(jì)劃通過火山引擎云產(chǎn)品的方式對外服務(wù)。
在云廠商的來勢洶洶下,芯片廠商也并非無動于衷。
當(dāng)初帶火DPU的英偉達(dá),自然對DPU有所部署。英偉達(dá)計(jì)劃在2022年推出性能更強(qiáng)的BlueField3;到2022年,英偉達(dá)計(jì)劃推出第三代DPU;2024年推出集成其GPU模塊的BlueField4。
Marvell最新推出的OCTEON 10系列DPU,采用了Armv9架構(gòu)的Neoverse N2 CPU內(nèi)核和臺積電5nm制程工藝,支持最新的PCIe 5.0 I/O與DDR5內(nèi)存。作為DPU的重要補(bǔ)充,Marvell還為OCTEON 10引入了內(nèi)部機(jī)器學(xué)習(xí)(ML)引擎。這樣,從本質(zhì)上講,Marvell正在成為英偉達(dá)的直接競爭對手。
英特爾也參與戰(zhàn)局,在2021年6月發(fā)布首款I(lǐng)PU產(chǎn)品,將其視為云戰(zhàn)略的重要支柱之一,助力數(shù)據(jù)中心網(wǎng)絡(luò)加速走向可編程的分布式架構(gòu)。2022年4月,英特爾公布收購云解決方案公司Granulate的協(xié)議,以提升自身在云計(jì)算系統(tǒng)的綜合協(xié)調(diào)性;2022年5月,英特爾發(fā)布第二代IPU,并公布將在2023—2024年間上線第三代IPU的消息。基于端到端可編程能力,英特爾不斷在“云端”實(shí)現(xiàn)高效運(yùn)算,解鎖數(shù)據(jù)中心基礎(chǔ)設(shè)施的新潛力。
國內(nèi)DPU初創(chuàng)企業(yè)
DPU的賽道上也逐漸出現(xiàn)了中國企業(yè)的身影,并且隨著DPU風(fēng)口的漸起成功融到資金。目前來說,國內(nèi)比較受到關(guān)注的DPU初創(chuàng)企業(yè)包括:云豹智能、中科馭數(shù)、芯啟源、云脈芯聯(lián)、星云智聯(lián)、大禹智芯。
今年6月,大禹智芯宣布完成A輪融資,融資金額未公布,該輪融資由前海方舟旗下的智慧互聯(lián)產(chǎn)業(yè)基金、中原前?;鸷妄R魯前海基金共同投資,融資資金將用于產(chǎn)品研發(fā)和推廣。
云豹智能同樣在6月完成了B輪融資,據(jù)悉本輪云豹投后估值約90 億元,而本輪投資方包括騰訊、淡馬錫、深創(chuàng)投、華西村股份旗下投資平臺一村資本、民生銀行上市金融控股平臺民銀資本、耀途資本,這是騰訊第3 次投資這家成立不到 2 年的 DPU 公司。
9月,中科馭數(shù)宣布完成超以往輪次融資規(guī)模的數(shù)億元B輪融資,由金融街資本領(lǐng)投,建設(shè)銀行旗下建信股權(quán)跟投,老股東靈均投資、光環(huán)資本、泉宗資本連續(xù)三輪追投。
芯啟源在去年11月完成數(shù)億元的Pre-A4 輪融資后,今年3月宣布再獲超億元戰(zhàn)略投資,本輪融資由國家集成電路產(chǎn)業(yè)基金旗下子基金上海超越摩爾領(lǐng)投,老股東允泰資本繼續(xù)堅(jiān)定跟投。
可以看到,在DPU的熱潮下,不少初創(chuàng)企業(yè)紛紛拿到巨額融資。但作為數(shù)據(jù)處理的一大將,DPU需要與CPU、GPU同量級的投入,可是市場規(guī)模遠(yuǎn)不如CPU、GPU。據(jù)統(tǒng)計(jì),2021年全球DPU市場規(guī)模達(dá)到50.7億美元,CPU市場規(guī)模則可達(dá)532億美元,這其中是10倍的差距。
有業(yè)內(nèi)人士做過一個(gè)估算,在終端場景,大芯片的銷量至少需要達(dá)到數(shù)千萬級別才能有效攤薄一次性的研發(fā)成本;在數(shù)據(jù)中心場景,則需要50萬甚至100萬以上的銷量,才能有效攤薄研發(fā)成本。
根據(jù)海外做 DPU 的初創(chuàng)公司如 Fungible 和 Pensando 等需要的資深開發(fā)人員規(guī)模、研發(fā)時(shí)間、需要購買的 IP 和測試工具以及這些公司融到的資金去估算,開發(fā)這樣復(fù)雜的高端通用的 DPU 芯片大概需要 3 億美元以上的成本,才能實(shí)現(xiàn)客戶量產(chǎn)。
這注定了DPU不可能是一個(gè)簡單的創(chuàng)業(yè)“游戲”。
DeepTech曾經(jīng)總結(jié)了打造一個(gè)成功的 DPU 芯片企業(yè),至少需要兼具的六大條件:一是具備高端芯片開發(fā)經(jīng)驗(yàn);二是要有大量商業(yè)落地的經(jīng)驗(yàn);三是有成功創(chuàng)業(yè)經(jīng)驗(yàn)的團(tuán)隊(duì);四是對云計(jì)算客戶業(yè)務(wù)非常熟悉;五是與云計(jì)算大廠客戶緊密合作,有豐富的場景實(shí)戰(zhàn)經(jīng)驗(yàn);六是必須要巨額融資。
創(chuàng)始人經(jīng)歷來看,不少初創(chuàng)公司或缺乏高端芯片開發(fā)經(jīng)驗(yàn),或缺乏頭部云服務(wù)商合作的經(jīng)驗(yàn)等,是否能走到最后還是一個(gè)問號。
云豹智能創(chuàng)始人蕭啟陽,博士畢業(yè)于美國斯坦福大學(xué),后續(xù)在硅谷創(chuàng)辦 RMI 公司;中科馭數(shù)創(chuàng)始人鄢貴海是中科院背景;芯啟源,創(chuàng)始人盧笙有銷售 USB 和 TCAM 芯片的背景;大禹智芯創(chuàng)始人李爽是前美團(tuán)公有云的負(fù)責(zé)人,對云業(yè)務(wù)有一定的認(rèn)識,這四家家公司創(chuàng)始人都有相關(guān)背景。
云脈芯聯(lián)、星云智聯(lián)等企業(yè)的創(chuàng)始人在公開資料中,并沒有開發(fā)高端芯片和創(chuàng)業(yè)的經(jīng)驗(yàn)。云脈芯聯(lián)創(chuàng)始人劉永鋒是技術(shù)出身,曾在阿里和華為工作過,在公開信息沒有查到其創(chuàng)始人有開發(fā)高端芯片和創(chuàng)業(yè)的經(jīng)驗(yàn);星云智聯(lián),兩位創(chuàng)始人是夏廬生和于勇。夏廬生曾擔(dān)任安信證券研究中心通信行業(yè)首席分析師,公開信息查不到于勇在芯片行業(yè)的背景。
即使強(qiáng)如英偉達(dá),其DPU發(fā)布兩年左右,使用的人數(shù)也尚且不多,更何況是本就在芯片方面發(fā)展相對欠缺的中國芯片初創(chuàng)企業(yè)。目前能夠拿出成績的僅有中科馭數(shù)、云豹智能兩家企業(yè)。
成立僅一年后,中科馭數(shù)第一顆芯片就已成功完成流片,并取得了業(yè)界數(shù)據(jù)庫與時(shí)序數(shù)據(jù)處理融合加速芯片零的突破。中科馭數(shù)的第三代DPU芯片的研發(fā)迭代也已經(jīng)接近尾聲。中科馭數(shù)第二代DPU芯片K2已于今年年初投片,預(yù)計(jì)在10月回片。
云豹的第一款 DPU SoC(系統(tǒng)級芯片)正在開發(fā)階段,計(jì)劃于明年量產(chǎn)。去年底云豹已發(fā)布基于 FPGA 版本的 DPU 云霄。
與 CPU、GPU 等一樣,DPU 結(jié)構(gòu)復(fù)雜、開發(fā)周期長、投入大。起步于2020 年和 2021 年的中國DPU初創(chuàng)企業(yè),算上前期團(tuán)隊(duì)組建時(shí)間,開發(fā)周期也僅在 1 年左右,何時(shí)能出現(xiàn)量產(chǎn)的產(chǎn)品是市場都在期待的。
總結(jié)
實(shí)際上,梳理中國DPU行業(yè)商業(yè)模式后,能將其分為兩種。
一種是以芯啟源為代表的,通過自研中高級軟件、外購處理器和網(wǎng)絡(luò)芯片的方式,這類方式門檻適中,DPU產(chǎn)線核心研發(fā)團(tuán)隊(duì)需至少10人,預(yù)判在5至8年收回前期成本。
另一種是以中科馭數(shù)和云豹為代表的,自研處理器微架構(gòu)和中高級軟件,外購網(wǎng)絡(luò)芯片的方式,這類方式門檻較高,DPU產(chǎn)線核心研發(fā)團(tuán)隊(duì)需具備至少40人。
DPU沒有統(tǒng)一的標(biāo)準(zhǔn)、需要與云計(jì)算基礎(chǔ)設(shè)施緊密綁定、產(chǎn)品的通用性問題、沒有明確的大客戶,這些都是DPU創(chuàng)業(yè)會遇到的問題。
目前要解決DPU標(biāo)準(zhǔn)化應(yīng)用,還存在一定挑戰(zhàn)。由于數(shù)據(jù)中心本身的復(fù)雜性,各大廠商一方面采用商用現(xiàn)貨組件(即COTS)來構(gòu)建系統(tǒng),追求低成本,一方面又設(shè)法分層服務(wù)化,打造面向不用類型客戶的標(biāo)準(zhǔn)化產(chǎn)品,但除此之外的所有技術(shù)實(shí)現(xiàn)幾乎都是“八仙過海,各顯神通。”
中科馭數(shù)創(chuàng)始人鄢貴海也表示:“有的廠商強(qiáng)化IO能力、有的關(guān)注路由轉(zhuǎn)發(fā)、有的重視存儲卸載、有的關(guān)注安全加密,不一而足?!倍蠈迂?fù)載不同,也必然對底層架構(gòu)有各異的需求,這也許是目前DPU標(biāo)準(zhǔn)化面臨的最大挑戰(zhàn)。