正在閱讀:

黃仁勛揭曉AI芯片最新路線圖,一文看懂GTC2025

掃一掃下載界面新聞APP

黃仁勛揭曉AI芯片最新路線圖,一文看懂GTC2025

股價(jià)保衛(wèi)戰(zhàn)惜敗!

文|硅兔賽跑 Xuushan

編輯|伊凡

現(xiàn)場(chǎng)一票難求,線上股價(jià)狂跌。

“買得越多,省得越多,賺得越多。”

英偉達(dá)GTC大會(huì)上黃仁勛打響了今年AI界帶貨最強(qiáng)Slogan。

在加利福尼亞州圣何塞SAP中心,一身標(biāo)志性皮衣的黃仁勛快步上臺(tái),表示今年的GTC大會(huì),是AI超級(jí)碗——AI正在解決更多行業(yè)與公司的更多問題,作為科技行業(yè)的風(fēng)向標(biāo),這場(chǎng)大會(huì)涉及1000場(chǎng)會(huì)議、2000名演講者和近400家參展商,超25000+參會(huì)人員。門票在會(huì)前被炒到了萬元高價(jià),并且早已售罄。

此次GTC大會(huì)對(duì)英偉達(dá)來說,是至關(guān)重要的一戰(zhàn)。

外界所關(guān)注的,AI的熱潮是否已經(jīng)達(dá)到頂峰?AI芯片的銷售是否放緩?當(dāng)DeepSeek證明了另一條性價(jià)比更高的計(jì)算路線時(shí),還在堅(jiān)持大算力的英偉達(dá)還能否坐穩(wěn)AI基建王者的寶座?

會(huì)前投資者的種種質(zhì)疑在黃仁勛為GTC準(zhǔn)備長(zhǎng)達(dá)120分鐘的演講之后逐漸消散。英偉達(dá)不僅直接公開了四年三代GPU架構(gòu)路線圖,Blackwell Ultra、Rubin、Rubin Ultra、Feynman等芯片悉數(shù)上臺(tái),而且還提及了AI、數(shù)據(jù)中心、機(jī)器人、CUDA生態(tài)等諸多進(jìn)展。

不過,投資者對(duì)此反應(yīng)平淡,主題演講結(jié)束后,英偉達(dá)的股價(jià)略有波動(dòng),股價(jià)下跌3.5%。英偉達(dá)生態(tài)內(nèi)的概念股,如臺(tái)積電、中電港、勝宏科技、鴻博股份君則有小幅下降。其中,英偉達(dá)國(guó)內(nèi)算力板第一供應(yīng)商勝宏科技,股價(jià)下跌5.75%。

業(yè)界表明,股價(jià)下跌的原因主要由于黃仁勛的演講基本在華爾街的意料之中,許多新的技術(shù)進(jìn)展已在今年的CES中有所涉及,而黃仁勛提及的關(guān)于量子計(jì)算、具身智能的部分,很難在短期內(nèi)看到有實(shí)質(zhì)增長(zhǎng)的可能。

英偉達(dá)半年來的股價(jià)走勢(shì) 來源:TradingView

以下是今日GTC大會(huì)主題演講干貨提煉:

1、芯片全家桶全面升級(jí):Blackwell芯片銷量提速,將是Hopper的3倍;Blackwell Ultra將是首個(gè)擁有288GB HBM3e的GPU,并配有GB300 NVL72機(jī)架、HGX B300 NVL16機(jī)架組合系統(tǒng)方案,將是今年下半年的主推產(chǎn)品;

首次公布未來三年技術(shù)藍(lán)圖:2026年推出Rubin架構(gòu)(FP4算力達(dá)100P Flops),2027年Rubin Ultra支持576個(gè)GPU集群,Rubin的AI工廠性能或能達(dá)到Hopper的900倍;2028年發(fā)布Feynman架構(gòu);

英偉達(dá)還與臺(tái)積電聯(lián)合封裝光網(wǎng)絡(luò)芯片,并于今年下半年將推出新版以太網(wǎng)芯片;

2、打造超算中心工廠:面向開發(fā)者以及企業(yè)研發(fā)場(chǎng)景,推出全球最小AI超級(jí)計(jì)算機(jī)DGX Spark以及AI超算DGX Station;推出搭載Blackwell Ultra GPU的DGX SuperPOD,提供AI工廠超級(jí)計(jì)算,并同步推出DGX GB300和 DGX B300系統(tǒng),組合提供開箱即用的 DGX SuperPOD AI 超級(jí)計(jì)算機(jī);上線英偉達(dá)Instant AI Factory,實(shí)現(xiàn)AI托管服務(wù)等;

3、推出AI推理模型系列:推出AI推理服務(wù)軟件Dynamo,旨在為部署推理 AI 模型的AI工廠最大化其token收益,可將DeepSeek-R1模型生成tokens數(shù)量提升30倍以上,每秒處理超30000tokens;推出全新Llama Nemotron推理模型,并幫助企業(yè)構(gòu)建企業(yè)級(jí)AI數(shù)據(jù)平臺(tái);

4、開源機(jī)器人模型:與谷歌DeepMind、迪士尼聯(lián)手打造的機(jī)器人上臺(tái)互動(dòng);亮相全球首個(gè)開源且完全可定制的基礎(chǔ)模型 NVIDIA Isaac GR00T N1,讓通用人形機(jī)器人實(shí)現(xiàn)推理及各項(xiàng)技能;

5、鞏固CUDA生態(tài):推出搭載GH200超級(jí)芯片的CUDA-X庫,讓CUDA-X與最新的超級(jí)芯片架構(gòu)協(xié)同工作實(shí)現(xiàn),計(jì)算工程工具的速度可提高11倍,計(jì)算量可擴(kuò)大5倍;首次設(shè)立量子計(jì)算日,并升級(jí)cuQuantum庫,推動(dòng)量子計(jì)算研究。

會(huì)上,英偉達(dá)還多次提及中國(guó)AI大模型DeepSeek,提及DeepSeek整體有利于英偉達(dá)更快速推動(dòng)生態(tài)建設(shè),并不會(huì)對(duì)英偉達(dá)造成負(fù)面影響,黃仁勛對(duì)此前大幅跳水的股價(jià)做出回應(yīng)。事實(shí)上,通過每年迭代一代架構(gòu)的速度,英偉達(dá)將AI算力密度提升周期逐漸縮短。

生成式AI第三年,英偉達(dá)通過GTC 2025大會(huì)正式宣告其構(gòu)建AI全?;ㄉ鷳B(tài)的野心,從硬件代際差、生態(tài)壟斷性和行業(yè)標(biāo)準(zhǔn)制定權(quán),英偉達(dá)圍繞“技術(shù)-商業(yè)”雙閉環(huán)的護(hù)城河逐漸完善,短期時(shí)間內(nèi),英偉達(dá)在AI基建領(lǐng)域幾乎毫無對(duì)手。

四年三架構(gòu)技術(shù)路線圖揭曉!黃仁勛:tokens是一切的基礎(chǔ)

“去年的一切都是錯(cuò)的,Scaling Law(擴(kuò)展定律)遠(yuǎn)沒有結(jié)束。”黃仁勛直言,擴(kuò)展定律正在以超過人們預(yù)期的方向發(fā)展。當(dāng)AI從過去依賴經(jīng)驗(yàn)和預(yù)訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)并推理,轉(zhuǎn)向采用思維鏈的方式,生成完整推理步驟,對(duì)算力的需求指數(shù)級(jí)提升。

在現(xiàn)場(chǎng)他用Llama 3.3 70B和DeepSeek R1模型進(jìn)行演示,向他們同時(shí)提出一個(gè)排座位的問題。傳統(tǒng)的Llama模型僅適用439tokens進(jìn)行訓(xùn)練,最后給出一個(gè)錯(cuò)誤的答案,而推理模型DeepSeek R1則使用了8559tokens進(jìn)行反復(fù)思考,是Llama的20倍,其中調(diào)用的計(jì)算資源也是Llama的150倍,最終給出一個(gè)正確的答案。

黃仁勛認(rèn)為數(shù)據(jù)仍是一切核心,盡管是R1也花費(fèi)了6080億的訓(xùn)練數(shù)據(jù),而下一代的模型提升或許需要數(shù)萬億的數(shù)據(jù)。Scaling Law所引領(lǐng)的大算力思路在英偉達(dá)的敘事中,仍然奏效。甚至,此次大會(huì)上,英偉達(dá)提出的Scaling Law的三大階段:Pre-Training Scaling、Post-Training Scaling、Test-Time Scaling“Long Thinking”階段。整個(gè)行業(yè)也將會(huì)從Agentic AI(AI代理)逐步轉(zhuǎn)向Physical AI(物理AI:指的是讓機(jī)器人、自動(dòng)駕駛汽車和智能空間等自主系統(tǒng)能夠感知、理解和執(zhí)行真實(shí)世界中的復(fù)雜動(dòng)作。由于它能夠生成見解和動(dòng)作,因此也經(jīng)常被稱為“生成物理 AI”。)。

“我希望大家走在對(duì)的方向上”,黃仁勛此次回應(yīng),或許也是對(duì)此前AI奇點(diǎn)已到,數(shù)據(jù)不再是AI模型提升的關(guān)鍵等一系列回應(yīng)的正面回應(yīng)。今年以來,英偉達(dá)的股價(jià)跌超13%,市值與2025年1月7日盤中創(chuàng)下的歷史高點(diǎn)相比,市值已經(jīng)蒸發(fā)近8200億美元。在這場(chǎng)股價(jià)保衛(wèi)戰(zhàn)上,黃仁勛選擇直面市場(chǎng)對(duì)英偉達(dá)股價(jià)與增長(zhǎng)潛力的質(zhì)疑。

表明了數(shù)據(jù)和算力仍是AI時(shí)代最關(guān)鍵的兩大方向之后,黃仁勛開始秀起了自己家的百寶箱。從2025年,英偉達(dá)將會(huì)在四年時(shí)間內(nèi)先后推出Blackwell、Rubin、Feynman三大架構(gòu)系列芯片。

Blackwell Ultra將承擔(dān)今年下半年主力產(chǎn)品,該系列其包括GB300 NVL72機(jī)架級(jí)解決方案以及NVIDIA HGX B300 NVL16系統(tǒng)。GB300 NVL72機(jī)架將把72個(gè)Blackwell Ultra GPU與36個(gè)基于Arm Neoverse的Grace CPU相連,Blackwell Ultra預(yù)計(jì)將比前代產(chǎn)品(H100)提供1.5倍的FP4推理能力,可以顯著加速AI推理能力。

可以看出,Blackwell Ultra相比上一代產(chǎn)品有些提升,但整體性能提升也沒有很驚喜,算是小版本升級(jí)。

芯片性能的“大升級(jí)”或在明年,承載英偉達(dá)希望的Rubin系列,將在2026年問世。此前,黃仁勛稱其計(jì)算能力能夠?qū)崿F(xiàn)“巨大飛躍”。Rubin主要是以發(fā)現(xiàn)暗物質(zhì)的天文學(xué)家Vera Rubin的名字命名。

今天,英偉達(dá)則進(jìn)一步透露有關(guān)Rubin系列最新信息。明年,Rubin將作為GPU的旗艦芯和Vera作為CPU旗艦芯同期發(fā)布。

用一個(gè)比喻或許就能表現(xiàn)出英偉達(dá)在AI時(shí)代的野心——英偉達(dá)正在構(gòu)建一個(gè)從市區(qū)、高速公路再到郊區(qū)的龐大AI帝國(guó)。

CPU是市區(qū),GPU是正在開發(fā)的高新區(qū),在這兩者之間,需要通過一個(gè)叫做PCIE的通道連接,車流量就是數(shù)據(jù)量。如果數(shù)據(jù)量大,就需要擴(kuò)大道路,或增加車道。只有CPU能夠決定這個(gè)分配。一直以來,CPU生態(tài)被Arm和英特爾的X86長(zhǎng)期壟斷?,F(xiàn)在,英偉達(dá)對(duì)他們發(fā)起了挑戰(zhàn)。

Vera Rubin是英偉達(dá)CPU+GPU戰(zhàn)略的重要落子,其將于2026年下半年發(fā)布,將配備一個(gè)名為Vera的定制Nvidia設(shè)計(jì)CPU。Nvidia 聲稱,與其前身 Grace Blackwell 相比,Vera Rubin 的性能有了顯著提升,尤其是在 AI 推理和訓(xùn)練任務(wù)方面。

其中,Vera有88個(gè)定制ARM結(jié)構(gòu)的內(nèi)核和176個(gè)線程。同時(shí),Vera還會(huì)有一個(gè)1.8TB/s NVLink的內(nèi)核接口,用于與Rubin GPU連接。與傳統(tǒng)的互聯(lián)技術(shù)相比,英偉達(dá)的這種互聯(lián)技術(shù)的速度更快,能夠通過的“車輛”更多。Vera將會(huì)取代現(xiàn)有的Grace CPU。據(jù)英偉達(dá)透露,Vera的新架構(gòu)設(shè)計(jì)將會(huì)比Grace CPU快兩倍。在2021年的GTC大會(huì)上,英偉達(dá)推出了其第一款CPU——Grace,以Arm架構(gòu)為核心。

看回Rubin系列,Rubin這次仍然是拼接式的設(shè)計(jì),也就是它其實(shí)是兩個(gè)GPU在電路板上拼接在一起,組成了一個(gè)新的GPU。性能上,與B300相比,Rubin計(jì)算性能提高了3.3倍,能提供1.2 ExaFLOPS FP8訓(xùn)練。

Vera Rubin可提供50 petaflops浮點(diǎn)運(yùn)算的FP4 推理性能,是Blackwell Ultra在類似機(jī)架配置的3.3倍。

2027年,Rubin Ultra將內(nèi)含4個(gè)GPU,支持576個(gè)GPU集群,在機(jī)架層面,將會(huì)比Rubin NVL144配置強(qiáng)大約四倍。同時(shí),英偉達(dá)計(jì)劃在。此外,F(xiàn)eynman同樣將會(huì)采用Vera CPU。

從最新的技術(shù)路線圖中可以看出,目前英偉達(dá)的GPU更新基本維持在兩年一個(gè)大版本升級(jí),一年一個(gè)小迭代的節(jié)奏上行穩(wěn)步推進(jìn),而CPU方向新品節(jié)奏稍緩,或許3年左右才會(huì)有較大的一個(gè)版本升級(jí)。

但無論如何,英偉達(dá)自研的GPU+CPU生態(tài)已經(jīng)逐漸完善,根據(jù)摩根斯坦利統(tǒng)計(jì),英偉達(dá)占據(jù)了全球AI專用芯片將近77%的市場(chǎng)份額。同時(shí)英偉達(dá)還一直是臺(tái)積電的VVVIP客戶,幾乎拿下了臺(tái)積電的大半產(chǎn)能,擁有強(qiáng)大的供應(yīng)鏈優(yōu)勢(shì)。英偉達(dá)的Rubin采用了臺(tái)積電3nm工藝、CoWoS(Chip on Wafer Substrate)封裝技術(shù)。最先進(jìn)的制造和封裝工藝,意味著這款芯片的性能將大幅度提升,英偉達(dá)也將在與臺(tái)積電的合作中積累豐富的先進(jìn)制程IP。一位芯片從業(yè)人士告訴硅兔君,先進(jìn)制程的產(chǎn)能一般是有限的,大客戶能夠獲得內(nèi)測(cè)以及訂單的優(yōu)先級(jí)。

再加上,英偉達(dá)一直在和各行各業(yè)的頭部公司合作,了解行業(yè)內(nèi)最先進(jìn)的技術(shù)、創(chuàng)新動(dòng)向以及行業(yè)Know-how??梢哉f,在AI訓(xùn)練側(cè),英偉達(dá)的芯片組合拳幾乎無人能擋。這也是英偉達(dá)能一路無阻地登上AI基建寶座的核心關(guān)鍵,同樣數(shù)據(jù)中心也為英偉達(dá)貢獻(xiàn)了大部分營(yíng)收。

英偉達(dá)2014-2024年主營(yíng)業(yè)務(wù)收入占比變化 來源:Wind、五礦證券研究所

再加上,英偉達(dá)一直在和各行各業(yè)的頭部公司合作,了解行業(yè)內(nèi)最先進(jìn)的技術(shù)、創(chuàng)新動(dòng)向以及行業(yè)Know-how??梢哉f,在AI訓(xùn)練側(cè),英偉達(dá)的芯片組合拳幾乎無人能擋。這也是英偉達(dá)能一路無阻地登上AI基建寶座的核心關(guān)鍵,同樣數(shù)據(jù)中心也為英偉達(dá)貢獻(xiàn)了大部分營(yíng)收。

黃仁勛透露,今年,微軟、谷歌、亞馬遜和Meta四家大型云服務(wù)商已經(jīng)購入360萬顆Blackwell芯片,理想預(yù)計(jì),2028年數(shù)據(jù)中心資本支出規(guī)模突破1萬億美元。科技巨頭們對(duì)數(shù)據(jù)中心建設(shè)的熱情將會(huì)推動(dòng)著英偉達(dá)的芯片銷售主要驅(qū)動(dòng)力。2024年三季度,英偉達(dá)的GPU市場(chǎng)份額達(dá)到90%。

賣鏟人的財(cái)富傳奇還遠(yuǎn)沒有結(jié)束,財(cái)報(bào)顯示,該公司截至1月份的2025財(cái)年銷售額增長(zhǎng)了一倍多,達(dá)到1246.2億美元。

投資分析師Vellante 表示:“我們相信GTC 2025將樹立另一個(gè)里程碑,標(biāo)志著未來極端并行計(jì)算不僅限于最大的公司,而是所有公司的日常?!?/p>

但同時(shí),我們也注意到近期財(cái)報(bào)顯示,Blackwell芯片的毛利率正在小幅下跌,下一代GPU能否夠順利投產(chǎn),下一代GPU是否能繼續(xù)成為英偉達(dá)的“搖錢樹”,或許市場(chǎng)還需驗(yàn)證。

Agentic AI+Physical AI,英偉達(dá)的下一代增長(zhǎng)渦輪

“AI正在經(jīng)歷一個(gè)拐點(diǎn),它將變得更智能、更有用?!?/p>

黃仁勛回憶道兩年前,ChatGPT出現(xiàn)的時(shí)候,很多復(fù)雜的問題和很多簡(jiǎn)單的問題,它都難以回答。無論訓(xùn)練多少次,研究過多少信息,但對(duì)所有問題,它都只思考一次,就像人類的脫口而出一樣。但現(xiàn)在有了推理,AI也有了反復(fù)思索的能力,思維鏈的技術(shù)能夠逐步完善。

黃仁勛認(rèn)為未來每個(gè)企業(yè)都會(huì)有兩個(gè)工廠,一個(gè)是他們建造的工廠,而另一個(gè)則是他們的AI工廠,主要為了科研或者是培訓(xùn)。他在主題演講一開始就提到Agentic AI以及Physical AI將會(huì)是今年討論的核心。

如果AI在未來將會(huì)無孔不入地深入到各行業(yè)的每一根毛細(xì)血管,那么英偉達(dá)正在建立一個(gè)更大更強(qiáng)的CUDA生態(tài),這個(gè)生態(tài),未來將成為各行業(yè)的生長(zhǎng)土壤——只要這個(gè)行業(yè)與AI相關(guān)——用的人越多,生態(tài)越強(qiáng)、軟硬件適配度越好。

迄今為止,英偉達(dá)已構(gòu)建了900多個(gè)特定領(lǐng)域的CUDA-X庫和AI模型,降低加速計(jì)算的準(zhǔn)入門檻。今年,CUDA-X將走入更前沿的工程學(xué)科,像是天文學(xué)、粒子物理學(xué)、量子物理學(xué)、汽車、航空航天和半導(dǎo)體設(shè)計(jì)。

“如果整個(gè)發(fā)布會(huì)只講一張PPT,那么就是這張?!?/p>

黃仁勛提到,如果沒有CUDA,沒有英偉達(dá)的基建底座,這些前沿庫對(duì)任何一個(gè)開發(fā)者都將不起作用。他詳細(xì)介紹了主攻醫(yī)療的MONAI、主攻天氣的Earth-2、以及量子計(jì)算的cuQuantum庫的最新動(dòng)向,這些庫也成為了英偉達(dá)在垂直AI領(lǐng)域中最新的落地成果,并圍繞著垂直領(lǐng)域的數(shù)據(jù)信息吸引著大批的開發(fā)者加入到CUDA生態(tài)中去。

英偉達(dá)還推出了AI推理服務(wù)軟件Dynamo,旨在為部署推理 AI 模型的AI工廠最大化其token收益,據(jù)英偉達(dá)透露,可將DeepSeek-R1模型生成tokens數(shù)量提升30倍以上,每秒處理超30000tokens。

Dynamo擁有GPU 規(guī)劃器、智能路由器、低延遲通信庫以及顯存管理器四大部分組成。同時(shí),Dynamo推理平臺(tái)還支持分離服務(wù),將LLM 不同計(jì)算階段分配給不同的GPU。

目前,已有多家AI創(chuàng)企與英偉達(dá)表示了合作意向。AI提供商Cohere計(jì)劃使用Dynamo為其Command系列模型中的代理式AI功能提供支持;Together AI希望能夠通過Dynamo能夠動(dòng)態(tài)地解決模型管線各個(gè)階段的流量瓶頸。

此外,英偉達(dá)今天還發(fā)布具有推理功能的開源Llama Nemotron模型系列,旨在為開發(fā)者和企業(yè)提供業(yè)務(wù)就緒型基礎(chǔ),助力構(gòu)建能夠獨(dú)立工作或以團(tuán)隊(duì)形式完成復(fù)雜任務(wù)的高級(jí) AI 智能體。

結(jié)合新發(fā)布的Dynamo,英偉達(dá)全新Llama Nemotron推理模型,可以使用高級(jí)推理技術(shù)來改進(jìn)上下文理解和響應(yīng)生成,并通過分離服務(wù)使得每個(gè)階段可以進(jìn)行單獨(dú)的微調(diào)和資源調(diào)配,從而提高吞吐量并更快地響應(yīng)用戶。

Llama Nemotron模型系列包括Nano、Super和Ultra三種規(guī)模。Nano 模型可在PC和邊緣設(shè)備上提供最高準(zhǔn)確性;Super模型能夠在單個(gè) GPU 上提供最佳的準(zhǔn)確性和最高的吞吐量;而Ultra 模型將在多 GPU 服務(wù)器上實(shí)現(xiàn)最高代理準(zhǔn)確性。

據(jù)英偉達(dá)透露,與基礎(chǔ)模型相比,Llama Nemotron推理模型對(duì)多步數(shù)學(xué)運(yùn)算、編碼、推理和復(fù)雜決策能力提供了加強(qiáng),加強(qiáng)后,模型的精度提高多達(dá)20%;與其他領(lǐng)先的開放推理模型相比,優(yōu)化推理速度達(dá)到了5倍。

除了Agentic AI,Physical AI則是以一種巧妙的方式融入到GTC大會(huì)之中。

走進(jìn)展會(huì)中心,參會(huì)者將會(huì)看到一個(gè)AI雕塑機(jī)器人,這個(gè)機(jī)器人是人工智能藝術(shù)家Emanuel Gollob使用腦電波測(cè)量設(shè)計(jì),并通過AI進(jìn)行編排設(shè)計(jì)的。

在會(huì)展旁邊,我們還可以看到了一款人形機(jī)器人當(dāng)起了會(huì)展顧問,它可以回答參會(huì)者有關(guān)活動(dòng)、論壇時(shí)間、地點(diǎn)等問題。該人形機(jī)器人是由初創(chuàng)公司IntBot開發(fā)的。

在主題演講的結(jié)尾,黃仁勛與谷歌DeepMind、迪士尼聯(lián)手打造的機(jī)器人Blue上臺(tái)互動(dòng)。據(jù)他介紹,Blue擁有兩大個(gè)人超算,十分聰明。對(duì)于黃仁勛的指令,Blue也能夠聽懂指令及時(shí)反饋。盡管Blue是一個(gè)雙足機(jī)器人,但從其表現(xiàn)形態(tài)上來看,Blue更像是一個(gè)機(jī)器狗,主要是提供一定情緒價(jià)值。

可以看出在此次大會(huì)現(xiàn)場(chǎng),機(jī)器人幾乎無處不在。黃仁勛提到具身智能主要有三大挑戰(zhàn)有待解決:如何處理數(shù)據(jù)問題、選擇什么樣的模型架構(gòu)以及機(jī)器人行業(yè)的Scaling Law是什么。

事實(shí)上,黃仁勛并沒有給出具體的答案,但他通過英偉達(dá)的產(chǎn)品布局給出了英偉達(dá)自己的思考思路。

英偉達(dá)強(qiáng)化提升了世界基礎(chǔ)模型Cosmos,引入了開放式、可完全定制的物理AI開發(fā)推理模型,讓開發(fā)者更好地控制世界生成。

Cosmos Transfer可簡(jiǎn)化感知AI訓(xùn)練,將Omniverse中創(chuàng)建的3D 仿真或真值轉(zhuǎn)換為逼真視頻,用于大規(guī)??煽睾铣蓴?shù)據(jù)生成。Cosmos Transfer WFM 能夠吸收結(jié)構(gòu)化視頻輸入,如分割圖、深度圖、激光雷達(dá)掃描、姿態(tài)估計(jì)圖和軌跡圖等,以生成可控、逼真的視頻輸出。Cosmos Reason 是一個(gè)開放式、可完全定制的 WFM,具有時(shí)空感知能力,它使用思維鏈推理來理解視頻數(shù)據(jù),并能夠預(yù)測(cè)交互結(jié)果,如一個(gè)人走進(jìn)人行道或一個(gè)盒子從架子上掉下來。

1X、Agility Robotics、Figure AI、Foretellix、Skild AI和Uber是首批采用Cosmos的企業(yè),可更快、更大規(guī)模地為物理 AI 生成更豐富的訓(xùn)練數(shù)據(jù)。

期望值回落,英偉達(dá)面對(duì)自研芯挑戰(zhàn)

從本次GTC大會(huì)活動(dòng)現(xiàn)場(chǎng)來看,黃仁勛明顯表現(xiàn)得沒有2023年那般得意氣風(fēng)發(fā)。演講現(xiàn)場(chǎng)多次卡殼,能夠明顯感受到,回應(yīng)關(guān)鍵問題,提到關(guān)鍵產(chǎn)品的時(shí)候,黃仁勛稍顯緊張。

2025年開年以來,英偉達(dá)的市值一路震蕩下跌。這其中,有美股大環(huán)境的影響,也有DeepSeek的沖擊,但更多的則是投資者們對(duì)英偉達(dá)的期望值逐漸回落,更加理性地看待英偉達(dá)的增長(zhǎng)曲線。情緒回落后,英偉達(dá)的市值也逐漸趨于穩(wěn)定。

但這并不意味英偉達(dá)就放緩了停下推動(dòng)AI的節(jié)奏,相反,2024年,英偉達(dá)更加密切地關(guān)注前沿AI項(xiàng)目進(jìn)展。

PitchBook數(shù)據(jù)顯示,英偉達(dá)在2024年加大了風(fēng)險(xiǎn)投資力度,參與了44輪人工智能公司融資,較2023年的34輪融資大幅增加。英偉達(dá)旗下的企業(yè)風(fēng)險(xiǎn)投資基金NVentures也在2024年參與了24筆交易投資。

英偉達(dá)投資公司

但新的挑戰(zhàn)也在出現(xiàn)。近期,谷歌、亞馬遜、Meta等大廠希望自研芯片(如TPU、Trainium)減少對(duì)英偉達(dá)GPU的采購。據(jù)悉,亞馬遜通過Graviton芯片節(jié)省10%-40%計(jì)算成本。不過,這些大廠的自研芯片更多自用,對(duì)于軟硬件能力差的公司,英偉達(dá)仍然是他們最好的選擇。

另一方面,在GPU所涉的數(shù)據(jù)中心業(yè)務(wù)上,英偉達(dá)中國(guó)市場(chǎng)營(yíng)收在總營(yíng)收中的占比已從2023財(cái)年的19%降至2024財(cái)年的約5%。此外,量子芯片、光子芯片等新的芯片架構(gòu)正在加速開發(fā)與落地,或許新的技術(shù)變革將會(huì)給英偉達(dá)帶來新的沖擊。

 
本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無評(píng)論哦,快來評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

黃仁勛揭曉AI芯片最新路線圖,一文看懂GTC2025

股價(jià)保衛(wèi)戰(zhàn)惜??!

文|硅兔賽跑 Xuushan

編輯|伊凡

現(xiàn)場(chǎng)一票難求,線上股價(jià)狂跌。

“買得越多,省得越多,賺得越多。”

英偉達(dá)GTC大會(huì)上黃仁勛打響了今年AI界帶貨最強(qiáng)Slogan。

在加利福尼亞州圣何塞SAP中心,一身標(biāo)志性皮衣的黃仁勛快步上臺(tái),表示今年的GTC大會(huì),是AI超級(jí)碗——AI正在解決更多行業(yè)與公司的更多問題,作為科技行業(yè)的風(fēng)向標(biāo),這場(chǎng)大會(huì)涉及1000場(chǎng)會(huì)議、2000名演講者和近400家參展商,超25000+參會(huì)人員。門票在會(huì)前被炒到了萬元高價(jià),并且早已售罄。

此次GTC大會(huì)對(duì)英偉達(dá)來說,是至關(guān)重要的一戰(zhàn)。

外界所關(guān)注的,AI的熱潮是否已經(jīng)達(dá)到頂峰?AI芯片的銷售是否放緩?當(dāng)DeepSeek證明了另一條性價(jià)比更高的計(jì)算路線時(shí),還在堅(jiān)持大算力的英偉達(dá)還能否坐穩(wěn)AI基建王者的寶座?

會(huì)前投資者的種種質(zhì)疑在黃仁勛為GTC準(zhǔn)備長(zhǎng)達(dá)120分鐘的演講之后逐漸消散。英偉達(dá)不僅直接公開了四年三代GPU架構(gòu)路線圖,Blackwell Ultra、Rubin、Rubin Ultra、Feynman等芯片悉數(shù)上臺(tái),而且還提及了AI、數(shù)據(jù)中心、機(jī)器人、CUDA生態(tài)等諸多進(jìn)展。

不過,投資者對(duì)此反應(yīng)平淡,主題演講結(jié)束后,英偉達(dá)的股價(jià)略有波動(dòng),股價(jià)下跌3.5%。英偉達(dá)生態(tài)內(nèi)的概念股,如臺(tái)積電、中電港、勝宏科技、鴻博股份君則有小幅下降。其中,英偉達(dá)國(guó)內(nèi)算力板第一供應(yīng)商勝宏科技,股價(jià)下跌5.75%。

業(yè)界表明,股價(jià)下跌的原因主要由于黃仁勛的演講基本在華爾街的意料之中,許多新的技術(shù)進(jìn)展已在今年的CES中有所涉及,而黃仁勛提及的關(guān)于量子計(jì)算、具身智能的部分,很難在短期內(nèi)看到有實(shí)質(zhì)增長(zhǎng)的可能。

英偉達(dá)半年來的股價(jià)走勢(shì) 來源:TradingView

以下是今日GTC大會(huì)主題演講干貨提煉:

1、芯片全家桶全面升級(jí):Blackwell芯片銷量提速,將是Hopper的3倍;Blackwell Ultra將是首個(gè)擁有288GB HBM3e的GPU,并配有GB300 NVL72機(jī)架、HGX B300 NVL16機(jī)架組合系統(tǒng)方案,將是今年下半年的主推產(chǎn)品;

首次公布未來三年技術(shù)藍(lán)圖:2026年推出Rubin架構(gòu)(FP4算力達(dá)100P Flops),2027年Rubin Ultra支持576個(gè)GPU集群,Rubin的AI工廠性能或能達(dá)到Hopper的900倍;2028年發(fā)布Feynman架構(gòu);

英偉達(dá)還與臺(tái)積電聯(lián)合封裝光網(wǎng)絡(luò)芯片,并于今年下半年將推出新版以太網(wǎng)芯片;

2、打造超算中心工廠:面向開發(fā)者以及企業(yè)研發(fā)場(chǎng)景,推出全球最小AI超級(jí)計(jì)算機(jī)DGX Spark以及AI超算DGX Station;推出搭載Blackwell Ultra GPU的DGX SuperPOD,提供AI工廠超級(jí)計(jì)算,并同步推出DGX GB300和 DGX B300系統(tǒng),組合提供開箱即用的 DGX SuperPOD AI 超級(jí)計(jì)算機(jī);上線英偉達(dá)Instant AI Factory,實(shí)現(xiàn)AI托管服務(wù)等;

3、推出AI推理模型系列:推出AI推理服務(wù)軟件Dynamo,旨在為部署推理 AI 模型的AI工廠最大化其token收益,可將DeepSeek-R1模型生成tokens數(shù)量提升30倍以上,每秒處理超30000tokens;推出全新Llama Nemotron推理模型,并幫助企業(yè)構(gòu)建企業(yè)級(jí)AI數(shù)據(jù)平臺(tái);

4、開源機(jī)器人模型:與谷歌DeepMind、迪士尼聯(lián)手打造的機(jī)器人上臺(tái)互動(dòng);亮相全球首個(gè)開源且完全可定制的基礎(chǔ)模型 NVIDIA Isaac GR00T N1,讓通用人形機(jī)器人實(shí)現(xiàn)推理及各項(xiàng)技能;

5、鞏固CUDA生態(tài):推出搭載GH200超級(jí)芯片的CUDA-X庫,讓CUDA-X與最新的超級(jí)芯片架構(gòu)協(xié)同工作實(shí)現(xiàn),計(jì)算工程工具的速度可提高11倍,計(jì)算量可擴(kuò)大5倍;首次設(shè)立量子計(jì)算日,并升級(jí)cuQuantum庫,推動(dòng)量子計(jì)算研究。

會(huì)上,英偉達(dá)還多次提及中國(guó)AI大模型DeepSeek,提及DeepSeek整體有利于英偉達(dá)更快速推動(dòng)生態(tài)建設(shè),并不會(huì)對(duì)英偉達(dá)造成負(fù)面影響,黃仁勛對(duì)此前大幅跳水的股價(jià)做出回應(yīng)。事實(shí)上,通過每年迭代一代架構(gòu)的速度,英偉達(dá)將AI算力密度提升周期逐漸縮短。

生成式AI第三年,英偉達(dá)通過GTC 2025大會(huì)正式宣告其構(gòu)建AI全?;ㄉ鷳B(tài)的野心,從硬件代際差、生態(tài)壟斷性和行業(yè)標(biāo)準(zhǔn)制定權(quán),英偉達(dá)圍繞“技術(shù)-商業(yè)”雙閉環(huán)的護(hù)城河逐漸完善,短期時(shí)間內(nèi),英偉達(dá)在AI基建領(lǐng)域幾乎毫無對(duì)手。

四年三架構(gòu)技術(shù)路線圖揭曉!黃仁勛:tokens是一切的基礎(chǔ)

“去年的一切都是錯(cuò)的,Scaling Law(擴(kuò)展定律)遠(yuǎn)沒有結(jié)束?!秉S仁勛直言,擴(kuò)展定律正在以超過人們預(yù)期的方向發(fā)展。當(dāng)AI從過去依賴經(jīng)驗(yàn)和預(yù)訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)并推理,轉(zhuǎn)向采用思維鏈的方式,生成完整推理步驟,對(duì)算力的需求指數(shù)級(jí)提升。

在現(xiàn)場(chǎng)他用Llama 3.3 70B和DeepSeek R1模型進(jìn)行演示,向他們同時(shí)提出一個(gè)排座位的問題。傳統(tǒng)的Llama模型僅適用439tokens進(jìn)行訓(xùn)練,最后給出一個(gè)錯(cuò)誤的答案,而推理模型DeepSeek R1則使用了8559tokens進(jìn)行反復(fù)思考,是Llama的20倍,其中調(diào)用的計(jì)算資源也是Llama的150倍,最終給出一個(gè)正確的答案。

黃仁勛認(rèn)為數(shù)據(jù)仍是一切核心,盡管是R1也花費(fèi)了6080億的訓(xùn)練數(shù)據(jù),而下一代的模型提升或許需要數(shù)萬億的數(shù)據(jù)。Scaling Law所引領(lǐng)的大算力思路在英偉達(dá)的敘事中,仍然奏效。甚至,此次大會(huì)上,英偉達(dá)提出的Scaling Law的三大階段:Pre-Training Scaling、Post-Training Scaling、Test-Time Scaling“Long Thinking”階段。整個(gè)行業(yè)也將會(huì)從Agentic AI(AI代理)逐步轉(zhuǎn)向Physical AI(物理AI:指的是讓機(jī)器人、自動(dòng)駕駛汽車和智能空間等自主系統(tǒng)能夠感知、理解和執(zhí)行真實(shí)世界中的復(fù)雜動(dòng)作。由于它能夠生成見解和動(dòng)作,因此也經(jīng)常被稱為“生成物理 AI”。)。

“我希望大家走在對(duì)的方向上”,黃仁勛此次回應(yīng),或許也是對(duì)此前AI奇點(diǎn)已到,數(shù)據(jù)不再是AI模型提升的關(guān)鍵等一系列回應(yīng)的正面回應(yīng)。今年以來,英偉達(dá)的股價(jià)跌超13%,市值與2025年1月7日盤中創(chuàng)下的歷史高點(diǎn)相比,市值已經(jīng)蒸發(fā)近8200億美元。在這場(chǎng)股價(jià)保衛(wèi)戰(zhàn)上,黃仁勛選擇直面市場(chǎng)對(duì)英偉達(dá)股價(jià)與增長(zhǎng)潛力的質(zhì)疑。

表明了數(shù)據(jù)和算力仍是AI時(shí)代最關(guān)鍵的兩大方向之后,黃仁勛開始秀起了自己家的百寶箱。從2025年,英偉達(dá)將會(huì)在四年時(shí)間內(nèi)先后推出Blackwell、Rubin、Feynman三大架構(gòu)系列芯片。

Blackwell Ultra將承擔(dān)今年下半年主力產(chǎn)品,該系列其包括GB300 NVL72機(jī)架級(jí)解決方案以及NVIDIA HGX B300 NVL16系統(tǒng)。GB300 NVL72機(jī)架將把72個(gè)Blackwell Ultra GPU與36個(gè)基于Arm Neoverse的Grace CPU相連,Blackwell Ultra預(yù)計(jì)將比前代產(chǎn)品(H100)提供1.5倍的FP4推理能力,可以顯著加速AI推理能力。

可以看出,Blackwell Ultra相比上一代產(chǎn)品有些提升,但整體性能提升也沒有很驚喜,算是小版本升級(jí)。

芯片性能的“大升級(jí)”或在明年,承載英偉達(dá)希望的Rubin系列,將在2026年問世。此前,黃仁勛稱其計(jì)算能力能夠?qū)崿F(xiàn)“巨大飛躍”。Rubin主要是以發(fā)現(xiàn)暗物質(zhì)的天文學(xué)家Vera Rubin的名字命名。

今天,英偉達(dá)則進(jìn)一步透露有關(guān)Rubin系列最新信息。明年,Rubin將作為GPU的旗艦芯和Vera作為CPU旗艦芯同期發(fā)布。

用一個(gè)比喻或許就能表現(xiàn)出英偉達(dá)在AI時(shí)代的野心——英偉達(dá)正在構(gòu)建一個(gè)從市區(qū)、高速公路再到郊區(qū)的龐大AI帝國(guó)。

CPU是市區(qū),GPU是正在開發(fā)的高新區(qū),在這兩者之間,需要通過一個(gè)叫做PCIE的通道連接,車流量就是數(shù)據(jù)量。如果數(shù)據(jù)量大,就需要擴(kuò)大道路,或增加車道。只有CPU能夠決定這個(gè)分配。一直以來,CPU生態(tài)被Arm和英特爾的X86長(zhǎng)期壟斷?,F(xiàn)在,英偉達(dá)對(duì)他們發(fā)起了挑戰(zhàn)。

Vera Rubin是英偉達(dá)CPU+GPU戰(zhàn)略的重要落子,其將于2026年下半年發(fā)布,將配備一個(gè)名為Vera的定制Nvidia設(shè)計(jì)CPU。Nvidia 聲稱,與其前身 Grace Blackwell 相比,Vera Rubin 的性能有了顯著提升,尤其是在 AI 推理和訓(xùn)練任務(wù)方面。

其中,Vera有88個(gè)定制ARM結(jié)構(gòu)的內(nèi)核和176個(gè)線程。同時(shí),Vera還會(huì)有一個(gè)1.8TB/s NVLink的內(nèi)核接口,用于與Rubin GPU連接。與傳統(tǒng)的互聯(lián)技術(shù)相比,英偉達(dá)的這種互聯(lián)技術(shù)的速度更快,能夠通過的“車輛”更多。Vera將會(huì)取代現(xiàn)有的Grace CPU。據(jù)英偉達(dá)透露,Vera的新架構(gòu)設(shè)計(jì)將會(huì)比Grace CPU快兩倍。在2021年的GTC大會(huì)上,英偉達(dá)推出了其第一款CPU——Grace,以Arm架構(gòu)為核心。

看回Rubin系列,Rubin這次仍然是拼接式的設(shè)計(jì),也就是它其實(shí)是兩個(gè)GPU在電路板上拼接在一起,組成了一個(gè)新的GPU。性能上,與B300相比,Rubin計(jì)算性能提高了3.3倍,能提供1.2 ExaFLOPS FP8訓(xùn)練。

Vera Rubin可提供50 petaflops浮點(diǎn)運(yùn)算的FP4 推理性能,是Blackwell Ultra在類似機(jī)架配置的3.3倍。

2027年,Rubin Ultra將內(nèi)含4個(gè)GPU,支持576個(gè)GPU集群,在機(jī)架層面,將會(huì)比Rubin NVL144配置強(qiáng)大約四倍。同時(shí),英偉達(dá)計(jì)劃在。此外,F(xiàn)eynman同樣將會(huì)采用Vera CPU。

從最新的技術(shù)路線圖中可以看出,目前英偉達(dá)的GPU更新基本維持在兩年一個(gè)大版本升級(jí),一年一個(gè)小迭代的節(jié)奏上行穩(wěn)步推進(jìn),而CPU方向新品節(jié)奏稍緩,或許3年左右才會(huì)有較大的一個(gè)版本升級(jí)。

但無論如何,英偉達(dá)自研的GPU+CPU生態(tài)已經(jīng)逐漸完善,根據(jù)摩根斯坦利統(tǒng)計(jì),英偉達(dá)占據(jù)了全球AI專用芯片將近77%的市場(chǎng)份額。同時(shí)英偉達(dá)還一直是臺(tái)積電的VVVIP客戶,幾乎拿下了臺(tái)積電的大半產(chǎn)能,擁有強(qiáng)大的供應(yīng)鏈優(yōu)勢(shì)。英偉達(dá)的Rubin采用了臺(tái)積電3nm工藝、CoWoS(Chip on Wafer Substrate)封裝技術(shù)。最先進(jìn)的制造和封裝工藝,意味著這款芯片的性能將大幅度提升,英偉達(dá)也將在與臺(tái)積電的合作中積累豐富的先進(jìn)制程IP。一位芯片從業(yè)人士告訴硅兔君,先進(jìn)制程的產(chǎn)能一般是有限的,大客戶能夠獲得內(nèi)測(cè)以及訂單的優(yōu)先級(jí)。

再加上,英偉達(dá)一直在和各行各業(yè)的頭部公司合作,了解行業(yè)內(nèi)最先進(jìn)的技術(shù)、創(chuàng)新動(dòng)向以及行業(yè)Know-how??梢哉f,在AI訓(xùn)練側(cè),英偉達(dá)的芯片組合拳幾乎無人能擋。這也是英偉達(dá)能一路無阻地登上AI基建寶座的核心關(guān)鍵,同樣數(shù)據(jù)中心也為英偉達(dá)貢獻(xiàn)了大部分營(yíng)收。

英偉達(dá)2014-2024年主營(yíng)業(yè)務(wù)收入占比變化 來源:Wind、五礦證券研究所

再加上,英偉達(dá)一直在和各行各業(yè)的頭部公司合作,了解行業(yè)內(nèi)最先進(jìn)的技術(shù)、創(chuàng)新動(dòng)向以及行業(yè)Know-how。可以說,在AI訓(xùn)練側(cè),英偉達(dá)的芯片組合拳幾乎無人能擋。這也是英偉達(dá)能一路無阻地登上AI基建寶座的核心關(guān)鍵,同樣數(shù)據(jù)中心也為英偉達(dá)貢獻(xiàn)了大部分營(yíng)收。

黃仁勛透露,今年,微軟、谷歌、亞馬遜和Meta四家大型云服務(wù)商已經(jīng)購入360萬顆Blackwell芯片,理想預(yù)計(jì),2028年數(shù)據(jù)中心資本支出規(guī)模突破1萬億美元。科技巨頭們對(duì)數(shù)據(jù)中心建設(shè)的熱情將會(huì)推動(dòng)著英偉達(dá)的芯片銷售主要驅(qū)動(dòng)力。2024年三季度,英偉達(dá)的GPU市場(chǎng)份額達(dá)到90%。

賣鏟人的財(cái)富傳奇還遠(yuǎn)沒有結(jié)束,財(cái)報(bào)顯示,該公司截至1月份的2025財(cái)年銷售額增長(zhǎng)了一倍多,達(dá)到1246.2億美元。

投資分析師Vellante 表示:“我們相信GTC 2025將樹立另一個(gè)里程碑,標(biāo)志著未來極端并行計(jì)算不僅限于最大的公司,而是所有公司的日常?!?/p>

但同時(shí),我們也注意到近期財(cái)報(bào)顯示,Blackwell芯片的毛利率正在小幅下跌,下一代GPU能否夠順利投產(chǎn),下一代GPU是否能繼續(xù)成為英偉達(dá)的“搖錢樹”,或許市場(chǎng)還需驗(yàn)證。

Agentic AI+Physical AI,英偉達(dá)的下一代增長(zhǎng)渦輪

“AI正在經(jīng)歷一個(gè)拐點(diǎn),它將變得更智能、更有用?!?/p>

黃仁勛回憶道兩年前,ChatGPT出現(xiàn)的時(shí)候,很多復(fù)雜的問題和很多簡(jiǎn)單的問題,它都難以回答。無論訓(xùn)練多少次,研究過多少信息,但對(duì)所有問題,它都只思考一次,就像人類的脫口而出一樣。但現(xiàn)在有了推理,AI也有了反復(fù)思索的能力,思維鏈的技術(shù)能夠逐步完善。

黃仁勛認(rèn)為未來每個(gè)企業(yè)都會(huì)有兩個(gè)工廠,一個(gè)是他們建造的工廠,而另一個(gè)則是他們的AI工廠,主要為了科研或者是培訓(xùn)。他在主題演講一開始就提到Agentic AI以及Physical AI將會(huì)是今年討論的核心。

如果AI在未來將會(huì)無孔不入地深入到各行業(yè)的每一根毛細(xì)血管,那么英偉達(dá)正在建立一個(gè)更大更強(qiáng)的CUDA生態(tài),這個(gè)生態(tài),未來將成為各行業(yè)的生長(zhǎng)土壤——只要這個(gè)行業(yè)與AI相關(guān)——用的人越多,生態(tài)越強(qiáng)、軟硬件適配度越好。

迄今為止,英偉達(dá)已構(gòu)建了900多個(gè)特定領(lǐng)域的CUDA-X庫和AI模型,降低加速計(jì)算的準(zhǔn)入門檻。今年,CUDA-X將走入更前沿的工程學(xué)科,像是天文學(xué)、粒子物理學(xué)、量子物理學(xué)、汽車、航空航天和半導(dǎo)體設(shè)計(jì)。

“如果整個(gè)發(fā)布會(huì)只講一張PPT,那么就是這張?!?/p>

黃仁勛提到,如果沒有CUDA,沒有英偉達(dá)的基建底座,這些前沿庫對(duì)任何一個(gè)開發(fā)者都將不起作用。他詳細(xì)介紹了主攻醫(yī)療的MONAI、主攻天氣的Earth-2、以及量子計(jì)算的cuQuantum庫的最新動(dòng)向,這些庫也成為了英偉達(dá)在垂直AI領(lǐng)域中最新的落地成果,并圍繞著垂直領(lǐng)域的數(shù)據(jù)信息吸引著大批的開發(fā)者加入到CUDA生態(tài)中去。

英偉達(dá)還推出了AI推理服務(wù)軟件Dynamo,旨在為部署推理 AI 模型的AI工廠最大化其token收益,據(jù)英偉達(dá)透露,可將DeepSeek-R1模型生成tokens數(shù)量提升30倍以上,每秒處理超30000tokens。

Dynamo擁有GPU 規(guī)劃器、智能路由器、低延遲通信庫以及顯存管理器四大部分組成。同時(shí),Dynamo推理平臺(tái)還支持分離服務(wù),將LLM 不同計(jì)算階段分配給不同的GPU。

目前,已有多家AI創(chuàng)企與英偉達(dá)表示了合作意向。AI提供商Cohere計(jì)劃使用Dynamo為其Command系列模型中的代理式AI功能提供支持;Together AI希望能夠通過Dynamo能夠動(dòng)態(tài)地解決模型管線各個(gè)階段的流量瓶頸。

此外,英偉達(dá)今天還發(fā)布具有推理功能的開源Llama Nemotron模型系列,旨在為開發(fā)者和企業(yè)提供業(yè)務(wù)就緒型基礎(chǔ),助力構(gòu)建能夠獨(dú)立工作或以團(tuán)隊(duì)形式完成復(fù)雜任務(wù)的高級(jí) AI 智能體。

結(jié)合新發(fā)布的Dynamo,英偉達(dá)全新Llama Nemotron推理模型,可以使用高級(jí)推理技術(shù)來改進(jìn)上下文理解和響應(yīng)生成,并通過分離服務(wù)使得每個(gè)階段可以進(jìn)行單獨(dú)的微調(diào)和資源調(diào)配,從而提高吞吐量并更快地響應(yīng)用戶。

Llama Nemotron模型系列包括Nano、Super和Ultra三種規(guī)模。Nano 模型可在PC和邊緣設(shè)備上提供最高準(zhǔn)確性;Super模型能夠在單個(gè) GPU 上提供最佳的準(zhǔn)確性和最高的吞吐量;而Ultra 模型將在多 GPU 服務(wù)器上實(shí)現(xiàn)最高代理準(zhǔn)確性。

據(jù)英偉達(dá)透露,與基礎(chǔ)模型相比,Llama Nemotron推理模型對(duì)多步數(shù)學(xué)運(yùn)算、編碼、推理和復(fù)雜決策能力提供了加強(qiáng),加強(qiáng)后,模型的精度提高多達(dá)20%;與其他領(lǐng)先的開放推理模型相比,優(yōu)化推理速度達(dá)到了5倍。

除了Agentic AI,Physical AI則是以一種巧妙的方式融入到GTC大會(huì)之中。

走進(jìn)展會(huì)中心,參會(huì)者將會(huì)看到一個(gè)AI雕塑機(jī)器人,這個(gè)機(jī)器人是人工智能藝術(shù)家Emanuel Gollob使用腦電波測(cè)量設(shè)計(jì),并通過AI進(jìn)行編排設(shè)計(jì)的。

在會(huì)展旁邊,我們還可以看到了一款人形機(jī)器人當(dāng)起了會(huì)展顧問,它可以回答參會(huì)者有關(guān)活動(dòng)、論壇時(shí)間、地點(diǎn)等問題。該人形機(jī)器人是由初創(chuàng)公司IntBot開發(fā)的。

在主題演講的結(jié)尾,黃仁勛與谷歌DeepMind、迪士尼聯(lián)手打造的機(jī)器人Blue上臺(tái)互動(dòng)。據(jù)他介紹,Blue擁有兩大個(gè)人超算,十分聰明。對(duì)于黃仁勛的指令,Blue也能夠聽懂指令及時(shí)反饋。盡管Blue是一個(gè)雙足機(jī)器人,但從其表現(xiàn)形態(tài)上來看,Blue更像是一個(gè)機(jī)器狗,主要是提供一定情緒價(jià)值。

可以看出在此次大會(huì)現(xiàn)場(chǎng),機(jī)器人幾乎無處不在。黃仁勛提到具身智能主要有三大挑戰(zhàn)有待解決:如何處理數(shù)據(jù)問題、選擇什么樣的模型架構(gòu)以及機(jī)器人行業(yè)的Scaling Law是什么。

事實(shí)上,黃仁勛并沒有給出具體的答案,但他通過英偉達(dá)的產(chǎn)品布局給出了英偉達(dá)自己的思考思路。

英偉達(dá)強(qiáng)化提升了世界基礎(chǔ)模型Cosmos,引入了開放式、可完全定制的物理AI開發(fā)推理模型,讓開發(fā)者更好地控制世界生成。

Cosmos Transfer可簡(jiǎn)化感知AI訓(xùn)練,將Omniverse中創(chuàng)建的3D 仿真或真值轉(zhuǎn)換為逼真視頻,用于大規(guī)??煽睾铣蓴?shù)據(jù)生成。Cosmos Transfer WFM 能夠吸收結(jié)構(gòu)化視頻輸入,如分割圖、深度圖、激光雷達(dá)掃描、姿態(tài)估計(jì)圖和軌跡圖等,以生成可控、逼真的視頻輸出。Cosmos Reason 是一個(gè)開放式、可完全定制的 WFM,具有時(shí)空感知能力,它使用思維鏈推理來理解視頻數(shù)據(jù),并能夠預(yù)測(cè)交互結(jié)果,如一個(gè)人走進(jìn)人行道或一個(gè)盒子從架子上掉下來。

1X、Agility Robotics、Figure AI、Foretellix、Skild AI和Uber是首批采用Cosmos的企業(yè),可更快、更大規(guī)模地為物理 AI 生成更豐富的訓(xùn)練數(shù)據(jù)。

期望值回落,英偉達(dá)面對(duì)自研芯挑戰(zhàn)

從本次GTC大會(huì)活動(dòng)現(xiàn)場(chǎng)來看,黃仁勛明顯表現(xiàn)得沒有2023年那般得意氣風(fēng)發(fā)。演講現(xiàn)場(chǎng)多次卡殼,能夠明顯感受到,回應(yīng)關(guān)鍵問題,提到關(guān)鍵產(chǎn)品的時(shí)候,黃仁勛稍顯緊張。

2025年開年以來,英偉達(dá)的市值一路震蕩下跌。這其中,有美股大環(huán)境的影響,也有DeepSeek的沖擊,但更多的則是投資者們對(duì)英偉達(dá)的期望值逐漸回落,更加理性地看待英偉達(dá)的增長(zhǎng)曲線。情緒回落后,英偉達(dá)的市值也逐漸趨于穩(wěn)定。

但這并不意味英偉達(dá)就放緩了停下推動(dòng)AI的節(jié)奏,相反,2024年,英偉達(dá)更加密切地關(guān)注前沿AI項(xiàng)目進(jìn)展。

PitchBook數(shù)據(jù)顯示,英偉達(dá)在2024年加大了風(fēng)險(xiǎn)投資力度,參與了44輪人工智能公司融資,較2023年的34輪融資大幅增加。英偉達(dá)旗下的企業(yè)風(fēng)險(xiǎn)投資基金NVentures也在2024年參與了24筆交易投資。

英偉達(dá)投資公司

但新的挑戰(zhàn)也在出現(xiàn)。近期,谷歌、亞馬遜、Meta等大廠希望自研芯片(如TPU、Trainium)減少對(duì)英偉達(dá)GPU的采購。據(jù)悉,亞馬遜通過Graviton芯片節(jié)省10%-40%計(jì)算成本。不過,這些大廠的自研芯片更多自用,對(duì)于軟硬件能力差的公司,英偉達(dá)仍然是他們最好的選擇。

另一方面,在GPU所涉的數(shù)據(jù)中心業(yè)務(wù)上,英偉達(dá)中國(guó)市場(chǎng)營(yíng)收在總營(yíng)收中的占比已從2023財(cái)年的19%降至2024財(cái)年的約5%。此外,量子芯片、光子芯片等新的芯片架構(gòu)正在加速開發(fā)與落地,或許新的技術(shù)變革將會(huì)給英偉達(dá)帶來新的沖擊。

 
本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。