文|硅谷101
在萬眾矚目的英偉達(dá)年度GTC大會中,黃仁勛告訴臺下的上萬名參會者:新一代AI革命是百萬億美元的市場,而他的賭注在遠(yuǎn)方。
01 英偉達(dá)GTC 2024
英偉達(dá),2024財(cái)年四季度營收是前一年同期水平的3.5倍。
利潤是前一年同期水平的9倍。
股價(jià)在16個(gè)月內(nèi)上漲了6倍。
AI浪潮給予英偉達(dá)的榮耀讓這家公司坐上了全球市值第三的位置,也吸引了上萬人來到英偉達(dá)在美國時(shí)間3月18日到21日舉辦的2024年度GTC大會現(xiàn)場,包括作為受邀媒體參會的我們硅谷101。
我們在參會前非常好奇,已經(jīng)成為AI芯片霸主的英偉達(dá)在接下來面對AMD、英特爾以及Groq等眾多競爭對手的追擊,以及英偉達(dá)的大客戶們,包括谷歌、Meta、亞馬遜等等科技巨頭都正在自研芯片的壓力下,它如何向市場傳達(dá)出,英偉達(dá)能守住霸主地位并且這個(gè)市場在未來還有巨大增長潛力的信號,來繼續(xù)激勵華爾街和硅谷。
我們經(jīng)過四天的參會、逛展會、聽論壇和分析師采訪,帶大家云參會2024年英偉達(dá)GTC,也順便聊聊,作為AI芯片市場絕對霸主的英偉達(dá)想要傳達(dá)出的野心和布局。
在今年英偉達(dá)GTC大會中,有四大板塊和議程是我們非常關(guān)注的,分別是:
1)英偉達(dá)創(chuàng)始人和CEO黃仁勛在第一天的重磅演講keynote中將傳達(dá)出的信號;
2)第三天議程中,黃仁勛會主持一場座談panel,邀請了當(dāng)今生成式AI浪潮的奠基石論文Transformer架構(gòu)的Attention Is All You Need論文8位作者到場,這8位作者當(dāng)年都在谷歌,但后來都紛紛出來自己創(chuàng)業(yè),所以這會是第一次他們8人再聚在一起討論AI的未來,非常是歷史性一刻;
3)前來參展的各家英偉達(dá)合作公司,因?yàn)檫@顯示出英偉達(dá)的業(yè)務(wù)前景,以及軟硬件落地的實(shí)際效果我們能有一個(gè)很直觀的感受;
4)就是分別在這四天中英偉達(dá)請來的演講和論壇嘉賓,從各個(gè)科技巨頭和AI獨(dú)角獸的科技領(lǐng)袖分享中,大家對AI行業(yè)傳遞出的信號。
接下來,我們就結(jié)合以上四點(diǎn)來聊聊我們對這次GTC的觀察。
02 芯片架構(gòu)更新Blackwell
黃仁勛的整場演講從下午1點(diǎn)到3點(diǎn),持續(xù)兩個(gè)小時(shí),其中涵蓋了英偉達(dá)的硬件和軟件的各類產(chǎn)品更新,現(xiàn)場PPT和視頻效果非常震撼。
老黃非常善于演講,沒有請任何的嘉賓,就一個(gè)人在臺上講了兩個(gè)小時(shí),很會控場也有幽默,臺下的效果和觀眾反應(yīng)都很熱烈,特別是最后講到英偉達(dá)機(jī)器人業(yè)務(wù)那一塊,老黃把迪士尼正在研發(fā)的Wall-E小機(jī)器人請到臺上互動,開了些小玩笑,簡直太可愛了,效果非常好。
整體來說,除了有幾個(gè)段子沒響之外,氣氛都拉到了頂點(diǎn),很多人看了keynote出來之后都直呼興奮。
這場萬眾聚焦的GTC演講的重點(diǎn)之一就是:重磅GPU架構(gòu)更新,所以黃仁勛把很大一部分演講重點(diǎn)放在了名為Blackwell的下一代GPU架構(gòu)。
他告訴臺下觀眾們:“如今AI訓(xùn)練需要更大的算力,那么就需要研發(fā)出更大的AI芯片來支持訓(xùn)練”。
(我們很快會上線一個(gè)和業(yè)內(nèi)人士一起逐幀講解這個(gè)動畫的視頻,詳細(xì)講講每一步,英偉達(dá)在Blackwell系列芯片硬件更新上做了哪些設(shè)計(jì)優(yōu)化,以及接下來對AI芯片產(chǎn)業(yè)將帶來如何的影響。)
總的來說,新的架構(gòu)下,Blackwell系列包括三個(gè)型號:B100、B200 和Grace-Blackwell Superchip(GB200)將是下一代更強(qiáng)大的芯片性能更新,也繼續(xù)實(shí)現(xiàn)著黃仁勛之前制定的黃氏定律Huang’s Law – 也就是,GPU將推動AI性能實(shí)現(xiàn)逐年翻倍。
黃仁勛,NVIDIA創(chuàng)始人兼首席執(zhí)行官:
如果要訓(xùn)練一個(gè)1.8萬億參數(shù)GPT模型,大約需要三到五個(gè)月的時(shí)間:如果使用傳統(tǒng)的安培芯片,大約需要25000個(gè)。如果用Hopper來做,可能需要8000個(gè)GPU,并且會消耗15兆瓦。8000個(gè)GPU和15兆瓦,它會需要90天,大約三個(gè)月的時(shí)間。如果你用Blackwell來做,只需要2000個(gè)GPU。2000個(gè)GPU,同樣的90天。但這是驚人的部分,只需要4兆瓦的電力。
這里還有幾個(gè)值得注意的點(diǎn):對于新一代的B100、B200 和 GB200,這些芯片的工作功率范圍在700W到1200W之間。隨著新一代芯片的功率和性能都大幅度升級,在AI數(shù)據(jù)中心領(lǐng)域,想要發(fā)揮Blackwell的最大潛力,轉(zhuǎn)向液態(tài)冷卻幾乎成為必須,這也給超微電腦Super Micro等數(shù)據(jù)中心硬件供應(yīng)商提出了新的挑戰(zhàn)。
陳茜,硅谷101聯(lián)合創(chuàng)始人:
新出來的B200可能算力更大、耗能更大對吧?裝載的rack跟現(xiàn)在來比,是不是技術(shù)、設(shè)計(jì)層 面上需要更大更多的一些提升?
Chiawei Chen博士,Senior Director, Super Micro Computer:
基本上以現(xiàn)在我們都按熱設(shè)計(jì)功耗(TDP),它以GPU來講是越來越高,比如現(xiàn)在的H100大概一顆大概700瓦,那B200已經(jīng)到一顆到1千瓦,所以水冷這件事情已經(jīng)不是可以有,而是必須有。對,我們必須要做這件事情。因?yàn)樗懔π枨笤絹碓礁?,你用ChatGPT,那就對算力需求越來越高,但是它又是一個(gè)比較高耗能的東西,所以你必須要有一個(gè)很有效率的散熱的解決方法,去把算力保持住或者甚至提高。但是你去降低所有環(huán)境,或者是說空調(diào)設(shè)備的使用電量,那大概就是水冷。
另外,芯片的產(chǎn)能問題也一直是困擾英偉達(dá)的一個(gè)方面,因?yàn)殡m然發(fā)布了B200,但是市面上能配置到H200的公司都不多。在這次大會上,英偉達(dá)也試圖直面這個(gè)問題,包括臺積電TSMC 和Synopsys將 NVIDIA合作,將在生產(chǎn)中使用 NVIDIA 計(jì)算光刻平臺,希望在加速芯片制造速度的同時(shí),也加快了對未來最新一代NVIDIA Blackwell架構(gòu)GPU的支持。
03 華爾街“暫不接招”
整體來說,黃仁勛的keynote期間在硬件上的發(fā)布效果還是非常好的,但是,從GTC這幾天的股價(jià)震蕩就可以看出來,華爾街并不覺得驚喜,因?yàn)橹霸?月公布財(cái)報(bào)的時(shí)候,利好都已經(jīng)出盡了,市場已經(jīng)知道英偉達(dá)會出新的芯片,這些硬件的更新已經(jīng)被市場提前消化了。
Yang Ren,Senior Analyst&Partner at Jirong Investment Management (濟(jì)容投資):
新發(fā)布的這個(gè)硬件的產(chǎn)品來看的話,其實(shí)我覺得沒有什么特別大的意外。因?yàn)槠鋵?shí)目前供應(yīng)鏈的這些渠道檢查,大家做得確實(shí)也都比較細(xì)致,比較到位了。我覺得就是硬件,如果讓我來總結(jié)我的感受的話,我覺得是“預(yù)期之內(nèi)的好”。我覺得可能是比較客觀的一個(gè)評價(jià)了。
陳茜,硅谷101聯(lián)合創(chuàng)始人:
你們會覺得說這個(gè)新的硬件的發(fā)布會,對整個(gè)英偉達(dá)在AI芯片中的地位造成任何的影響嗎?會進(jìn)一步的去鞏固它的現(xiàn)狀?還是會跟其他的,例如MI300等其他的一些競爭對手其實(shí)拉得更遠(yuǎn)?
Yang Ren,Senior Analyst&Partner at Jirong Investment Management (濟(jì)容投資):
我覺得其實(shí)現(xiàn)在這是一個(gè)大家交替領(lǐng)先,同時(shí)在進(jìn)步的這么一個(gè)狀態(tài)。因?yàn)榭赡芊旁趲讉€(gè)月之前,MI300剛剛出來的時(shí)候,大家會覺得MI300在硬件層面上,其實(shí)在已經(jīng)一定程度上超越了H100。 然后當(dāng)時(shí)大家對AMD的預(yù)期就拔得很高,認(rèn)為MI300可以很快地占據(jù)市場。但是我覺得這種角度去看可能是過于靜態(tài)了,因?yàn)闆]有一家公司他真的就會止步不前,然后不再進(jìn)步。
包括像Jensen英偉達(dá),他們是已經(jīng)對于MI300的這些進(jìn)步吧,他們是完全是看在眼里,也是有預(yù)期。他們自己在B100里面也是了加入了很多:比如像內(nèi)存一致性、比如將更大的高帶寬內(nèi)存,這些東西加入到B100里面,其實(shí)是大家共同進(jìn)步,交替領(lǐng)先的一個(gè)狀態(tài)。所以我覺得整體來看,我覺得硬件上英偉達(dá)確實(shí)還是走得很穩(wěn),還是在全速地往前推的這么一個(gè)狀態(tài)。他跟其他的競爭對的是持續(xù)性地一個(gè)差距,沒有再縮短的狀態(tài)。
所以,在這次GTC上,硬件的發(fā)布更新固然重要,但我們能強(qiáng)烈感覺到,黃仁勛想要強(qiáng)調(diào)的是,英偉達(dá)不僅僅是一家GPU公司,英偉達(dá)想要通過軟件的升級,不僅僅是已經(jīng)成功變成英偉達(dá)牢固護(hù)城河的CUDA,還有更遠(yuǎn)的布局。
黃仁勛在他的keynote中強(qiáng)調(diào)的很清楚,他眼中的新一代市值100萬億美元的新工業(yè)革命市場,英偉達(dá)是這樣布局的:除了Blackwell硬件算力平臺,黃仁勛還著重推出NIMs,幫助企業(yè)級客戶接入AI。
NVIDIA NIM是經(jīng)過優(yōu)化的推理微服務(wù),用于大規(guī)模部署 AI 模型,為開發(fā)AI驅(qū)動的企業(yè)應(yīng)用程序和在生產(chǎn)中部署AI模型提供了比較便捷和簡化的路徑。也就是說,企業(yè)想要部署AI,英偉達(dá)在生態(tài)上已經(jīng)給你提供了各種api和基礎(chǔ)大模型,讓企業(yè)更快的上手。
此外的生態(tài)重點(diǎn)是英偉達(dá)的AI foundry和NeMo。去年英偉達(dá)發(fā)布的AI foundry 具備三個(gè)要素:英偉達(dá)的AI基礎(chǔ)模型,NVIDIA NeMo 框架和工具、用于構(gòu)建、自定義和部署生成式AI 模型,以及NVIDIA DGX 云AI 超級計(jì)算服務(wù)。這樣依賴,AI foundry就可以用于為企業(yè)軟件、電信、媒體等各個(gè)行業(yè)的生成式AI 應(yīng)用定制模型。而在今年,英偉達(dá)進(jìn)一步在這樣的AI foundry生態(tài)上繼續(xù)更新各種基礎(chǔ)模型和生態(tài)服務(wù)。
下一個(gè)重點(diǎn)就是英偉達(dá)的Omniverse,也就是物理模擬反饋的平臺,通過模擬與物理世界中各種互動的過程,來訓(xùn)練AI。我們在之前講機(jī)器人那一集的時(shí)候就著重提過,AI機(jī)器人在模擬環(huán)境中的訓(xùn)練非常重要,而現(xiàn)在來看,不僅僅是AI機(jī)器人,還有無人駕駛,氣候模擬,藥物發(fā)現(xiàn),計(jì)算生物學(xué),乃至于Vision Pro所構(gòu)建的XR生態(tài),英偉達(dá)的Omniverse都已經(jīng)在布局。
這次GTC上,英偉達(dá)宣布了Omniverse Cloud API接口,讓開發(fā)者能夠輕松地將Omniverse的核心技術(shù)直接集成到現(xiàn)有的數(shù)字孿生設(shè)計(jì)與自動化軟件應(yīng)用中,或是集成到用于測試和驗(yàn)證機(jī)器人或自動駕駛汽車等自主機(jī)器的仿真工作流中。
同時(shí)在keynote中,黃仁勛進(jìn)一步強(qiáng)調(diào)Isaac Sim,這個(gè)基于Omniverse平臺之上的機(jī)器人培訓(xùn)與模擬系統(tǒng),這相當(dāng)于給機(jī)器人構(gòu)建了一個(gè)全新的“操作系統(tǒng)”,同時(shí),英偉達(dá)還宣布了一個(gè)名為GROOT的機(jī)器人通用基礎(chǔ)大模型,和新型計(jì)算機(jī)Jetson Thor來加速機(jī)器人訓(xùn)練。
而且,黃仁勛的一對兒女都在Omniver部門就職,女兒Madison Huang是Omniverse部門的高級產(chǎn)品營銷經(jīng)理,兒子Spencer Huang是Omniverse旗下機(jī)器人仿真和擴(kuò)展組的產(chǎn)品經(jīng)理,可見老黃對這個(gè)Omniverse這項(xiàng)業(yè)務(wù)的重視程度。
而從英偉達(dá)邀請的這四天的分享嘉賓中,我們能從現(xiàn)場就感受到,公司在軟件生態(tài)上的布局和發(fā)力。在各個(gè)panel和分享會上,我們也很直觀的感受到英偉達(dá)軟件生態(tài)的升級,給各個(gè)行業(yè)帶來的助力,這包括大語言模型賦能自動駕駛技術(shù)上,英偉達(dá)的數(shù)字孿生的模擬技術(shù)能讓自動駕駛繼續(xù)在模擬器中得以更好更快更有效率的訓(xùn)練。
另外,在具身智能專家李飛飛和波士頓動力機(jī)器人的分享環(huán)節(jié)中,嘉賓也都強(qiáng)調(diào)了深度機(jī)器學(xué)習(xí)給機(jī)器人技術(shù)帶來的巨大潛力,包括在模擬環(huán)境中的訓(xùn)練,以及在周一,黃仁勛也宣布了一個(gè)通用人形機(jī)器人基礎(chǔ)模型的新平臺,來和波士頓動力等等機(jī)器人公司合作,加速機(jī)器人的發(fā)展。
然而,雖然我身邊一些做軟件和研究的科學(xué)家和博士朋友們都對Omniverse以及數(shù)字孿生的升級有很大的期待,但無論是從昨天黃仁勛的演講現(xiàn)場,還是今天的分享會上,我們的感受和觀察是,軟件上的升級似乎并沒有給外界帶來非常大的興奮值,包括在昨天的keynote演講中,特別在軟件環(huán)節(jié),黃仁勛好幾個(gè)講的笑話和?,F(xiàn)場的觀眾都沒有理解到,好幾度比較冷場。
陳茜,硅谷101聯(lián)合創(chuàng)始人:
有幾個(gè)朋友他們是讀PhD技術(shù)背景出來的。他們會覺得說特別是軟件方向,包括數(shù)字孿生,包括模擬方面,英偉達(dá)在軟件方向提供這么多的支持,整個(gè)的研究、調(diào)研、他們的工作會加快非常多,所以他們感覺非常的興奮。但是感覺就是講硬件的那一塊,當(dāng)然很燃,大家就是能夠很快地理解到他硬件提升多少倍。但是好像講了軟件的那一塊,我感覺到現(xiàn)場好像參會者不是那么容易的能理解到,英偉達(dá)他想要去做什么事情,他想的是一個(gè)什么樣的市場。我覺得說老黃他表達(dá)出來的東西,跟現(xiàn)場觀眾接受到的信息中間還是有一個(gè)不對等。
Yang Ren,Senior Analyst&Partner at Jirong Investment Management (濟(jì)容投資):
對,我特別同意你這個(gè)觀察。我覺得英偉達(dá),大家對于它的芯片這一塊其實(shí)已經(jīng)認(rèn)知得非常充分了,軟件這部分我覺得可能不光是聽眾或者說投資人,有時(shí)候我甚至有一個(gè)感覺,就是英偉達(dá)自己對于他們的軟件這一塊到底是什么樣一個(gè)戰(zhàn)略,或者什么樣一個(gè)策略,也還是沒有一個(gè)特別清晰或者說完全成型的一個(gè)狀態(tài),都是在走一步、看一步,然后逐漸慢慢摸索的這種狀態(tài)。你剛才提到一點(diǎn),就是說覺得中間好像還隔著點(diǎn)什么?我也是這么一種感受。包括這次,大家都聽到他提很多關(guān)于數(shù)字孿生、關(guān)于Ominverse的這些東西。
但是這前兩年他第一次把Omniverse這個(gè)東西拿出來講的時(shí)候,大家都非常困惑,不知道Jensen到底想把這個(gè)東西來干嘛用?怎么去賣?一開始的時(shí)候,大家只是感覺這就是一個(gè),對于這些3D設(shè)計(jì)師或者說平面設(shè)計(jì)師用來協(xié)作的一個(gè)平臺。但是隨著現(xiàn)在慢慢的發(fā)展,慢慢地變成了數(shù)字孿生的一個(gè)操作系統(tǒng)。同時(shí)這些數(shù)字孿生在工業(yè)里面最初始的應(yīng)用,跟現(xiàn)在比較類似。我記得他最早提到在寶馬工廠里面一個(gè)應(yīng)用,就是幫助在工廠建設(shè)的過程中,提前做好布局設(shè)計(jì),做好工作流程的這些安排,這樣的話可以提升整體運(yùn)行的效率。因?yàn)檫@次提到了包括Wistron公司的例子、包括西門子的例子,都是類似的一個(gè)概念,我覺得非常合理。
一定程度上就是,在這些工業(yè)制造領(lǐng)域里面虛擬實(shí)境的一個(gè)應(yīng)用。另外他提到Omniverse的一個(gè)應(yīng)用,就是機(jī)器人的訓(xùn)練場。我覺得這個(gè)也是他們一直在做的事情,之前也斷斷續(xù)續(xù)有提到過。但之前整個(gè)軟件的版圖,給我的感覺就是他們這有一點(diǎn)東西,那有一點(diǎn)東西,但是一直缺一個(gè)特別好的、特別有凝聚力的一個(gè)戰(zhàn)略,能夠把所有的拼圖拼在一起。這一次聽完我其實(shí)真的有這種感覺了,就是有一種AI和Omniverse匯聚這么一種感覺。我現(xiàn)在能慢慢能夠看到他們軟件這一塊更清晰的一個(gè)版圖、一個(gè)戰(zhàn)略往后走是什么樣的。我能理解,為什么你剛才提到很多比較關(guān)注軟件的朋友,他們會覺得非常興奮。
陳茜,硅谷101聯(lián)合創(chuàng)始人:
你覺得對于就是華爾街來說,看到它軟件上面的一些業(yè)務(wù)慢慢的清晰化了,以及AI跟軟件的結(jié)合,這會對它的估值來說,會有一個(gè)更高的提升嗎?
Qindong Liu,Portfolio Manager&Partner at Jirong Investment Management (濟(jì)容投資):
我覺得其實(shí)是這樣子,就是我們管叫rerating(重新評定)的這么一個(gè)過程。那我覺得現(xiàn)在大部分,你從它現(xiàn)在估值水平,我覺得市場其實(shí)還是把它當(dāng)成一個(gè)芯片公司。我覺得這個(gè)是落后于英偉達(dá)自己的想法的。英偉達(dá)慢慢把自己定位成一個(gè)系統(tǒng)公司,不但是有硬件、軟件,我又能幫助你打造整個(gè)生態(tài),就給你提供一個(gè)大的生態(tài)。
譬如說我們之前還在講,說起來這相關(guān)又不那么相關(guān):就說以后無人駕駛這一塊,特斯拉大家都知道了,我不知道有多少人真的會想到說,英偉達(dá)在這里面以后也會成為特別重要的一環(huán)。像我前兩天和任總還在討論,以后是不是除了特斯拉之外的這些原始設(shè)備制造商,都要給英偉達(dá)去打工了。就是當(dāng)市場逐漸意識到這是需要時(shí)間的。像Jensen這樣這么一個(gè)有遠(yuǎn)見的CEO,在接下來的幾年,只要是AI這個(gè)賽道不冷,只要能一直這么發(fā)展下去,他會逐漸地把這些東西灌輸給市場,然后逐漸地被大家接受。
華爾街總是難以討好的,硬件升級,華爾街并不驚喜,因?yàn)橹皥?bào)財(cái)報(bào)的時(shí)候已經(jīng)被市場消化了,而軟件布局,華爾街沒有看到即刻的營收價(jià)值,目前也沒有買賬。但這并不影響黃仁勛的長期主義和未來布局,畢竟,加速計(jì)算他布局了20年,CUDA軟件布局了10多年。
04 權(quán)力與野心
無論華爾街是否在現(xiàn)在買賬,黃仁勛管理下的英偉達(dá)正在動用一切的努力去加固自己的護(hù)城河,也毫不掩飾的展示出未來朝著更多領(lǐng)域提供服務(wù)的野心。
最近一個(gè)黃仁勛在斯坦福的演講中,他說:他的目標(biāo)是就算競爭對手的芯片免費(fèi)送,也不如英偉達(dá)的劃算。非常大的口氣。
黃仁勛,NVIDIA創(chuàng)始人兼首席執(zhí)行官:
我們部署的時(shí)間、我們的表現(xiàn)、我們的落地應(yīng)用,以及在不同應(yīng)用間的靈活性,這些綜合起來,容許我們的運(yùn)營成本,我們的總體運(yùn)營成本好到一個(gè)程度。就是即便競爭對手的芯片免費(fèi)送,也無法便宜過我們。這就是我們的目標(biāo):讓成本不再成為我們產(chǎn)品價(jià)值的衡量標(biāo)準(zhǔn)。當(dāng)然這個(gè)需要我們付出很多心血,得持續(xù)創(chuàng)新、虛心前行。但我們的競爭對手太多了。
所以,更高的護(hù)城河,更大的生態(tài)系統(tǒng),是黃仁勛追求的。
一篇華爾街日報(bào)里面寫到的細(xì)節(jié),說風(fēng)險(xiǎn)投資公司Thomvest Ventures的董事總經(jīng)理Umesh Padval說他和黃仁勛一起去投資布局一些初創(chuàng)公司的時(shí)候,黃仁勛毫不掩飾并且以來就比較aggressively、比較激進(jìn)的直接問:“我需要做什么才能建立生態(tài)系統(tǒng),以便我可以銷售更多的芯片和系統(tǒng)?”
所以,我們看到,目前英偉達(dá)參與了很多的初創(chuàng)公司投資,除了上面說的這家Thomvest和英偉達(dá)一起投資的基礎(chǔ)模型AI公司Cohere之外,英偉達(dá)還投資了云計(jì)算公司CoreWeave。華爾街日報(bào)報(bào)道, 在上一財(cái)年中,英偉達(dá)所持其他公司的股份價(jià)值增長了五倍多,截至2024年1月底達(dá)到約 15.5 億美元。而英偉達(dá)在 2023 年總共投資了超過35家初創(chuàng)公司,這個(gè)投資量級是上一年的三倍多。
所以,在這些人工智能、機(jī)器人、自動化、醫(yī)療保健公司等等賽道,黃仁勛都在布局。也許這些賽道還沒有爆發(fā),也許還需要很長的時(shí)間,但就像黃仁勛20年前就開始布局加速計(jì)算、10多年前就開始布局CUDA一樣,這些產(chǎn)業(yè)被老黃稱為“Zero-billion dollar markets”,就是目前市場有限、但在未來可能會爆發(fā)的市場,黃仁勛在一如既往的提前布局他遙遠(yuǎn)的野心。
而黃仁勛在目前是有資本進(jìn)行布局的:股價(jià)一路上漲、手握大量現(xiàn)金不說,另外一個(gè)原因我們在跟硅谷一個(gè)VC聊天的時(shí)候?qū)Ψ秸f:現(xiàn)在VC去搶好項(xiàng)目,明星AI公司看的不是你給的估值有多好,而是看你有沒有買GPU的渠道。而這個(gè)渠道的權(quán)力,有誰搶得過英偉達(dá)本身呢?
所以,英偉達(dá)如今搶占各個(gè)明星AI項(xiàng)目的席位,也是非常順理成章。而這樣的市場絕對霸主地位帶來的權(quán)力讓英偉達(dá)有著很大的話語權(quán)。
華爾街日報(bào)同樣的一篇文章中寫到:甲骨文創(chuàng)始人兼董事長Larry Ellison在去年9月的一次公司會議上講述了他和馬斯克與黃仁勛在硅谷Palo Alto的Nobu日本餐廳吃晚餐。Larry Ellison回憶說,描述這頓飯最貼切的方式是:一個(gè)小時(shí)的壽司和乞討。
原文真的用的乞討(begging)這個(gè)詞。所以,我們用了“絕對霸主的權(quán)力”和“遙遠(yuǎn)的野心”作為視頻的主題,我覺得還挺能概括目前英偉達(dá)的狀態(tài)的。
但是并不是說英偉達(dá)就沒有挑戰(zhàn)了。英偉達(dá)可能面對的最大威脅,正是自己。
如果生成式AI像自動駕駛一樣發(fā)展到瓶頸期,或者最終證明transformer這個(gè)架構(gòu)并不是將人類帶向AGI,那么英偉達(dá)將面臨非常大的危機(jī)。
可能這也是為什么黃仁勛將本次GTC大會上,將Transformer論文作者聚集在一起的原因之一。
05 Transformer七子:AI的未來
最后,再來說說本次GTC大會上的一個(gè)大熱門環(huán)節(jié):由黃仁勛親自主持,邀請了Transformer這篇論文的幾位作者到場。
2017年,8位谷歌的研究員發(fā)表了一篇論文叫做Attention is all you need,這篇論文提出了一種新的簡單網(wǎng)絡(luò)架構(gòu),這就是Transformer,它完全基于Attention注意力機(jī)制,完全摒棄了之前的RNN和卷積CNN等機(jī)制。
而正是因?yàn)檫@篇論文,剛成立的OpenAI開始用transformer的架構(gòu)開始訓(xùn)練GPT路線,開始走堆算力和堆參數(shù)的AI訓(xùn)練方法,之后才造就了今天我們所看到的生成式AI革命。所以這8位研究員可以稱為如今生成式AI的大功臣,而他們在意識到transformer架構(gòu)的潛力之后,也相繼的離開了谷歌,開始投身于不同的初創(chuàng)公司和項(xiàng)目當(dāng)中。
這里面其實(shí)有兩個(gè)很有意思的點(diǎn):
1)Transformer架構(gòu)是谷歌最先推出的,但這幾位研究元老一位都沒有留住,他們在分享中也說道,因?yàn)榉椒ㄓ辛耍酉聛碜钪匾木褪强焖俚某鰬?yīng)用,接觸用戶,完善產(chǎn)品,尋求市場反饋,然后再快速的推進(jìn),但顯然,谷歌陷入的所謂的“大公司創(chuàng)新陷阱”里,很難在公司內(nèi)部來快速推進(jìn),所以大家只能紛紛叛逃,出來自己做初創(chuàng)公司,這8位從前的研究員,如今的創(chuàng)業(yè)者,全部都是這樣。
2)他們也看到了如今AI浪潮所帶來的機(jī)會,而他們本身的光環(huán)就足夠能吸引融資和人才人脈加入他們。在硅谷,人們都想創(chuàng)業(yè),都想自己推出產(chǎn)品,主導(dǎo)創(chuàng)新,而就像黃仁勛說的,接下來10年將是黃金10年的機(jī)會,所以也難怪8位研究員都出來自己單干。很有意思的是,他們之前從來都沒有聚在一起過,之前都是線上合作辦公,而這一次,除了一位女性研究員Niki Parmar 因?yàn)橛屑依锛笔聸]有來之外,其它七位研究員都來到了現(xiàn)場,可以說是非常有歷史紀(jì)念意義的一個(gè)瞬間了。
整個(gè)會場從很早就開始排隊(duì),差不多接近2000人的會場都坐滿了,黃仁勛也提前來到現(xiàn)場和大家打招呼合影,之后介紹每位研究員上場。
他們分別是AI角色扮演對話公司Character AI聯(lián)合創(chuàng)始人兼首席執(zhí)行官Noam Shazeer;
我們上面提到的基礎(chǔ)模型AI創(chuàng)業(yè)公司,Cohere聯(lián)合創(chuàng)始人兼首席執(zhí)行官Aidan Gomez;
Ashish Vaswani和缺席的Niki Parmar 兩人聯(lián)合創(chuàng)立了Essential AI這家基于大模型的全棧型智能產(chǎn)品開發(fā)商,Essential AI開發(fā)了一項(xiàng)名為“企業(yè)大腦”的技術(shù),可以利用AI執(zhí)行企業(yè)職能,比如說數(shù)據(jù)分析,并自動執(zhí)行單調(diào)的任務(wù)。
此外,Llion Jones在日本東京創(chuàng)建了Sakana AI,這是一家AI技術(shù)研發(fā)商,專注于為基礎(chǔ)模型創(chuàng)建新架構(gòu);
Illia Polosukhin聯(lián)合創(chuàng)立的使用區(qū)塊鏈為AI 賦能的Near Protocol公司;
此外,Jakob Uskhoreit是Inceptive的聯(lián)合創(chuàng)始人兼首席執(zhí)行官,這家公司將人工智能用于mRNA疫苗開發(fā);
同時(shí)英偉達(dá)也投資了他們;最后是Lukasz Kaiser,加入了OpenAI,而黃仁勛介紹他上臺時(shí)開玩笑說,這是8位作者中唯一一位還在做工程師的技術(shù)人員。
而在座談會上,大家分享了自己從事的公司方向,以及對技術(shù)的理解。大家認(rèn)為,模型還需要進(jìn)一步的優(yōu)化,無論是在技術(shù)還是在推理上,我們還需要看到技術(shù)的繼續(xù)突破,甚至需要有比transformer更好的框架。
Aidan Gomez,Cohere聯(lián)合創(chuàng)始人兼首席執(zhí)行官:
我仍然覺得,我們與最初的設(shè)計(jì)形態(tài)相似過高。這讓我有些不安。我認(rèn)為世界需要一種比transformer更先進(jìn)的模型。我們所有人都希望它能被更高效的技術(shù)所取代。將性能繼續(xù)往上拔高。
而一個(gè)比transformer更好的模型或者框架,英偉達(dá)的GPU是否還是必不可少的呢?這其實(shí)是一個(gè)問號,也是英偉達(dá)最大的危機(jī)所在。
但無論如何,目前算力是緊缺的,七位作者也一致認(rèn)為,接下來,自適應(yīng)計(jì)算(adaptive computation),也就是如何在特定的問題上分配合適的計(jì)算量,也是接下來的著力點(diǎn)之一。
換句話說,如果我們把2+2=4這個(gè)問題輸入現(xiàn)有模型,計(jì)算機(jī)需要使用一萬億參數(shù)解答這個(gè)問題,而這個(gè)問題的價(jià)值就不如問“2+2為什么等于4”,所以之后我們?nèi)绾稳ゼ兴懔鉀Q更有價(jià)值的問題、更合理分配算力,也是接下來需要推動的方向。
同時(shí),七位作者也認(rèn)為,AI下一個(gè)更重要的方向是訓(xùn)練AI的推理和自主決策能力,因?yàn)锳I的推理能力越強(qiáng),所需要的數(shù)據(jù)訓(xùn)練量就越少,屆時(shí)用于訓(xùn)練的數(shù)據(jù)質(zhì)量會更加重要,人機(jī)交互會更加深度,而接下來 如何去訓(xùn)練更高質(zhì)量的數(shù)據(jù)、私人的數(shù)據(jù),將是接下來發(fā)展的重點(diǎn)和挑戰(zhàn)。
而隨著AI技術(shù)迅速往前更迭,創(chuàng)業(yè)者以及創(chuàng)業(yè)賽道都面臨著巨大的不確定性。所以今年2024年GTC給我的唯一確定性就是,AI還是繼續(xù)發(fā)展和變化。
最后,問大家一個(gè)問題,大家知道GTC的全稱是什么嗎?
公布答案:GTC大會的全稱是“GPU Technology Conference”。
第一屆是2009年,此前都是非常GPU非常硬件的會議,但之后隨著英偉達(dá)公布CUDA,公布軟件布局,如今,GTC已經(jīng)不止是GPU,而是更大的生態(tài),以及將會影響人類未來的各種可能性。