正在閱讀:

這屆VC,對(duì)AI大模型“望而生畏”

掃一掃下載界面新聞APP

這屆VC,對(duì)AI大模型“望而生畏”

太貴,讓VC更理性了。

文|獵云網(wǎng) 孫媛

2023年,大模型狂飆;但一級(jí)市場(chǎng)卻略顯十動(dòng)然拒。

一邊,大廠跟大佬all in大模型的規(guī)劃掀起賽道的狂熱,有VC搶做一個(gè)吃螃蟹的人,數(shù)億元融資成大模型投早標(biāo)配。

譬如,啟明攜手經(jīng)緯,數(shù)億元天使輪投向周伯文創(chuàng)辦的銜遠(yuǎn)科技;創(chuàng)新工場(chǎng)孵化的AI 2.0 大模型瀾舟科技,也續(xù)上一筆數(shù)億元Pre-A輪,斯道資本和創(chuàng)新工場(chǎng)持續(xù)加碼。

但到了另一邊,卻仿佛現(xiàn)實(shí)照進(jìn)理想,大模型自研所需的“鈔能力”讓不少VC望而生畏。

一次運(yùn)算450萬(wàn)美元(約合3000萬(wàn)元)的開銷,以及月薪2萬(wàn)至10萬(wàn)/人的重金求賢爭(zhēng)奪賽,讓某家美元基金相關(guān)人員直接表示,“不關(guān)注AI大模型,太貴了?!?/p>

更有投資人直言,真實(shí)情況是項(xiàng)目根本搶不起來(lái)。一是估值體系還不成熟,幾億一輪融資,釋放10到20個(gè)點(diǎn)的股權(quán),估值馬上超10億,而這估值還是按照一個(gè)大模型燒GPU消耗的成本去計(jì)算,而不是以其真正的商業(yè)價(jià)值去評(píng)估;二是國(guó)內(nèi)存在商業(yè)化落地以及時(shí)機(jī)的不確定性。

“大家看好宏觀趨勢(shì),也更愿意做跟投,但到具體項(xiàng)目,要領(lǐng)投可太需要勇氣了。而且一起進(jìn)場(chǎng)投,很可能會(huì)追高?!?/p>

但有VC放棄,就會(huì)有VC勇往直前。

有幾家機(jī)構(gòu)跟獵云網(wǎng)表示目前仍在持續(xù)學(xué)習(xí)中,但還未形成投資邏輯,處于想投但是多觀望的狀態(tài)。而這樣的狀態(tài)反應(yīng)到項(xiàng)目端,卻也引發(fā)了部分創(chuàng)業(yè)者的吐槽,有創(chuàng)業(yè)者表示,很多基金與其說(shuō)是投資溝通,不如說(shuō)是找他們學(xué)習(xí)。

“有VC還在問(wèn)一些很基礎(chǔ)的問(wèn)題,譬如大模型跟原來(lái)小模型有什么不同。天天給人教育,相當(dāng)于變成了一個(gè)免費(fèi)的老師,后面的盡調(diào)也一直在問(wèn)偏學(xué)術(shù)上的問(wèn)題,商業(yè)上的考量都還沒(méi)有聊到?!?/p>

顯然,在一級(jí)市場(chǎng)投“真香”大模型上,多看少投甚至不投成為了大部分VC的日常。

國(guó)內(nèi)大模型“冷飯熱吃”

說(shuō)起大模型,其實(shí)也不算什么新鮮概念。

國(guó)外超大規(guī)模預(yù)訓(xùn)練模型始于2018年谷歌提出BERT大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型,并在2021年進(jìn)入“軍備競(jìng)賽”階段。

2020年,OpenAI推出GPT-3超大規(guī)模語(yǔ)言訓(xùn)練模型,參數(shù)達(dá)到1750億,用了大約兩年的時(shí)間,實(shí)現(xiàn)了模型規(guī)模從1億到上千億級(jí)的突破,并能實(shí)現(xiàn)作詩(shī)、聊天、生成代碼等功能。

再到2021年,谷歌推出的Switch Transformer模型成為歷史上首個(gè)萬(wàn)億級(jí)語(yǔ)言模型多達(dá) 1.6 萬(wàn)億個(gè)參數(shù),并在12月提出了具有 1.2 萬(wàn)億參數(shù)的 GLaM 通用稀疏語(yǔ)言模型,在7項(xiàng)小樣本學(xué)習(xí)領(lǐng)域的性能優(yōu)于 GPT-3。

同期,國(guó)內(nèi)超大模型的研發(fā)發(fā)展也很迅速,2021年成為中國(guó)AI大模型爆發(fā)的一年。

商湯科技的計(jì)算機(jī)視覺(jué)模型、華為云聯(lián)合發(fā)布的盤古NLP超大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型和盤古α超大規(guī)模預(yù)訓(xùn)練模型、阿里達(dá)摩院PLUG中文預(yù)訓(xùn)練模型以及聯(lián)合發(fā)布的M6中文多模態(tài)預(yù)訓(xùn)練模型以及百度的ERNIE 3.0 Titan模型陸續(xù)面世,其中達(dá)摩院M6模型的參數(shù)達(dá)到10萬(wàn)億,直接將大模型的參數(shù)提升了一個(gè)量級(jí)。

雖然當(dāng)時(shí)國(guó)內(nèi)院校跟大廠都在做大模型,但在銀杏谷資本高級(jí)投資經(jīng)理鐘偉成看來(lái),這更多是科研上的效果復(fù)現(xiàn),對(duì)國(guó)外較為前沿的AI模型的跟進(jìn)。直到2022年年底StableDiffusion、ChatGPT的出現(xiàn),才開始讓更多業(yè)內(nèi)人士從觀望走向下場(chǎng)。

“之前產(chǎn)品的商用價(jià)值并沒(méi)有完全體現(xiàn)出來(lái),大部分比較好的落地場(chǎng)景是心理慰藉的對(duì)話,或者文檔的改寫生成,以及此前的AI繪畫。ChatGPT出來(lái)后,大家發(fā)現(xiàn)說(shuō)可以通過(guò)多輪對(duì)話去做不斷微調(diào)、上下文學(xué)習(xí),然后去生成更好的內(nèi)容。”

從技術(shù)和戰(zhàn)略層面上看,ChatGPT讓更多人意識(shí)到這不單只是一個(gè)應(yīng)用工具,甚至?xí)蔀橐粋€(gè)新的PaaS層基礎(chǔ)設(shè)施。從技術(shù)和戰(zhàn)略層面上,群雄爭(zhēng)霸,都想試圖成為一個(gè)新時(shí)代的基礎(chǔ)設(shè)施供應(yīng)商。

再到2023年,上市公司和大廠陸續(xù)放出做大模型的信號(hào),AIGC概念股股價(jià)翻番,外加“AI的iPhone時(shí)刻 ”無(wú)不讓這股熱度從二級(jí)市場(chǎng)涌向一級(jí),引發(fā)對(duì)語(yǔ)言大模型的重點(diǎn)關(guān)注。

風(fēng)口之下,從前年開始布局的學(xué)院派等語(yǔ)言大模型創(chuàng)企從去年開始浮出水面,擊中了有出手壓力的VC心巴。

鐘偉成表示,多數(shù)投資人在大環(huán)境不確定下,會(huì)傾向于尋求一些偏底層及回報(bào)較高、能最終形成一家獨(dú)大的投資領(lǐng)域,外加對(duì)錯(cuò)過(guò)下一個(gè)時(shí)代風(fēng)口的焦慮,使得語(yǔ)言大模型項(xiàng)目成為了市面上最為性感的一類投資標(biāo)的。

然而賽道雖香,語(yǔ)言大模型的火爆表象下,技術(shù)差距并不止一點(diǎn)。

以當(dāng)前國(guó)內(nèi)大廠語(yǔ)言基礎(chǔ)大模型十幾億、幾百億的參數(shù)規(guī)模,以及大多數(shù)創(chuàng)業(yè)公司還在做一兩百億的參數(shù)模型來(lái)看,跟ChatGPT相比,還有2-3年的距離。

VC看多投少,項(xiàng)目端狂蹭熱點(diǎn)

正如上文所說(shuō),現(xiàn)在VC看大模型,光看鮮出手。

一方面,是因?yàn)橐恍┗鹗菑腁IGC火了后,才研究和關(guān)注大模型,開始找項(xiàng)目,正處于學(xué)習(xí)階段,而更主要的原因是貴。

以O(shè)penAI為例,其在推出GPT3的API接口出來(lái)之前,已經(jīng)燒了好幾億,后在微軟百億美元狂砸下,才有了GPT3的面世及能力的涌現(xiàn)。

所以想要對(duì)標(biāo)ChatGPT,資金必不可少。

鐘偉成表示,過(guò)去,團(tuán)隊(duì)健全的大佬創(chuàng)業(yè)項(xiàng)目,一般第一輪估值2-3億元就已經(jīng)很高。但放到大模型創(chuàng)企來(lái)說(shuō),光1年租1000張GPU卡就要花大幾千萬(wàn)到1億元的支出。

“這還只是試錯(cuò)的成本,萬(wàn)一技術(shù)路徑選錯(cuò)了,模型訓(xùn)練的過(guò)程中出了一些bug,重新弄根本吃不消。天使輪估值就這么高,等退出還要7-8年,跑出來(lái)的還不一定是投資的那一家。冒著整支基金回報(bào)的風(fēng)險(xiǎn)去投大模型,是項(xiàng)目推進(jìn)時(shí)較大的阻力?!?/p>

與此同時(shí),不同背景的基金之間,對(duì)于基金存續(xù)期以及試錯(cuò)風(fēng)險(xiǎn)的承受度都有不同的要求,部分基金會(huì)要求被投企業(yè)盡早做商業(yè)化嘗試,而這樣的投資模式跟慢工出細(xì)活的通用基礎(chǔ)大模型并不適配。

就目前來(lái)說(shuō),旗下有美元基金的機(jī)構(gòu)存續(xù)期較長(zhǎng),更容易下注投資語(yǔ)言大模型,但就目前主要投資早期輪來(lái)看,隨著語(yǔ)言大模型項(xiàng)目到第三四輪,一輪5-10億的砸錢下,估值到50億元后,誰(shuí)來(lái)接盤又成為問(wèn)題。

在鐘偉成看來(lái),與百度阿里等大廠,有內(nèi)部資金支持科研團(tuán)隊(duì)去做不同,國(guó)內(nèi)語(yǔ)言大模型創(chuàng)企,投資風(fēng)險(xiǎn)高就在于不確定因素太多,早期VC基金攢局投完以后,后期輪還是需要國(guó)資機(jī)構(gòu)的投資介入,幫助創(chuàng)企緩和資金量,才能推動(dòng)扶持出一家頭部企業(yè)。

他不禁感慨,“別看創(chuàng)業(yè)公司去做語(yǔ)言大模型好像很熱鬧,最后的格局可能還是一家特別大,兩家相對(duì)小的中文語(yǔ)言大模型存活下來(lái)?!?/p>

與此同時(shí),以目前市面上的大模型項(xiàng)目來(lái)說(shuō),蹭熱點(diǎn)的也不在少數(shù)。

就華映資本董事劉天杰的感觸來(lái)說(shuō),他從年底開始開始看AIGC的項(xiàng)目,過(guò)去是一個(gè)月看5-10個(gè),現(xiàn)在是每天都要看3-4個(gè),其中大概有1/4跟大模型相關(guān)。在他看來(lái),現(xiàn)在項(xiàng)目多到已經(jīng)成為繼上一波移動(dòng)互聯(lián)網(wǎng)以來(lái)的新一輪全球狂潮。

“所有人都想第一波沖進(jìn)去,挺正?!,F(xiàn)在很多做語(yǔ)音圖像識(shí)別的中后期輪甚至上市公司都在蹭這一波熱度,有些公司號(hào)稱做大模型,但最終是面向應(yīng)用的,其中大模型也得分語(yǔ)言大模型,以及中度的促進(jìn)性模型?!?/p>

故而在一級(jí)市場(chǎng)上,普遍VC采取看多投少的節(jié)奏,尤其是在大模型底層還未確定能發(fā)展多快的情況下,美元基金偏好語(yǔ)言大模型,人民幣基金則更偏向應(yīng)用層,但總體出手還是相當(dāng)審慎。

此外,劉天杰還指出,上一波AI公司現(xiàn)在往AIGC靠攏,其實(shí)已經(jīng)很難追上。事實(shí)上,這就是一場(chǎng)AI的自我革命。

“國(guó)外大模型從2018年就開始研究,這不是一蹴而就的事情。傳統(tǒng)判別式或者做卷積網(wǎng)絡(luò)的AI團(tuán)隊(duì)現(xiàn)在跳出來(lái)講大模型,但是他在傳統(tǒng)AI技術(shù)路線上投入了太多時(shí)間人力,歷史包袱成為其困局所在?!?/p>

同時(shí),劉天杰也坦言,在基礎(chǔ)大模型領(lǐng)域,其實(shí)文字、圖形乃至視頻的創(chuàng)業(yè)機(jī)會(huì)都不大。

“因?yàn)檫@不是一個(gè)擁有幾個(gè)算法天才就能解決的事情,你需要一個(gè)非常龐大的算力基礎(chǔ),這可能現(xiàn)在連國(guó)內(nèi)的大廠都沒(méi)有,就更別說(shuō)創(chuàng)業(yè)公司。同時(shí)你還需要一個(gè)巨大的高質(zhì)量數(shù)據(jù)集基礎(chǔ),純靠公網(wǎng)扒取、或者花錢去買,想要去做語(yǔ)言大模型真是挺困難?!?/p>

再回到現(xiàn)如今的大佬紛紛下場(chǎng)創(chuàng)業(yè),在鐘偉成看來(lái)也并非獨(dú)具優(yōu)勢(shì)。

“很多大佬是邀請(qǐng)了一些以前參與過(guò)大模型訓(xùn)練項(xiàng)目的人,把架構(gòu)搭起來(lái)重造,但其實(shí)不同量級(jí)的語(yǔ)言大模型訓(xùn)練,在工程化上都有很多不同的坑需要去逐步攻克,從0開始做,同行的競(jìng)爭(zhēng)壓力還是蠻大的。”

應(yīng)用層暫時(shí)失寵,模型層投資機(jī)會(huì)在“細(xì)分”

短期來(lái)看,國(guó)內(nèi)互聯(lián)網(wǎng)大廠在研發(fā)語(yǔ)言及多模態(tài)大模型的節(jié)奏下,未來(lái)3-5年會(huì)出現(xiàn)各種不同垂直領(lǐng)域的大模型,甚至細(xì)分到各個(gè)公司私有化部署的大模型。

在這樣趨勢(shì)下,各家都會(huì)有一個(gè)嘗鮮期。

在鐘偉成看來(lái),這就跟過(guò)去的中臺(tái)概念很像,短期內(nèi)激發(fā)一波需求,會(huì)有很多大廠或初創(chuàng)公司,去輔助大企業(yè)煉制自己的AI大模型。而中國(guó)的市場(chǎng)里面,長(zhǎng)遠(yuǎn)來(lái)看還是會(huì)走出一兩家通用的語(yǔ)言大模型,由百家爭(zhēng)鳴的狀態(tài)走向大一統(tǒng),且目前來(lái)看互聯(lián)網(wǎng)大廠的勝率較大。

“國(guó)內(nèi)公域流量上的中文語(yǔ)料非常差,優(yōu)質(zhì)的中文語(yǔ)料又集中在各個(gè)不同大廠的私域場(chǎng)景里,比方抖音的視頻數(shù)據(jù)、阿里的圖文數(shù)據(jù)、百度的文本數(shù)據(jù),還有知乎跟小紅書等,這些數(shù)據(jù)都是不會(huì)共享出來(lái)給外部去做通用的大模型訓(xùn)練。而有著私域數(shù)據(jù)及資金能力的互聯(lián)網(wǎng)大廠訓(xùn)練各自領(lǐng)域的大模型后,再看哪一家有能力擴(kuò)展到更多行業(yè),變成一個(gè)通用的語(yǔ)言大模型,我覺(jué)得這是國(guó)內(nèi)大模型比較符合常理的一個(gè)發(fā)展過(guò)程。”

那既然創(chuàng)業(yè)公司做基礎(chǔ)大模型對(duì)標(biāo)ChatGPT的機(jī)會(huì)不大,那么大模型創(chuàng)業(yè)還能往哪卷?

對(duì)此,有投資人給出一些答案:投細(xì)分、投基礎(chǔ)設(shè)施。

劉天杰表示,現(xiàn)階段,國(guó)內(nèi)有一些大模型在垂直領(lǐng)域的細(xì)分機(jī)會(huì)可以查漏補(bǔ)缺,包括一些現(xiàn)在在國(guó)際上比較前沿的領(lǐng)域,比如3D大模型、視頻大模型、多模態(tài)大模型等中型模型。

“微軟英偉達(dá),他們也沒(méi)有足夠多的3D數(shù)據(jù)去訓(xùn)練一個(gè)通用的3D大模型,而是用一些中型模型的路徑或者說(shuō)用一些模型監(jiān)督強(qiáng)化學(xué)習(xí)的方式去迫近3D大模型。在這一點(diǎn)上,我覺(jué)得國(guó)內(nèi)公司是有機(jī)會(huì)的?!?/p>

對(duì)此,鐘偉成也持相同看法。“關(guān)注垂直的語(yǔ)言大模型或多模態(tài)的大模型,國(guó)內(nèi)創(chuàng)企還是有一定的數(shù)據(jù)優(yōu)勢(shì),譬如字節(jié)或快手的人去做視頻生成,就很有可能做成。我認(rèn)為在垂直領(lǐng)域,市場(chǎng)規(guī)模足夠大、你進(jìn)得足夠早,比別人先積累一些領(lǐng)域內(nèi)的私有數(shù)據(jù),很有可能做到行業(yè)一霸?!?/p>

此外,他也認(rèn)為未來(lái)針對(duì)模型推理/訓(xùn)練的優(yōu)化、AI推理/訓(xùn)練專用芯片等AI基礎(chǔ)設(shè)施方向,也是有比較明確的市場(chǎng)需求。

值得注意的是,目前相較于模型層,應(yīng)用層暫時(shí)屬于失寵狀態(tài)。

過(guò)去移動(dòng)互聯(lián)網(wǎng)或元宇宙浪潮,其最大特點(diǎn)是基礎(chǔ)設(shè)施發(fā)展較慢,但基礎(chǔ)設(shè)施架構(gòu)上的應(yīng)用發(fā)展較快。但到了這一波AI,基礎(chǔ)設(shè)施不僅已經(jīng)迎來(lái)爆發(fā)式增長(zhǎng),更在大廠大模型的涌入下,不斷變化著。

在劉天杰看來(lái),這種情況下講應(yīng)用毫無(wú)意義,投入后一旦大廠發(fā)了一個(gè)新模型,就可能直接把應(yīng)用干翻。

“在這種情況下,我們第二波才會(huì)看應(yīng)用。現(xiàn)在的AI公司,如果能在目前中文大模型不那么完善的情況下,釋放功能給C端積累大量的高質(zhì)量數(shù)據(jù)集,那這家公司才有意義和價(jià)值?!?/p>

此外,據(jù)鐘偉成透露,4月看大模型的投資人基本會(huì)對(duì)心儀的項(xiàng)目做最后推進(jìn),好幾家已經(jīng)close了?,F(xiàn)在還在市面融資的大模型項(xiàng)目相對(duì)變少,但還是會(huì)有很多做應(yīng)用的AIGC項(xiàng)目主動(dòng)找上門。

在他看來(lái),眼下大廠百家爭(zhēng)鳴,大模型越割裂,對(duì)資本來(lái)說(shuō)是一個(gè)利好,讓投資機(jī)構(gòu)有機(jī)會(huì)參與到垂直領(lǐng)域的大模型投資。但對(duì)于創(chuàng)業(yè)者來(lái)說(shuō),無(wú)論是模型層還是應(yīng)用層,都需要想清楚,一是找到一個(gè)AI原生的細(xì)分領(lǐng)域,二是認(rèn)真思考其所帶來(lái)的根本性變化在哪,只是生成內(nèi)容,還是內(nèi)容的理解及后續(xù)合成。

顯然,這新一輪AI浪潮下,找VC拿錢的條件越來(lái)越高了。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

這屆VC,對(duì)AI大模型“望而生畏”

太貴,讓VC更理性了。

文|獵云網(wǎng) 孫媛

2023年,大模型狂飆;但一級(jí)市場(chǎng)卻略顯十動(dòng)然拒。

一邊,大廠跟大佬all in大模型的規(guī)劃掀起賽道的狂熱,有VC搶做一個(gè)吃螃蟹的人,數(shù)億元融資成大模型投早標(biāo)配。

譬如,啟明攜手經(jīng)緯,數(shù)億元天使輪投向周伯文創(chuàng)辦的銜遠(yuǎn)科技;創(chuàng)新工場(chǎng)孵化的AI 2.0 大模型瀾舟科技,也續(xù)上一筆數(shù)億元Pre-A輪,斯道資本和創(chuàng)新工場(chǎng)持續(xù)加碼。

但到了另一邊,卻仿佛現(xiàn)實(shí)照進(jìn)理想,大模型自研所需的“鈔能力”讓不少VC望而生畏。

一次運(yùn)算450萬(wàn)美元(約合3000萬(wàn)元)的開銷,以及月薪2萬(wàn)至10萬(wàn)/人的重金求賢爭(zhēng)奪賽,讓某家美元基金相關(guān)人員直接表示,“不關(guān)注AI大模型,太貴了?!?/p>

更有投資人直言,真實(shí)情況是項(xiàng)目根本搶不起來(lái)。一是估值體系還不成熟,幾億一輪融資,釋放10到20個(gè)點(diǎn)的股權(quán),估值馬上超10億,而這估值還是按照一個(gè)大模型燒GPU消耗的成本去計(jì)算,而不是以其真正的商業(yè)價(jià)值去評(píng)估;二是國(guó)內(nèi)存在商業(yè)化落地以及時(shí)機(jī)的不確定性。

“大家看好宏觀趨勢(shì),也更愿意做跟投,但到具體項(xiàng)目,要領(lǐng)投可太需要勇氣了。而且一起進(jìn)場(chǎng)投,很可能會(huì)追高?!?/p>

但有VC放棄,就會(huì)有VC勇往直前。

有幾家機(jī)構(gòu)跟獵云網(wǎng)表示目前仍在持續(xù)學(xué)習(xí)中,但還未形成投資邏輯,處于想投但是多觀望的狀態(tài)。而這樣的狀態(tài)反應(yīng)到項(xiàng)目端,卻也引發(fā)了部分創(chuàng)業(yè)者的吐槽,有創(chuàng)業(yè)者表示,很多基金與其說(shuō)是投資溝通,不如說(shuō)是找他們學(xué)習(xí)。

“有VC還在問(wèn)一些很基礎(chǔ)的問(wèn)題,譬如大模型跟原來(lái)小模型有什么不同。天天給人教育,相當(dāng)于變成了一個(gè)免費(fèi)的老師,后面的盡調(diào)也一直在問(wèn)偏學(xué)術(shù)上的問(wèn)題,商業(yè)上的考量都還沒(méi)有聊到。”

顯然,在一級(jí)市場(chǎng)投“真香”大模型上,多看少投甚至不投成為了大部分VC的日常。

國(guó)內(nèi)大模型“冷飯熱吃”

說(shuō)起大模型,其實(shí)也不算什么新鮮概念。

國(guó)外超大規(guī)模預(yù)訓(xùn)練模型始于2018年谷歌提出BERT大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型,并在2021年進(jìn)入“軍備競(jìng)賽”階段。

2020年,OpenAI推出GPT-3超大規(guī)模語(yǔ)言訓(xùn)練模型,參數(shù)達(dá)到1750億,用了大約兩年的時(shí)間,實(shí)現(xiàn)了模型規(guī)模從1億到上千億級(jí)的突破,并能實(shí)現(xiàn)作詩(shī)、聊天、生成代碼等功能。

再到2021年,谷歌推出的Switch Transformer模型成為歷史上首個(gè)萬(wàn)億級(jí)語(yǔ)言模型多達(dá) 1.6 萬(wàn)億個(gè)參數(shù),并在12月提出了具有 1.2 萬(wàn)億參數(shù)的 GLaM 通用稀疏語(yǔ)言模型,在7項(xiàng)小樣本學(xué)習(xí)領(lǐng)域的性能優(yōu)于 GPT-3。

同期,國(guó)內(nèi)超大模型的研發(fā)發(fā)展也很迅速,2021年成為中國(guó)AI大模型爆發(fā)的一年。

商湯科技的計(jì)算機(jī)視覺(jué)模型、華為云聯(lián)合發(fā)布的盤古NLP超大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型和盤古α超大規(guī)模預(yù)訓(xùn)練模型、阿里達(dá)摩院PLUG中文預(yù)訓(xùn)練模型以及聯(lián)合發(fā)布的M6中文多模態(tài)預(yù)訓(xùn)練模型以及百度的ERNIE 3.0 Titan模型陸續(xù)面世,其中達(dá)摩院M6模型的參數(shù)達(dá)到10萬(wàn)億,直接將大模型的參數(shù)提升了一個(gè)量級(jí)。

雖然當(dāng)時(shí)國(guó)內(nèi)院校跟大廠都在做大模型,但在銀杏谷資本高級(jí)投資經(jīng)理鐘偉成看來(lái),這更多是科研上的效果復(fù)現(xiàn),對(duì)國(guó)外較為前沿的AI模型的跟進(jìn)。直到2022年年底StableDiffusion、ChatGPT的出現(xiàn),才開始讓更多業(yè)內(nèi)人士從觀望走向下場(chǎng)。

“之前產(chǎn)品的商用價(jià)值并沒(méi)有完全體現(xiàn)出來(lái),大部分比較好的落地場(chǎng)景是心理慰藉的對(duì)話,或者文檔的改寫生成,以及此前的AI繪畫。ChatGPT出來(lái)后,大家發(fā)現(xiàn)說(shuō)可以通過(guò)多輪對(duì)話去做不斷微調(diào)、上下文學(xué)習(xí),然后去生成更好的內(nèi)容?!?/p>

從技術(shù)和戰(zhàn)略層面上看,ChatGPT讓更多人意識(shí)到這不單只是一個(gè)應(yīng)用工具,甚至?xí)蔀橐粋€(gè)新的PaaS層基礎(chǔ)設(shè)施。從技術(shù)和戰(zhàn)略層面上,群雄爭(zhēng)霸,都想試圖成為一個(gè)新時(shí)代的基礎(chǔ)設(shè)施供應(yīng)商。

再到2023年,上市公司和大廠陸續(xù)放出做大模型的信號(hào),AIGC概念股股價(jià)翻番,外加“AI的iPhone時(shí)刻 ”無(wú)不讓這股熱度從二級(jí)市場(chǎng)涌向一級(jí),引發(fā)對(duì)語(yǔ)言大模型的重點(diǎn)關(guān)注。

風(fēng)口之下,從前年開始布局的學(xué)院派等語(yǔ)言大模型創(chuàng)企從去年開始浮出水面,擊中了有出手壓力的VC心巴。

鐘偉成表示,多數(shù)投資人在大環(huán)境不確定下,會(huì)傾向于尋求一些偏底層及回報(bào)較高、能最終形成一家獨(dú)大的投資領(lǐng)域,外加對(duì)錯(cuò)過(guò)下一個(gè)時(shí)代風(fēng)口的焦慮,使得語(yǔ)言大模型項(xiàng)目成為了市面上最為性感的一類投資標(biāo)的。

然而賽道雖香,語(yǔ)言大模型的火爆表象下,技術(shù)差距并不止一點(diǎn)。

以當(dāng)前國(guó)內(nèi)大廠語(yǔ)言基礎(chǔ)大模型十幾億、幾百億的參數(shù)規(guī)模,以及大多數(shù)創(chuàng)業(yè)公司還在做一兩百億的參數(shù)模型來(lái)看,跟ChatGPT相比,還有2-3年的距離。

VC看多投少,項(xiàng)目端狂蹭熱點(diǎn)

正如上文所說(shuō),現(xiàn)在VC看大模型,光看鮮出手。

一方面,是因?yàn)橐恍┗鹗菑腁IGC火了后,才研究和關(guān)注大模型,開始找項(xiàng)目,正處于學(xué)習(xí)階段,而更主要的原因是貴。

以O(shè)penAI為例,其在推出GPT3的API接口出來(lái)之前,已經(jīng)燒了好幾億,后在微軟百億美元狂砸下,才有了GPT3的面世及能力的涌現(xiàn)。

所以想要對(duì)標(biāo)ChatGPT,資金必不可少。

鐘偉成表示,過(guò)去,團(tuán)隊(duì)健全的大佬創(chuàng)業(yè)項(xiàng)目,一般第一輪估值2-3億元就已經(jīng)很高。但放到大模型創(chuàng)企來(lái)說(shuō),光1年租1000張GPU卡就要花大幾千萬(wàn)到1億元的支出。

“這還只是試錯(cuò)的成本,萬(wàn)一技術(shù)路徑選錯(cuò)了,模型訓(xùn)練的過(guò)程中出了一些bug,重新弄根本吃不消。天使輪估值就這么高,等退出還要7-8年,跑出來(lái)的還不一定是投資的那一家。冒著整支基金回報(bào)的風(fēng)險(xiǎn)去投大模型,是項(xiàng)目推進(jìn)時(shí)較大的阻力?!?/p>

與此同時(shí),不同背景的基金之間,對(duì)于基金存續(xù)期以及試錯(cuò)風(fēng)險(xiǎn)的承受度都有不同的要求,部分基金會(huì)要求被投企業(yè)盡早做商業(yè)化嘗試,而這樣的投資模式跟慢工出細(xì)活的通用基礎(chǔ)大模型并不適配。

就目前來(lái)說(shuō),旗下有美元基金的機(jī)構(gòu)存續(xù)期較長(zhǎng),更容易下注投資語(yǔ)言大模型,但就目前主要投資早期輪來(lái)看,隨著語(yǔ)言大模型項(xiàng)目到第三四輪,一輪5-10億的砸錢下,估值到50億元后,誰(shuí)來(lái)接盤又成為問(wèn)題。

在鐘偉成看來(lái),與百度阿里等大廠,有內(nèi)部資金支持科研團(tuán)隊(duì)去做不同,國(guó)內(nèi)語(yǔ)言大模型創(chuàng)企,投資風(fēng)險(xiǎn)高就在于不確定因素太多,早期VC基金攢局投完以后,后期輪還是需要國(guó)資機(jī)構(gòu)的投資介入,幫助創(chuàng)企緩和資金量,才能推動(dòng)扶持出一家頭部企業(yè)。

他不禁感慨,“別看創(chuàng)業(yè)公司去做語(yǔ)言大模型好像很熱鬧,最后的格局可能還是一家特別大,兩家相對(duì)小的中文語(yǔ)言大模型存活下來(lái)?!?/p>

與此同時(shí),以目前市面上的大模型項(xiàng)目來(lái)說(shuō),蹭熱點(diǎn)的也不在少數(shù)。

就華映資本董事劉天杰的感觸來(lái)說(shuō),他從年底開始開始看AIGC的項(xiàng)目,過(guò)去是一個(gè)月看5-10個(gè),現(xiàn)在是每天都要看3-4個(gè),其中大概有1/4跟大模型相關(guān)。在他看來(lái),現(xiàn)在項(xiàng)目多到已經(jīng)成為繼上一波移動(dòng)互聯(lián)網(wǎng)以來(lái)的新一輪全球狂潮。

“所有人都想第一波沖進(jìn)去,挺正?!,F(xiàn)在很多做語(yǔ)音圖像識(shí)別的中后期輪甚至上市公司都在蹭這一波熱度,有些公司號(hào)稱做大模型,但最終是面向應(yīng)用的,其中大模型也得分語(yǔ)言大模型,以及中度的促進(jìn)性模型?!?/p>

故而在一級(jí)市場(chǎng)上,普遍VC采取看多投少的節(jié)奏,尤其是在大模型底層還未確定能發(fā)展多快的情況下,美元基金偏好語(yǔ)言大模型,人民幣基金則更偏向應(yīng)用層,但總體出手還是相當(dāng)審慎。

此外,劉天杰還指出,上一波AI公司現(xiàn)在往AIGC靠攏,其實(shí)已經(jīng)很難追上。事實(shí)上,這就是一場(chǎng)AI的自我革命。

“國(guó)外大模型從2018年就開始研究,這不是一蹴而就的事情。傳統(tǒng)判別式或者做卷積網(wǎng)絡(luò)的AI團(tuán)隊(duì)現(xiàn)在跳出來(lái)講大模型,但是他在傳統(tǒng)AI技術(shù)路線上投入了太多時(shí)間人力,歷史包袱成為其困局所在。”

同時(shí),劉天杰也坦言,在基礎(chǔ)大模型領(lǐng)域,其實(shí)文字、圖形乃至視頻的創(chuàng)業(yè)機(jī)會(huì)都不大。

“因?yàn)檫@不是一個(gè)擁有幾個(gè)算法天才就能解決的事情,你需要一個(gè)非常龐大的算力基礎(chǔ),這可能現(xiàn)在連國(guó)內(nèi)的大廠都沒(méi)有,就更別說(shuō)創(chuàng)業(yè)公司。同時(shí)你還需要一個(gè)巨大的高質(zhì)量數(shù)據(jù)集基礎(chǔ),純靠公網(wǎng)扒取、或者花錢去買,想要去做語(yǔ)言大模型真是挺困難?!?/p>

再回到現(xiàn)如今的大佬紛紛下場(chǎng)創(chuàng)業(yè),在鐘偉成看來(lái)也并非獨(dú)具優(yōu)勢(shì)。

“很多大佬是邀請(qǐng)了一些以前參與過(guò)大模型訓(xùn)練項(xiàng)目的人,把架構(gòu)搭起來(lái)重造,但其實(shí)不同量級(jí)的語(yǔ)言大模型訓(xùn)練,在工程化上都有很多不同的坑需要去逐步攻克,從0開始做,同行的競(jìng)爭(zhēng)壓力還是蠻大的?!?/p>

應(yīng)用層暫時(shí)失寵,模型層投資機(jī)會(huì)在“細(xì)分”

短期來(lái)看,國(guó)內(nèi)互聯(lián)網(wǎng)大廠在研發(fā)語(yǔ)言及多模態(tài)大模型的節(jié)奏下,未來(lái)3-5年會(huì)出現(xiàn)各種不同垂直領(lǐng)域的大模型,甚至細(xì)分到各個(gè)公司私有化部署的大模型。

在這樣趨勢(shì)下,各家都會(huì)有一個(gè)嘗鮮期。

在鐘偉成看來(lái),這就跟過(guò)去的中臺(tái)概念很像,短期內(nèi)激發(fā)一波需求,會(huì)有很多大廠或初創(chuàng)公司,去輔助大企業(yè)煉制自己的AI大模型。而中國(guó)的市場(chǎng)里面,長(zhǎng)遠(yuǎn)來(lái)看還是會(huì)走出一兩家通用的語(yǔ)言大模型,由百家爭(zhēng)鳴的狀態(tài)走向大一統(tǒng),且目前來(lái)看互聯(lián)網(wǎng)大廠的勝率較大。

“國(guó)內(nèi)公域流量上的中文語(yǔ)料非常差,優(yōu)質(zhì)的中文語(yǔ)料又集中在各個(gè)不同大廠的私域場(chǎng)景里,比方抖音的視頻數(shù)據(jù)、阿里的圖文數(shù)據(jù)、百度的文本數(shù)據(jù),還有知乎跟小紅書等,這些數(shù)據(jù)都是不會(huì)共享出來(lái)給外部去做通用的大模型訓(xùn)練。而有著私域數(shù)據(jù)及資金能力的互聯(lián)網(wǎng)大廠訓(xùn)練各自領(lǐng)域的大模型后,再看哪一家有能力擴(kuò)展到更多行業(yè),變成一個(gè)通用的語(yǔ)言大模型,我覺(jué)得這是國(guó)內(nèi)大模型比較符合常理的一個(gè)發(fā)展過(guò)程?!?/p>

那既然創(chuàng)業(yè)公司做基礎(chǔ)大模型對(duì)標(biāo)ChatGPT的機(jī)會(huì)不大,那么大模型創(chuàng)業(yè)還能往哪卷?

對(duì)此,有投資人給出一些答案:投細(xì)分、投基礎(chǔ)設(shè)施。

劉天杰表示,現(xiàn)階段,國(guó)內(nèi)有一些大模型在垂直領(lǐng)域的細(xì)分機(jī)會(huì)可以查漏補(bǔ)缺,包括一些現(xiàn)在在國(guó)際上比較前沿的領(lǐng)域,比如3D大模型、視頻大模型、多模態(tài)大模型等中型模型。

“微軟英偉達(dá),他們也沒(méi)有足夠多的3D數(shù)據(jù)去訓(xùn)練一個(gè)通用的3D大模型,而是用一些中型模型的路徑或者說(shuō)用一些模型監(jiān)督強(qiáng)化學(xué)習(xí)的方式去迫近3D大模型。在這一點(diǎn)上,我覺(jué)得國(guó)內(nèi)公司是有機(jī)會(huì)的?!?/p>

對(duì)此,鐘偉成也持相同看法?!瓣P(guān)注垂直的語(yǔ)言大模型或多模態(tài)的大模型,國(guó)內(nèi)創(chuàng)企還是有一定的數(shù)據(jù)優(yōu)勢(shì),譬如字節(jié)或快手的人去做視頻生成,就很有可能做成。我認(rèn)為在垂直領(lǐng)域,市場(chǎng)規(guī)模足夠大、你進(jìn)得足夠早,比別人先積累一些領(lǐng)域內(nèi)的私有數(shù)據(jù),很有可能做到行業(yè)一霸。”

此外,他也認(rèn)為未來(lái)針對(duì)模型推理/訓(xùn)練的優(yōu)化、AI推理/訓(xùn)練專用芯片等AI基礎(chǔ)設(shè)施方向,也是有比較明確的市場(chǎng)需求。

值得注意的是,目前相較于模型層,應(yīng)用層暫時(shí)屬于失寵狀態(tài)。

過(guò)去移動(dòng)互聯(lián)網(wǎng)或元宇宙浪潮,其最大特點(diǎn)是基礎(chǔ)設(shè)施發(fā)展較慢,但基礎(chǔ)設(shè)施架構(gòu)上的應(yīng)用發(fā)展較快。但到了這一波AI,基礎(chǔ)設(shè)施不僅已經(jīng)迎來(lái)爆發(fā)式增長(zhǎng),更在大廠大模型的涌入下,不斷變化著。

在劉天杰看來(lái),這種情況下講應(yīng)用毫無(wú)意義,投入后一旦大廠發(fā)了一個(gè)新模型,就可能直接把應(yīng)用干翻。

“在這種情況下,我們第二波才會(huì)看應(yīng)用?,F(xiàn)在的AI公司,如果能在目前中文大模型不那么完善的情況下,釋放功能給C端積累大量的高質(zhì)量數(shù)據(jù)集,那這家公司才有意義和價(jià)值?!?/p>

此外,據(jù)鐘偉成透露,4月看大模型的投資人基本會(huì)對(duì)心儀的項(xiàng)目做最后推進(jìn),好幾家已經(jīng)close了。現(xiàn)在還在市面融資的大模型項(xiàng)目相對(duì)變少,但還是會(huì)有很多做應(yīng)用的AIGC項(xiàng)目主動(dòng)找上門。

在他看來(lái),眼下大廠百家爭(zhēng)鳴,大模型越割裂,對(duì)資本來(lái)說(shuō)是一個(gè)利好,讓投資機(jī)構(gòu)有機(jī)會(huì)參與到垂直領(lǐng)域的大模型投資。但對(duì)于創(chuàng)業(yè)者來(lái)說(shuō),無(wú)論是模型層還是應(yīng)用層,都需要想清楚,一是找到一個(gè)AI原生的細(xì)分領(lǐng)域,二是認(rèn)真思考其所帶來(lái)的根本性變化在哪,只是生成內(nèi)容,還是內(nèi)容的理解及后續(xù)合成。

顯然,這新一輪AI浪潮下,找VC拿錢的條件越來(lái)越高了。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。