正在閱讀:

中國(guó)AI今天的問(wèn)題,是大模型又多又亂

掃一掃下載界面新聞APP

中國(guó)AI今天的問(wèn)題,是大模型又多又亂

中國(guó)AI之春在去掉90%的大模型之后。

文|腦極體

OpenAI的開(kāi)發(fā)者日活動(dòng)后,GPTs模式引發(fā)了新一輪的AI熱潮,開(kāi)發(fā)者調(diào)用過(guò)分火爆,甚至導(dǎo)致OpenAI服務(wù)器一度宕機(jī)。隨后,花式把玩GPTs的經(jīng)驗(yàn),以及圍繞這種新形態(tài)的巨大爭(zhēng)議開(kāi)始涌現(xiàn)。中國(guó)的IT從業(yè)者、軟件開(kāi)發(fā)者與AI工程師也積極參與討論,迎來(lái)了一場(chǎng)新的AI狂歡。

但在這種氛圍下,卻有一種沉默顯得像個(gè)顯眼包。那就是絕大多數(shù)大模型公司,似乎都沉默了。為了模仿類GPT的大模型,中國(guó)AI圈用了一年時(shí)間,雨后春筍般打造了上百個(gè)大模型。但其中能夠誕生明星應(yīng)用,能夠推動(dòng)產(chǎn)品創(chuàng)新,甚至能夠擁有規(guī)模化用戶的似乎都寥寥無(wú)幾。當(dāng)OpenAI的飛輪效應(yīng)顯現(xiàn),這些大模型公司就有種越是模仿差距越大的感覺(jué)。于是干脆不去追新的熱點(diǎn),埋頭把眼前能做的先做完。

記得今年年初的時(shí)候,社交網(wǎng)絡(luò)和媒體都在討論中國(guó)能否有大模型?

當(dāng)時(shí)我們說(shuō)過(guò),這其實(shí)是個(gè)偽命題,因?yàn)橹袊?guó)早就有大模型。而在ChatGPT爆火之后,中國(guó)AI遇到的問(wèn)題一定不是大模型太少,而是大模型過(guò)剩。

今天,這種問(wèn)題開(kāi)始浮現(xiàn)了出來(lái)。此刻中國(guó)AI行業(yè)最大的問(wèn)題,就是大模型太多,而且還挺亂。

摩肩接踵的大模型

中國(guó)到底有多少AI大模型?經(jīng)過(guò)一年的井噴式發(fā)展,這已經(jīng)變成了一筆糊涂賬。上半年的時(shí)候,答案大概是幾十個(gè)。時(shí)間來(lái)到11月,有人說(shuō)是一百多個(gè),有人說(shuō)是二百多個(gè)??傊?,中國(guó)此刻必然是全世界擁有大模型最多的國(guó)家,遠(yuǎn)遠(yuǎn)超過(guò)美國(guó)。

但是,這一百多個(gè)大模型有人用過(guò)嗎?有人對(duì)比、評(píng)測(cè)過(guò)嗎?恐怕沒(méi)有。因?yàn)槌藥讉€(gè)頭部大模型形成了用戶規(guī)模外,其中大部分存在于開(kāi)源社區(qū),還有一部分只存在通稿里。

這就像什么呢?其實(shí)很多人不知道,根據(jù)相關(guān)數(shù)據(jù),中國(guó)有2600萬(wàn)足球人口,同樣居世界第一。我們無(wú)從考證數(shù)據(jù)從何而來(lái),反正周圍踢足球的人看著是不多,而國(guó)足的成績(jī)有目共睹。

為什么會(huì)出現(xiàn)這么多大模型呢?

首先是今年大模型賽道好,機(jī)會(huì)難得。雖然科技板塊的VC市場(chǎng)非常低迷,但在其他互聯(lián)網(wǎng)創(chuàng)投項(xiàng)目普遍失效,虛擬貨幣被嚴(yán)格限制的情況下,AI大模型成為今年近乎唯一的故事。因此即便熱錢不多,但還是集中涌向了大模型創(chuàng)業(yè)。

其次,與很多人設(shè)想的不同,大模型創(chuàng)業(yè)并沒(méi)有真正意義上的高門檻。一旦以股權(quán)、期權(quán)等方式吸引到了合適的人才,大模型創(chuàng)業(yè)公司過(guò)多的費(fèi)用支出。相比于其他科技領(lǐng)域有產(chǎn)品研發(fā)、用戶推廣、硬件化等燒錢選項(xiàng),在擁有大量開(kāi)放數(shù)據(jù)集、免費(fèi)工具的情況下,僅僅是訓(xùn)練大模型并沒(méi)有過(guò)高的成本門檻,并且所謂大模型項(xiàng)目,往往一個(gè)科研團(tuán)隊(duì)就可以支撐,不需要像互聯(lián)網(wǎng)創(chuàng)業(yè)公司搭建較為復(fù)雜的業(yè)務(wù)體系。

此外,還有一種“刷業(yè)績(jī)”式的大模型,極大程度增加了大模型數(shù)量。這種一般是高校、科研機(jī)構(gòu)相關(guān)團(tuán)隊(duì),選報(bào)大模型方面課題更容易獲得立項(xiàng)。其結(jié)項(xiàng)結(jié)果發(fā)布后,大模型數(shù)量就又增加了一個(gè)?;蛘呤谴笮推髽I(yè)上級(jí)要求做大模型,于是IT部門會(huì)根據(jù)開(kāi)源的模型框架搭建一個(gè)出來(lái),即使效果不佳,落地困難,也要進(jìn)行對(duì)內(nèi)對(duì)外宣傳。

賽道好、成本低、需要完成任務(wù),這幾種動(dòng)力,導(dǎo)致中國(guó)大模型越來(lái)越多,且產(chǎn)生效率越來(lái)越快。

但問(wèn)題在于,足球人口規(guī)??赡艽_實(shí)很重要,但更重要的是有一支能踢進(jìn)世界杯的球隊(duì)。

沒(méi)有希望的窄賽道

那么有人或許要問(wèn)了。大模型數(shù)量說(shuō)難道不能成為優(yōu)勢(shì)嗎?我們靠數(shù)量出奇跡,說(shuō)不定數(shù)量一多就能選出拔尖的來(lái)?

這恐怕并不現(xiàn)實(shí)。因?yàn)閺姆N種理由來(lái)看,今天龐大的大模型規(guī)模,都是不可能持續(xù)存在。通稿打造類GPT模型而擠入下一個(gè)科技時(shí)代的美好想法,已經(jīng)將AI大模型變成了一條沒(méi)有希望的窄賽道。

我們可以來(lái)正視這樣幾個(gè)問(wèn)題:

1.大模型的數(shù)量多,其實(shí)和大模型本質(zhì)背道而馳。

提起大模型,我們會(huì)說(shuō)它的優(yōu)點(diǎn)是模型的泛化性、高魯棒性,繼而帶來(lái)了“智能涌現(xiàn)”效果。我們總是驚嘆OpenAI的成績(jī),就是因?yàn)镚PT系列始終在深度挖掘模型的泛化性。也就是說(shuō),大模型的優(yōu)勢(shì)就是一個(gè)頂一群,用一個(gè)模型代替一堆模型,結(jié)果反而出現(xiàn)了數(shù)量過(guò)剩的大模型,這與大模型初衷南轅北轍,并且浪費(fèi)了海量的社會(huì)資源。

2.大模型是底層技術(shù),底層技術(shù)的玩家不可能很多。

僅僅以AI開(kāi)發(fā)為例,模型之上還有AI芯片、AI框架。在過(guò)去幾年,這些領(lǐng)域也有很多廠商布局,但最后大多不了了之。AI芯片無(wú)法出貨,AI框架無(wú)人問(wèn)津,能夠剩下的只有頭部一兩家而已。大模型也是同樣的道理,這是一個(gè)注定洗牌到存量很少的賽道。

3. 大模型,距離開(kāi)發(fā)者很遠(yuǎn)。

絕大多數(shù)初創(chuàng)大模型,都會(huì)選擇開(kāi)源吸引開(kāi)發(fā)者的模式。但現(xiàn)實(shí)情況是,這些模型無(wú)論是與國(guó)外開(kāi)源大模型,還是國(guó)內(nèi)頭部大模型相比,都沒(méi)有實(shí)際競(jìng)爭(zhēng)力,無(wú)法形成規(guī)?;拈_(kāi)發(fā)者聚合效應(yīng)。這些大模型普遍是開(kāi)源時(shí)大力宣傳一波吸引關(guān)注,但開(kāi)發(fā)者實(shí)際體驗(yàn)后馬上遇冷。

4.大模型,距離用戶很遠(yuǎn)。

在可見(jiàn)的場(chǎng)景中,絕大多數(shù)大模型都缺乏商業(yè)化支撐,是這個(gè)賽道最大的問(wèn)題。對(duì)應(yīng)大模型創(chuàng)業(yè)型企業(yè)來(lái)說(shuō),一開(kāi)局就是最艱難的局面。后來(lái)廣受詬病的機(jī)器視覺(jué)公司,在開(kāi)局階段還有智能安防市場(chǎng)作為支撐。但大模型公司擁有的只是算法,甚至連一條可行的商業(yè)化通道都找不到。

這些問(wèn)題,導(dǎo)致堆積了巨大數(shù)量的大模型賽道開(kāi)始變得并不美好。它今天的情況是,說(shuō)算法,各個(gè)創(chuàng)新;說(shuō)參數(shù),各個(gè)龐大;說(shuō)調(diào)用,根本沒(méi)人用;說(shuō)商業(yè),根本沒(méi)去想。

模型一多,亂象也多

大模型一多,產(chǎn)業(yè)賽道開(kāi)始熱絡(luò)起來(lái),也必不可免出現(xiàn)一些問(wèn)題。這就是我們說(shuō)的,大模型不僅有點(diǎn)多,還有點(diǎn)亂。

由于目前階段,有一股“大模型用不用不重要,先要擁有大模型”的思潮。因此就開(kāi)始有各種方式降低大模型的開(kāi)發(fā)成本,通過(guò)話術(shù)夸大價(jià)值,甚至硬蹭大模型熱度,把不是大模型技術(shù)的項(xiàng)目包裝成大模型,進(jìn)而導(dǎo)致大模型圈子里,開(kāi)始出現(xiàn)良莠不齊、魚(yú)龍混雜的態(tài)勢(shì),我們可以列舉其中的幾種:

1.打榜刷分型大模型。由于大模型數(shù)量龐大,且實(shí)現(xiàn)思路基本一致,這就導(dǎo)致不同公司之間的差異化微乎其微。而為了凸顯自己的差異化與領(lǐng)先性,目前通用方式是硬造一個(gè)技術(shù)術(shù)語(yǔ),然后宣傳通過(guò)這項(xiàng)技術(shù)自身項(xiàng)目刷新了某榜單紀(jì)錄,在某測(cè)試中跑出了多少分。

事實(shí)上,大部分榜單都只測(cè)試模型的某個(gè)維度,可以進(jìn)行針對(duì)性調(diào)參。打榜刷分并不難,且有比較大的操作空間。類似的,社區(qū)開(kāi)發(fā)者打多少顆星,發(fā)了多少篇頂會(huì),也都是慣用的包裝方案。

2.結(jié)項(xiàng)為主型大模型。有很多用作課題結(jié)項(xiàng),或者企業(yè)數(shù)字化成果結(jié)項(xiàng)的大模型。評(píng)審結(jié)束,結(jié)項(xiàng)成功,開(kāi)源開(kāi)放,這三條做到就是它們的生命終點(diǎn)。這類大模型不考慮應(yīng)用場(chǎng)景與后續(xù)更新,有某種朝生夕死的精神特質(zhì)。

3.動(dòng)輒開(kāi)源型大模型。軟件開(kāi)源當(dāng)然是大勢(shì)所趨,但隨著這幾年中國(guó)開(kāi)源事業(yè)的興旺發(fā)展,AI模型開(kāi)源似乎變成了某種“時(shí)尚”。加上一些企業(yè)更愿意將大模型的開(kāi)源與免費(fèi)作為流量聚攏工具。開(kāi)源,逐漸成為了低質(zhì)量、低維護(hù)大模型的遮羞布。

4.冒名頂替型大模型。大模型火了之后,開(kāi)始有公司打起了蹭熱點(diǎn)的主意。于是,用并非標(biāo)準(zhǔn)預(yù)訓(xùn)練大模型技術(shù)冒充大模型,甚至干脆把古早的對(duì)話機(jī)器人、應(yīng)用軟件包裝成大模型的案例屢見(jiàn)不鮮。用大模型的瓶子,裝其他老酒,也成為了一門生意。

5.套殼變身型大模型。最近,一些創(chuàng)業(yè)公司套殼國(guó)外開(kāi)源模型的事件引起爭(zhēng)議。其實(shí)業(yè)界類似手法并不少見(jiàn),將開(kāi)源大模型進(jìn)行改寫和包裝,搖身一變,成為自研大模型的例子非常多。

這些大模型隊(duì)伍里的妖魔鬼怪,也紛紛可以通過(guò)發(fā)明術(shù)語(yǔ)、加強(qiáng)定語(yǔ)的方式,來(lái)宣傳自己的創(chuàng)新能力和差異化。最終導(dǎo)致把真正的技術(shù)創(chuàng)新,淹沒(méi)在了一系列的“偽裝創(chuàng)新”當(dāng)中。

中國(guó)AI之春在去掉90%的大模型之后

如果我們看美國(guó)的大模型產(chǎn)業(yè)結(jié)構(gòu),會(huì)發(fā)現(xiàn)它處在一個(gè)每層數(shù)量差異不大的金字塔結(jié)構(gòu)里。即OpenAI一家獨(dú)大,谷歌、微軟、Meta、X保持持續(xù)競(jìng)爭(zhēng)力,此外還有20幾個(gè)較為常用,開(kāi)發(fā)者群落比較活躍的大模型。

當(dāng)然咱們不是說(shuō)一定要照搬美國(guó),但從中大概可以看見(jiàn)一個(gè)科技大國(guó),在目前情況下大模型產(chǎn)業(yè)體量是什么。

中國(guó)大模型,已經(jīng)在短時(shí)間內(nèi)發(fā)展出了遠(yuǎn)遠(yuǎn)超過(guò)本身應(yīng)有存量的大模型。數(shù)量過(guò)于龐大的大模型,一方面浪費(fèi)了極大的研發(fā)、算力,以及數(shù)據(jù)資源;另一方面也蘊(yùn)藏了一場(chǎng)并不會(huì)太久的“危機(jī)”。

在資本泡沫相對(duì)冷卻之后,我們很容易看到這樣的情況:忽然之間,眾多大模型開(kāi)始停止更新,緊接著大模型領(lǐng)域的公司大量倒閉。伴隨著資本退場(chǎng),員工待遇下降等問(wèn)題開(kāi)始發(fā)生,于是媒體開(kāi)始唱衰大模型寒冬,社交媒體上開(kāi)始冷嘲熱諷AI這門技術(shù)。

這種行業(yè)猛然轉(zhuǎn)冷,大概率會(huì)給真正具有競(jìng)爭(zhēng)力、創(chuàng)新能力的中國(guó)AI企業(yè)帶來(lái)巨大的麻煩。

但是請(qǐng)記住,這并不是AI不行了,而是這些AI公司和大模型項(xiàng)目本來(lái)就不行。

這不是AI寒冬,而是中國(guó)AI的春天剛剛要真正開(kāi)始。產(chǎn)業(yè)優(yōu)化重組后的大模型產(chǎn)業(yè)形態(tài),才是真正能發(fā)揮出中國(guó)在應(yīng)用創(chuàng)新、產(chǎn)品打磨、產(chǎn)業(yè)智能化落地等領(lǐng)域的優(yōu)勢(shì)。

在中國(guó),相對(duì)良性的大模型產(chǎn)業(yè)形態(tài),應(yīng)該是有5家左右可以互相競(jìng)爭(zhēng)的主流大模型,1到2個(gè)能夠進(jìn)行底層技術(shù)創(chuàng)新,保持全球競(jìng)爭(zhēng)力的大模型體系,同時(shí)有一系列開(kāi)源大模型作為補(bǔ)充,以及一些學(xué)術(shù)領(lǐng)域的大模型作為AI for sience的支撐。此外,還要具備較為完善的大模型配套設(shè)施,包括AI芯片、AI計(jì)算、深度學(xué)習(xí)開(kāi)發(fā)框架、AI開(kāi)發(fā)工具,并且這些領(lǐng)域都有較高的自主化程度。換言之,必須要淘汰今天超過(guò)90%的大模型。

在這些底層軟硬件基礎(chǔ)之上,應(yīng)該有大量創(chuàng)業(yè)公司、AI開(kāi)發(fā)者去探索C端和B端的大模型落地。在大模型與行業(yè)結(jié)合的垂直領(lǐng)域,組成推廣和復(fù)制行業(yè)大模型的產(chǎn)業(yè)生態(tài);在主要的C端市場(chǎng),比如大模型+辦公、大模型+娛樂(lè)、大模型+信息獲取方面,涌入成千上萬(wàn)家公司,形成互聯(lián)網(wǎng)經(jīng)濟(jì)之后的AI經(jīng)濟(jì)奇跡。

而從“百模大戰(zhàn)”中能夠留到那時(shí)的只有三種公司:具備核心技術(shù)創(chuàng)新的、形成平臺(tái)型產(chǎn)業(yè)鏈的以及能夠快速找到商業(yè)出口,形成正向資金循環(huán)的。

我們依舊篤信,有一天AI技術(shù)上會(huì)出現(xiàn)新的抖音、微信、office,甚至更多此前無(wú)法想象的東西。

但今天絕大多數(shù)的大模型,結(jié)局恐怕只能是躺在歷史空隙與開(kāi)源平臺(tái)上,成為大時(shí)代的小腳注。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

中國(guó)AI今天的問(wèn)題,是大模型又多又亂

中國(guó)AI之春在去掉90%的大模型之后。

文|腦極體

OpenAI的開(kāi)發(fā)者日活動(dòng)后,GPTs模式引發(fā)了新一輪的AI熱潮,開(kāi)發(fā)者調(diào)用過(guò)分火爆,甚至導(dǎo)致OpenAI服務(wù)器一度宕機(jī)。隨后,花式把玩GPTs的經(jīng)驗(yàn),以及圍繞這種新形態(tài)的巨大爭(zhēng)議開(kāi)始涌現(xiàn)。中國(guó)的IT從業(yè)者、軟件開(kāi)發(fā)者與AI工程師也積極參與討論,迎來(lái)了一場(chǎng)新的AI狂歡。

但在這種氛圍下,卻有一種沉默顯得像個(gè)顯眼包。那就是絕大多數(shù)大模型公司,似乎都沉默了。為了模仿類GPT的大模型,中國(guó)AI圈用了一年時(shí)間,雨后春筍般打造了上百個(gè)大模型。但其中能夠誕生明星應(yīng)用,能夠推動(dòng)產(chǎn)品創(chuàng)新,甚至能夠擁有規(guī)?;脩舻乃坪醵剂攘葻o(wú)幾。當(dāng)OpenAI的飛輪效應(yīng)顯現(xiàn),這些大模型公司就有種越是模仿差距越大的感覺(jué)。于是干脆不去追新的熱點(diǎn),埋頭把眼前能做的先做完。

記得今年年初的時(shí)候,社交網(wǎng)絡(luò)和媒體都在討論中國(guó)能否有大模型?

當(dāng)時(shí)我們說(shuō)過(guò),這其實(shí)是個(gè)偽命題,因?yàn)橹袊?guó)早就有大模型。而在ChatGPT爆火之后,中國(guó)AI遇到的問(wèn)題一定不是大模型太少,而是大模型過(guò)剩。

今天,這種問(wèn)題開(kāi)始浮現(xiàn)了出來(lái)。此刻中國(guó)AI行業(yè)最大的問(wèn)題,就是大模型太多,而且還挺亂。

摩肩接踵的大模型

中國(guó)到底有多少AI大模型?經(jīng)過(guò)一年的井噴式發(fā)展,這已經(jīng)變成了一筆糊涂賬。上半年的時(shí)候,答案大概是幾十個(gè)。時(shí)間來(lái)到11月,有人說(shuō)是一百多個(gè),有人說(shuō)是二百多個(gè)。總之,中國(guó)此刻必然是全世界擁有大模型最多的國(guó)家,遠(yuǎn)遠(yuǎn)超過(guò)美國(guó)。

但是,這一百多個(gè)大模型有人用過(guò)嗎?有人對(duì)比、評(píng)測(cè)過(guò)嗎?恐怕沒(méi)有。因?yàn)槌藥讉€(gè)頭部大模型形成了用戶規(guī)模外,其中大部分存在于開(kāi)源社區(qū),還有一部分只存在通稿里。

這就像什么呢?其實(shí)很多人不知道,根據(jù)相關(guān)數(shù)據(jù),中國(guó)有2600萬(wàn)足球人口,同樣居世界第一。我們無(wú)從考證數(shù)據(jù)從何而來(lái),反正周圍踢足球的人看著是不多,而國(guó)足的成績(jī)有目共睹。

為什么會(huì)出現(xiàn)這么多大模型呢?

首先是今年大模型賽道好,機(jī)會(huì)難得。雖然科技板塊的VC市場(chǎng)非常低迷,但在其他互聯(lián)網(wǎng)創(chuàng)投項(xiàng)目普遍失效,虛擬貨幣被嚴(yán)格限制的情況下,AI大模型成為今年近乎唯一的故事。因此即便熱錢不多,但還是集中涌向了大模型創(chuàng)業(yè)。

其次,與很多人設(shè)想的不同,大模型創(chuàng)業(yè)并沒(méi)有真正意義上的高門檻。一旦以股權(quán)、期權(quán)等方式吸引到了合適的人才,大模型創(chuàng)業(yè)公司過(guò)多的費(fèi)用支出。相比于其他科技領(lǐng)域有產(chǎn)品研發(fā)、用戶推廣、硬件化等燒錢選項(xiàng),在擁有大量開(kāi)放數(shù)據(jù)集、免費(fèi)工具的情況下,僅僅是訓(xùn)練大模型并沒(méi)有過(guò)高的成本門檻,并且所謂大模型項(xiàng)目,往往一個(gè)科研團(tuán)隊(duì)就可以支撐,不需要像互聯(lián)網(wǎng)創(chuàng)業(yè)公司搭建較為復(fù)雜的業(yè)務(wù)體系。

此外,還有一種“刷業(yè)績(jī)”式的大模型,極大程度增加了大模型數(shù)量。這種一般是高校、科研機(jī)構(gòu)相關(guān)團(tuán)隊(duì),選報(bào)大模型方面課題更容易獲得立項(xiàng)。其結(jié)項(xiàng)結(jié)果發(fā)布后,大模型數(shù)量就又增加了一個(gè)。或者是大型企業(yè)上級(jí)要求做大模型,于是IT部門會(huì)根據(jù)開(kāi)源的模型框架搭建一個(gè)出來(lái),即使效果不佳,落地困難,也要進(jìn)行對(duì)內(nèi)對(duì)外宣傳。

賽道好、成本低、需要完成任務(wù),這幾種動(dòng)力,導(dǎo)致中國(guó)大模型越來(lái)越多,且產(chǎn)生效率越來(lái)越快。

但問(wèn)題在于,足球人口規(guī)??赡艽_實(shí)很重要,但更重要的是有一支能踢進(jìn)世界杯的球隊(duì)。

沒(méi)有希望的窄賽道

那么有人或許要問(wèn)了。大模型數(shù)量說(shuō)難道不能成為優(yōu)勢(shì)嗎?我們靠數(shù)量出奇跡,說(shuō)不定數(shù)量一多就能選出拔尖的來(lái)?

這恐怕并不現(xiàn)實(shí)。因?yàn)閺姆N種理由來(lái)看,今天龐大的大模型規(guī)模,都是不可能持續(xù)存在。通稿打造類GPT模型而擠入下一個(gè)科技時(shí)代的美好想法,已經(jīng)將AI大模型變成了一條沒(méi)有希望的窄賽道。

我們可以來(lái)正視這樣幾個(gè)問(wèn)題:

1.大模型的數(shù)量多,其實(shí)和大模型本質(zhì)背道而馳。

提起大模型,我們會(huì)說(shuō)它的優(yōu)點(diǎn)是模型的泛化性、高魯棒性,繼而帶來(lái)了“智能涌現(xiàn)”效果。我們總是驚嘆OpenAI的成績(jī),就是因?yàn)镚PT系列始終在深度挖掘模型的泛化性。也就是說(shuō),大模型的優(yōu)勢(shì)就是一個(gè)頂一群,用一個(gè)模型代替一堆模型,結(jié)果反而出現(xiàn)了數(shù)量過(guò)剩的大模型,這與大模型初衷南轅北轍,并且浪費(fèi)了海量的社會(huì)資源。

2.大模型是底層技術(shù),底層技術(shù)的玩家不可能很多。

僅僅以AI開(kāi)發(fā)為例,模型之上還有AI芯片、AI框架。在過(guò)去幾年,這些領(lǐng)域也有很多廠商布局,但最后大多不了了之。AI芯片無(wú)法出貨,AI框架無(wú)人問(wèn)津,能夠剩下的只有頭部一兩家而已。大模型也是同樣的道理,這是一個(gè)注定洗牌到存量很少的賽道。

3. 大模型,距離開(kāi)發(fā)者很遠(yuǎn)。

絕大多數(shù)初創(chuàng)大模型,都會(huì)選擇開(kāi)源吸引開(kāi)發(fā)者的模式。但現(xiàn)實(shí)情況是,這些模型無(wú)論是與國(guó)外開(kāi)源大模型,還是國(guó)內(nèi)頭部大模型相比,都沒(méi)有實(shí)際競(jìng)爭(zhēng)力,無(wú)法形成規(guī)?;拈_(kāi)發(fā)者聚合效應(yīng)。這些大模型普遍是開(kāi)源時(shí)大力宣傳一波吸引關(guān)注,但開(kāi)發(fā)者實(shí)際體驗(yàn)后馬上遇冷。

4.大模型,距離用戶很遠(yuǎn)。

在可見(jiàn)的場(chǎng)景中,絕大多數(shù)大模型都缺乏商業(yè)化支撐,是這個(gè)賽道最大的問(wèn)題。對(duì)應(yīng)大模型創(chuàng)業(yè)型企業(yè)來(lái)說(shuō),一開(kāi)局就是最艱難的局面。后來(lái)廣受詬病的機(jī)器視覺(jué)公司,在開(kāi)局階段還有智能安防市場(chǎng)作為支撐。但大模型公司擁有的只是算法,甚至連一條可行的商業(yè)化通道都找不到。

這些問(wèn)題,導(dǎo)致堆積了巨大數(shù)量的大模型賽道開(kāi)始變得并不美好。它今天的情況是,說(shuō)算法,各個(gè)創(chuàng)新;說(shuō)參數(shù),各個(gè)龐大;說(shuō)調(diào)用,根本沒(méi)人用;說(shuō)商業(yè),根本沒(méi)去想。

模型一多,亂象也多

大模型一多,產(chǎn)業(yè)賽道開(kāi)始熱絡(luò)起來(lái),也必不可免出現(xiàn)一些問(wèn)題。這就是我們說(shuō)的,大模型不僅有點(diǎn)多,還有點(diǎn)亂。

由于目前階段,有一股“大模型用不用不重要,先要擁有大模型”的思潮。因此就開(kāi)始有各種方式降低大模型的開(kāi)發(fā)成本,通過(guò)話術(shù)夸大價(jià)值,甚至硬蹭大模型熱度,把不是大模型技術(shù)的項(xiàng)目包裝成大模型,進(jìn)而導(dǎo)致大模型圈子里,開(kāi)始出現(xiàn)良莠不齊、魚(yú)龍混雜的態(tài)勢(shì),我們可以列舉其中的幾種:

1.打榜刷分型大模型。由于大模型數(shù)量龐大,且實(shí)現(xiàn)思路基本一致,這就導(dǎo)致不同公司之間的差異化微乎其微。而為了凸顯自己的差異化與領(lǐng)先性,目前通用方式是硬造一個(gè)技術(shù)術(shù)語(yǔ),然后宣傳通過(guò)這項(xiàng)技術(shù)自身項(xiàng)目刷新了某榜單紀(jì)錄,在某測(cè)試中跑出了多少分。

事實(shí)上,大部分榜單都只測(cè)試模型的某個(gè)維度,可以進(jìn)行針對(duì)性調(diào)參。打榜刷分并不難,且有比較大的操作空間。類似的,社區(qū)開(kāi)發(fā)者打多少顆星,發(fā)了多少篇頂會(huì),也都是慣用的包裝方案。

2.結(jié)項(xiàng)為主型大模型。有很多用作課題結(jié)項(xiàng),或者企業(yè)數(shù)字化成果結(jié)項(xiàng)的大模型。評(píng)審結(jié)束,結(jié)項(xiàng)成功,開(kāi)源開(kāi)放,這三條做到就是它們的生命終點(diǎn)。這類大模型不考慮應(yīng)用場(chǎng)景與后續(xù)更新,有某種朝生夕死的精神特質(zhì)。

3.動(dòng)輒開(kāi)源型大模型。軟件開(kāi)源當(dāng)然是大勢(shì)所趨,但隨著這幾年中國(guó)開(kāi)源事業(yè)的興旺發(fā)展,AI模型開(kāi)源似乎變成了某種“時(shí)尚”。加上一些企業(yè)更愿意將大模型的開(kāi)源與免費(fèi)作為流量聚攏工具。開(kāi)源,逐漸成為了低質(zhì)量、低維護(hù)大模型的遮羞布。

4.冒名頂替型大模型。大模型火了之后,開(kāi)始有公司打起了蹭熱點(diǎn)的主意。于是,用并非標(biāo)準(zhǔn)預(yù)訓(xùn)練大模型技術(shù)冒充大模型,甚至干脆把古早的對(duì)話機(jī)器人、應(yīng)用軟件包裝成大模型的案例屢見(jiàn)不鮮。用大模型的瓶子,裝其他老酒,也成為了一門生意。

5.套殼變身型大模型。最近,一些創(chuàng)業(yè)公司套殼國(guó)外開(kāi)源模型的事件引起爭(zhēng)議。其實(shí)業(yè)界類似手法并不少見(jiàn),將開(kāi)源大模型進(jìn)行改寫和包裝,搖身一變,成為自研大模型的例子非常多。

這些大模型隊(duì)伍里的妖魔鬼怪,也紛紛可以通過(guò)發(fā)明術(shù)語(yǔ)、加強(qiáng)定語(yǔ)的方式,來(lái)宣傳自己的創(chuàng)新能力和差異化。最終導(dǎo)致把真正的技術(shù)創(chuàng)新,淹沒(méi)在了一系列的“偽裝創(chuàng)新”當(dāng)中。

中國(guó)AI之春在去掉90%的大模型之后

如果我們看美國(guó)的大模型產(chǎn)業(yè)結(jié)構(gòu),會(huì)發(fā)現(xiàn)它處在一個(gè)每層數(shù)量差異不大的金字塔結(jié)構(gòu)里。即OpenAI一家獨(dú)大,谷歌、微軟、Meta、X保持持續(xù)競(jìng)爭(zhēng)力,此外還有20幾個(gè)較為常用,開(kāi)發(fā)者群落比較活躍的大模型。

當(dāng)然咱們不是說(shuō)一定要照搬美國(guó),但從中大概可以看見(jiàn)一個(gè)科技大國(guó),在目前情況下大模型產(chǎn)業(yè)體量是什么。

中國(guó)大模型,已經(jīng)在短時(shí)間內(nèi)發(fā)展出了遠(yuǎn)遠(yuǎn)超過(guò)本身應(yīng)有存量的大模型。數(shù)量過(guò)于龐大的大模型,一方面浪費(fèi)了極大的研發(fā)、算力,以及數(shù)據(jù)資源;另一方面也蘊(yùn)藏了一場(chǎng)并不會(huì)太久的“危機(jī)”。

在資本泡沫相對(duì)冷卻之后,我們很容易看到這樣的情況:忽然之間,眾多大模型開(kāi)始停止更新,緊接著大模型領(lǐng)域的公司大量倒閉。伴隨著資本退場(chǎng),員工待遇下降等問(wèn)題開(kāi)始發(fā)生,于是媒體開(kāi)始唱衰大模型寒冬,社交媒體上開(kāi)始冷嘲熱諷AI這門技術(shù)。

這種行業(yè)猛然轉(zhuǎn)冷,大概率會(huì)給真正具有競(jìng)爭(zhēng)力、創(chuàng)新能力的中國(guó)AI企業(yè)帶來(lái)巨大的麻煩。

但是請(qǐng)記住,這并不是AI不行了,而是這些AI公司和大模型項(xiàng)目本來(lái)就不行。

這不是AI寒冬,而是中國(guó)AI的春天剛剛要真正開(kāi)始。產(chǎn)業(yè)優(yōu)化重組后的大模型產(chǎn)業(yè)形態(tài),才是真正能發(fā)揮出中國(guó)在應(yīng)用創(chuàng)新、產(chǎn)品打磨、產(chǎn)業(yè)智能化落地等領(lǐng)域的優(yōu)勢(shì)。

在中國(guó),相對(duì)良性的大模型產(chǎn)業(yè)形態(tài),應(yīng)該是有5家左右可以互相競(jìng)爭(zhēng)的主流大模型,1到2個(gè)能夠進(jìn)行底層技術(shù)創(chuàng)新,保持全球競(jìng)爭(zhēng)力的大模型體系,同時(shí)有一系列開(kāi)源大模型作為補(bǔ)充,以及一些學(xué)術(shù)領(lǐng)域的大模型作為AI for sience的支撐。此外,還要具備較為完善的大模型配套設(shè)施,包括AI芯片、AI計(jì)算、深度學(xué)習(xí)開(kāi)發(fā)框架、AI開(kāi)發(fā)工具,并且這些領(lǐng)域都有較高的自主化程度。換言之,必須要淘汰今天超過(guò)90%的大模型。

在這些底層軟硬件基礎(chǔ)之上,應(yīng)該有大量創(chuàng)業(yè)公司、AI開(kāi)發(fā)者去探索C端和B端的大模型落地。在大模型與行業(yè)結(jié)合的垂直領(lǐng)域,組成推廣和復(fù)制行業(yè)大模型的產(chǎn)業(yè)生態(tài);在主要的C端市場(chǎng),比如大模型+辦公、大模型+娛樂(lè)、大模型+信息獲取方面,涌入成千上萬(wàn)家公司,形成互聯(lián)網(wǎng)經(jīng)濟(jì)之后的AI經(jīng)濟(jì)奇跡。

而從“百模大戰(zhàn)”中能夠留到那時(shí)的只有三種公司:具備核心技術(shù)創(chuàng)新的、形成平臺(tái)型產(chǎn)業(yè)鏈的以及能夠快速找到商業(yè)出口,形成正向資金循環(huán)的。

我們依舊篤信,有一天AI技術(shù)上會(huì)出現(xiàn)新的抖音、微信、office,甚至更多此前無(wú)法想象的東西。

但今天絕大多數(shù)的大模型,結(jié)局恐怕只能是躺在歷史空隙與開(kāi)源平臺(tái)上,成為大時(shí)代的小腳注。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。