界面新聞?dòng)浾?| 伍洋宇
界面新聞編輯 | 劉方遠(yuǎn)
李開(kāi)復(fù)最近很忙,不斷飛往全國(guó)各地,頻繁往返于深港之間。用他自己的話(huà)來(lái)講:忙著見(jiàn)許多“超大客戶(hù)”。
他在61歲這年創(chuàng)辦的AI大模型公司零一萬(wàn)物,前不久經(jīng)歷了重大的戰(zhàn)略調(diào)整,成為“AI六小虎”中第一家宣布放棄超大參數(shù)模型預(yù)訓(xùn)練的公司,在國(guó)內(nèi)市場(chǎng)聚焦輕量化模型落地,全力轉(zhuǎn)向ToB(企業(yè)端)應(yīng)用。
DeepSeek在春節(jié)期間的異軍突起也加速了零一萬(wàn)物的轉(zhuǎn)型。“當(dāng)你花大筆的錢(qián)(去訓(xùn)超大模型)得不到回報(bào),跟DeepSeek也不能對(duì)標(biāo),為什么要做這件事情?這是一個(gè)好的CEO必須要問(wèn)自己的問(wèn)題?!崩铋_(kāi)復(fù)說(shuō)。
DeepSeek的爆火為大模型ToB業(yè)務(wù)完成了一次透徹的市場(chǎng)教育。他看到的機(jī)會(huì)是,企業(yè)主意識(shí)到或許是時(shí)候搭上大模型的快車(chē),但對(duì)中途的路徑和最終的目的地依然認(rèn)知模糊。
這樣的背景之下,零一萬(wàn)物發(fā)布了一款名為“萬(wàn)智”的企業(yè)大模型一站式平臺(tái),當(dāng)前最大賣(mài)點(diǎn)是可提供企業(yè)級(jí)DeepSeek部署定制解決方案。它被寄予填補(bǔ)企業(yè)與DeepSeek之間技術(shù)溝壑的厚望。
不過(guò),這些看起來(lái)務(wù)實(shí)的做法,也在行業(yè)中引來(lái)了諸多質(zhì)疑。有人批評(píng)李開(kāi)復(fù)輕易就退出了AGI競(jìng)爭(zhēng)。
對(duì)于這些議論,李開(kāi)復(fù)以平靜心態(tài)來(lái)看待?!拔矣X(jué)得它代表了大家看懂我們做的戰(zhàn)略轉(zhuǎn)型,我沒(méi)有任何的意見(jiàn)?!彼鞔_表態(tài)不會(huì)過(guò)度反思曾經(jīng)的錯(cuò)誤決策,但如果說(shuō)大模型創(chuàng)業(yè)經(jīng)歷留下了什么教訓(xùn),那就是應(yīng)該更早看清楚開(kāi)源的必然性。
盡管暫時(shí)放棄了超大參數(shù)基礎(chǔ)模型競(jìng)爭(zhēng),但李開(kāi)復(fù)依然在密切觀(guān)察這一領(lǐng)域。他預(yù)言,中國(guó)AI基座大模型最后會(huì)大概率會(huì)剩三家:DeepSeek,阿里通義,字節(jié)跳動(dòng)。在中美大模型競(jìng)賽話(huà)題上,他認(rèn)為以O(shè)penAI o1和DeepSeek-R1為基準(zhǔn),中美差距或已收縮至3個(gè)月。
另外,他試圖重申對(duì)于A(yíng)GI的定義,不是“什么事情都能夠超過(guò)所有人類(lèi)”,而是“在人做的90%事情上,比90%的人做得要好”。以這個(gè)定義為標(biāo)準(zhǔn),我們距離AGI或許還有5年。
在人生最后一次創(chuàng)業(yè)項(xiàng)目上,雖然作出了務(wù)實(shí)抉擇,但李開(kāi)復(fù)堅(jiān)稱(chēng)這并不等同于完全放棄了AGI。在他看來(lái),打造一個(gè)商業(yè)底座,用利潤(rùn)拾起AGI的夢(mèng)想,這也是可能的。
“我們最終還是想成為一個(gè)偉大的AI 2.0公司,讓大模型賦能千行百業(yè)?!崩铋_(kāi)復(fù)說(shuō)。
以下為界面新聞對(duì)李開(kāi)復(fù)的專(zhuān)訪(fǎng)實(shí)錄,略作編輯:
“過(guò)度依賴(lài)閉源模型才會(huì)焦慮”
界面新聞:你最近好像一直在出差,就連“萬(wàn)智”發(fā)布會(huì)當(dāng)天都在趕飛機(jī),為什么?
李開(kāi)復(fù):我最近行程安排得很滿(mǎn),也見(jiàn)了很多客戶(hù)。比如說(shuō)我今天去深圳就是見(jiàn)了一個(gè)超大客戶(hù),我在香港也見(jiàn)了很多超大客戶(hù)。
相比重點(diǎn)參與招投標(biāo),不惜虧本拿單的To B打法,我們的差別就是會(huì)尋找那些頭部的大B客戶(hù),利用過(guò)去積累的大模型研發(fā)中臺(tái)能力來(lái)深度參與,以比較輕但是精準(zhǔn)的方式進(jìn)行企業(yè)定制,當(dāng)然對(duì)這些客戶(hù)的收費(fèi)也會(huì)更高。有的公司一年上百個(gè)客戶(hù),每個(gè)拿小幾百萬(wàn),我們的訴求是少于10個(gè)主要客戶(hù),每個(gè)都是千萬(wàn)級(jí)別收入。
我們的發(fā)展會(huì)主要看幾個(gè)指標(biāo):第一是這個(gè)公司是否希望把AI放進(jìn)核心業(yè)務(wù)里。第二是找那些數(shù)字化轉(zhuǎn)型已經(jīng)做得比較好的公司。第三是希望公司從CEO開(kāi)始積極擁抱AI,這樣雙方合作起來(lái)才會(huì)暢通,而且老板拍板的經(jīng)費(fèi)會(huì)更多。
還有一個(gè)特點(diǎn)是,我畢竟年紀(jì)、經(jīng)驗(yàn)、人脈都擺在這里,中國(guó)的大老板們,我能敲開(kāi)門(mén)的機(jī)會(huì)會(huì)比其他友商多得多。
界面新聞:所以你并不避諱要自己親自跑出來(lái)給公司做銷(xiāo)售?
李開(kāi)復(fù):我們要做To B的公司,公司最大的銷(xiāo)售一定是CEO。這一點(diǎn)可能很多公司老板不愿意做,但這是我愿意做的。
我們公司今天銷(xiāo)售團(tuán)隊(duì)還非常小,但不到10人的團(tuán)隊(duì)能拿到這么多訂單,就是因?yàn)槲覀儚臒羲蛻?hù)開(kāi)始打,然后我親自出馬。
我們的轉(zhuǎn)換率可能很低,比如我見(jiàn)10個(gè)CEO朋友有1個(gè)單子就已經(jīng)很好了。但是比起AI 1.0時(shí)代相互競(jìng)標(biāo)、做一單賠一單的模式,目前我們的商業(yè)模式更健康,更可持續(xù)。一次不成沒(méi)關(guān)系,合適的客戶(hù)在那里,我們只是需要時(shí)間來(lái)挖掘。
界面新聞:發(fā)布“萬(wàn)智”這個(gè)產(chǎn)品對(duì)零一萬(wàn)物意味著什么?算是找到了階段性的出路嗎?
李開(kāi)復(fù):今天跟過(guò)去有一個(gè)很大的差別是,企業(yè)客戶(hù)都覺(jué)醒了。因?yàn)镈eepSeek的出現(xiàn)教育了市場(chǎng),中國(guó)經(jīng)歷了自己的“DeepSeek Moment”。春節(jié)之前DeepSeek發(fā)布,接著就是春節(jié)期間的傳播,老板們回來(lái)以后都說(shuō)我們要對(duì)接DeepSeek,然后IT部門(mén)開(kāi)始部署起來(lái)。
這些老板們可能首先想到的是,如果我能把公司所有財(cái)務(wù)信息、競(jìng)爭(zhēng)對(duì)手信息輸入進(jìn)去,我能不能問(wèn)它今年的戰(zhàn)略方向?我的競(jìng)爭(zhēng)對(duì)手最大的軟肋在什么地方?以及公司在哪里有浪費(fèi)?法律合同是否有違規(guī)風(fēng)險(xiǎn)?
這可能是第一步,DeepSeek也許可以做到一部分,但是如果他們只把模型接入,是不能完全解決這些問(wèn)題的。很多企業(yè)CEO出于數(shù)據(jù)安全等原因,不希望直接接入API,所以需要本地部署。另外在應(yīng)用實(shí)踐方面,很多公司需要DeepResearch等功能,也需要用RAG技術(shù)鏈接企業(yè)數(shù)據(jù)庫(kù)。此外還有企業(yè)希望能夠在基座模型基礎(chǔ)上開(kāi)發(fā)應(yīng)用、打造企業(yè)專(zhuān)屬智能體。甚至還有很多企業(yè)需要基于DeepSeek模型進(jìn)行模型微調(diào)。
這些都是萬(wàn)智的機(jī)會(huì)。我們是提供了一個(gè)“大模型研發(fā)中臺(tái)”,讓客戶(hù)可以接入包括DeepSeek在內(nèi)的大模型,然后基于自身需求進(jìn)行微調(diào)和搭建應(yīng)用。當(dāng)然我們的Yi模型還在里面,也包括阿里千問(wèn)的模型,但是大部分用戶(hù)要的是DeepSeek。
界面新聞:外界現(xiàn)在有質(zhì)疑聲說(shuō),你們的產(chǎn)品會(huì)過(guò)于依賴(lài)其他開(kāi)源模型。你們內(nèi)部會(huì)有焦慮嗎?
李開(kāi)復(fù):DeepSeek事件對(duì)全世界最大的一個(gè)撼動(dòng)就是,開(kāi)源模型贏(yíng)了。因?yàn)槟呐率菑?qiáng)如Open AI的公司,花了70億美元一年的經(jīng)費(fèi),也只能比DeepSeek略好一點(diǎn)點(diǎn),而且DeepSeek還是免費(fèi)的。我覺(jué)得“花70億美元比別人好一點(diǎn)點(diǎn)”是一個(gè)不可持續(xù)的商業(yè)模式。
未來(lái)越來(lái)越多的基座模型會(huì)開(kāi)源。我們也看到有一些大廠(chǎng)開(kāi)始有更多開(kāi)源的動(dòng)作,美國(guó)可能也是這樣。下一個(gè)階段的競(jìng)爭(zhēng),就是誰(shuí)能做最好的開(kāi)源模型。
所以,我覺(jué)得全世界每一家大模型公司,現(xiàn)在只會(huì)焦慮自己是否過(guò)度依賴(lài)閉源模型。特別是資金實(shí)力不夠雄厚的公司,只依賴(lài)自己的能力,能不能打敗全世界的開(kāi)源社區(qū)?這個(gè)才是焦慮。相反,現(xiàn)在主動(dòng)擁抱DeepSeek等開(kāi)源模型,盡早做出差異化的打法,可以每天睡得很好,很安穩(wěn)。
“投資人對(duì)轉(zhuǎn)型非常認(rèn)可”
界面新聞:零一萬(wàn)物算是六小虎里比較早退出超大基座大模型競(jìng)爭(zhēng)的公司,但現(xiàn)在確實(shí)還有很多公司還執(zhí)著于預(yù)訓(xùn)練這件事情,你想對(duì)他們說(shuō)什么?
李開(kāi)復(fù):每家公司有自己運(yùn)營(yíng)的一些考量跟規(guī)則,在不了解每家公司基本面狀況下我不會(huì)認(rèn)為我有資格去給他們做建議。我覺(jué)得在大模型領(lǐng)域能夠膽敢去做的都是勇敢的創(chuàng)業(yè)者,所以我會(huì)祝他們好運(yùn)。
但就我們自己來(lái)說(shuō),過(guò)去這半年,因?yàn)椴蛔?/span>超大模型訓(xùn)練,我們的GPU成本大大下降,讓我們有預(yù)算在商業(yè)部門(mén)里衡量決策,在什么地方增加人數(shù)、有多快能得到相應(yīng)回報(bào)。就算要花錢(qián),也可以在一段時(shí)間后看到這個(gè)錢(qián)產(chǎn)生回報(bào),而不是預(yù)訓(xùn)練一個(gè)可能是血本無(wú)歸的巨大模型。
就算你只花3000萬(wàn)美元訓(xùn)練了一個(gè)世界前十的模型,它的生命周期可能就是3-6個(gè)月。那就代表你每個(gè)月要有500萬(wàn)到1000萬(wàn)美元凈利潤(rùn)才能夠打平,這個(gè)賬明顯是算不過(guò)來(lái)的。
所以短期來(lái)說(shuō),當(dāng)你花大筆的錢(qián)得不到回報(bào),跟DeepSeek也不能有效對(duì)標(biāo),為什么要做這件事情?這是一個(gè)負(fù)責(zé)任的CEO必須要問(wèn)自己的問(wèn)題。
界面新聞:現(xiàn)在讓你重新定位零一萬(wàn)物,你會(huì)把它叫作一家什么公司?
李開(kāi)復(fù):最懂大模型的應(yīng)用公司。
界面新聞:你們?cè)谵D(zhuǎn)型之后再去融資有更被認(rèn)可嗎?
李開(kāi)復(fù):投資人對(duì)我們的轉(zhuǎn)型是非常認(rèn)可的。另外我之前在Bloomberg的采訪(fǎng)上也說(shuō)了,今天的VC對(duì)投資一個(gè)燒超大模型的創(chuàng)業(yè)型公司是零興趣。
當(dāng)然如果把DeepSeek算在里面,它是例外。它現(xiàn)在要一個(gè)非常高的估值也是可以要得到的。
界面新聞:我能不能理解為零一萬(wàn)物目前所做的一切努力或者轉(zhuǎn)型,最終還是為了給投資人交代,或者說(shuō)要服務(wù)于上市?
李開(kāi)復(fù):當(dāng)然不是,我們最終還是想成為一個(gè)偉大的軟件公司。
比如說(shuō)當(dāng)年誰(shuí)是做出最早的微型機(jī)操作系統(tǒng)的,是一個(gè)今天可能都沒(méi)有聽(tīng)過(guò)的公司叫做Digital Research。微軟是參考了別人的操作系統(tǒng),優(yōu)化創(chuàng)新后搭建成了一個(gè)真正的用戶(hù)可用的操作系統(tǒng)。以及當(dāng)年誰(shuí)是做database(數(shù)據(jù)庫(kù))最牛的公司,肯定是IBM,但是誰(shuí)做了一套可用的database,那就是Oracle、SAP還有SalesForce。
今天沒(méi)有誰(shuí)會(huì)去詬病Oracle、SAP、SalesForce沒(méi)有做出最偉大的database research(數(shù)據(jù)庫(kù)研究),也沒(méi)有人會(huì)詬病微軟當(dāng)年沒(méi)有最強(qiáng)的操作系統(tǒng)技術(shù),也沒(méi)有人會(huì)說(shuō)當(dāng)年的它們做事情就是為了上市。它們之所以能成功,就是因?yàn)樗鼈兊脑妇笆亲鲆粋€(gè)偉大的軟件公司。
我也不是說(shuō)就永遠(yuǎn)放棄了AGI的夢(mèng)想,但是有了一個(gè)商業(yè)底座,成為一個(gè)很成功的軟件公司,利用利潤(rùn)再拾起AGI的夢(mèng)想,這也是可能的。
界面新聞:你有預(yù)見(jiàn)到零一萬(wàn)物會(huì)發(fā)展成現(xiàn)在這個(gè)樣子嗎?復(fù)盤(pán)過(guò)去會(huì)不會(huì)反思有哪些決策可以做得更好?
李開(kāi)復(fù):我覺(jué)得當(dāng)時(shí)應(yīng)該更擁抱開(kāi)源的?,F(xiàn)在我們是從應(yīng)用層擁抱開(kāi)源,當(dāng)時(shí)可能從模型層擁抱開(kāi)源,會(huì)是一個(gè)更好的抉擇。
當(dāng)時(shí)我們看到有三種公司,一種是堅(jiān)決閉源的,第二種是開(kāi)源次好的模型,閉源最好的模型,第三種是徹底開(kāi)源的。我們屬于第二種,當(dāng)時(shí)如果做得更完整的話(huà)會(huì)更好。
界面新聞:更擁抱開(kāi)源的核心意義是什么?
李開(kāi)復(fù):開(kāi)源能夠創(chuàng)造生態(tài),然后得到認(rèn)可。但是我也不會(huì)去過(guò)度揣測(cè),如果當(dāng)時(shí)做了,我們是不是有機(jī)會(huì)成為DeepSeek。但是如果說(shuō)我學(xué)到了什么教訓(xùn)的話(huà),那就是應(yīng)該更看清楚開(kāi)源的必然性。
中國(guó)基礎(chǔ)大模型看DeepSeek,阿里,字節(jié)三家
界面新聞:你在年初看到DeepSeek全球爆火的直觀(guān)感受是什么?會(huì)復(fù)盤(pán)為什么零一無(wú)法做到嗎?因?yàn)槟銓?duì)技術(shù)的判斷都沒(méi)有錯(cuò),從day 1開(kāi)始就重視AI infra,很早認(rèn)為低價(jià)的推理極其重要。
李開(kāi)復(fù):DeepSeek做了若干件很正確的事情,這是所有六小虎值得學(xué)習(xí)的地方。
一個(gè)是它很重視Infra,我們做得也不錯(cuò),但還是差它一個(gè)身位,這個(gè)必須承認(rèn)。第二是它在模型訓(xùn)練上做得很好,這個(gè)大家本質(zhì)上倒沒(méi)有差很多。第三它Reasoning(推理)做得很好。從理論基礎(chǔ)上來(lái)說(shuō),DeepSeek-R1 Zero應(yīng)該是最驚艷的一個(gè)科研貢獻(xiàn),它可能在歷史上都會(huì)留名的。最后一點(diǎn)是他們執(zhí)著選擇開(kāi)源。
前兩個(gè)事情大家還可以辯論一下,你不錯(cuò),我也不錯(cuò),但R1-Zero是一騎絕塵的事情,我們是心服口服的。
界面新聞:你對(duì)梁文鋒這個(gè)人了解嗎?你會(huì)怎么評(píng)價(jià)他?
李開(kāi)復(fù):我跟他認(rèn)識(shí),但不算很熟,我只能看他的行為來(lái)點(diǎn)評(píng)。我覺(jué)得他是一個(gè)非常值得尊重的、很純粹熱愛(ài)技術(shù)的人。他完全有商業(yè)化的能力,但沒(méi)有為商業(yè)化和資本彎腰,這表示他是一個(gè)有理想的人。他選擇專(zhuān)注技術(shù),有自信自己能把模型做得非常的強(qiáng),愿意完全投入。我覺(jué)得這是讓我很佩服的事情。
界面新聞:在你人生中最后一次創(chuàng)業(yè)里,遇到了梁文鋒這樣的對(duì)手,有什么感受?
李開(kāi)復(fù):我是很驚喜,同時(shí)作為中國(guó)人也很自豪。
我之前有說(shuō)過(guò),如ChatGPT不對(duì)中國(guó)開(kāi)放,而中國(guó)人沒(méi)有自己的ChatGPT,會(huì)是新質(zhì)生產(chǎn)力發(fā)展的一個(gè)阻礙。最后無(wú)論是誰(shuí)做出來(lái),只要做出來(lái),大家最擔(dān)心的障礙就解決了。
現(xiàn)在回頭看,也只有梁文鋒這樣一個(gè)人,既有理想,又有做量化所積累的AI Infrastructure團(tuán)隊(duì)和技術(shù)背景,再加上他敢用年輕人的抉擇,每一點(diǎn)都讓我很佩服。
界面新聞:你認(rèn)為中國(guó)AI大模型會(huì)收攏到三家,DeepSeek,阿里通義,字節(jié)跳動(dòng),是基于哪些維度判斷的?
李開(kāi)復(fù):萬(wàn)億參數(shù)以上的超大模型還是需要有人來(lái)做的,只是這樣的公司,它要有非常強(qiáng)的資金能力和工程能力,能不要過(guò)度的燒錢(qián),然后融到足夠的錢(qián),我認(rèn)為DeepSeek是可以做到的。
另一個(gè)可能的路徑是,要有非常大的商業(yè)體積和用戶(hù)量,才能合理去燒超大模型,這是阿里和字節(jié)。它們有非常大的用戶(hù)量,燒超大模型可能花了很多錢(qián),但是分?jǐn)偟矫總€(gè)用戶(hù)身上就還好。所以淘寶和抖音的用戶(hù),如果都能從超大模型得到價(jià)值,并為公司產(chǎn)生價(jià)值,加起來(lái)就值得。
阿里還有一點(diǎn)值得注意的是它們的模型現(xiàn)在做得真的很好,不遜色于DeepSeek。字節(jié)跳動(dòng)今天在學(xué)術(shù)界、模型界以及開(kāi)源界,并沒(méi)有像DeepSeek跟阿里那么知名。但是我們可以看到他們有資金也有決心,也能吸引到好的人才,有足夠多的用戶(hù)和場(chǎng)景讓這個(gè)投入在商業(yè)上得到回報(bào)。字節(jié)應(yīng)該很快就可以做出很好的模型。
界面新聞:能問(wèn)一下騰訊為什么被摘出去了嗎?
李開(kāi)復(fù):騰訊是一家應(yīng)用驅(qū)動(dòng)的科技公司,產(chǎn)品方面護(hù)城河很深,有世界級(jí)的競(jìng)爭(zhēng)力,但在基座模型投入上跟前面三家比投入還不是一個(gè)量級(jí)。我覺(jué)得騰訊完全可以是第四個(gè)。但是今天從模型的角度,開(kāi)源模型也好,模型表現(xiàn)也好,國(guó)內(nèi)的第一梯隊(duì)并沒(méi)有見(jiàn)到騰訊的身影。它目前選擇是微信、元寶等應(yīng)用全面擁抱DeepSeek,與自研模型共存,這也是一個(gè)非常明智的做法。
中美大模型差距縮短至三個(gè)月:“他們急了,睡不著覺(jué)了”
界面新聞:在你了解中,美國(guó)有哪些公司真正意義上把DeepSeek直接視為了競(jìng)爭(zhēng)對(duì)手?這種正視體現(xiàn)在什么地方?
李開(kāi)復(fù):應(yīng)該每一家都會(huì)吧(笑)。最明顯的肯定是Meta,因?yàn)樗陂_(kāi)源的領(lǐng)先地位一下就被震撼了。而且我剛剛講的那幾個(gè)優(yōu)勢(shì),Meta除了開(kāi)源之外,沒(méi)一個(gè)能夠跟DeepSeek競(jìng)爭(zhēng)的,所以這是一個(gè)Meta內(nèi)部需要嚴(yán)重反思的問(wèn)題。
OpenAI和Anthropic,你看他們的言行,就可以知道他們的態(tài)度。他們開(kāi)始跟美國(guó)政府抱怨,想要用政治手段來(lái)對(duì)待DeepSeek或者是對(duì)待中國(guó),讓中國(guó)更買(mǎi)不到芯片,讓DeepSeek被美國(guó)制裁等等,而且很多話(huà)都沒(méi)有事實(shí)根據(jù)。
所以讓我們看到的就是,他們急了,他們睡不著覺(jué)了。
因?yàn)樗麄冎暗膬r(jià)值主張已經(jīng)坍塌了,就是你每年多給我?guī)妆兜馁Y金和資源,我就會(huì)第一個(gè)燒出AGI,當(dāng)我有了AGI,別人就做不出來(lái)了。這個(gè)價(jià)值主張多方面地坍塌了,第一,好像不是只有你做得出來(lái);第二,人家好像不用這么多錢(qián)就做出來(lái)了;第三,人家還是開(kāi)源免費(fèi)的。
當(dāng)然這些公司的人還是很牛的,技術(shù)也是領(lǐng)先的,但是作為每年燒這么多錢(qián)的公司,整個(gè)公司能夠運(yùn)轉(zhuǎn)就是因?yàn)槟苤v這個(gè)故事,讓它能繼續(xù)循環(huán)推動(dòng),但現(xiàn)在良性循環(huán)變成惡性循環(huán)。
界面新聞:美國(guó)對(duì)中國(guó)的算力限制真的能卡住中國(guó)大模型的技術(shù)發(fā)展嗎?
李開(kāi)復(fù):未來(lái)這一兩年中國(guó)已有的英偉達(dá)芯片還是足夠的,再加上中國(guó)Infra的優(yōu)勢(shì),DeepSeek訓(xùn)練一個(gè)同樣效果的模型,可能只需要Open AI十分之一的成本,這也是一種Scaling Law。
而且不是說(shuō)堆更多GPU,而是說(shuō)更有效去做預(yù)訓(xùn)練,所以我覺(jué)得未來(lái)更有效的預(yù)訓(xùn)練加上已有的GPU,應(yīng)該還是可以再做一定提升,不會(huì)說(shuō)掉隊(duì)。
再往下走的話(huà),那就要靠國(guó)產(chǎn)芯片了。再給個(gè)一兩年時(shí)間,國(guó)產(chǎn)芯片應(yīng)該也能夠去使用,所以我覺(jué)得不會(huì)因?yàn)樾酒瑔?wèn)題有一個(gè)不可克服的挑戰(zhàn)。
當(dāng)然挑戰(zhàn)還是有的,因?yàn)槟阌脟?guó)產(chǎn)芯片就沒(méi)有CUDA,那就得自己更辛苦,用更多的時(shí)間來(lái)去換取結(jié)果。但這個(gè)事也是可以做的,因?yàn)镈eepSeek前面一次發(fā)表也可以看到它很多底層工作都是自己做的,所以中國(guó)工程師的勤奮刻苦可以克服這些問(wèn)題。
把這幾件事情對(duì)接起來(lái),我是比較樂(lè)觀(guān)的。
界面新聞:我們現(xiàn)在的確可以說(shuō)中美之間AI大模型差距變小了對(duì)嗎?它可能縮短到了幾個(gè)月了?
李開(kāi)復(fù):最好的衡量方式就是美國(guó)做出一個(gè)嶄新的技術(shù),比如說(shuō)o1,然后中國(guó)在多久之后做出了一個(gè)跟它同樣好的技術(shù),而且還有技術(shù)亮點(diǎn)。
之前我們落后了6個(gè)月也好,9個(gè)月也好,但現(xiàn)在你從o1的發(fā)布日到R1的發(fā)布日,可以算一下應(yīng)該差不多三個(gè)月,而且這次不是一個(gè)復(fù)現(xiàn)或蒸餾,而是有自己的新技術(shù)亮點(diǎn),有值得尊重的論文的發(fā)表。
從這幾點(diǎn)來(lái)說(shuō)的話(huà),至少三個(gè)月是一個(gè)合理的距離,而且在有些方面做得比Open AI還要好。
比如說(shuō)在成本和Infra方面,你其實(shí)可以倒過(guò)來(lái)說(shuō),Open AI什么時(shí)候才能夠在Infra方面趕上DeepSeek?我很確定三個(gè)月是做不到的。
界面新聞:在GPT-4.5之后,我們對(duì)預(yù)訓(xùn)練階段的Scaling Law還能期待些什么?
李開(kāi)復(fù):預(yù)訓(xùn)練出來(lái)的超大模型本身,即便它還有進(jìn)步,速度也會(huì)放緩,而且它使用起來(lái)會(huì)很貴很慢。GPT-4.5比DeepSeek-V3要貴差不多500倍,絕大多數(shù)應(yīng)用是用不起它的。
當(dāng)然我覺(jué)得超大模型在一些巨大的科學(xué)或者金融決策上還是可以利用的,但這不是它主要的使用方法,因?yàn)樘F了。
但新的曙光已經(jīng)出現(xiàn)了。一方面,Scaling Law 正從預(yù)訓(xùn)練階段轉(zhuǎn)向推理階段,也就是慢思考模式。目前看來(lái),慢思考模式下,模型性能的成長(zhǎng)速度非??欤疫€有很大的增長(zhǎng)空間。
另一方面,我認(rèn)為超大模型的一個(gè)重要價(jià)值在于作為“教師模型”,可以去教小的模型,說(shuō)直白點(diǎn)用它做蒸餾、標(biāo)注,還有合成數(shù)據(jù)的產(chǎn)生。以后較小的模型可能訓(xùn)練的語(yǔ)料也是超大模型合成的,這樣可以更有效去壓縮它一定的訓(xùn)練量。
AI借助慢思考獲得了反思的能力,能夠自我迭代、自我進(jìn)步,未來(lái)可能不再單單依靠人來(lái)發(fā)明新算法、發(fā)明模型架構(gòu),而是“AI教AI”,AI會(huì)進(jìn)入到自我演進(jìn)范式。
大家會(huì)驚喜地發(fā)現(xiàn),整體來(lái)看,模型性能的提升其實(shí)在加速,而不是在放緩。從GPT-2到 GPT-3、從GPT-3到GPT-4.5,每一次升級(jí)都花了大約兩年的時(shí)間。而無(wú)論是從OpenAI o1到o3,還是從DeepSeek-R1到可能很快會(huì)發(fā)布的R2,模型迭代的速度縮短到了三個(gè)月左右。
界面新聞:那在現(xiàn)有情況下,你認(rèn)為我們還要多久能實(shí)現(xiàn)AGI?
李開(kāi)復(fù):我覺(jué)得AGI的原始定義是模糊的,甚至可能是不可及的?!笆裁词虑槎寄軌虺^(guò)所有人類(lèi)”,首先難度就很高,衡量標(biāo)準(zhǔn)也不清晰,而且會(huì)給人一種恐怖感,就是那我們?nèi)祟?lèi)以后干什么?
AGI更合理的定義可能是,在人做的90%事情上,比90%的人做得要好。按照這個(gè)定義,我覺(jué)得5年之內(nèi)肯定會(huì)實(shí)現(xiàn)的。
界面新聞:你會(huì)怎么看待Manus的走紅?進(jìn)入AI應(yīng)用時(shí)代,做得更早還有先發(fā)優(yōu)勢(shì)嗎?
李開(kāi)復(fù):我不談某一個(gè)應(yīng)用。但我可以說(shuō),我之前也說(shuō)過(guò)2025年是應(yīng)用爆發(fā)年,就是因?yàn)榈讓幽P湍芰焖偬嵘?,而且推理成本快速下降,各行各業(yè)每個(gè)應(yīng)用都會(huì)被重做一次,還有很多過(guò)去不可能的應(yīng)用,讓人眼睛一亮的應(yīng)用,都會(huì)在2025年開(kāi)始產(chǎn)生。
界面新聞:你們有在憋這種類(lèi)似于可以刷屏產(chǎn)品的大招嗎?
李開(kāi)復(fù):我肯定是有興趣,因?yàn)楫?dāng)我看到這種商機(jī)卻什么都不做,那肯定是不行的。但你要說(shuō)憋了什么大招,到底多大,我現(xiàn)在無(wú)可奉告。
界面新聞:最后一個(gè)問(wèn)題,面對(duì)這么卷的行業(yè),你個(gè)人堅(jiān)持下去的動(dòng)力是什么?
李開(kāi)復(fù):我覺(jué)得我這一生就在等AI時(shí)代的來(lái)臨,它來(lái)臨了,就是給我最大的動(dòng)力。實(shí)際上做什么,我覺(jué)得每一個(gè)人就是量力而為,去自己能夠產(chǎn)生最大價(jià)值的地方,我覺(jué)得是一個(gè)務(wù)實(shí)的做法。