正在閱讀:

大模型創(chuàng)業(yè),李彥宏指了條路

掃一掃下載界面新聞APP

大模型創(chuàng)業(yè),李彥宏指了條路

大模型太多,應用太少。

文|定焦(dingjiaoone)  黎明

編輯|方展博

中國的大模型創(chuàng)業(yè)很火,但有些公司可能跑偏了。

“百模大戰(zhàn)”這半年,大大小小的科技公司,都推出了自己的大模型。仿佛不發(fā)布一個大模型,就不配坐上通往AI時代的列車。

這造成一種現(xiàn)象:高度雷同,同質(zhì)競爭。大家一蜂窩撲上來,重復造輪子。

11月15日在深圳舉行的西麗湖論壇上,百度董事長兼CEO李彥宏發(fā)表演講時表示,他看到很多企業(yè)對大模型的本質(zhì)理解不深,被各種說法忽悠,都想去自己搞個基礎模型,或者按照網(wǎng)上傳播的評測方法去挑選一款評分高的大模型,就以為這是擁抱AI了。

“殊不知大模型本身不僅不產(chǎn)生任何價值,還造成了對公司資源、社會資源的巨大浪費?!?/p>

金沙江創(chuàng)投主管合伙人朱嘯虎近期也說過,今年上半年有一波AI的虛火,大家天天在講大模型。投資人FOMO,投了很多大模型,現(xiàn)在都后悔了。他認為明年下半年大部分創(chuàng)業(yè)者會出局。

大模型創(chuàng)業(yè),方向比努力更重要。要想持久坐在牌桌上,就得看清浪潮的流向。

跟風搞大模型,AI創(chuàng)業(yè)的歧路

都知道大模型很重要,問題是,我們到底需要多少個大模型?

在15日的演講中,李彥宏引用公開數(shù)據(jù)說,截止10月份國內(nèi)已經(jīng)發(fā)布了238個大模型,而6月份的時候這個數(shù)字是79個,相當于4個月就翻了3倍。

平均下來,每天至少有一個大模型面世。

200多個大模型,看似很多,實際差異很小,大家本質(zhì)都差不多。其中,還有一些是“套殼”——在Llama開源模型的基礎上訓練而來。比如零一萬物的Yi系列大模型,最近就被質(zhì)疑完全使用LLama架構(gòu),卻對外宣稱“原創(chuàng)”。

相對之下,美國作為大模型的發(fā)源地,也只有上十個大模型。

大模型不是越多越好,我們不需要那么多大模型,最終這些大模型也不會全部活下來。

李彥宏認為,大模型可以被視為AI時代的操作系統(tǒng),是各類原生應用的基礎底座。他做了一個類比:縱觀互聯(lián)網(wǎng)發(fā)展史,不論是PC時代,還是移動互聯(lián)網(wǎng)時代,操作系統(tǒng)都只剩下少數(shù)幾個——PC是Windows系統(tǒng),移動時代是安卓和iOS。

那么同理,大家普遍認為,最終能活下來的通用大模型,也會是個位數(shù)級別。這意味著,國內(nèi)一股腦冒出來的200多個大模型,絕大部分都是炮灰。

一家AI設計公司的創(chuàng)始人對「定焦」說,大模型是一種基礎設施建設,需要集中力量辦大事,投入產(chǎn)出比才最高,生態(tài)里的各種人匯集在平臺上,就會形成平臺效應和規(guī)模效應。

不是所有公司都能成為基礎設施般的存在,這與野心無關(guān),而與能力有關(guān)。要做出一款好用、可用的大模型,技術(shù)門檻和成本門檻極高。

OpenAI潛心研發(fā)這么多年,背靠微軟的支持,投入數(shù)十億美金,才取得今天的成績。國內(nèi)的百度、華為、阿里等互聯(lián)網(wǎng)大廠,也是因為有過去多年的積累,今天才能快速跟上潮流。那些跟風入場、從零起步的創(chuàng)業(yè)公司,想要自研一款通用大模型,難度可想而知。

即便技術(shù)實力過關(guān),或者借用開源方案,訓練模型的成本也讓很多公司吃不消。訓練一遍,耗資幾百萬人民幣,不在少數(shù)。關(guān)鍵是,訓練出來的模型本質(zhì)上不是原創(chuàng),也沒什么人使用。

按照李彥宏的說法,“國內(nèi)有200多個大模型,很多上了這個榜單、那個排名,其實都沒有什么使用量?!彼J為,“重復造輪子其實是對社會資源的極大浪費。”

有一些公司劍走偏鋒,想從頭訓練自己的專用大模型,這樣成本可控。但李彥宏認為,這樣煉出來的大模型是沒有智能涌現(xiàn)能力的。因為只有參數(shù)規(guī)模足夠大,算法、數(shù)據(jù)訓練都做對的時候,并且能夠持續(xù)投入,不斷迭代,才能夠產(chǎn)生智能涌現(xiàn),大模型才具有觸類旁通的能力。

做不了通才,又成不了專才,就沒有核心競爭力。

“今天你推出一個大模型,花錢打了榜,有很多人用,可能明天就有個新的模型迅速替代掉?!绷硪患胰斯ぶ悄芄镜膭?chuàng)始人對「定焦」說。

所以,一些跟風搞大模型創(chuàng)業(yè)者,跑偏了。

創(chuàng)業(yè)者真正的機會

如果不做通用大模型,創(chuàng)業(yè)者應該做什么?

李彥宏的答案是:AI原生應用?!癆I原生時代,我們需要的不是100個所謂的大模型,而是100萬量級的AI原生應用。”他說。

互聯(lián)網(wǎng)歷史上的幾波創(chuàng)業(yè)潮,漲潮的標志性事件,都是原生應用的爆發(fā)。距離我們最近的移動互聯(lián)網(wǎng),是由iPhone手機掀起的,業(yè)內(nèi)公認的起點是2010年。

但事實上,初代iPhone在2007年就誕生了,一直到三年后,具有劃時代意義的iphone 4發(fā)布,手機行業(yè)才整體進入智能化時代。iphone 4除了亮眼的外觀設計,最大的貢獻是搭建了系統(tǒng)生態(tài),讓無數(shù)開發(fā)者創(chuàng)造了大量原生應用,由此開啟了創(chuàng)業(yè)者的黃金年代。

過去十多年,互聯(lián)網(wǎng)行業(yè)最成功的公司、最亮眼的產(chǎn)品、最明星的創(chuàng)業(yè)者,都集中在應用層。微信、抖音、美團、滴滴,都是從零開始成為超級應用。

李彥宏認為,人類進入AI時代的標志,是出現(xiàn)大量的AI原生應用,而不是出現(xiàn)大量的大模型?;诨A大模型開發(fā)出來的應用,才是模型存在的意義。

AI原生應用,就是基于大模型智能涌現(xiàn)后產(chǎn)生的理解、生成、邏輯和記憶四大核心能力開發(fā)出來的應用。這些能力是過去的時代所不具備的,能解決過去解決不了或解決不好的問題,因而才能打開無限的創(chuàng)新空間。

那么,AI原生應用進展如何?

答案是尚未爆發(fā)。

國內(nèi)的AI原生應用屈指可數(shù)。9月初,國內(nèi)才開放第一批大模型備案,允許公開注冊使用,此前都只能內(nèi)測。百度的文心一言APP第一批上線,迅速登頂手機應用商店排行榜。11月1日,百度正式上線文心一言專業(yè)版,開啟訂閱收費,每月59.9元。這是國內(nèi)首個采用會員模式面向C端收費的大模型產(chǎn)品。

國外的進展更快一些,AI原生應用的數(shù)量已經(jīng)有上千個。據(jù)應用商店監(jiān)測平臺Sensor Tower的數(shù)據(jù),美國市場貢獻了55%的AI應用總收入,歐洲市場占20%,包括中國在內(nèi)的其他市場,加起來只占比25%。

10個大模型里找不出1個應用,這就是中國大模型創(chuàng)業(yè)的現(xiàn)狀。

對于創(chuàng)業(yè)者而言,必須要考慮清楚,是去跟風砸錢做基礎大模型,還是做大模型在垂直行業(yè)的精調(diào),抑或是基于大模型打造新的應用。

在李彥宏看來,直到今天,不論中國還是美國,最好的AI原生應用還沒出現(xiàn)。這恰恰就是創(chuàng)業(yè)者千載難逢的機會。

是時候?qū)ふ冶顟昧?/h4>

中國的AI原生應用發(fā)展緩慢,不是中國創(chuàng)業(yè)者不努力,而是起步晚了。

大模型創(chuàng)業(yè)分為三大類:一是做基礎大模型,二是做行業(yè)大模型,三是基于前兩類大模型開發(fā)應用。

在中國,基礎大模型和應用層的創(chuàng)業(yè),幾乎是同步展開的。去年底ChatGPT火了之后,中國的創(chuàng)業(yè)者一方面研發(fā)基礎大模型,同時也嘗試AI原生應用的各種可能性。但基礎模型不成熟,意味著應用層發(fā)展所倚賴的條件不具備。

大半年的“軍備競賽”之后,一些頭部的大模型廠商脫穎而出?;ヂ?lián)網(wǎng)大廠中,典型的如百度,創(chuàng)業(yè)公司中,也有一些發(fā)展很快。這些基礎大模型是AI原生應用的底層驅(qū)動力,為爆款應用的出現(xiàn)提供了基礎。

按照李彥宏的話說:“只有用好最強大的基礎大模型,中國的開發(fā)者和創(chuàng)業(yè)者才可能做出更多超級應用?!?/p>

根據(jù)與大模型接入的深度,應用層創(chuàng)業(yè)可以分為兩類:自建模型開發(fā)應用,以及直接調(diào)用已有大模型開發(fā)應用。

百度正在孵化全新的AI原生應用。比如智能代碼助手Comate。據(jù)百度透露,百度現(xiàn)在每新增100行代碼,就有20行是AI生成的,而且這個比例還在快速增長中。這樣的AI原生應用,通過人機協(xié)同,大幅提升了研發(fā)效率。

與此同時,百度在內(nèi)的一些頭部大模型廠商,以及一些開源平臺,對開發(fā)者提供全套開發(fā)工具,降低了應用層的創(chuàng)業(yè)門檻。對于那些無力獨立訓練一個大模型的中小開發(fā)者,接入大廠的API,成為一個性價比較高的選擇。

前幾天OpenAI召開首屆開發(fā)者大會,推出Assistants API,讓開發(fā)者能夠調(diào)用GPT上幾乎所有的新功能,面向普通用戶推出的GPTs,則讓不懂代碼的人也能輕松編程。這“殺死”了一些模型層和中間層創(chuàng)業(yè)者的生意,卻為應用層的繁榮打下了基礎。

這是一個重要的風向轉(zhuǎn)變。國外已經(jīng)將重點轉(zhuǎn)向了應用層的AI agent(智能體),而國內(nèi)還在卷大模型。

李彥宏說,API是AI原生應用調(diào)用基礎大模型的主要方式。未來,每一家企業(yè)跟自己客戶打交道的方式,都將被改造為AI原生應用,這將大幅度提升企業(yè)的競爭力?!鞍俣鹊哪繕?,就是打造好大模型的基礎能力,支持好AI原生應用開發(fā)。”

百度擁有800萬AI開發(fā)者,不久前上線的大模型插件平臺,讓個人和企業(yè)都能把自己的數(shù)據(jù)和能力,快速變成插件。插件是一種特殊的AI原生應用,大大降低了開發(fā)者門檻,有利于構(gòu)建繁榮的AI原生應用生態(tài)。

在巨頭們已經(jīng)鋪好路、建好基礎設施的情況下,創(chuàng)業(yè)者與其重復造輪子與巨頭對抗,不如將重點放在應用開發(fā)上,尋找下一個爆款應用。

梳理清楚自己的核心優(yōu)勢和競爭壁壘,在生態(tài)里找到自己的位置,才能在大模型創(chuàng)業(yè)潮里借勢而起。

*題圖及文中配圖來源于Unsplash。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

大模型創(chuàng)業(yè),李彥宏指了條路

大模型太多,應用太少。

文|定焦(dingjiaoone)  黎明

編輯|方展博

中國的大模型創(chuàng)業(yè)很火,但有些公司可能跑偏了。

“百模大戰(zhàn)”這半年,大大小小的科技公司,都推出了自己的大模型。仿佛不發(fā)布一個大模型,就不配坐上通往AI時代的列車。

這造成一種現(xiàn)象:高度雷同,同質(zhì)競爭。大家一蜂窩撲上來,重復造輪子。

11月15日在深圳舉行的西麗湖論壇上,百度董事長兼CEO李彥宏發(fā)表演講時表示,他看到很多企業(yè)對大模型的本質(zhì)理解不深,被各種說法忽悠,都想去自己搞個基礎模型,或者按照網(wǎng)上傳播的評測方法去挑選一款評分高的大模型,就以為這是擁抱AI了。

“殊不知大模型本身不僅不產(chǎn)生任何價值,還造成了對公司資源、社會資源的巨大浪費。”

金沙江創(chuàng)投主管合伙人朱嘯虎近期也說過,今年上半年有一波AI的虛火,大家天天在講大模型。投資人FOMO,投了很多大模型,現(xiàn)在都后悔了。他認為明年下半年大部分創(chuàng)業(yè)者會出局。

大模型創(chuàng)業(yè),方向比努力更重要。要想持久坐在牌桌上,就得看清浪潮的流向。

跟風搞大模型,AI創(chuàng)業(yè)的歧路

都知道大模型很重要,問題是,我們到底需要多少個大模型?

在15日的演講中,李彥宏引用公開數(shù)據(jù)說,截止10月份國內(nèi)已經(jīng)發(fā)布了238個大模型,而6月份的時候這個數(shù)字是79個,相當于4個月就翻了3倍。

平均下來,每天至少有一個大模型面世。

200多個大模型,看似很多,實際差異很小,大家本質(zhì)都差不多。其中,還有一些是“套殼”——在Llama開源模型的基礎上訓練而來。比如零一萬物的Yi系列大模型,最近就被質(zhì)疑完全使用LLama架構(gòu),卻對外宣稱“原創(chuàng)”。

相對之下,美國作為大模型的發(fā)源地,也只有上十個大模型。

大模型不是越多越好,我們不需要那么多大模型,最終這些大模型也不會全部活下來。

李彥宏認為,大模型可以被視為AI時代的操作系統(tǒng),是各類原生應用的基礎底座。他做了一個類比:縱觀互聯(lián)網(wǎng)發(fā)展史,不論是PC時代,還是移動互聯(lián)網(wǎng)時代,操作系統(tǒng)都只剩下少數(shù)幾個——PC是Windows系統(tǒng),移動時代是安卓和iOS。

那么同理,大家普遍認為,最終能活下來的通用大模型,也會是個位數(shù)級別。這意味著,國內(nèi)一股腦冒出來的200多個大模型,絕大部分都是炮灰。

一家AI設計公司的創(chuàng)始人對「定焦」說,大模型是一種基礎設施建設,需要集中力量辦大事,投入產(chǎn)出比才最高,生態(tài)里的各種人匯集在平臺上,就會形成平臺效應和規(guī)模效應。

不是所有公司都能成為基礎設施般的存在,這與野心無關(guān),而與能力有關(guān)。要做出一款好用、可用的大模型,技術(shù)門檻和成本門檻極高。

OpenAI潛心研發(fā)這么多年,背靠微軟的支持,投入數(shù)十億美金,才取得今天的成績。國內(nèi)的百度、華為、阿里等互聯(lián)網(wǎng)大廠,也是因為有過去多年的積累,今天才能快速跟上潮流。那些跟風入場、從零起步的創(chuàng)業(yè)公司,想要自研一款通用大模型,難度可想而知。

即便技術(shù)實力過關(guān),或者借用開源方案,訓練模型的成本也讓很多公司吃不消。訓練一遍,耗資幾百萬人民幣,不在少數(shù)。關(guān)鍵是,訓練出來的模型本質(zhì)上不是原創(chuàng),也沒什么人使用。

按照李彥宏的說法,“國內(nèi)有200多個大模型,很多上了這個榜單、那個排名,其實都沒有什么使用量?!彼J為,“重復造輪子其實是對社會資源的極大浪費?!?/p>

有一些公司劍走偏鋒,想從頭訓練自己的專用大模型,這樣成本可控。但李彥宏認為,這樣煉出來的大模型是沒有智能涌現(xiàn)能力的。因為只有參數(shù)規(guī)模足夠大,算法、數(shù)據(jù)訓練都做對的時候,并且能夠持續(xù)投入,不斷迭代,才能夠產(chǎn)生智能涌現(xiàn),大模型才具有觸類旁通的能力。

做不了通才,又成不了專才,就沒有核心競爭力。

“今天你推出一個大模型,花錢打了榜,有很多人用,可能明天就有個新的模型迅速替代掉?!绷硪患胰斯ぶ悄芄镜膭?chuàng)始人對「定焦」說。

所以,一些跟風搞大模型創(chuàng)業(yè)者,跑偏了。

創(chuàng)業(yè)者真正的機會

如果不做通用大模型,創(chuàng)業(yè)者應該做什么?

李彥宏的答案是:AI原生應用?!癆I原生時代,我們需要的不是100個所謂的大模型,而是100萬量級的AI原生應用?!彼f。

互聯(lián)網(wǎng)歷史上的幾波創(chuàng)業(yè)潮,漲潮的標志性事件,都是原生應用的爆發(fā)。距離我們最近的移動互聯(lián)網(wǎng),是由iPhone手機掀起的,業(yè)內(nèi)公認的起點是2010年。

但事實上,初代iPhone在2007年就誕生了,一直到三年后,具有劃時代意義的iphone 4發(fā)布,手機行業(yè)才整體進入智能化時代。iphone 4除了亮眼的外觀設計,最大的貢獻是搭建了系統(tǒng)生態(tài),讓無數(shù)開發(fā)者創(chuàng)造了大量原生應用,由此開啟了創(chuàng)業(yè)者的黃金年代。

過去十多年,互聯(lián)網(wǎng)行業(yè)最成功的公司、最亮眼的產(chǎn)品、最明星的創(chuàng)業(yè)者,都集中在應用層。微信、抖音、美團、滴滴,都是從零開始成為超級應用。

李彥宏認為,人類進入AI時代的標志,是出現(xiàn)大量的AI原生應用,而不是出現(xiàn)大量的大模型。基于基礎大模型開發(fā)出來的應用,才是模型存在的意義。

AI原生應用,就是基于大模型智能涌現(xiàn)后產(chǎn)生的理解、生成、邏輯和記憶四大核心能力開發(fā)出來的應用。這些能力是過去的時代所不具備的,能解決過去解決不了或解決不好的問題,因而才能打開無限的創(chuàng)新空間。

那么,AI原生應用進展如何?

答案是尚未爆發(fā)。

國內(nèi)的AI原生應用屈指可數(shù)。9月初,國內(nèi)才開放第一批大模型備案,允許公開注冊使用,此前都只能內(nèi)測。百度的文心一言APP第一批上線,迅速登頂手機應用商店排行榜。11月1日,百度正式上線文心一言專業(yè)版,開啟訂閱收費,每月59.9元。這是國內(nèi)首個采用會員模式面向C端收費的大模型產(chǎn)品。

國外的進展更快一些,AI原生應用的數(shù)量已經(jīng)有上千個。據(jù)應用商店監(jiān)測平臺Sensor Tower的數(shù)據(jù),美國市場貢獻了55%的AI應用總收入,歐洲市場占20%,包括中國在內(nèi)的其他市場,加起來只占比25%。

10個大模型里找不出1個應用,這就是中國大模型創(chuàng)業(yè)的現(xiàn)狀。

對于創(chuàng)業(yè)者而言,必須要考慮清楚,是去跟風砸錢做基礎大模型,還是做大模型在垂直行業(yè)的精調(diào),抑或是基于大模型打造新的應用。

在李彥宏看來,直到今天,不論中國還是美國,最好的AI原生應用還沒出現(xiàn)。這恰恰就是創(chuàng)業(yè)者千載難逢的機會。

是時候?qū)ふ冶顟昧?/h4>

中國的AI原生應用發(fā)展緩慢,不是中國創(chuàng)業(yè)者不努力,而是起步晚了。

大模型創(chuàng)業(yè)分為三大類:一是做基礎大模型,二是做行業(yè)大模型,三是基于前兩類大模型開發(fā)應用。

在中國,基礎大模型和應用層的創(chuàng)業(yè),幾乎是同步展開的。去年底ChatGPT火了之后,中國的創(chuàng)業(yè)者一方面研發(fā)基礎大模型,同時也嘗試AI原生應用的各種可能性。但基礎模型不成熟,意味著應用層發(fā)展所倚賴的條件不具備。

大半年的“軍備競賽”之后,一些頭部的大模型廠商脫穎而出?;ヂ?lián)網(wǎng)大廠中,典型的如百度,創(chuàng)業(yè)公司中,也有一些發(fā)展很快。這些基礎大模型是AI原生應用的底層驅(qū)動力,為爆款應用的出現(xiàn)提供了基礎。

按照李彥宏的話說:“只有用好最強大的基礎大模型,中國的開發(fā)者和創(chuàng)業(yè)者才可能做出更多超級應用。”

根據(jù)與大模型接入的深度,應用層創(chuàng)業(yè)可以分為兩類:自建模型開發(fā)應用,以及直接調(diào)用已有大模型開發(fā)應用。

百度正在孵化全新的AI原生應用。比如智能代碼助手Comate。據(jù)百度透露,百度現(xiàn)在每新增100行代碼,就有20行是AI生成的,而且這個比例還在快速增長中。這樣的AI原生應用,通過人機協(xié)同,大幅提升了研發(fā)效率。

與此同時,百度在內(nèi)的一些頭部大模型廠商,以及一些開源平臺,對開發(fā)者提供全套開發(fā)工具,降低了應用層的創(chuàng)業(yè)門檻。對于那些無力獨立訓練一個大模型的中小開發(fā)者,接入大廠的API,成為一個性價比較高的選擇。

前幾天OpenAI召開首屆開發(fā)者大會,推出Assistants API,讓開發(fā)者能夠調(diào)用GPT上幾乎所有的新功能,面向普通用戶推出的GPTs,則讓不懂代碼的人也能輕松編程。這“殺死”了一些模型層和中間層創(chuàng)業(yè)者的生意,卻為應用層的繁榮打下了基礎。

這是一個重要的風向轉(zhuǎn)變。國外已經(jīng)將重點轉(zhuǎn)向了應用層的AI agent(智能體),而國內(nèi)還在卷大模型。

李彥宏說,API是AI原生應用調(diào)用基礎大模型的主要方式。未來,每一家企業(yè)跟自己客戶打交道的方式,都將被改造為AI原生應用,這將大幅度提升企業(yè)的競爭力?!鞍俣鹊哪繕?,就是打造好大模型的基礎能力,支持好AI原生應用開發(fā)?!?/p>

百度擁有800萬AI開發(fā)者,不久前上線的大模型插件平臺,讓個人和企業(yè)都能把自己的數(shù)據(jù)和能力,快速變成插件。插件是一種特殊的AI原生應用,大大降低了開發(fā)者門檻,有利于構(gòu)建繁榮的AI原生應用生態(tài)。

在巨頭們已經(jīng)鋪好路、建好基礎設施的情況下,創(chuàng)業(yè)者與其重復造輪子與巨頭對抗,不如將重點放在應用開發(fā)上,尋找下一個爆款應用。

梳理清楚自己的核心優(yōu)勢和競爭壁壘,在生態(tài)里找到自己的位置,才能在大模型創(chuàng)業(yè)潮里借勢而起。

*題圖及文中配圖來源于Unsplash。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。