6677免费观看在线视频,久久WWW免费人成看片入口

界面新聞?dòng)浾?| 崔鵬
界面新聞編輯 | 宋佳楠

近日，李彥宏在百度內(nèi)部做了一次面向員工的講話，內(nèi)容涉及大模型的能力壁壘、開(kāi)源模型的問(wèn)題，以及百度為什么要強(qiáng)調(diào)智能體等方面。

在他看來(lái)，外界對(duì)大模型有很多誤解，榜單得分超過(guò)Open AI的產(chǎn)品，不代表自己的模型與Open AI模型的差距已經(jīng)很小。

不同的模型之間，在理解、生成和邏輯等基本能力方面都會(huì)有差距，在使用成本方面的差距也很大，只是很多做大模型的人，并不了解用戶真實(shí)需求，所以只能做性能測(cè)試，感覺(jué)自己跟競(jìng)品的大模型差距不大。

“今天看差距也許沒(méi)那么大，再過(guò)一年你看差距有沒(méi)有拉大？”李彥宏表示，不同模型之間的差距不是越來(lái)越小，一定是越來(lái)越大的。

他還堅(jiān)持認(rèn)為，開(kāi)源模式在大模型時(shí)代是不成立的，因?yàn)檫@種模式解決不了算力從哪里來(lái)的問(wèn)題，在成本方面無(wú)法與閉源大模型相比，“文心大模型每天調(diào)用量超過(guò)6億，每天生成的token數(shù)超過(guò)萬(wàn)億，哪個(gè)開(kāi)源模型可以說(shuō)自己一天調(diào)用量是多少、生成了多少token？”

對(duì)于企業(yè)用戶來(lái)說(shuō)，使用閉源模型會(huì)失去對(duì)源代碼的掌握，但李彥宏認(rèn)為這并不重要，“在商業(yè)領(lǐng)域，當(dāng)你追求的是效率、效果和最低的成本時(shí)，開(kāi)源模型是沒(méi)有優(yōu)勢(shì)的?！?/p>

談及智能體，李彥宏選擇堅(jiān)持自己之前的觀點(diǎn)，認(rèn)為創(chuàng)業(yè)者卷大模型沒(méi)有意義，去做門檻更低的智能體，加入文心一言的平臺(tái)，是更合適的道路。

以下是李彥宏內(nèi)部問(wèn)答的原文摘要：

問(wèn)：如何看待“大模型之間的能力已經(jīng)沒(méi)有壁壘了”這種觀點(diǎn)？

李彥宏：這個(gè)說(shuō)法我不同意。我認(rèn)為外界對(duì)大模型有相當(dāng)多的誤解，每一個(gè)新模型發(fā)布時(shí)，肯定都想說(shuō)自己有多好，每次都去跟GPT-4o做比較，拿測(cè)試集或者弄一些榜單，說(shuō)我的得分已經(jīng)跟它差不多了，甚至某些單項(xiàng)上得分已經(jīng)超過(guò)它了。但這并不能證明這些新發(fā)的模型跟OpenAl最先進(jìn)的模型相比已經(jīng)沒(méi)有那么大的差距了。?

模型之間的差距是多維度的，一個(gè)維度是能力方面，不管是理解能力、生成能力、邏輯推理能力還是記憶能力等這些基本能力上的差距；另一個(gè)維度是成本方面，你想具備這個(gè)能力或者想回答這些問(wèn)題，你付出的成本是多少？有些模型可能推理速度很慢，雖然也達(dá)到了同樣的效果，但實(shí)際上它的體驗(yàn)還是不如最先進(jìn)的模型。

還有就是對(duì)于測(cè)試集的over-fitting，每一個(gè)想證明自己能力的模型都會(huì)去打榜，打榜時(shí)他就要猜別人到底在測(cè)什么、哪些題我用什么樣的技巧就能做對(duì)。所以從榜單或者測(cè)試集上看，你覺(jué)得能力已經(jīng)很接近了，但到實(shí)際應(yīng)用中還是有明顯差距的。?

部分自媒體的炒作，再加上每個(gè)新模型發(fā)布時(shí)都有宣傳的動(dòng)力，使得大家有一種印象，認(rèn)為模型之間的能力差別已經(jīng)比較小了，其實(shí)真不是這樣。在實(shí)際使用過(guò)程當(dāng)中，我不允許我們的技術(shù)人員去打榜，真正衡量文心大模型能力的是，你在具體應(yīng)用場(chǎng)景當(dāng)中到底有沒(méi)有能夠滿足用戶的需求，有沒(méi)有能夠產(chǎn)生價(jià)值的增益，這是我們真正在乎的。

我們需要看到，一方面模型能力之間還有比較明顯的差距，另外一方面天花板很高，你今天做到的跟你實(shí)際想要做到的、跟理想狀態(tài)還差得非常遠(yuǎn)，所以模型還需要不斷快速地去迭代、去更新、去升級(jí)。

即使今天你看到差距也許沒(méi)有那么大了，再過(guò)一年你看看差距有沒(méi)有拉大？ 有誰(shuí)能夠持續(xù)不斷地幾年甚至十幾年如一日往這個(gè)方向上去投入，讓它越來(lái)越能夠滿足用戶的需求，滿足場(chǎng)景，滿足提升效率或者說(shuō)降低成本等需求？不同的模型之間差距不是越來(lái)越小，是會(huì)越來(lái)越大的，只是他們不知道真實(shí)需求的時(shí)候，只去做測(cè)試集的題可能會(huì)覺(jué)得差不多。

所謂的領(lǐng)先12個(gè)月或者落后18個(gè)月，我認(rèn)為沒(méi)有那么重要。每個(gè)公司都處在完全競(jìng)爭(zhēng)的市場(chǎng)環(huán)境中，你不管做什么方向都有很多競(jìng)爭(zhēng)對(duì)手，如果你能永遠(yuǎn)保證領(lǐng)先對(duì)手12到18個(gè)月，那是天下無(wú)敵的。不要覺(jué)得12到18個(gè)月很短，哪怕你能保證永遠(yuǎn)領(lǐng)先競(jìng)爭(zhēng)對(duì)手6個(gè)月，那就贏了，你的市場(chǎng)份額可能是70%，而對(duì)手可能僅為20%甚至10%的份額。

問(wèn)：有人說(shuō)開(kāi)源模型正在縮小與閉源模型的差距，這會(huì)摧毀閉源大模型公司的商業(yè)模式嗎？

李彥宏：這個(gè)問(wèn)題跟上一個(gè)問(wèn)題是高度關(guān)聯(lián)的，我剛才講一個(gè)模型除了能力或效果之外還要看效率，效率上開(kāi)源模型是不行的。

閉源模型準(zhǔn)確地講應(yīng)該叫商業(yè)模型，商業(yè)化的模型是無(wú)數(shù)個(gè)用戶或者說(shuō)客戶在共享同樣的資源，在分?jǐn)傃邪l(fā)成本、分?jǐn)偼评碛玫臋C(jī)器資源和GPU，而開(kāi)源模型需要你自己去部署一套東西，部署之后GPU的使用率是多少呢？我們的EB3.5也好，EB4也好，使用率都是90%多，你部署一個(gè)開(kāi)源模型有多少人在用？

我們對(duì)外講文心大模型每天調(diào)用量超過(guò)6億，每天生成的token數(shù)超過(guò)萬(wàn)億，哪個(gè)開(kāi)源模型可以說(shuō)自己一天調(diào)用量是多少？生成了多少token？沒(méi)有人用的話成本怎么分擔(dān)？推理成本怎么能夠跟商業(yè)化模型相比呢？?

在大模型時(shí)代之前，大家習(xí)慣了開(kāi)源意味著免費(fèi)、成本低。那時(shí)市面上那種商業(yè)化的產(chǎn)品，每一個(gè)版本都要為之付錢，比如買一個(gè)電腦裝Windows，可能微軟要從中收多少錢，而你如果跑一個(gè)Linux就不用花這個(gè)錢了。由于Linux是開(kāi)源的，所有程序員都可以看到代碼，哪兒做得不好我可以去更新，更新了再check in，大家眾人拾柴火焰高，你在巨人的肩膀上可以不斷地進(jìn)步。

但是這些東西在大模型時(shí)代都不成立，大模型時(shí)代大家經(jīng)常講的是GPU有多貴，算力是決定大模型成敗的一個(gè)關(guān)鍵因素，開(kāi)源的模型給你送算力嗎？它不給你送算力，怎么能夠讓算力高效地被利用？開(kāi)源模型解決不了這個(gè)問(wèn)題。

以前你買電腦的時(shí)候就已經(jīng)為算力付費(fèi)了，但大模型的推理不是這樣，這個(gè)推理其實(shí)很貴。所以說(shuō)開(kāi)源大模型的價(jià)值在教學(xué)科研這些領(lǐng)域。要想搞清楚大模型的工作原理是什么，如果不知道源代碼之類肯定是有劣勢(shì)的，但是真正在商業(yè)領(lǐng)域，當(dāng)你追求的是效率、效果、最低的成本時(shí)，開(kāi)源模型是沒(méi)有優(yōu)勢(shì)的。

問(wèn)：AI應(yīng)用的演進(jìn)方式是什么？為什么強(qiáng)調(diào)智能體？

李彥宏：大模型發(fā)展的過(guò)程必然要經(jīng)歷這幾個(gè)階段。一開(kāi)始是對(duì)人進(jìn)行輔助，最后出來(lái)什么東西需要人把最后一道關(guān)，我們確定它的效果是OK的，各方面都不錯(cuò)，才會(huì)讓它出去，這是Copilot階段；再往下走就是Agent智能體，外界對(duì)于Agent有各種各樣不同的定義，最主要還是說(shuō)它有了一定的自主性，具備自主使用工具、反思、自我進(jìn)化等能力。這種自動(dòng)化程度再往下走就變成一個(gè)所謂的Al Worker，能夠像人一樣做各種各樣的腦力和體力勞動(dòng)，各方面的工作都可以獨(dú)立完成?？隙ㄒ羞@么一個(gè)過(guò)程。

?“智能體是大模型最重要的發(fā)展方向”這個(gè)判斷，其實(shí)是一個(gè)非共識(shí)。百度Create大會(huì)上我們發(fā)了三個(gè)產(chǎn)品，AgentBuilder、AppBuilder、ModelBuilder，其中AgentBuilder和AppBuilder都是講智能體的，一個(gè)門檻更低一些，另一個(gè)功能更強(qiáng)大一些。當(dāng)我們解釋完了之后，有些人終于開(kāi)始明白這東西確實(shí)有意思，能夠產(chǎn)生價(jià)值，而且已經(jīng)可以相對(duì)比較低門檻地做出來(lái)大家感覺(jué)可用的東西。從那時(shí)候開(kāi)始，智能體的熱度才慢慢上來(lái)，也開(kāi)始有很多人看好智能體這個(gè)發(fā)展方向。但是到今天為止，智能體還不是共識(shí)，像百度這樣把智能體作為大模型最重要的戰(zhàn)略、最重要的發(fā)展方向的公司并不多。

為什么我們這么強(qiáng)調(diào)智能體？因?yàn)橹悄荏w的門檻確實(shí)很低。我們?nèi)ツ暾f(shuō)要卷應(yīng)用、大家都去做應(yīng)用，其實(shí)很多人還是說(shuō)不知道該怎么做，不知道這個(gè)方向能不能做出來(lái)，我到底要用到什么能力才能夠在這個(gè)場(chǎng)景下產(chǎn)生價(jià)值，這里面有無(wú)數(shù)不確定性，大家不知道怎么從模型變成應(yīng)用。但是智能體提供了一個(gè)非常直接、非常高效、非常簡(jiǎn)單的方式，在模型之上構(gòu)建智能體是相當(dāng)方便的，這也是為什么今天每周都有上萬(wàn)個(gè)新的智能體在文心平臺(tái)上被創(chuàng)造出來(lái)。

智能體方面我們已經(jīng)看到了趨勢(shì)，也有比較好的先決條件，除了模型本身的能力比較強(qiáng)大之外，我們也有很好地分發(fā)通路。

百度的APP，尤其是百度搜索一天有好幾億人在用，用戶的需求主動(dòng)向我們表達(dá)了，哪一個(gè)智能體能更好地去回答他這些問(wèn)題，去滿足他這些需求，這是一個(gè)自然匹配的過(guò)程，所以我們是最能夠幫助這些開(kāi)發(fā)者分發(fā)他們智能體的。

界面新聞?dòng)浾?| 崔鵬
界面新聞編輯 | 宋佳楠

在他看來(lái)，外界對(duì)大模型有很多誤解，榜單得分超過(guò)Open AI的產(chǎn)品，不代表自己的模型與Open AI模型的差距已經(jīng)很小。

以下是李彥宏內(nèi)部問(wèn)答的原文摘要：

問(wèn)：如何看待“大模型之間的能力已經(jīng)沒(méi)有壁壘了”這種觀點(diǎn)？

問(wèn)：有人說(shuō)開(kāi)源模型正在縮小與閉源模型的差距，這會(huì)摧毀閉源大模型公司的商業(yè)模式嗎？

問(wèn)：AI應(yīng)用的演進(jìn)方式是什么？為什么強(qiáng)調(diào)智能體？

智能體方面我們已經(jīng)看到了趨勢(shì)，也有比較好的先決條件，除了模型本身的能力比較強(qiáng)大之外，我們也有很好地分發(fā)通路。

歷史搜索全部刪除

熱門搜索

李彥宏最新內(nèi)部講話：不同模型之間的差距只會(huì)越來(lái)越大

以下是李彥宏內(nèi)部問(wèn)答的原文摘要：

百度

評(píng)論

李彥宏最新內(nèi)部講話：不同模型之間的差距只會(huì)越來(lái)越大

以下是李彥宏內(nèi)部問(wèn)答的原文摘要：