文|三易生活
早前Meta的LLaMA大模型“意外”泄露后,大模型的開源與閉源之爭就此提上了日程。大模型到底是開源好、還是閉源好?過去一年整個AI業(yè)界可謂是爭吵不休。如今,又有一位重量級人士站出來表態(tài)了。
就在4月11日,百度創(chuàng)始人李彥宏的內(nèi)部講話被傳出。據(jù)悉他在此次講話中表示,去年文心一言發(fā)布時,百度方面就判斷市場上一定會有開源的模型,而且不止一家會開源,在這種情況下多百度一家開源不多、少百度一家開源也不少。并且他認為,大模型開源意義不大,閉源才能走通商業(yè)模式。
李彥宏之所以堅定押注閉源,在于他認為開源大模型的運行模式和傳統(tǒng)開源軟件不同,并不是眾人拾柴火焰高。作為從自由軟件思潮之中誕生的結晶,開源軟件也繼承了自由軟件所提倡的知識共享理念,同時又允許以專利的形式從知識產(chǎn)品中獲得收益。事實上,開源本身并不是一種商業(yè)模式,而是一種軟件的開發(fā)、發(fā)布和傳播模式。
而開源就使得大規(guī)模協(xié)作開發(fā)成為了可能,從GNU/Linux、Android、Chromium這一系列大名鼎鼎的項目,到XZ Utils這類深耕細分領域的產(chǎn)品,它們的成功都是源自于匯聚了開源社區(qū)的力量,大量的開發(fā)者都在為這些項目貢獻力量。
然而開源大模型的運行模式則完全不同,如今無論是來自歐洲的AI獨角獸Mistral的Mixtral-8x7B,還是美國科技巨頭Meta的Llama-2,它們都鼓勵開發(fā)者貢獻各種各樣的數(shù)據(jù)、代碼,但Mixtral-8x7B、Llama-2的主要開發(fā)者依舊還是Mistral、Meta。
開源大模型很難從社區(qū)獲益,歸根結底在于社區(qū)貢獻的價值并不一定是正向的。AI大模型會出現(xiàn)“幻覺”(Hallucination),現(xiàn)在幾乎已經(jīng)是業(yè)界的共識,AI科學家也仍未完全解開這個謎題,但數(shù)據(jù)的質(zhì)量與大模型幻覺呈現(xiàn)正相關則是肯定的。
開源大模型接受垃圾代碼、低質(zhì)數(shù)據(jù)導致性能下降,這樣的事情不是沒有發(fā)生過。甚至Anthropic的研究人員曾發(fā)表論文警告,現(xiàn)階段的安全訓練無法消除插入后門觸發(fā)機制的惡意行為,進而會導致開源大模型變得不安全。
開源大模型缺乏安全性,這也是OpenAI、Anthropic等閉源陣營旗手攻擊開源的重要論點。
除此之外,開源大模型在性能上也還無法媲美閉源大模型。如今無論是哪個機構給出的大模型評測榜單中,OpenAI的GPT-4、谷歌的Gemini、Anthropic的Claude,以及國產(chǎn)的文心一言、訊飛星火、KimiChat,對比它們的開源大模型競爭對手都更有優(yōu)勢。所以在同等參數(shù)的情況下,閉源大模型的能力更強,李彥宏此言并非無的放矢。
此前福布斯的一篇文章《10 AI Predictions For 2024》就曾給了預測,盡管開源模型在某些領域有優(yōu)勢,但最先進的商業(yè)閉源模型可能仍將在性能上保持領先。
大家不妨試想一下,如果GPT-4不能保持性能領先,用戶就會轉向免費的開源模型。當免費、不受限制的替代品在質(zhì)量上具有可比性時,用戶確實不會為受限制的模型付費??扇缃竦那闆r,卻是開源大模型的性能還不能挑戰(zhàn)閉源大模型。
當然,開源大模型最致命的缺陷其實是在商業(yè)層面。Meta的Llama-2開源之后,國內(nèi)的百模大戰(zhàn)立刻拉開了帷幕,市面上很快也多了一大堆套殼模型。從某種意義上來說,大模型的開源其實是給自己平白無故地增加了一大堆競爭對手,而且這一部分競爭者又會分食潛在的企業(yè)級用戶。
由于開源協(xié)議本身并沒有限制商業(yè)化,因此在許多開源軟件中存在著免費社區(qū)版和收費企業(yè)版共存的模式,也就是所謂的雙許可證。其中免費版本負責擴大軟件的影響力,再用付費版本獲利,這就是開源軟件經(jīng)典的商業(yè)模式。比如在2018年被IBM以334億美元收購的開源軟件和技術供應商Red Hat,就是這一模式的典型。
開源大模型沒有建立起商業(yè)模式,這是當下開源大模型鼓吹者始終無法回避的一個問題。拋開眾說紛紜的B端業(yè)務,OpenAI的GPT-4、百度的文心一言目前都有付費訂閱版本,C端用戶的付費是實打?qū)嵈嬖诘摹6掖髽I(yè)大的Meta打定主意要用開源來為自己挽回已經(jīng)跌入谷底的企業(yè)形象,Llama則可以被視為Meta方面精心設計的一個廣告。
但其他的開源大模型廠商不能總是只靠融資,事實上,即使是開源大模型的代表Mistral,如今對于開源也沒有那么堅定。Mistral創(chuàng)始人Arthur Mensch近期在接受媒體采訪時就曾確認,Mistral已經(jīng)推出了商業(yè)模型,并且他還坦言,商業(yè)模型可以幫助Mistral創(chuàng)造收入。歸根結底,大模型太貴,開發(fā)成本比傳統(tǒng)的軟件要高出了數(shù)個量級,因此也更加依賴融資。
當大模型與資本的牽扯如此之深的情況下,可后者顯然是要謀求回報的,所以這可能才是李彥宏堅定看好閉源的原因。