文|旗幟財經(jīng) 李長懷
國內(nèi)外頭部廠商紛紛加入這場“開源熱”,意味著“加速快跑”已成為行業(yè)共識。大家都希望跑在前面,成為李彥宏口中那剩下的1%。而留給后來者的機會窗口也正緩緩關(guān)閉。
因為在競爭空前激烈的大模型賽道上,所有參賽者都明白,這不是一場排位賽,而是一場淘汰賽。
兩千多年前,春秋諸侯連年征戰(zhàn),天下格局也隨之動蕩不定。
但正如常言所道,“天下大勢,分久必合”,經(jīng)過近300年的兼并戰(zhàn)爭,數(shù)百個諸侯紛紛覆滅,最終只剩下少數(shù)幾個主要國家,歷史進入七國爭雄的戰(zhàn)國時期。
歷史不會簡單重演,但總會飛來幾只似曾相識的燕子。這一次的“燕子”,名叫大模型。
從被稱為AIGC的“iPhone時刻”的ChatGPT誕生以來,正如智能手機的iPhone時刻不只屬于蘋果公司,而是帶來了一大批智能手機品牌的崛起一樣,大模型也迎來了“百模大戰(zhàn)”。
據(jù)GitHub的統(tǒng)計數(shù)據(jù),到2023年底,僅國內(nèi)已經(jīng)發(fā)布的大語言模型數(shù)量,即已接近300個。加上海外企業(yè),全球大模型數(shù)量已超過400個。
巧合的是,當(dāng)初東周王室分封的諸侯數(shù)量,也是400多個。
盡管大模型空前廣闊復(fù)雜的應(yīng)用場景,以及不同廠商在細分領(lǐng)域優(yōu)劣勢的客觀存在,決定了大模型不會像PC一樣出現(xiàn)Windows一統(tǒng)天下的格局,也不會像智能手機一樣僅由iOS、Android兩個主要玩家壟斷市場;但大模型本身超強的適應(yīng)能力,也決定了百度李彥宏所說的“99%陪跑”,更有可能成為行業(yè)的未來景象。
新的歷史正在上演,而在敘事上,大模型研發(fā)者們,似乎已經(jīng)選擇了當(dāng)初谷歌打下Android江山的劇本。
去年12月,阿里云正式發(fā)布并開源“業(yè)界最強開源大模型”通義千問720億參數(shù)模型Qwen-72B。
1月17日,商湯科技與上海AI實驗室聯(lián)合香港中文大學(xué)和復(fù)旦大學(xué)發(fā)布的新一代大語言模型書生·浦語2.0宣布開源。
1月29日,Meta發(fā)布的“Code Llama家族中體量最大、性能最好的模型版本” Code Llama70B,也選擇了開源。
1月30日,科大訊飛發(fā)布首個基于全國產(chǎn)化算力平臺”飛星一號”的開源大模型——星火開源-13B。
公開信息顯示,Meta的LLama、OPT,谷歌的T5、MT5、FLAN-T5以及UU2,Big Science的BLOOM、T0、BLOOMZ等國內(nèi)外主流大模型,均走上了開源道路。
艾倫人工智能研究所等5機構(gòu)最近公布的開源模型OLMo,更是將模型權(quán)重、完整訓(xùn)練代碼、數(shù)據(jù)集和訓(xùn)練過程全部予以公開,玩起了大模型的“真·完全開源”模式。
國內(nèi)外頭部廠商紛紛加入這場“開源熱”,意味著“加速快跑”已成為行業(yè)共識。大家都希望跑在前面,成為李彥宏口中那剩下的1%。
而留給后來者的機會窗口也正緩緩關(guān)閉。因為在競爭空前激烈的大模型賽道上,所有參賽者都明白,這不是一場排位賽,而是一場淘汰賽。
大模型的“戰(zhàn)國時代”,似乎已經(jīng)遙遙在望。
01、推開“戰(zhàn)國”的大門
Android的發(fā)展歷程,堪稱互聯(lián)網(wǎng)行業(yè)底層操作系統(tǒng)開源的教科書。
作為一個開源系統(tǒng),Android較之此前占據(jù)優(yōu)勢的塞班、黑莓、WP,以至同樣出身名門的plam OS(惠普)、BADA OS(三星)、MeeGo(英特爾+諾基亞),本身并沒有多大突破。但是由于開發(fā)者可以自由訪問系統(tǒng)底層,通過其源代碼進行二次開發(fā),App的開發(fā)門檻、周期都得以大幅縮短,并且可以根據(jù)自己的需求和風(fēng)格定制界面和功能,市場自然更容易接受。
手機廠商也樂得將更多的精力,投入到系統(tǒng)的打磨上,改善用戶的使用體驗。因此,我們所熟知的小米、魅族、vivo、OPPO等手機廠商,基本都是基于Android的深度定制打造的自身操作系統(tǒng)。
回望模型,開源大模型的出現(xiàn),讓 AI 應(yīng)用的開發(fā)周期和成本大幅降低,加快人工智能的普及。以Meta發(fā)布的Code Llama70B為例,據(jù)稱,其API調(diào)用成本大約比 GPT-4 便宜了 30 倍。在Llama2 發(fā)布兩個月后,通過 Hugging Face 的 Llama 模型下載量就超過 3000 萬次。國內(nèi)興起的AIGC,不少應(yīng)用的基礎(chǔ)模型就是 Llama2。
正如Meta 首席科學(xué)家、深度學(xué)習(xí)三巨頭之一 Yann LeCun所說:“閉源證明了大模型路線的可行性,而開源則通過繁榮的生態(tài),讓大模型變得易用、可用?!?/p>
而這次大模型的“開源熱”,除了市場推廣邏輯的復(fù)刻外,還有更現(xiàn)實的利益考量,那就是算力資源的匱乏。
根據(jù)不同的機構(gòu)測算,GPT-4 的訓(xùn)練需要的 A100 數(shù)量大約在10000-25000 張的區(qū)間?!鞍倌4髴?zhàn)”所消耗的算力規(guī)??上攵?。
更富邏輯性的說法則是,過去4年間,大模型參數(shù)量以年均400%的速度增長,AI算力需求增長超過15萬倍,傳統(tǒng)算力基礎(chǔ)設(shè)施已無法滿足大模型、生成式AI的訓(xùn)練需求。
正是在這一背景下,業(yè)內(nèi)早就提出,AI大模型的合理發(fā)展路徑,應(yīng)該是“可能僅有少數(shù)企業(yè)會開發(fā)基礎(chǔ)大模型,其他各行各業(yè)將根據(jù)自身業(yè)務(wù)需求、數(shù)據(jù)量等,接入大模型平臺,開發(fā)屬于自己的模型”。
國內(nèi)大模型的先發(fā)者百度CEO李彥宏更是直言:“好幾百個基礎(chǔ)模型,這是對社會資源巨大的浪費?!?/p>
另一方面,“百模大戰(zhàn)”對于技術(shù)升級的意義或許也確實不大。
盡管目前各家大模型在數(shù)據(jù)、算法等各個層面千差萬別,但核心的技術(shù)路線,事實上都是6年前誕生的Transformer 架構(gòu)。ChatGPT的名字中,GPT的T,指的就是Transformer。Copilot、 DALL·E 3 、 Midjourney、Runway……這一年不斷刷新我們認知的 AI 產(chǎn)品,背后的核心技術(shù)架構(gòu)都是Transformer。
這也解釋了為什么ChatGPT之后,新的大模型會如此密集出現(xiàn)。ChatGPT的最大功績,不是創(chuàng)造了新的AI工具,而是讓大家看到了AI革命性突破的確定路徑。這與前文提到的智能手機的iPhone時刻可謂異曲同工。
在同樣的架構(gòu)之下,訓(xùn)練出再多再好的大模型,最終意義或許就是刷個榜而已。
1月30日,上海人工智能實驗室推出的大模型開源開放評測體系司南(OpenCompass2.0),發(fā)布了2023年度大模型評測榜單,榜單顯示,整體技術(shù)能力居于GPT4與GPT3.5之間的大模型數(shù)量,已多達7個,其中不乏國產(chǎn)大模型身影。
OpenCompass2.0大語言模型中英雙語客觀評測前十名(采用百分制)。商用閉源模型通過API形式測試,開源模型直接在模型權(quán)重上測試。
但在實際應(yīng)用上,李彥宏表示:“國內(nèi)數(shù)百個大模型調(diào)用量加起來,還不如文心一個多?!?/p>
既然這樣,把資源集中在幾個更有實力的大模型上,的確是更優(yōu)選擇。
從政策上來看,開源也是行業(yè)大勢所趨。早在2017年,中國發(fā)布的《新一代人工智能發(fā)展規(guī)劃》就將開源、開放作為基本原則寫入了規(guī)劃。2023年,科技部副部長吳朝暉也表示,中國堅持開源協(xié)作,加強大模型技術(shù)持續(xù)創(chuàng)新,協(xié)同解決透明性、穩(wěn)定性等共性問題,加快形成大模型的產(chǎn)業(yè)生態(tài)。
因此,當(dāng)下大模型發(fā)展的“春秋時期”,是市場、企業(yè)、政策多方合力,共同用開源推開了“戰(zhàn)國”的大門。
02、“分晉”?“代齊”?
開源將改變大語言模型的格局已毋庸置疑。如何應(yīng)對?相信誰也給不出終極答案。
但既然“似曾相識燕歸來”,我們不妨再次將眼光轉(zhuǎn)向兩千多年前的那個時代。
歷史從春秋轉(zhuǎn)入戰(zhàn)國,有兩個標志性的事件,一是三家分晉,二是田氏代齊。這兩大事件,也為大模型廠商們面對開源后加快的市場洗牌,提供了兩個有效的應(yīng)對思路。
三家分晉的最終成行,在于趙、魏、韓三家勢弱的公卿,通過聯(lián)合取勝,消滅了勢強的智家,從而各自分得了晉國的部分領(lǐng)土。對于大模型廠商來說,這意味著一種合縱抗敵,各得其利的思路。
海外比較具有代表性的案例當(dāng)屬Hugging Face開源社區(qū)。作為世界最大的大模型托管平臺,Hugging Face近日推出了開源、可定制的AI 助手Hugging Chat Assistants。除了免費之外,其與GPTs和GPT Store另一個重要區(qū)別在于:后兩者完全依賴于OpenAI的專有大模型GPT-4以及GPT-4 Vision/Turbo,而前者的用戶可以自由選擇多個開源LLM來驅(qū)動AI助手。
Hugging Chat Assistants推出后不久,就受到AI社區(qū)許多開發(fā)者的稱贊,認為它在某些方面“超越了GPTs”,成為其追趕閉源系統(tǒng)競爭對手方面的不二法寶。
在國內(nèi),2023年9月5日,由重慶市大數(shù)據(jù)應(yīng)用發(fā)展管理局牽頭,華為、阿里、騰訊、百度、京東、科大訊飛等50多家國內(nèi)頭部大模型企業(yè)加入的,全國首個大模型聯(lián)盟智博會正式宣告成立,極大地推動了大模型產(chǎn)業(yè)生態(tài)發(fā)展。這與Android系統(tǒng)發(fā)布當(dāng)天,Google公司宣布聯(lián)合摩托羅拉、高通、HTC和T-Mobile在內(nèi)的30多家公司,共同組建全球性的開放手機聯(lián)盟,以推動Android普及,看上去頗有幾分相似。
回顧歷史,田氏代齊中的田氏,則是通過“有德于民”,而使“齊之民歸之如流水”,最終取代姜氏,掌握了齊國的政權(quán)。這種給與下游生態(tài)合作伙伴及客戶更多實惠,從而提升其合作意愿的思路,更適合有實力的大模型廠商。
譬如2023年9月5日召開的百度云智大會上,百度即宣布,推出大模型新生態(tài)政策,為伙伴提供資金、算力、技術(shù)、營銷等全方位的強力支持。百度如今能做到“國內(nèi)數(shù)百個大模型調(diào)用量加起來,還不如文心一個多”的成績,與此不無關(guān)系。
當(dāng)然,從大模型長期發(fā)展的復(fù)雜性來說,需要考慮的因素遠不止此。數(shù)據(jù)安全、許可協(xié)議標準、商業(yè)模式等等問題,在如今的發(fā)展階段,仍然處于未解之中。
但,Android先例在前,無論選擇“分晉”還是“代齊”路線,抑或其他,大模型廠商們通過開源加快搶占市場的用心,早已堅不可摧?!按呵飼r代”戰(zhàn)事的終結(jié),也早已由此注定。
Android的命名靈感,來自一個充滿野心的科幻作品《未來夏娃》。在這部小說中,作者試圖創(chuàng)造出一個完美的機器生命。正是出于對作者利爾·亞當(dāng)科學(xué)精神的致敬,Android之父安迪·魯賓,將本書女主角的名字,用在了自己開發(fā)的操作系統(tǒng)之上。大模型廠商們,誰又將造出AI時代的“未來夏娃”,我們拭目以待。