文|智駕網(wǎng) 黃華丹
ChatGPT走紅后,大模型的熱度持續(xù)不減。
尤其在國內(nèi),更是出現(xiàn)諸神混戰(zhàn)的場面。從3月到4月,包括百度、阿里巴巴、騰訊、知乎等多家巨頭官宣進軍大模型,發(fā)布中國版ChatGPT。
有機構(gòu)統(tǒng)計,今年以來,宣布進入大模型創(chuàng)業(yè)的公司,從互聯(lián)網(wǎng)巨頭、科技公司,到科研院所和創(chuàng)業(yè)明星大佬,林林總總超過30余家。
而國外,除了微軟、谷歌等巨頭,不久前馬斯克也被曝出緊急搶購1萬張GPU,創(chuàng)立X.AI,準(zhǔn)備開發(fā)TruthGPT。
行業(yè)熱火,但,開發(fā)大模型的成本如何?商業(yè)模式又如何?對于一腔熱情的入局者們,成本與前景,也是不得不面對的問題。
如果無法實現(xiàn)商業(yè)落地,如今熱鬧的大模型,也很可能步元宇宙的后塵。
有觀點認(rèn)為,通用型大模型參數(shù)量大,訓(xùn)練成本和使用成本高啟,并不是一般創(chuàng)業(yè)者所能承受的。而垂直領(lǐng)域的大模型相對成本較低,或許會成為更容易實現(xiàn)商業(yè)落地的領(lǐng)域。
而正在向智能化發(fā)展的汽車,就是一個很好的場景。
4月18日,上海車展首日,阿里巴巴新能源汽車發(fā)布會上,阿里集團副總裁、斑馬智行CEO張春暉在發(fā)言時表示,大模型開啟AI時代,會重塑千行百業(yè),而新汽車是大模型最大的交互應(yīng)用場景,智能汽車操作系統(tǒng)也會被重塑。
同時,張春暉宣布AliOS智能汽車操作系統(tǒng)已接入通義千問大模型進行測試,斑馬智行第三代汽車AI能力體系Banma Co-Pilot首次亮相,相關(guān)技術(shù)將率先在智己汽車上落地。
4月11日,阿里巴巴集團董事會主席兼CEO、阿里云智能集團CEO張勇公布阿里人工智能大語言模型“通義千問”,并宣布,未來阿里所有的產(chǎn)品都將接入“通義千問”。
阿里發(fā)布通義千問并不算早,斑馬宣布大模型上車也不是首例。但這依然代表了一種趨勢。
此前,百度發(fā)布文心一言后,便有多家車企宣布將接入文心一言。
據(jù)不完全統(tǒng)計,目前已經(jīng)宣布將接入文心一言的車企包括長安、集度、吉利、嵐圖、紅旗、長城、東風(fēng)日產(chǎn)、愛馳、零跑、海馬等。長安逸達(dá)成為首搭文心一言的車型。
據(jù)路透社報道,此前通用汽車一位高管也曾表示正在探索ChatGPT的用途,作為其與微軟公司更廣泛合作的一部分。
而毫末智行也在本月發(fā)布了首個基于大模型的自動駕駛算法DriveGPT。
大模型熱潮已來,行業(yè)會走向何方?而對汽車業(yè)來說,大模型能力的發(fā)展又將為汽車帶來怎樣的變化?
01 僅中國就可能超過50家
根據(jù)公開信息,目前已經(jīng)入局大模型的互聯(lián)網(wǎng)巨頭包括百度、騰訊、京東、阿里巴巴、華為、字節(jié)跳動、360等,而以美團聯(lián)合創(chuàng)始人王慧文、王興,搜狗創(chuàng)始人王小川等為代表的大佬們也熱情高漲,“帶資入組”的,融資組建團隊的,熱鬧非凡。
據(jù)民生證券不完全統(tǒng)計,目前國內(nèi)已發(fā)布超過30個大模型,而據(jù)出門問問創(chuàng)始人、CEO李志飛預(yù)計,中國未來1-2年會看到50家以上公司做大模型。
不久前馬斯克還在批判濫用GPT背后的大模型會引發(fā)人類社會發(fā)展危機,轉(zhuǎn)身便也躬身入場。
但馬斯克等人呼吁暫停時擔(dān)憂的AI監(jiān)管問題,確實也尚未在全球形成一致的共識。
不過,從目前來看,入局者首先要擔(dān)心的,恐怕并不是安全問題,而是是否能夠找到商業(yè)落地方向,并以可靠的技術(shù)實現(xiàn)落地。
李彥宏認(rèn)為,中國創(chuàng)業(yè)公司中基本不會出現(xiàn)下一個OpenAI。OpenAI誕生是因為美國大廠不看好這個方向,但現(xiàn)在中國的大廠都看好AI大模型,都在做這個方向。創(chuàng)業(yè)公司重新再做一個ChatGPT沒有多大意義。李彥宏認(rèn)為基于大語言模型開發(fā)應(yīng)用機會很大,沒有必要再重新發(fā)明一遍輪子。
大量創(chuàng)業(yè)者同時涌入,一定意義上其實是對資源的浪費。
而且,不得不提的是,開發(fā)和訓(xùn)練大模型的成本很高,并不是一般創(chuàng)業(yè)團隊能夠承擔(dān)的。
據(jù)浙江大學(xué)人工智能研究所所長吳飛介紹,ChatGPT的訓(xùn)練門檻是1萬張英偉達(dá)A100 GPU,約人民幣10億元,模型訓(xùn)練算力開銷是每秒運算一千萬億次,需運行3640天。
而國盛證券計算機分析師劉高暢和楊然也在《ChatGPT需要多少算力》報告中估算,GPT-3訓(xùn)練一次的成本約為140萬美元,對于一些更大的大語言模型,訓(xùn)練成本介于200萬美元至1200萬美元之間。
除了算力,訓(xùn)練大模型還需要服務(wù)器、數(shù)據(jù)甚至電費等多方面的支持。
有機構(gòu)估算,假如平均每天約有1300萬用戶訪問ChatGPT,就需要3萬多片英偉達(dá)A100 GPU,初期投入成本約為8億美元,每日還需約5萬美元的電費。
就OpenAI的投入來看,數(shù)據(jù)顯示,微軟已向其投資累計130億美元,使其估值近300億美元,此外,微軟還向OpenAI提供算力和研發(fā)支持。
而根據(jù)PitchBook的數(shù)據(jù),OpenAI今年營收將達(dá)到2億美元,比2022年增長150%,2024 年將達(dá)到10億美元。
這是一門昂貴的生意。
在商業(yè)化可能上,OpenAI的GPT可以說走在前列。B端和C端均實現(xiàn)了收費。但對大部分后來者而言,要實現(xiàn)如OpenAI的C端規(guī)?;静豢赡?。在B端尋求落地才是更可行的方案。
而智能汽車,就是目前一個可行的B端場景。
02 在汽車領(lǐng)域應(yīng)用相對容易實現(xiàn)
一方面,汽車有著明確的交互需求,而且相較于通用型大模型,垂直領(lǐng)域的應(yīng)用場景相對較小,對參數(shù)的量級要求也沒有通用型AI那么大,因此是更容易實現(xiàn)應(yīng)用的領(lǐng)域。
目前來看,大模型在車上的應(yīng)用場景主要是在智能交互和智能駕駛上。
張春暉在阿里巴巴新能源發(fā)布會上表示,雖然語音交互已經(jīng)發(fā)展了多年,但目前車載語音助手整體水平還停留在可能叫不醒、響應(yīng)慢、總出錯、聽不懂、不好用的階段。
而大模型可以通過深度學(xué)習(xí)等技術(shù),訓(xùn)練出更加準(zhǔn)確的語義和意圖理解模型,幫助車載系統(tǒng)更好地理解用戶的指令和意圖。并讓車載語音實現(xiàn)更深層次的個性化和自然擬人的交互。
例如,在大模型賦能下,車載助手將具備真正的智能化水平,更好地了解用戶的喜好,根據(jù)語義識別,理解用戶的環(huán)境和情緒狀態(tài),并以此推薦相應(yīng)的音樂、電影、電子書等內(nèi)容。
而基于AI大模型對語音及圖像的理解能力,座艙內(nèi)的交互方式能夠變得更加多元。語音之外,用戶還能夠以手勢、眼神等方式,創(chuàng)造出更加自然、便捷的交互方式。
此外,大模型還可以訓(xùn)練出預(yù)測用戶行為的模型,預(yù)測用戶是否會變道或剎車等,提前做出相應(yīng)的駕駛協(xié)助。
上海車展期間,商湯也展示了其最新的座艙應(yīng)用。其全新推出的大模型體系“日日新Sensenova”擁有語言大模型以及數(shù)字人等多種生成式AI能力,可為車艙提供更智能和人性化的多模態(tài)人車交互體驗。
據(jù)商湯科技介紹,商湯語言大模型“商量SenseChat”會與嘉賓交流互動,并推薦個性化體驗內(nèi)容,同時,它還支持郵件模式,可自動提煉郵件關(guān)鍵信息,幫助用戶節(jié)省閱讀時間?!懊氘婼enseMirage”文生圖創(chuàng)作平臺則借助商湯AIGC模型能力自動為嘉賓生成各種風(fēng)格的照片。
Elektrobit中國區(qū)總經(jīng)理鄒露君則認(rèn)為,人機交互應(yīng)該是受影響最大的領(lǐng)域,大模型對人機交互會產(chǎn)生顛覆性的影響。
就座艙內(nèi)的交互而言,對大模型上車的期待絕不會只停留在可以為用戶提供更順暢的交流,以及提供生成圖片的能力。
而在智能駕駛方面,地平線CTO黃暢在接受采訪時曾表示,GPT在自動駕駛場景中最先應(yīng)用的很可能是環(huán)境模型的預(yù)測和交互式規(guī)控、交互式規(guī)劃。
黃暢認(rèn)為,這個場景不需要特別大規(guī)模的參數(shù)模型,因為它不是一個完整的端到端,尤其因為它更關(guān)注于預(yù)測和規(guī)劃,不用花太多精力在感知這個層面上,因此很可能在百TOPS級別的算力平臺上就能應(yīng)用,在三到五年內(nèi)就可以初步上線。
而在完整的端到端緩解,從感知到定位地圖到規(guī)控,整個端到端的閉環(huán)做出來,黃暢認(rèn)為需要一個更大規(guī)模的參數(shù)模型,大概需要五到十年的時間。
毫末智行發(fā)布的DriveGPT雪湖·海若則是使用GPT模型和技術(shù)邏輯的自動駕駛算法模型。作為適用于自動駕駛訓(xùn)練的大模型,DriveGPT雪湖·海若的能力是:
在預(yù)訓(xùn)練階段引入量產(chǎn)智能駕駛數(shù)據(jù),訓(xùn)練出一個初始模型。然后引入量產(chǎn)數(shù)據(jù)中的用戶接管片段,訓(xùn)練反饋模型。通過強化學(xué)習(xí),使用反饋模型不斷優(yōu)化迭代初始模型。
其基本邏輯是:
1、按概率生成多個場景序列,每個場景都是一個全局的場景,每個場景序列都是未來有可能發(fā)生的一種實際情況。
2、在所有場景序列都產(chǎn)生的情況下,把場景中最關(guān)注的自車行為軌跡給量化出來,也就是生成場景的同時,便會產(chǎn)生自車未來的軌跡信息。
3、有了這段軌跡之后,DriveGPT雪湖·海若還能在生成場景序列、軌跡的同時,輸出整個決策邏輯鏈。
也就是說,利用DriveGPT雪湖·海若,在一個統(tǒng)一的生成式框架下,將規(guī)劃、決策與推理等多個任務(wù)全部完成。
有業(yè)內(nèi)人士認(rèn)為,通用型大模型的發(fā)展,將會使其成為一種如基礎(chǔ)設(shè)施般的存在。而對智能汽車來說,大模型能力對車輛智能化的推動也將上升一個量級。
不過,當(dāng)然,前提是如今倉促進場的各方能有足夠的投入將技術(shù)打磨成熟。
此前李彥宏曾表示文心一言與ChatGPT之間只差兩三個月,引發(fā)一波爭議。王小川則認(rèn)為有三年的差距。
文心一言與通義千問已開啟內(nèi)測,而大部分項目仍處在公布階段。顯然,國內(nèi)大模型行業(yè)要走的路,還有很遠(yuǎn)。