正在閱讀:

大模型混戰(zhàn)上海車展,智能汽車能否撐起這門昂貴的生意?

掃一掃下載界面新聞APP

大模型混戰(zhàn)上海車展,智能汽車能否撐起這門昂貴的生意?

多巨頭混戰(zhàn)大模型,智能汽車成為新戰(zhàn)場(chǎng)。

文|智駕網(wǎng) 黃華丹

ChatGPT走紅后,大模型的熱度持續(xù)不減。

尤其在國(guó)內(nèi),更是出現(xiàn)諸神混戰(zhàn)的場(chǎng)面。從3月到4月,包括百度、阿里巴巴、騰訊、知乎等多家巨頭官宣進(jìn)軍大模型,發(fā)布中國(guó)版ChatGPT。

有機(jī)構(gòu)統(tǒng)計(jì),今年以來(lái),宣布進(jìn)入大模型創(chuàng)業(yè)的公司,從互聯(lián)網(wǎng)巨頭、科技公司,到科研院所和創(chuàng)業(yè)明星大佬,林林總總超過(guò)30余家。

而國(guó)外,除了微軟、谷歌等巨頭,不久前馬斯克也被曝出緊急搶購(gòu)1萬(wàn)張GPU,創(chuàng)立X.AI,準(zhǔn)備開(kāi)發(fā)TruthGPT。

行業(yè)熱火,但,開(kāi)發(fā)大模型的成本如何?商業(yè)模式又如何?對(duì)于一腔熱情的入局者們,成本與前景,也是不得不面對(duì)的問(wèn)題。

如果無(wú)法實(shí)現(xiàn)商業(yè)落地,如今熱鬧的大模型,也很可能步元宇宙的后塵。

有觀點(diǎn)認(rèn)為,通用型大模型參數(shù)量大,訓(xùn)練成本和使用成本高啟,并不是一般創(chuàng)業(yè)者所能承受的。而垂直領(lǐng)域的大模型相對(duì)成本較低,或許會(huì)成為更容易實(shí)現(xiàn)商業(yè)落地的領(lǐng)域。

而正在向智能化發(fā)展的汽車,就是一個(gè)很好的場(chǎng)景。

4月18日,上海車展首日,阿里巴巴新能源汽車發(fā)布會(huì)上,阿里集團(tuán)副總裁、斑馬智行CEO張春暉在發(fā)言時(shí)表示,大模型開(kāi)啟AI時(shí)代,會(huì)重塑千行百業(yè),而新汽車是大模型最大的交互應(yīng)用場(chǎng)景,智能汽車操作系統(tǒng)也會(huì)被重塑。

同時(shí),張春暉宣布AliOS智能汽車操作系統(tǒng)已接入通義千問(wèn)大模型進(jìn)行測(cè)試,斑馬智行第三代汽車AI能力體系Banma Co-Pilot首次亮相,相關(guān)技術(shù)將率先在智己汽車上落地。

4月11日,阿里巴巴集團(tuán)董事會(huì)主席兼CEO、阿里云智能集團(tuán)CEO張勇公布阿里人工智能大語(yǔ)言模型“通義千問(wèn)”,并宣布,未來(lái)阿里所有的產(chǎn)品都將接入“通義千問(wèn)”。

阿里發(fā)布通義千問(wèn)并不算早,斑馬宣布大模型上車也不是首例。但這依然代表了一種趨勢(shì)。

此前,百度發(fā)布文心一言后,便有多家車企宣布將接入文心一言。

據(jù)不完全統(tǒng)計(jì),目前已經(jīng)宣布將接入文心一言的車企包括長(zhǎng)安、集度、吉利、嵐圖、紅旗、長(zhǎng)城、東風(fēng)日產(chǎn)、愛(ài)馳、零跑、海馬等。長(zhǎng)安逸達(dá)成為首搭文心一言的車型。

據(jù)路透社報(bào)道,此前通用汽車一位高管也曾表示正在探索ChatGPT的用途,作為其與微軟公司更廣泛合作的一部分。

而毫末智行也在本月發(fā)布了首個(gè)基于大模型的自動(dòng)駕駛算法DriveGPT。

大模型熱潮已來(lái),行業(yè)會(huì)走向何方?而對(duì)汽車業(yè)來(lái)說(shuō),大模型能力的發(fā)展又將為汽車帶來(lái)怎樣的變化?

01 僅中國(guó)就可能超過(guò)50家

根據(jù)公開(kāi)信息,目前已經(jīng)入局大模型的互聯(lián)網(wǎng)巨頭包括百度、騰訊、京東、阿里巴巴、華為、字節(jié)跳動(dòng)、360等,而以美團(tuán)聯(lián)合創(chuàng)始人王慧文、王興,搜狗創(chuàng)始人王小川等為代表的大佬們也熱情高漲,“帶資入組”的,融資組建團(tuán)隊(duì)的,熱鬧非凡。

據(jù)民生證券不完全統(tǒng)計(jì),目前國(guó)內(nèi)已發(fā)布超過(guò)30個(gè)大模型,而據(jù)出門問(wèn)問(wèn)創(chuàng)始人、CEO李志飛預(yù)計(jì),中國(guó)未來(lái)1-2年會(huì)看到50家以上公司做大模型。

不久前馬斯克還在批判濫用GPT背后的大模型會(huì)引發(fā)人類社會(huì)發(fā)展危機(jī),轉(zhuǎn)身便也躬身入場(chǎng)。

但馬斯克等人呼吁暫停時(shí)擔(dān)憂的AI監(jiān)管問(wèn)題,確實(shí)也尚未在全球形成一致的共識(shí)。

不過(guò),從目前來(lái)看,入局者首先要擔(dān)心的,恐怕并不是安全問(wèn)題,而是是否能夠找到商業(yè)落地方向,并以可靠的技術(shù)實(shí)現(xiàn)落地。

李彥宏認(rèn)為,中國(guó)創(chuàng)業(yè)公司中基本不會(huì)出現(xiàn)下一個(gè)OpenAI。OpenAI誕生是因?yàn)槊绹?guó)大廠不看好這個(gè)方向,但現(xiàn)在中國(guó)的大廠都看好AI大模型,都在做這個(gè)方向。創(chuàng)業(yè)公司重新再做一個(gè)ChatGPT沒(méi)有多大意義。李彥宏認(rèn)為基于大語(yǔ)言模型開(kāi)發(fā)應(yīng)用機(jī)會(huì)很大,沒(méi)有必要再重新發(fā)明一遍輪子。

大量創(chuàng)業(yè)者同時(shí)涌入,一定意義上其實(shí)是對(duì)資源的浪費(fèi)。

而且,不得不提的是,開(kāi)發(fā)和訓(xùn)練大模型的成本很高,并不是一般創(chuàng)業(yè)團(tuán)隊(duì)能夠承擔(dān)的。

據(jù)浙江大學(xué)人工智能研究所所長(zhǎng)吳飛介紹,ChatGPT的訓(xùn)練門檻是1萬(wàn)張英偉達(dá)A100 GPU,約人民幣10億元,模型訓(xùn)練算力開(kāi)銷是每秒運(yùn)算一千萬(wàn)億次,需運(yùn)行3640天。

而國(guó)盛證券計(jì)算機(jī)分析師劉高暢和楊然也在《ChatGPT需要多少算力》報(bào)告中估算,GPT-3訓(xùn)練一次的成本約為140萬(wàn)美元,對(duì)于一些更大的大語(yǔ)言模型,訓(xùn)練成本介于200萬(wàn)美元至1200萬(wàn)美元之間。

除了算力,訓(xùn)練大模型還需要服務(wù)器、數(shù)據(jù)甚至電費(fèi)等多方面的支持。

有機(jī)構(gòu)估算,假如平均每天約有1300萬(wàn)用戶訪問(wèn)ChatGPT,就需要3萬(wàn)多片英偉達(dá)A100 GPU,初期投入成本約為8億美元,每日還需約5萬(wàn)美元的電費(fèi)。

就OpenAI的投入來(lái)看,數(shù)據(jù)顯示,微軟已向其投資累計(jì)130億美元,使其估值近300億美元,此外,微軟還向OpenAI提供算力和研發(fā)支持。

而根據(jù)PitchBook的數(shù)據(jù),OpenAI今年?duì)I收將達(dá)到2億美元,比2022年增長(zhǎng)150%,2024 年將達(dá)到10億美元。

這是一門昂貴的生意。

在商業(yè)化可能上,OpenAI的GPT可以說(shuō)走在前列。B端和C端均實(shí)現(xiàn)了收費(fèi)。但對(duì)大部分后來(lái)者而言,要實(shí)現(xiàn)如OpenAI的C端規(guī)?;静豢赡堋T贐端尋求落地才是更可行的方案。

而智能汽車,就是目前一個(gè)可行的B端場(chǎng)景。

02 在汽車領(lǐng)域應(yīng)用相對(duì)容易實(shí)現(xiàn)

一方面,汽車有著明確的交互需求,而且相較于通用型大模型,垂直領(lǐng)域的應(yīng)用場(chǎng)景相對(duì)較小,對(duì)參數(shù)的量級(jí)要求也沒(méi)有通用型AI那么大,因此是更容易實(shí)現(xiàn)應(yīng)用的領(lǐng)域。

目前來(lái)看,大模型在車上的應(yīng)用場(chǎng)景主要是在智能交互和智能駕駛上。

張春暉在阿里巴巴新能源發(fā)布會(huì)上表示,雖然語(yǔ)音交互已經(jīng)發(fā)展了多年,但目前車載語(yǔ)音助手整體水平還停留在可能叫不醒、響應(yīng)慢、總出錯(cuò)、聽(tīng)不懂、不好用的階段。

而大模型可以通過(guò)深度學(xué)習(xí)等技術(shù),訓(xùn)練出更加準(zhǔn)確的語(yǔ)義和意圖理解模型,幫助車載系統(tǒng)更好地理解用戶的指令和意圖。并讓車載語(yǔ)音實(shí)現(xiàn)更深層次的個(gè)性化和自然擬人的交互。

例如,在大模型賦能下,車載助手將具備真正的智能化水平,更好地了解用戶的喜好,根據(jù)語(yǔ)義識(shí)別,理解用戶的環(huán)境和情緒狀態(tài),并以此推薦相應(yīng)的音樂(lè)、電影、電子書等內(nèi)容。

而基于AI大模型對(duì)語(yǔ)音及圖像的理解能力,座艙內(nèi)的交互方式能夠變得更加多元。語(yǔ)音之外,用戶還能夠以手勢(shì)、眼神等方式,創(chuàng)造出更加自然、便捷的交互方式。

此外,大模型還可以訓(xùn)練出預(yù)測(cè)用戶行為的模型,預(yù)測(cè)用戶是否會(huì)變道或剎車等,提前做出相應(yīng)的駕駛協(xié)助。

上海車展期間,商湯也展示了其最新的座艙應(yīng)用。其全新推出的大模型體系“日日新Sensenova”擁有語(yǔ)言大模型以及數(shù)字人等多種生成式AI能力,可為車艙提供更智能和人性化的多模態(tài)人車交互體驗(yàn)。

據(jù)商湯科技介紹,商湯語(yǔ)言大模型“商量SenseChat”會(huì)與嘉賓交流互動(dòng),并推薦個(gè)性化體驗(yàn)內(nèi)容,同時(shí),它還支持郵件模式,可自動(dòng)提煉郵件關(guān)鍵信息,幫助用戶節(jié)省閱讀時(shí)間。“秒畫SenseMirage”文生圖創(chuàng)作平臺(tái)則借助商湯AIGC模型能力自動(dòng)為嘉賓生成各種風(fēng)格的照片。

Elektrobit中國(guó)區(qū)總經(jīng)理鄒露君則認(rèn)為,人機(jī)交互應(yīng)該是受影響最大的領(lǐng)域,大模型對(duì)人機(jī)交互會(huì)產(chǎn)生顛覆性的影響。

就座艙內(nèi)的交互而言,對(duì)大模型上車的期待絕不會(huì)只停留在可以為用戶提供更順暢的交流,以及提供生成圖片的能力。

而在智能駕駛方面,地平線CTO黃暢在接受采訪時(shí)曾表示,GPT在自動(dòng)駕駛場(chǎng)景中最先應(yīng)用的很可能是環(huán)境模型的預(yù)測(cè)和交互式規(guī)控、交互式規(guī)劃。

黃暢認(rèn)為,這個(gè)場(chǎng)景不需要特別大規(guī)模的參數(shù)模型,因?yàn)樗皇且粋€(gè)完整的端到端,尤其因?yàn)樗P(guān)注于預(yù)測(cè)和規(guī)劃,不用花太多精力在感知這個(gè)層面上,因此很可能在百TOPS級(jí)別的算力平臺(tái)上就能應(yīng)用,在三到五年內(nèi)就可以初步上線。

而在完整的端到端緩解,從感知到定位地圖到規(guī)控,整個(gè)端到端的閉環(huán)做出來(lái),黃暢認(rèn)為需要一個(gè)更大規(guī)模的參數(shù)模型,大概需要五到十年的時(shí)間。

毫末智行發(fā)布的DriveGPT雪湖·海若則是使用GPT模型和技術(shù)邏輯的自動(dòng)駕駛算法模型。作為適用于自動(dòng)駕駛訓(xùn)練的大模型,DriveGPT雪湖·海若的能力是:

在預(yù)訓(xùn)練階段引入量產(chǎn)智能駕駛數(shù)據(jù),訓(xùn)練出一個(gè)初始模型。然后引入量產(chǎn)數(shù)據(jù)中的用戶接管片段,訓(xùn)練反饋模型。通過(guò)強(qiáng)化學(xué)習(xí),使用反饋模型不斷優(yōu)化迭代初始模型。

其基本邏輯是:

1、按概率生成多個(gè)場(chǎng)景序列,每個(gè)場(chǎng)景都是一個(gè)全局的場(chǎng)景,每個(gè)場(chǎng)景序列都是未來(lái)有可能發(fā)生的一種實(shí)際情況。

2、在所有場(chǎng)景序列都產(chǎn)生的情況下,把場(chǎng)景中最關(guān)注的自車行為軌跡給量化出來(lái),也就是生成場(chǎng)景的同時(shí),便會(huì)產(chǎn)生自車未來(lái)的軌跡信息。

3、有了這段軌跡之后,DriveGPT雪湖·海若還能在生成場(chǎng)景序列、軌跡的同時(shí),輸出整個(gè)決策邏輯鏈。

也就是說(shuō),利用DriveGPT雪湖·海若,在一個(gè)統(tǒng)一的生成式框架下,將規(guī)劃、決策與推理等多個(gè)任務(wù)全部完成。

有業(yè)內(nèi)人士認(rèn)為,通用型大模型的發(fā)展,將會(huì)使其成為一種如基礎(chǔ)設(shè)施般的存在。而對(duì)智能汽車來(lái)說(shuō),大模型能力對(duì)車輛智能化的推動(dòng)也將上升一個(gè)量級(jí)。

不過(guò),當(dāng)然,前提是如今倉(cāng)促進(jìn)場(chǎng)的各方能有足夠的投入將技術(shù)打磨成熟。

此前李彥宏曾表示文心一言與ChatGPT之間只差兩三個(gè)月,引發(fā)一波爭(zhēng)議。王小川則認(rèn)為有三年的差距。

文心一言與通義千問(wèn)已開(kāi)啟內(nèi)測(cè),而大部分項(xiàng)目仍處在公布階段。顯然,國(guó)內(nèi)大模型行業(yè)要走的路,還有很遠(yuǎn)。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

大模型混戰(zhàn)上海車展,智能汽車能否撐起這門昂貴的生意?

多巨頭混戰(zhàn)大模型,智能汽車成為新戰(zhàn)場(chǎng)。

文|智駕網(wǎng) 黃華丹

ChatGPT走紅后,大模型的熱度持續(xù)不減。

尤其在國(guó)內(nèi),更是出現(xiàn)諸神混戰(zhàn)的場(chǎng)面。從3月到4月,包括百度、阿里巴巴、騰訊、知乎等多家巨頭官宣進(jìn)軍大模型,發(fā)布中國(guó)版ChatGPT。

有機(jī)構(gòu)統(tǒng)計(jì),今年以來(lái),宣布進(jìn)入大模型創(chuàng)業(yè)的公司,從互聯(lián)網(wǎng)巨頭、科技公司,到科研院所和創(chuàng)業(yè)明星大佬,林林總總超過(guò)30余家。

而國(guó)外,除了微軟、谷歌等巨頭,不久前馬斯克也被曝出緊急搶購(gòu)1萬(wàn)張GPU,創(chuàng)立X.AI,準(zhǔn)備開(kāi)發(fā)TruthGPT。

行業(yè)熱火,但,開(kāi)發(fā)大模型的成本如何?商業(yè)模式又如何?對(duì)于一腔熱情的入局者們,成本與前景,也是不得不面對(duì)的問(wèn)題。

如果無(wú)法實(shí)現(xiàn)商業(yè)落地,如今熱鬧的大模型,也很可能步元宇宙的后塵。

有觀點(diǎn)認(rèn)為,通用型大模型參數(shù)量大,訓(xùn)練成本和使用成本高啟,并不是一般創(chuàng)業(yè)者所能承受的。而垂直領(lǐng)域的大模型相對(duì)成本較低,或許會(huì)成為更容易實(shí)現(xiàn)商業(yè)落地的領(lǐng)域。

而正在向智能化發(fā)展的汽車,就是一個(gè)很好的場(chǎng)景。

4月18日,上海車展首日,阿里巴巴新能源汽車發(fā)布會(huì)上,阿里集團(tuán)副總裁、斑馬智行CEO張春暉在發(fā)言時(shí)表示,大模型開(kāi)啟AI時(shí)代,會(huì)重塑千行百業(yè),而新汽車是大模型最大的交互應(yīng)用場(chǎng)景,智能汽車操作系統(tǒng)也會(huì)被重塑。

同時(shí),張春暉宣布AliOS智能汽車操作系統(tǒng)已接入通義千問(wèn)大模型進(jìn)行測(cè)試,斑馬智行第三代汽車AI能力體系Banma Co-Pilot首次亮相,相關(guān)技術(shù)將率先在智己汽車上落地。

4月11日,阿里巴巴集團(tuán)董事會(huì)主席兼CEO、阿里云智能集團(tuán)CEO張勇公布阿里人工智能大語(yǔ)言模型“通義千問(wèn)”,并宣布,未來(lái)阿里所有的產(chǎn)品都將接入“通義千問(wèn)”。

阿里發(fā)布通義千問(wèn)并不算早,斑馬宣布大模型上車也不是首例。但這依然代表了一種趨勢(shì)。

此前,百度發(fā)布文心一言后,便有多家車企宣布將接入文心一言。

據(jù)不完全統(tǒng)計(jì),目前已經(jīng)宣布將接入文心一言的車企包括長(zhǎng)安、集度、吉利、嵐圖、紅旗、長(zhǎng)城、東風(fēng)日產(chǎn)、愛(ài)馳、零跑、海馬等。長(zhǎng)安逸達(dá)成為首搭文心一言的車型。

據(jù)路透社報(bào)道,此前通用汽車一位高管也曾表示正在探索ChatGPT的用途,作為其與微軟公司更廣泛合作的一部分。

而毫末智行也在本月發(fā)布了首個(gè)基于大模型的自動(dòng)駕駛算法DriveGPT。

大模型熱潮已來(lái),行業(yè)會(huì)走向何方?而對(duì)汽車業(yè)來(lái)說(shuō),大模型能力的發(fā)展又將為汽車帶來(lái)怎樣的變化?

01 僅中國(guó)就可能超過(guò)50家

根據(jù)公開(kāi)信息,目前已經(jīng)入局大模型的互聯(lián)網(wǎng)巨頭包括百度、騰訊、京東、阿里巴巴、華為、字節(jié)跳動(dòng)、360等,而以美團(tuán)聯(lián)合創(chuàng)始人王慧文、王興,搜狗創(chuàng)始人王小川等為代表的大佬們也熱情高漲,“帶資入組”的,融資組建團(tuán)隊(duì)的,熱鬧非凡。

據(jù)民生證券不完全統(tǒng)計(jì),目前國(guó)內(nèi)已發(fā)布超過(guò)30個(gè)大模型,而據(jù)出門問(wèn)問(wèn)創(chuàng)始人、CEO李志飛預(yù)計(jì),中國(guó)未來(lái)1-2年會(huì)看到50家以上公司做大模型。

不久前馬斯克還在批判濫用GPT背后的大模型會(huì)引發(fā)人類社會(huì)發(fā)展危機(jī),轉(zhuǎn)身便也躬身入場(chǎng)。

但馬斯克等人呼吁暫停時(shí)擔(dān)憂的AI監(jiān)管問(wèn)題,確實(shí)也尚未在全球形成一致的共識(shí)。

不過(guò),從目前來(lái)看,入局者首先要擔(dān)心的,恐怕并不是安全問(wèn)題,而是是否能夠找到商業(yè)落地方向,并以可靠的技術(shù)實(shí)現(xiàn)落地。

李彥宏認(rèn)為,中國(guó)創(chuàng)業(yè)公司中基本不會(huì)出現(xiàn)下一個(gè)OpenAI。OpenAI誕生是因?yàn)槊绹?guó)大廠不看好這個(gè)方向,但現(xiàn)在中國(guó)的大廠都看好AI大模型,都在做這個(gè)方向。創(chuàng)業(yè)公司重新再做一個(gè)ChatGPT沒(méi)有多大意義。李彥宏認(rèn)為基于大語(yǔ)言模型開(kāi)發(fā)應(yīng)用機(jī)會(huì)很大,沒(méi)有必要再重新發(fā)明一遍輪子。

大量創(chuàng)業(yè)者同時(shí)涌入,一定意義上其實(shí)是對(duì)資源的浪費(fèi)。

而且,不得不提的是,開(kāi)發(fā)和訓(xùn)練大模型的成本很高,并不是一般創(chuàng)業(yè)團(tuán)隊(duì)能夠承擔(dān)的。

據(jù)浙江大學(xué)人工智能研究所所長(zhǎng)吳飛介紹,ChatGPT的訓(xùn)練門檻是1萬(wàn)張英偉達(dá)A100 GPU,約人民幣10億元,模型訓(xùn)練算力開(kāi)銷是每秒運(yùn)算一千萬(wàn)億次,需運(yùn)行3640天。

而國(guó)盛證券計(jì)算機(jī)分析師劉高暢和楊然也在《ChatGPT需要多少算力》報(bào)告中估算,GPT-3訓(xùn)練一次的成本約為140萬(wàn)美元,對(duì)于一些更大的大語(yǔ)言模型,訓(xùn)練成本介于200萬(wàn)美元至1200萬(wàn)美元之間。

除了算力,訓(xùn)練大模型還需要服務(wù)器、數(shù)據(jù)甚至電費(fèi)等多方面的支持。

有機(jī)構(gòu)估算,假如平均每天約有1300萬(wàn)用戶訪問(wèn)ChatGPT,就需要3萬(wàn)多片英偉達(dá)A100 GPU,初期投入成本約為8億美元,每日還需約5萬(wàn)美元的電費(fèi)。

就OpenAI的投入來(lái)看,數(shù)據(jù)顯示,微軟已向其投資累計(jì)130億美元,使其估值近300億美元,此外,微軟還向OpenAI提供算力和研發(fā)支持。

而根據(jù)PitchBook的數(shù)據(jù),OpenAI今年?duì)I收將達(dá)到2億美元,比2022年增長(zhǎng)150%,2024 年將達(dá)到10億美元。

這是一門昂貴的生意。

在商業(yè)化可能上,OpenAI的GPT可以說(shuō)走在前列。B端和C端均實(shí)現(xiàn)了收費(fèi)。但對(duì)大部分后來(lái)者而言,要實(shí)現(xiàn)如OpenAI的C端規(guī)?;静豢赡堋T贐端尋求落地才是更可行的方案。

而智能汽車,就是目前一個(gè)可行的B端場(chǎng)景。

02 在汽車領(lǐng)域應(yīng)用相對(duì)容易實(shí)現(xiàn)

一方面,汽車有著明確的交互需求,而且相較于通用型大模型,垂直領(lǐng)域的應(yīng)用場(chǎng)景相對(duì)較小,對(duì)參數(shù)的量級(jí)要求也沒(méi)有通用型AI那么大,因此是更容易實(shí)現(xiàn)應(yīng)用的領(lǐng)域。

目前來(lái)看,大模型在車上的應(yīng)用場(chǎng)景主要是在智能交互和智能駕駛上。

張春暉在阿里巴巴新能源發(fā)布會(huì)上表示,雖然語(yǔ)音交互已經(jīng)發(fā)展了多年,但目前車載語(yǔ)音助手整體水平還停留在可能叫不醒、響應(yīng)慢、總出錯(cuò)、聽(tīng)不懂、不好用的階段。

而大模型可以通過(guò)深度學(xué)習(xí)等技術(shù),訓(xùn)練出更加準(zhǔn)確的語(yǔ)義和意圖理解模型,幫助車載系統(tǒng)更好地理解用戶的指令和意圖。并讓車載語(yǔ)音實(shí)現(xiàn)更深層次的個(gè)性化和自然擬人的交互。

例如,在大模型賦能下,車載助手將具備真正的智能化水平,更好地了解用戶的喜好,根據(jù)語(yǔ)義識(shí)別,理解用戶的環(huán)境和情緒狀態(tài),并以此推薦相應(yīng)的音樂(lè)、電影、電子書等內(nèi)容。

而基于AI大模型對(duì)語(yǔ)音及圖像的理解能力,座艙內(nèi)的交互方式能夠變得更加多元。語(yǔ)音之外,用戶還能夠以手勢(shì)、眼神等方式,創(chuàng)造出更加自然、便捷的交互方式。

此外,大模型還可以訓(xùn)練出預(yù)測(cè)用戶行為的模型,預(yù)測(cè)用戶是否會(huì)變道或剎車等,提前做出相應(yīng)的駕駛協(xié)助。

上海車展期間,商湯也展示了其最新的座艙應(yīng)用。其全新推出的大模型體系“日日新Sensenova”擁有語(yǔ)言大模型以及數(shù)字人等多種生成式AI能力,可為車艙提供更智能和人性化的多模態(tài)人車交互體驗(yàn)。

據(jù)商湯科技介紹,商湯語(yǔ)言大模型“商量SenseChat”會(huì)與嘉賓交流互動(dòng),并推薦個(gè)性化體驗(yàn)內(nèi)容,同時(shí),它還支持郵件模式,可自動(dòng)提煉郵件關(guān)鍵信息,幫助用戶節(jié)省閱讀時(shí)間?!懊氘婼enseMirage”文生圖創(chuàng)作平臺(tái)則借助商湯AIGC模型能力自動(dòng)為嘉賓生成各種風(fēng)格的照片。

Elektrobit中國(guó)區(qū)總經(jīng)理鄒露君則認(rèn)為,人機(jī)交互應(yīng)該是受影響最大的領(lǐng)域,大模型對(duì)人機(jī)交互會(huì)產(chǎn)生顛覆性的影響。

就座艙內(nèi)的交互而言,對(duì)大模型上車的期待絕不會(huì)只停留在可以為用戶提供更順暢的交流,以及提供生成圖片的能力。

而在智能駕駛方面,地平線CTO黃暢在接受采訪時(shí)曾表示,GPT在自動(dòng)駕駛場(chǎng)景中最先應(yīng)用的很可能是環(huán)境模型的預(yù)測(cè)和交互式規(guī)控、交互式規(guī)劃。

黃暢認(rèn)為,這個(gè)場(chǎng)景不需要特別大規(guī)模的參數(shù)模型,因?yàn)樗皇且粋€(gè)完整的端到端,尤其因?yàn)樗P(guān)注于預(yù)測(cè)和規(guī)劃,不用花太多精力在感知這個(gè)層面上,因此很可能在百TOPS級(jí)別的算力平臺(tái)上就能應(yīng)用,在三到五年內(nèi)就可以初步上線。

而在完整的端到端緩解,從感知到定位地圖到規(guī)控,整個(gè)端到端的閉環(huán)做出來(lái),黃暢認(rèn)為需要一個(gè)更大規(guī)模的參數(shù)模型,大概需要五到十年的時(shí)間。

毫末智行發(fā)布的DriveGPT雪湖·海若則是使用GPT模型和技術(shù)邏輯的自動(dòng)駕駛算法模型。作為適用于自動(dòng)駕駛訓(xùn)練的大模型,DriveGPT雪湖·海若的能力是:

在預(yù)訓(xùn)練階段引入量產(chǎn)智能駕駛數(shù)據(jù),訓(xùn)練出一個(gè)初始模型。然后引入量產(chǎn)數(shù)據(jù)中的用戶接管片段,訓(xùn)練反饋模型。通過(guò)強(qiáng)化學(xué)習(xí),使用反饋模型不斷優(yōu)化迭代初始模型。

其基本邏輯是:

1、按概率生成多個(gè)場(chǎng)景序列,每個(gè)場(chǎng)景都是一個(gè)全局的場(chǎng)景,每個(gè)場(chǎng)景序列都是未來(lái)有可能發(fā)生的一種實(shí)際情況。

2、在所有場(chǎng)景序列都產(chǎn)生的情況下,把場(chǎng)景中最關(guān)注的自車行為軌跡給量化出來(lái),也就是生成場(chǎng)景的同時(shí),便會(huì)產(chǎn)生自車未來(lái)的軌跡信息。

3、有了這段軌跡之后,DriveGPT雪湖·海若還能在生成場(chǎng)景序列、軌跡的同時(shí),輸出整個(gè)決策邏輯鏈。

也就是說(shuō),利用DriveGPT雪湖·海若,在一個(gè)統(tǒng)一的生成式框架下,將規(guī)劃、決策與推理等多個(gè)任務(wù)全部完成。

有業(yè)內(nèi)人士認(rèn)為,通用型大模型的發(fā)展,將會(huì)使其成為一種如基礎(chǔ)設(shè)施般的存在。而對(duì)智能汽車來(lái)說(shuō),大模型能力對(duì)車輛智能化的推動(dòng)也將上升一個(gè)量級(jí)。

不過(guò),當(dāng)然,前提是如今倉(cāng)促進(jìn)場(chǎng)的各方能有足夠的投入將技術(shù)打磨成熟。

此前李彥宏曾表示文心一言與ChatGPT之間只差兩三個(gè)月,引發(fā)一波爭(zhēng)議。王小川則認(rèn)為有三年的差距。

文心一言與通義千問(wèn)已開(kāi)啟內(nèi)測(cè),而大部分項(xiàng)目仍處在公布階段。顯然,國(guó)內(nèi)大模型行業(yè)要走的路,還有很遠(yuǎn)。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。