在經(jīng)歷了上半年的「千模大戰(zhàn)」之后,如今已經(jīng)沒(méi)人會(huì)懷疑「人類已經(jīng)踏入 AI 時(shí)代」這件事。
但眼下,人們關(guān)于大模型的疑問(wèn)卻沒(méi)有因此變少:隨著包括 ChatGPT 在內(nèi)的消費(fèi)級(jí)生成式對(duì)話機(jī)器人的用戶增長(zhǎng)已經(jīng)顯出疲態(tài),普通用戶對(duì) AI 大模型的關(guān)注度也在下降,但對(duì)于大模型的下一個(gè)最重要的應(yīng)用形態(tài)會(huì)是什么。沒(méi)人能說(shuō)得清。因此行業(yè)頭部玩家的每一步,都備受關(guān)注。
10月24日,在2023年科大訊飛全球 1024 開(kāi)發(fā)者節(jié)上,科大訊飛董事長(zhǎng)劉慶峰介紹了星火認(rèn)知大模型最新的 3.0 版本:除了前兩個(gè)版本中已有的文本生成、語(yǔ)言理解和多模態(tài)等能力提升,這次科大訊飛還重點(diǎn)升級(jí)了星火大模型的代碼能力。
在介紹 3.0 版本更新時(shí),劉慶峰還宣布,不管是外部對(duì)通用認(rèn)知大模型的評(píng)測(cè),還是根據(jù) OpenAI 構(gòu)建的測(cè)試集,星火大模型 3.0 在綜合能力上,都超越了 GPT-3.5。
星火大模型最初在五月發(fā)布,并在五月、八月、十月三個(gè)時(shí)間點(diǎn)快速迭代,將星火大模型迭代至 3.0 版本。如此迭代速度很難說(shuō)是科大訊飛在此期間真的獲得了突破性進(jìn)展,更像是科大訊飛在此之前數(shù)年在 AI 以及認(rèn)知智能領(lǐng)域的厚積薄發(fā)。
八月,在星火大模型 2.0 發(fā)布的同時(shí),科大訊飛同時(shí)還宣布了與華為聯(lián)手、聯(lián)合攻關(guān)算力卡脖子的問(wèn)題,如今這項(xiàng)合作的成果也隨著 3.0 版本一起公布:科大訊飛與華為在算力上實(shí)現(xiàn)合作,聯(lián)合發(fā)布了基于昇騰芯片的大模型底座「飛星一號(hào)」平臺(tái),在半年內(nèi)實(shí)現(xiàn)了將星火大模型訓(xùn)練與推理效率翻倍。
此前,科大訊飛已經(jīng)與華為合作推出了「星火一體機(jī)」,提示工程等5種定制優(yōu)化模式,開(kāi)箱即可使用,提供從底層算力、AI框架、訓(xùn)練算法、推理能力、應(yīng)用成效等AI能力。
對(duì)于從2019年開(kāi)始就已經(jīng)被美國(guó)列入實(shí)體清單的科大訊飛而言,國(guó)產(chǎn)自主算力一直都是在計(jì)劃之中的必選項(xiàng):可控的算力也是未來(lái)進(jìn)一步拓展大模型使用場(chǎng)景的必然需求。這在今年10月17日,美國(guó)政府進(jìn)一步收緊限制,禁止英偉達(dá)和其他芯片制造商向中國(guó)銷售高性能半導(dǎo)體芯片 —— 包括 H800、A800 在內(nèi)多款原本還是可選項(xiàng)的 GPU 都即將無(wú)法購(gòu)買的背景下,更是時(shí)代需求:安全可控的自研算力是未來(lái)穩(wěn)定發(fā)展的關(guān)鍵,也是另一種意義上的「技術(shù)底座」。
劉慶峰同時(shí)還表示:基于對(duì)標(biāo) GPT-4 的下一代更大參數(shù)規(guī)模的大模型,已經(jīng)在基于訓(xùn)練中。預(yù)計(jì)將在2024年上半年發(fā)布,其使用的華為昇騰 910B 的算力,已經(jīng)基本可以對(duì)標(biāo)英偉達(dá) A100,這是自主大模型之路的底氣所在。
目前,星火大模型目前的注冊(cè)用戶數(shù)量已經(jīng)超過(guò) 1200 萬(wàn),訊飛開(kāi)放平臺(tái)從五月后新增 17.8 萬(wàn)大模型開(kāi)發(fā)者,與華為合作構(gòu)建的自主算力平臺(tái)也已經(jīng)投入使用,在訊飛星火中已有4109個(gè)助手開(kāi)發(fā)者團(tuán)隊(duì)開(kāi)發(fā)出7862款星火助手;可以說(shuō)科大訊飛是目前少數(shù)幾個(gè)能構(gòu)建硬件/軟件/開(kāi)發(fā)者生態(tài)全棧布局的大模型玩家,因此科大訊飛的選擇自然備受關(guān)注。
但對(duì)于此時(shí)的科大訊飛,單一參數(shù)的對(duì)標(biāo),似乎已經(jīng)不再是最需要優(yōu)先關(guān)注的對(duì)象:大模型已經(jīng)逐漸跨過(guò)了早期發(fā)展中「先上牌桌」的階段,開(kāi)始尋求在大模型的行業(yè)應(yīng)用中突圍,先一步搶占行業(yè)市場(chǎng)。國(guó)內(nèi)大模型廠商也逐漸減少大模型參數(shù)與性能的宣傳,而是更加聚焦于大模型的商業(yè)落地場(chǎng)景以及用戶數(shù)量。這本身就是行業(yè)更加成熟的表現(xiàn)。
即使如今的 GPT 4.0 已經(jīng)能從圖像中識(shí)別出畫(huà)面的信息、以及具備了生成圖片、視頻等進(jìn)階能力,仍然沒(méi)有完全解決那個(gè)最致命的問(wèn)題:通用大模型幾乎全部是基于網(wǎng)絡(luò)上公開(kāi)文獻(xiàn)與信息訓(xùn)練而來(lái),這些信息中往往充斥著大量錯(cuò)誤、偏見(jiàn)甚至是謠言,這些導(dǎo)致模型數(shù)據(jù)中充斥著太多的噪音。
在很多行業(yè)場(chǎng)景中,專業(yè)用戶對(duì)于行業(yè)大模型所提供的數(shù)據(jù)要求更高,容錯(cuò)度也要更低,這意味著對(duì)大模型的可控、可修正能力也至關(guān)重要,但這些往往要求更多用戶本身的數(shù)據(jù)來(lái)做「最后一公里」級(jí)的訓(xùn)練與精調(diào),才能在世紀(jì)場(chǎng)景中解決某個(gè)具體問(wèn)題 —— 這些即使放眼全球也仍算是罕有玩家深入的無(wú)人區(qū)。
「行業(yè)大模型需要更加前瞻的布局,有先手優(yōu)勢(shì)的玩家同時(shí)也承擔(dān)起了教育市場(chǎng)的任務(wù)」一位行業(yè)大模型領(lǐng)域分析師對(duì)電廠記者表達(dá)了關(guān)于大模型行業(yè)應(yīng)用落地的看法。認(rèn)為現(xiàn)有大模型廠商普遍選擇教育、醫(yī)療、自動(dòng)駕駛等應(yīng)用領(lǐng)域,其實(shí)在本輪 AI 浪潮之前已有深度介入。但如何挖掘 B 端用戶在流程中出現(xiàn)的深度需求,實(shí)現(xiàn)更快速的迭代開(kāi)發(fā)以及深度對(duì)接,才是下一個(gè)階段「千模大戰(zhàn)」需要關(guān)注的重點(diǎn)。
看清楚這一點(diǎn),其實(shí)也就不難看懂科大訊飛在星火大模型上的布局:以行業(yè)大模型近期最常被提到的編程輔助能力舉例:其中具體到應(yīng)用場(chǎng)景,又分為代碼設(shè)計(jì)、開(kāi)發(fā)以及測(cè)試等不同階段。在開(kāi)發(fā)需求上又對(duì)應(yīng)了包括代碼生成、代碼補(bǔ)齊、代碼糾錯(cuò)、代碼解釋、單元測(cè)試生成等內(nèi)容。
這些細(xì)分領(lǐng)域的 Knowhow,是考驗(yàn)大模型多模態(tài)能力的關(guān)鍵,跟業(yè)務(wù)結(jié)合也是最困難的部分。在這一點(diǎn)上,科大訊飛的答案是搭載訊飛星火 V3.0 的智能編程助手 iFlvCode2.0。
按照科大訊飛給出的數(shù)據(jù),iFlvCode2.0 發(fā)布后,發(fā)現(xiàn)產(chǎn)品在編程的設(shè)計(jì)階段提效 50%、開(kāi)發(fā)階段提效 37%、測(cè)試階段提效 44%,大幅提升軟件從業(yè)人員效率:科大訊飛展示了智慧課堂項(xiàng)目的從 Windows 到 Linux 跨平臺(tái)移植:該項(xiàng)目代碼超過(guò) 20 萬(wàn)行,在智能編程助手 iFlyCode 的幫助下,開(kāi)發(fā)時(shí)間從傳統(tǒng)方式在的三個(gè)月,縮短到了一個(gè)月。
在多模態(tài)方面,星火 3.0 夠理解更口語(yǔ)化表示、同時(shí)包含更多細(xì)節(jié)的 Prompt:發(fā)布會(huì)上,科大訊飛還用一個(gè)簡(jiǎn)單Prompt 展示大模型在代碼中的理解能力,要求大模型「用 Python 代碼畫(huà)出一個(gè)大大的心形,然后里面大大小小的五顏六色的很多星星逐步呈現(xiàn)出來(lái)」,這些包含復(fù)雜任務(wù)與理解能力的需求,既是目前 GPT 4 的短板,同時(shí)也從科大訊飛的展示中看到了更多可能。
除了代碼能力之外,科大訊飛還發(fā)布了 AI 心理咨詢師「小星」:這是一款基于星火認(rèn)知大模型、幫助青少年舒緩心理困擾的多模態(tài)心理產(chǎn)品,它能夠通過(guò)視頻、語(yǔ)音、文字等多模態(tài)方式與青少年展開(kāi)類人自由對(duì)話,理解青少年的情緒情感,表達(dá)接納與共情,促進(jìn)青少年自我覺(jué)察,并提供個(gè)性化行動(dòng)建議。
通過(guò) 550 萬(wàn)個(gè)心理分析評(píng)估數(shù)據(jù)以及 40 萬(wàn)篇期刊文獻(xiàn),也能在共情能力上展現(xiàn)出不同于以往生成式對(duì)話機(jī)器人的一面,有自動(dòng)情感識(shí)別、個(gè)性化心理輔導(dǎo)等對(duì)話特征。
集成了癥狀自查、報(bào)告解讀、醫(yī)療信息快速查詢、健康檔案管理等功能的醫(yī)療大模型 —— 訊飛曉醫(yī) APP,是科大訊飛在本次 1024 開(kāi)發(fā)者大會(huì)中發(fā)布的另一項(xiàng)應(yīng)用:針對(duì)醫(yī)療場(chǎng)景容錯(cuò)率更低的天然需求,訊飛星火醫(yī)療大模型通過(guò)上線實(shí)際使用數(shù)據(jù)抽查 12 萬(wàn)例,并通過(guò)國(guó)家科技信息資源綜合利用與公共服務(wù)中心(STI)數(shù)據(jù)來(lái)輔助生成專業(yè)醫(yī)療內(nèi)容。即使用戶不知道該如何表達(dá)自己的病情,或是想要對(duì)比自己的體檢報(bào)告,都可以直接用最通俗的語(yǔ)言詢問(wèn)。
目前,訊飛星火醫(yī)療大模型在醫(yī)療海量知識(shí)問(wèn)答、醫(yī)療復(fù)雜語(yǔ)言理解、醫(yī)療專業(yè)文本生成、醫(yī)療診斷治療推薦的問(wèn)題回答正確率已經(jīng)超越了 GPT-4。這就是在行業(yè)應(yīng)用場(chǎng)景中最重要的部分 —— 與行業(yè)內(nèi)有實(shí)際需求的用戶深度合作,快速推動(dòng)大模型在具體場(chǎng)景內(nèi)更新迭代。
不難看出,「千模大戰(zhàn)」的下一階段,將會(huì)是各家大模型在商業(yè)應(yīng)用場(chǎng)景中落地的競(jìng)賽,技術(shù)能力直接決定了大模型未來(lái)在各種領(lǐng)域拓展的可能性,更多應(yīng)用場(chǎng)景的落地才能更快地體現(xiàn)出大模型的商業(yè)價(jià)值。未來(lái)不只是教育、代碼醫(yī)療領(lǐng)域,幾乎所有常見(jiàn)的行業(yè)應(yīng)用場(chǎng)景都有大模型發(fā)展成熟的可能:科大訊飛甚至展示了未來(lái)能應(yīng)用于工業(yè)等特種領(lǐng)域的機(jī)器人超腦平臺(tái) AIBOT,給 AI 賦予了形體讓其能夠處理更多復(fù)雜任務(wù)。
這些都依賴核心技術(shù)的支持,因此到了2023的下半年,「技術(shù)底座」成了大模型賽道頭部玩家越來(lái)越多提及的名詞同時(shí)在這個(gè)過(guò)程里,業(yè)務(wù)數(shù)據(jù)會(huì)成為稀缺資源。
「國(guó)產(chǎn)大模型必須正視和 GPT-4 的差距?!皣?guó)產(chǎn)大模型在復(fù)雜知識(shí)推理、小樣本快速學(xué)習(xí)、超長(zhǎng)文本處理、跨模態(tài)統(tǒng)一理解上距GPT4還有差距」劉慶峰表示,唯有實(shí)事求是的科學(xué)精神,才能真正實(shí)現(xiàn)超越。
但新的共識(shí)已經(jīng)出現(xiàn):隨著大模型進(jìn)一步深入行業(yè)應(yīng)用,大模型行業(yè)很快將迎來(lái)另一次重新洗牌。這其中,有更多行業(yè)大模型實(shí)際使用經(jīng)驗(yàn)的科大訊飛,或許會(huì)成為這個(gè)時(shí)代,先一步「突圍」的大模型廠商。