好男人的社区在线,色久综合网

在經(jīng)歷了上半年的「千模大戰(zhàn)」之后，如今已經(jīng)沒(méi)人會(huì)懷疑「人類已經(jīng)踏入 AI 時(shí)代」這件事。

但眼下，人們關(guān)于大模型的疑問(wèn)卻沒(méi)有因此變少：隨著包括 ChatGPT 在內(nèi)的消費(fèi)級(jí)生成式對(duì)話機(jī)器人的用戶增長(zhǎng)已經(jīng)顯出疲態(tài)，普通用戶對(duì) AI 大模型的關(guān)注度也在下降，但對(duì)于大模型的下一個(gè)最重要的應(yīng)用形態(tài)會(huì)是什么。沒(méi)人能說(shuō)得清。因此行業(yè)頭部玩家的每一步，都備受關(guān)注。

10月24日，在2023年科大訊飛全球 1024 開(kāi)發(fā)者節(jié)上，科大訊飛董事長(zhǎng)劉慶峰介紹了星火認(rèn)知大模型最新的 3.0 版本：除了前兩個(gè)版本中已有的文本生成、語(yǔ)言理解和多模態(tài)等能力提升，這次科大訊飛還重點(diǎn)升級(jí)了星火大模型的代碼能力。

在介紹 3.0 版本更新時(shí)，劉慶峰還宣布，不管是外部對(duì)通用認(rèn)知大模型的評(píng)測(cè)，還是根據(jù) OpenAI 構(gòu)建的測(cè)試集，星火大模型 3.0 在綜合能力上，都超越了 GPT-3.5。

星火大模型最初在五月發(fā)布，并在五月、八月、十月三個(gè)時(shí)間點(diǎn)快速迭代，將星火大模型迭代至 3.0 版本。如此迭代速度很難說(shuō)是科大訊飛在此期間真的獲得了突破性進(jìn)展，更像是科大訊飛在此之前數(shù)年在 AI 以及認(rèn)知智能領(lǐng)域的厚積薄發(fā)。

八月，在星火大模型 2.0 發(fā)布的同時(shí)，科大訊飛同時(shí)還宣布了與華為聯(lián)手、聯(lián)合攻關(guān)算力卡脖子的問(wèn)題，如今這項(xiàng)合作的成果也隨著 3.0 版本一起公布：科大訊飛與華為在算力上實(shí)現(xiàn)合作，聯(lián)合發(fā)布了基于昇騰芯片的大模型底座「飛星一號(hào)」平臺(tái)，在半年內(nèi)實(shí)現(xiàn)了將星火大模型訓(xùn)練與推理效率翻倍。

此前，科大訊飛已經(jīng)與華為合作推出了「星火一體機(jī)」，提示工程等5種定制優(yōu)化模式，開(kāi)箱即可使用，提供從底層算力、AI框架、訓(xùn)練算法、推理能力、應(yīng)用成效等AI能力。

對(duì)于從2019年開(kāi)始就已經(jīng)被美國(guó)列入實(shí)體清單的科大訊飛而言，國(guó)產(chǎn)自主算力一直都是在計(jì)劃之中的必選項(xiàng)：可控的算力也是未來(lái)進(jìn)一步拓展大模型使用場(chǎng)景的必然需求。這在今年10月17日，美國(guó)政府進(jìn)一步收緊限制，禁止英偉達(dá)和其他芯片制造商向中國(guó)銷售高性能半導(dǎo)體芯片 —— 包括 H800、A800 在內(nèi)多款原本還是可選項(xiàng)的 GPU 都即將無(wú)法購(gòu)買的背景下，更是時(shí)代需求：安全可控的自研算力是未來(lái)穩(wěn)定發(fā)展的關(guān)鍵，也是另一種意義上的「技術(shù)底座」。

劉慶峰同時(shí)還表示：基于對(duì)標(biāo) GPT-4 的下一代更大參數(shù)規(guī)模的大模型，已經(jīng)在基于訓(xùn)練中。預(yù)計(jì)將在2024年上半年發(fā)布，其使用的華為昇騰 910B 的算力，已經(jīng)基本可以對(duì)標(biāo)英偉達(dá) A100，這是自主大模型之路的底氣所在。

目前，星火大模型目前的注冊(cè)用戶數(shù)量已經(jīng)超過(guò) 1200 萬(wàn)，訊飛開(kāi)放平臺(tái)從五月后新增 17.8 萬(wàn)大模型開(kāi)發(fā)者，與華為合作構(gòu)建的自主算力平臺(tái)也已經(jīng)投入使用，在訊飛星火中已有4109個(gè)助手開(kāi)發(fā)者團(tuán)隊(duì)開(kāi)發(fā)出7862款星火助手；可以說(shuō)科大訊飛是目前少數(shù)幾個(gè)能構(gòu)建硬件/軟件/開(kāi)發(fā)者生態(tài)全棧布局的大模型玩家，因此科大訊飛的選擇自然備受關(guān)注。

但對(duì)于此時(shí)的科大訊飛，單一參數(shù)的對(duì)標(biāo)，似乎已經(jīng)不再是最需要優(yōu)先關(guān)注的對(duì)象：大模型已經(jīng)逐漸跨過(guò)了早期發(fā)展中「先上牌桌」的階段，開(kāi)始尋求在大模型的行業(yè)應(yīng)用中突圍，先一步搶占行業(yè)市場(chǎng)。國(guó)內(nèi)大模型廠商也逐漸減少大模型參數(shù)與性能的宣傳，而是更加聚焦于大模型的商業(yè)落地場(chǎng)景以及用戶數(shù)量。這本身就是行業(yè)更加成熟的表現(xiàn)。

即使如今的 GPT 4.0 已經(jīng)能從圖像中識(shí)別出畫(huà)面的信息、以及具備了生成圖片、視頻等進(jìn)階能力，仍然沒(méi)有完全解決那個(gè)最致命的問(wèn)題：通用大模型幾乎全部是基于網(wǎng)絡(luò)上公開(kāi)文獻(xiàn)與信息訓(xùn)練而來(lái)，這些信息中往往充斥著大量錯(cuò)誤、偏見(jiàn)甚至是謠言，這些導(dǎo)致模型數(shù)據(jù)中充斥著太多的噪音。

在很多行業(yè)場(chǎng)景中，專業(yè)用戶對(duì)于行業(yè)大模型所提供的數(shù)據(jù)要求更高，容錯(cuò)度也要更低，這意味著對(duì)大模型的可控、可修正能力也至關(guān)重要，但這些往往要求更多用戶本身的數(shù)據(jù)來(lái)做「最后一公里」級(jí)的訓(xùn)練與精調(diào)，才能在世紀(jì)場(chǎng)景中解決某個(gè)具體問(wèn)題 —— 這些即使放眼全球也仍算是罕有玩家深入的無(wú)人區(qū)。

「行業(yè)大模型需要更加前瞻的布局，有先手優(yōu)勢(shì)的玩家同時(shí)也承擔(dān)起了教育市場(chǎng)的任務(wù)」一位行業(yè)大模型領(lǐng)域分析師對(duì)電廠記者表達(dá)了關(guān)于大模型行業(yè)應(yīng)用落地的看法。認(rèn)為現(xiàn)有大模型廠商普遍選擇教育、醫(yī)療、自動(dòng)駕駛等應(yīng)用領(lǐng)域，其實(shí)在本輪 AI 浪潮之前已有深度介入。但如何挖掘 B 端用戶在流程中出現(xiàn)的深度需求，實(shí)現(xiàn)更快速的迭代開(kāi)發(fā)以及深度對(duì)接，才是下一個(gè)階段「千模大戰(zhàn)」需要關(guān)注的重點(diǎn)。

看清楚這一點(diǎn)，其實(shí)也就不難看懂科大訊飛在星火大模型上的布局：以行業(yè)大模型近期最常被提到的編程輔助能力舉例：其中具體到應(yīng)用場(chǎng)景，又分為代碼設(shè)計(jì)、開(kāi)發(fā)以及測(cè)試等不同階段。在開(kāi)發(fā)需求上又對(duì)應(yīng)了包括代碼生成、代碼補(bǔ)齊、代碼糾錯(cuò)、代碼解釋、單元測(cè)試生成等內(nèi)容。

這些細(xì)分領(lǐng)域的 Knowhow，是考驗(yàn)大模型多模態(tài)能力的關(guān)鍵，跟業(yè)務(wù)結(jié)合也是最困難的部分。在這一點(diǎn)上，科大訊飛的答案是搭載訊飛星火 V3.0 的智能編程助手 iFlvCode2.0。

按照科大訊飛給出的數(shù)據(jù)，iFlvCode2.0 發(fā)布后，發(fā)現(xiàn)產(chǎn)品在編程的設(shè)計(jì)階段提效 50%、開(kāi)發(fā)階段提效 37%、測(cè)試階段提效 44%，大幅提升軟件從業(yè)人員效率：科大訊飛展示了智慧課堂項(xiàng)目的從 Windows 到 Linux 跨平臺(tái)移植：該項(xiàng)目代碼超過(guò) 20 萬(wàn)行，在智能編程助手 iFlyCode 的幫助下，開(kāi)發(fā)時(shí)間從傳統(tǒng)方式在的三個(gè)月，縮短到了一個(gè)月。

在多模態(tài)方面，星火 3.0 夠理解更口語(yǔ)化表示、同時(shí)包含更多細(xì)節(jié)的 Prompt：發(fā)布會(huì)上，科大訊飛還用一個(gè)簡(jiǎn)單Prompt 展示大模型在代碼中的理解能力，要求大模型「用 Python 代碼畫(huà)出一個(gè)大大的心形，然后里面大大小小的五顏六色的很多星星逐步呈現(xiàn)出來(lái)」，這些包含復(fù)雜任務(wù)與理解能力的需求，既是目前 GPT 4 的短板，同時(shí)也從科大訊飛的展示中看到了更多可能。

除了代碼能力之外，科大訊飛還發(fā)布了 AI 心理咨詢師「小星」：這是一款基于星火認(rèn)知大模型、幫助青少年舒緩心理困擾的多模態(tài)心理產(chǎn)品，它能夠通過(guò)視頻、語(yǔ)音、文字等多模態(tài)方式與青少年展開(kāi)類人自由對(duì)話，理解青少年的情緒情感，表達(dá)接納與共情，促進(jìn)青少年自我覺(jué)察，并提供個(gè)性化行動(dòng)建議。

通過(guò) 550 萬(wàn)個(gè)心理分析評(píng)估數(shù)據(jù)以及 40 萬(wàn)篇期刊文獻(xiàn)，也能在共情能力上展現(xiàn)出不同于以往生成式對(duì)話機(jī)器人的一面，有自動(dòng)情感識(shí)別、個(gè)性化心理輔導(dǎo)等對(duì)話特征。

集成了癥狀自查、報(bào)告解讀、醫(yī)療信息快速查詢、健康檔案管理等功能的醫(yī)療大模型 —— 訊飛曉醫(yī) APP，是科大訊飛在本次 1024 開(kāi)發(fā)者大會(huì)中發(fā)布的另一項(xiàng)應(yīng)用：針對(duì)醫(yī)療場(chǎng)景容錯(cuò)率更低的天然需求，訊飛星火醫(yī)療大模型通過(guò)上線實(shí)際使用數(shù)據(jù)抽查 12 萬(wàn)例，并通過(guò)國(guó)家科技信息資源綜合利用與公共服務(wù)中心（STI）數(shù)據(jù)來(lái)輔助生成專業(yè)醫(yī)療內(nèi)容。即使用戶不知道該如何表達(dá)自己的病情，或是想要對(duì)比自己的體檢報(bào)告，都可以直接用最通俗的語(yǔ)言詢問(wèn)。

目前，訊飛星火醫(yī)療大模型在醫(yī)療海量知識(shí)問(wèn)答、醫(yī)療復(fù)雜語(yǔ)言理解、醫(yī)療專業(yè)文本生成、醫(yī)療診斷治療推薦的問(wèn)題回答正確率已經(jīng)超越了 GPT-4。這就是在行業(yè)應(yīng)用場(chǎng)景中最重要的部分 —— 與行業(yè)內(nèi)有實(shí)際需求的用戶深度合作，快速推動(dòng)大模型在具體場(chǎng)景內(nèi)更新迭代。

不難看出，「千模大戰(zhàn)」的下一階段，將會(huì)是各家大模型在商業(yè)應(yīng)用場(chǎng)景中落地的競(jìng)賽，技術(shù)能力直接決定了大模型未來(lái)在各種領(lǐng)域拓展的可能性，更多應(yīng)用場(chǎng)景的落地才能更快地體現(xiàn)出大模型的商業(yè)價(jià)值。未來(lái)不只是教育、代碼醫(yī)療領(lǐng)域，幾乎所有常見(jiàn)的行業(yè)應(yīng)用場(chǎng)景都有大模型發(fā)展成熟的可能：科大訊飛甚至展示了未來(lái)能應(yīng)用于工業(yè)等特種領(lǐng)域的機(jī)器人超腦平臺(tái) AIBOT，給 AI 賦予了形體讓其能夠處理更多復(fù)雜任務(wù)。

這些都依賴核心技術(shù)的支持，因此到了2023的下半年，「技術(shù)底座」成了大模型賽道頭部玩家越來(lái)越多提及的名詞同時(shí)在這個(gè)過(guò)程里，業(yè)務(wù)數(shù)據(jù)會(huì)成為稀缺資源。

「國(guó)產(chǎn)大模型必須正視和 GPT-4 的差距?！皣?guó)產(chǎn)大模型在復(fù)雜知識(shí)推理、小樣本快速學(xué)習(xí)、超長(zhǎng)文本處理、跨模態(tài)統(tǒng)一理解上距GPT4還有差距」劉慶峰表示，唯有實(shí)事求是的科學(xué)精神，才能真正實(shí)現(xiàn)超越。

但新的共識(shí)已經(jīng)出現(xiàn)：隨著大模型進(jìn)一步深入行業(yè)應(yīng)用，大模型行業(yè)很快將迎來(lái)另一次重新洗牌。這其中，有更多行業(yè)大模型實(shí)際使用經(jīng)驗(yàn)的科大訊飛，或許會(huì)成為這個(gè)時(shí)代，先一步「突圍」的大模型廠商。

在經(jīng)歷了上半年的「千模大戰(zhàn)」之后，如今已經(jīng)沒(méi)人會(huì)懷疑「人類已經(jīng)踏入 AI 時(shí)代」這件事。

歷史搜索全部刪除

熱門(mén)搜索

電廠 | 科大訊飛的「大模型突圍」

科大訊飛

評(píng)論

電廠 | 科大訊飛的「大模型突圍」