正在閱讀:

開(kāi)源大模型的力量:為AI注入“靈魂”,和你一起玩劇本殺

掃一掃下載界面新聞APP

開(kāi)源大模型的力量:為AI注入“靈魂”,和你一起玩劇本殺

源1.0大模型參數(shù)、數(shù)據(jù)集、算力效率均超GPT-3,助力開(kāi)發(fā)者實(shí)現(xiàn)劇本殺AI創(chuàng)意。

文 | 智東西 楊暢

編輯 | 漠影

你有想過(guò)和AI(人工智能)玩劇本殺嗎,會(huì)是一種什么樣的體驗(yàn)?最近,一群腦洞大開(kāi)的開(kāi)發(fā)者們基于浪潮 源1.0大模型,開(kāi)發(fā)出了一個(gè)能和人玩劇本殺的AI(以下簡(jiǎn)稱:劇本殺AI)。這個(gè)AI不但可以從容回答你提出的各種相關(guān)問(wèn)題,還能向你拋出反問(wèn)。在游戲劇情解謎過(guò)程中,其余真人玩家可能察覺(jué)不出來(lái)他們是和AI在玩游戲。

浪潮 源1.0大模型是2021年9月浪潮發(fā)布的全球最大巨量模型(或稱單體模型)之一。源1.0大模型的模型參數(shù)規(guī)模達(dá)2457億,其中文訓(xùn)練數(shù)據(jù)集多達(dá)5TB,在2128個(gè)GPU上運(yùn)行了16天就完成了其參數(shù)的訓(xùn)練。參數(shù)規(guī)模、數(shù)據(jù)集、算力效率均超過(guò)業(yè)界知名的大模型GPT-3。

其實(shí)隨著浪潮 源1.0等各類大模型的陸續(xù)發(fā)布和開(kāi)源,這些算法基礎(chǔ)設(shè)施為各行業(yè)開(kāi)發(fā)者實(shí)現(xiàn)其創(chuàng)意構(gòu)想提供了強(qiáng)大的支撐,也為AI產(chǎn)業(yè)的發(fā)展和其他產(chǎn)業(yè)的數(shù)字化轉(zhuǎn)型提供了助力。同時(shí),大模型的出現(xiàn)為強(qiáng)人工智能的實(shí)現(xiàn)提供了更多的可能。

強(qiáng)人工智能即具備和人類一樣甚至超過(guò)人類的AI一直是AI領(lǐng)域的研究目標(biāo)之一。目前的AI已經(jīng)能完成一些需要?jiǎng)?chuàng)造力的任務(wù),如作詩(shī)、寫歌、畫畫等。

人們期待著AI能夠理解人的情感或者博弈,所以不斷有開(kāi)發(fā)者嘗試像劇本殺AI類似的創(chuàng)造性AI項(xiàng)目的開(kāi)發(fā)。那么這樣一個(gè)能與人互相博弈的AI是如何開(kāi)發(fā)出來(lái)的?為什么其開(kāi)發(fā)者說(shuō)浪潮 源1.0大模型給項(xiàng)目開(kāi)發(fā)和創(chuàng)意實(shí)現(xiàn)帶來(lái)了顛覆性變化?

元宇宙的智能核心竟然是大模型?智東西與浪潮人工智能研究院首席研究員吳韶華、劇本殺AI開(kāi)發(fā)者、VR/AR資深從業(yè)者無(wú)空(工作昵稱)進(jìn)行了深入交流,發(fā)現(xiàn)想要實(shí)現(xiàn)真正的強(qiáng)人工智能存在多重困難,讓AI擁有類人的情感和思考更是充滿巨大的挑戰(zhàn),不過(guò)浪潮等AI前沿技術(shù)探索者們一直在這方面進(jìn)行不斷的探索和嘗試。

01.只有一位有代碼經(jīng)驗(yàn)5人團(tuán)如何開(kāi)發(fā)出劇本殺AI?

無(wú)空談道,他一直關(guān)注AI驅(qū)動(dòng)內(nèi)容生成相關(guān)的產(chǎn)業(yè)進(jìn)展,留意到2021年以來(lái)不少國(guó)內(nèi)科技企業(yè)紛紛發(fā)布了其開(kāi)發(fā)的大模型,其中就有像浪潮 源1.0這種針對(duì)中文自然語(yǔ)言處理的大模型。他說(shuō),看到浪潮 源1.0大模型開(kāi)源的消息后,他就去申請(qǐng)了浪潮 源1.0大模型的API,想體驗(yàn)浪潮開(kāi)源出來(lái)的這個(gè)大模型。

2022年1月份,API申請(qǐng)通過(guò),拿到浪潮 源1.0大模型的API后,無(wú)空就嘗試了一個(gè)簡(jiǎn)單的demo試驗(yàn)。在他看來(lái)利用大模型生成的模擬對(duì)話都是符合正常人表達(dá)邏輯的,這讓他很震驚,因?yàn)檫@強(qiáng)于之前所見(jiàn)的大多數(shù)模型。體驗(yàn)到浪潮 源1.0大模型在目的性對(duì)話生成方面具備的突出性能后,無(wú)空想到劇本殺可能是更好的一個(gè)利用大模型的思路。

然后,他和與他有相同興趣的四名高校學(xué)生一起組成了一個(gè)團(tuán)隊(duì),開(kāi)始嘗試用源1.0大模型來(lái)實(shí)現(xiàn)他們?cè)O(shè)想的能與人一起玩劇本殺的AI。劇本殺AI團(tuán)隊(duì)選定了一個(gè)線上微型劇本殺游戲劇本。這個(gè)劇本需要五位玩家共同參與,游戲過(guò)程在微信上進(jìn)行。

劇本殺AI團(tuán)隊(duì)設(shè)定其中的四個(gè)角色由真人玩家扮演,剩下的一個(gè)角色由AI扮演,本著細(xì)節(jié)拉滿的原則,開(kāi)發(fā)者為AI也準(zhǔn)備了一個(gè)微信賬號(hào),并設(shè)好了昵稱、頭像和近三天的朋友圈內(nèi)容。

這個(gè)劇本殺的劇情設(shè)置是:經(jīng)過(guò)科技公司巨頭“北極鵝”腦機(jī)接口改造的AI人蔡曉(劇本殺AI)已經(jīng)加入到某高校的推理社團(tuán),計(jì)劃推動(dòng)社團(tuán)的其余人同意和科技公司巨頭“北極鵝”合作,控制推理社,從而幫助“北極鵝”擴(kuò)大其腦機(jī)接口試驗(yàn)范圍。其余真人玩家也有各自有要達(dá)成的目標(biāo)。通過(guò)文字交流,各角色之間進(jìn)行博弈。

如何實(shí)現(xiàn)讓AI能像真人一樣參與到劇本殺游戲中?浪潮 源1.0大模型是一種生成式預(yù)訓(xùn)練模型(GPT),其使用的模型結(jié)構(gòu)是Language Model(LM),擅長(zhǎng)零樣本和小樣本學(xué)習(xí)。劇本殺AI開(kāi)發(fā)團(tuán)隊(duì)最終采取的方案是建立example語(yǔ)料庫(kù),然后針對(duì)每次的提問(wèn)內(nèi)容,從example語(yǔ)料庫(kù)中選取三個(gè)最符合的example作為模型生成的小樣本輸入。

因?yàn)锳I需要根據(jù)劇情對(duì)不同角色要采取不同的回答策略,所以語(yǔ)料庫(kù)被分裝為4個(gè)TXT文件,AI會(huì)根據(jù)提問(wèn)者選擇對(duì)應(yīng)的語(yǔ)料來(lái)源,然后生成其回復(fù)內(nèi)容。除了無(wú)空之外,其余四位劇本殺AI團(tuán)隊(duì)成員并沒(méi)有代碼經(jīng)驗(yàn),他們主要負(fù)責(zé)的就是語(yǔ)料庫(kù)的完善,不斷根據(jù)公測(cè)結(jié)果對(duì)AI回答的比較差的問(wèn)題進(jìn)行相關(guān)語(yǔ)料的補(bǔ)充。

無(wú)空說(shuō),他們團(tuán)隊(duì)在開(kāi)發(fā)劇本殺AI后,已經(jīng)進(jìn)行了三輪公測(cè),主要收到了三類反饋。第一類反饋是有些出乎劇本殺AI團(tuán)隊(duì)意料之外的,無(wú)空談道其實(shí)他們是不想讓人類玩家意識(shí)到是有一位AI玩家的,從實(shí)際的玩家反饋來(lái)看,不少人的第一反應(yīng)是沒(méi)發(fā)現(xiàn)其中一位玩家是AI,他們更關(guān)注游戲劇情進(jìn)展。而當(dāng)玩家得知是和AI一起玩劇本殺,他們也樂(lè)意去和AI進(jìn)行更多的交流。第二類反饋是目前版本的劇本殺AI還存在一些限制,比如需要有4個(gè)真人玩家才能開(kāi)始劇本殺游戲測(cè)試;單純的文字交流影響游戲體驗(yàn),因?yàn)榫€上文字劇本殺不如線下劇本殺還能觀察其他玩家的肢體、面部表情等語(yǔ)言之外輔助推理的細(xì)節(jié)。

第三類是玩家感覺(jué)AI的回復(fù)效果還有很大提升空間,AI生成的回復(fù)有很大的不確定性。在體驗(yàn)過(guò)浪潮 源1.0大模型在助力開(kāi)發(fā)方面的能力后,劇本殺AI團(tuán)隊(duì)還提煉出了一套端到端的對(duì)話生成機(jī)制方案,該方案比傳統(tǒng)的對(duì)話生成模式更靈活,開(kāi)發(fā)周期更短,效果更好。

他們還嘗試將這種方案應(yīng)用在社區(qū)基層工作效率提升方面,幫助社區(qū)志愿者解決難以短時(shí)間內(nèi)將同樣的公告內(nèi)容發(fā)到幾十個(gè)微信群中的困難。無(wú)空講到未來(lái)他們會(huì)基于浪潮 源1.0的升級(jí)迭代,將其劇本殺AI進(jìn)行進(jìn)一步的優(yōu)化和迭代,開(kāi)發(fā)出更成熟的作品,讓更多人可以體驗(yàn)劇本殺AI。同時(shí),他們還會(huì)進(jìn)一步研究其提煉出的端到端的對(duì)話能力如何更好地在治理、服務(wù)等領(lǐng)域?qū)崿F(xiàn)應(yīng)用和賦能。他總結(jié)說(shuō),大模型對(duì)于相關(guān)AI應(yīng)用開(kāi)發(fā)來(lái)說(shuō),帶來(lái)的變化是顛覆性的,不僅僅是開(kāi)發(fā)時(shí)間和開(kāi)發(fā)流程上的優(yōu)化。

未來(lái),或許有開(kāi)發(fā)者可以通過(guò)大模型為元宇宙中的虛擬數(shù)字人注入“靈魂”,讓虛擬人能更自然和靈活地與人交流。同時(shí),大模型運(yùn)算對(duì)于數(shù)據(jù)和算力有較高的要求,對(duì)于想使用大模型的開(kāi)發(fā)者來(lái)說(shuō)這可能是其面臨的主要難題之一。

不同大模型的開(kāi)源程度不同,無(wú)空說(shuō),浪潮 源1.0以API的形式為開(kāi)發(fā)者提供開(kāi)源服務(wù),降低了開(kāi)發(fā)者的使用門檻,讓開(kāi)發(fā)者可以將其精力更多的投入到創(chuàng)意構(gòu)思方面。

02.4個(gè)技能模型助力大模型落地API模式實(shí)現(xiàn)深度開(kāi)源

2020年時(shí)OpenAI推出GPT-3,引發(fā)了AI行業(yè)對(duì)于大模型的各種思考。浪潮人工智能研究院首席研究員吳韶華談道,浪潮當(dāng)時(shí)選擇進(jìn)行大模型的研究主要有兩方面的考量。

一是浪潮當(dāng)時(shí)就看到了GPT-3這類大模型在小樣本、零樣本情況下的學(xué)習(xí)能力,以及基于此的自然語(yǔ)言處理能力;還有就是大模型能夠同時(shí)支撐多個(gè)不同任務(wù)的能力。

浪潮認(rèn)為大模型會(huì)對(duì)AI算法研發(fā)產(chǎn)生非常深刻的影響,也代表著一種新的趨勢(shì)。

二是,吳韶華補(bǔ)充說(shuō),能開(kāi)發(fā)大模型也是依托浪潮在大規(guī)模算力算法上面有多年的持續(xù)積累,并且有相關(guān)的基礎(chǔ)。基于這些考量,浪潮研發(fā)并推出了源1.0大模型。

源1.0大模型專注于NLP(自然語(yǔ)言處理)領(lǐng)域,能夠創(chuàng)建生成任何具有語(yǔ)言結(jié)構(gòu)的語(yǔ)言表達(dá),能夠做到包括自動(dòng)問(wèn)答、論文撰寫、詩(shī)歌寫作、新聞報(bào)道、總結(jié)長(zhǎng)文本、翻譯語(yǔ)言等任務(wù),甚至還可以“寫”計(jì)算機(jī)代碼。

更重要的一點(diǎn)是源1.0大模型還可以理解文字背后的含義,并抽取其中的關(guān)鍵信息,如應(yīng)用于智能客服對(duì)話時(shí)感知用戶情緒,更智能地給出回應(yīng)。

在發(fā)布后不久,2021年10月,浪潮開(kāi)源了源1.0,并發(fā)布“源1.0”開(kāi)源開(kāi)放計(jì)劃,在GitHub等開(kāi)源社區(qū)開(kāi)源了其大模型的模型訓(xùn)練代碼、推理代碼、應(yīng)用代碼,開(kāi)放API等,助力開(kāi)發(fā)者更高效地實(shí)現(xiàn)AI應(yīng)用的開(kāi)發(fā)。

浪潮不僅開(kāi)放了相關(guān)的代碼以及大模型使用的API,同時(shí)還開(kāi)放出了1TB的語(yǔ)料數(shù)據(jù)集,這些語(yǔ)料數(shù)據(jù)集是來(lái)自當(dāng)初浪潮訓(xùn)練大模型的基礎(chǔ)數(shù)據(jù)集。吳韶華提到浪潮開(kāi)源 源1.0大模型從四個(gè)方面為開(kāi)發(fā)者提供支撐或說(shuō)提升開(kāi)發(fā)者創(chuàng)意實(shí)現(xiàn)的效率。

一是浪潮開(kāi)源了直接可用的代碼示例,可以幫助開(kāi)發(fā)者節(jié)省各類研發(fā)開(kāi)支。二是浪潮 源1.0大模型的開(kāi)源模式之一是向開(kāi)發(fā)者提供大模型API,顯著降低了開(kāi)發(fā)者應(yīng)用開(kāi)發(fā)的門檻。不同知識(shí)背景的各行業(yè)用戶可以驅(qū)動(dòng)大模型創(chuàng)造更多的可能,就像劇本殺AI一樣。用戶可以完全通過(guò)模型的能力和開(kāi)發(fā)的API就能創(chuàng)造各種不同的任務(wù),實(shí)現(xiàn)不同內(nèi)容的交互,將部分繁瑣的開(kāi)發(fā)流程省略。

浪潮在降低開(kāi)發(fā)門檻上面還進(jìn)行了兩類探索,一個(gè)是APIExp的工具,讓用戶直接通過(guò)網(wǎng)頁(yè)與大模型交流,一個(gè)是研發(fā)了一款沙箱工具,同樣是通過(guò)網(wǎng)頁(yè)直接選擇用戶所需的創(chuàng)意效果。三是浪潮將源1.0大模型相關(guān)的訓(xùn)練數(shù)據(jù)開(kāi)源,能助力用戶實(shí)現(xiàn)業(yè)務(wù)模型或代碼優(yōu)化。吳韶華舉例說(shuō),有開(kāi)發(fā)者直接利用浪潮開(kāi)源的數(shù)據(jù)集來(lái)對(duì)其模型進(jìn)行二次訓(xùn)練,得到了明顯的精度提升,訓(xùn)練結(jié)果甚至登頂CLUE基準(zhǔn)評(píng)測(cè)榜單。四是浪潮會(huì)給到利用源1.0大模型的開(kāi)發(fā)者一些持續(xù)的支撐,進(jìn)而實(shí)現(xiàn)開(kāi)源社區(qū)交流共贏。

浪潮為開(kāi)發(fā)者提供持續(xù)的支持,有專門的運(yùn)營(yíng)團(tuán)隊(duì)與開(kāi)發(fā)者建立聯(lián)系,建立社區(qū),增進(jìn)彼此之間的交流,更及時(shí)地了解開(kāi)發(fā)者在技術(shù)和使用方式上的問(wèn)題。同時(shí)浪潮也會(huì)第一時(shí)間給出相關(guān)問(wèn)題的反饋。一些深入的技術(shù)問(wèn)題,浪潮會(huì)投入專門的研發(fā)團(tuán)隊(duì)進(jìn)行進(jìn)一步的研究和支持,交流的成果還會(huì)以代碼的方式進(jìn)行開(kāi)源。

吳韶華談道,因?yàn)樵?.0大模型的應(yīng)用場(chǎng)景多元,浪潮目前基于大模型推出了4個(gè)面向不同場(chǎng)景的技能模型。這四個(gè)模型都經(jīng)過(guò)了場(chǎng)景化數(shù)據(jù)的增強(qiáng),表現(xiàn)精度更好,所需算力相對(duì)更小一些。

第一個(gè)是古文模型,可以“寫”詩(shī)詞歌賦,同時(shí)具備古文解析能力。第二個(gè)技能模型是對(duì)話模型,主要面向虛擬人、智能助手場(chǎng)景。第三個(gè)是翻譯技能模型,中英文翻譯準(zhǔn)確度和流暢度上均有不錯(cuò)表現(xiàn)。第四個(gè)技能模型是問(wèn)答模型,主要是面向智能客服場(chǎng)景,該模型具備語(yǔ)義級(jí)知識(shí)檢索能力,可以做到多領(lǐng)域支持。

03.大模型或成元宇宙智能核心源2.0瞄準(zhǔn)多模態(tài)交互

當(dāng)了解完劇本殺AI和源1.0大模型后,我們還能看到,其實(shí)這個(gè)劇本殺AI開(kāi)發(fā)項(xiàng)目也引發(fā)了一些人對(duì)于大模型與元宇宙之間關(guān)系更多的思考。其實(shí),源1.0大模型以及基于大模型的四個(gè)技能模型,都是專注于自然語(yǔ)言理解的,可幫助人機(jī)交互場(chǎng)景的實(shí)現(xiàn),可應(yīng)用于虛擬人、元宇宙領(lǐng)域。

劇本殺AI開(kāi)發(fā)者提到他感覺(jué)在未來(lái)的元宇宙中,虛擬人的數(shù)量將數(shù)倍于真人,這樣才能帶來(lái)比現(xiàn)實(shí)更好的體驗(yàn)。然而目前的虛擬人外表都很好看,但是都是“提線木偶”,更多地依賴于開(kāi)發(fā)者的設(shè)定,而他們希望為虛擬人注入“靈魂”,讓它能更靈活自然地與人交互。

這也是他們進(jìn)行劇本殺AI開(kāi)發(fā)的另一層考慮。吳韶華說(shuō),關(guān)于大模型和元宇宙這兩個(gè)智能行業(yè)的熱門方向,他認(rèn)為在元宇宙中大模型會(huì)成為其智能的核心,主要有兩方面原因,一是大模型的泛化能力,可以支撐多任務(wù);二是大模型體現(xiàn)了更高的智能化水平,在人機(jī)交互中,會(huì)給人更真實(shí)地感受。

浪潮一直在持續(xù)優(yōu)化源1.0大模型,未來(lái)可能面向更多場(chǎng)景,基于開(kāi)發(fā)者的需求,推出更多的類似技能模型的新模型。吳韶華還透露,浪潮目前也在規(guī)劃源2.0大模型的開(kāi)發(fā)工作。源2.0大模型會(huì)瞄準(zhǔn)多模態(tài)交互進(jìn)行相關(guān)的研發(fā)布局。

04.結(jié)語(yǔ):開(kāi)源大模型泛化應(yīng)用有望助力產(chǎn)業(yè)轉(zhuǎn)型

劇本殺AI的開(kāi)發(fā)一方面體現(xiàn)了業(yè)界對(duì)于強(qiáng)人工智能、人機(jī)交互的更多探索,另一方面也為我們展示了開(kāi)源大模型在其他行業(yè)智能應(yīng)用開(kāi)發(fā)方面的能力。

除了劇本殺AI之外,詩(shī)詞寫作、智能客服、個(gè)人智能助手等等基于浪潮 源1.0大模型開(kāi)發(fā)的各種應(yīng)用也陸續(xù)進(jìn)入大眾的視野。未來(lái)在智能客服、虛擬數(shù)字人等方面,基于大模型的開(kāi)發(fā)存在更多泛化的應(yīng)用場(chǎng)景。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

開(kāi)源大模型的力量:為AI注入“靈魂”,和你一起玩劇本殺

源1.0大模型參數(shù)、數(shù)據(jù)集、算力效率均超GPT-3,助力開(kāi)發(fā)者實(shí)現(xiàn)劇本殺AI創(chuàng)意。

文 | 智東西 楊暢

編輯 | 漠影

你有想過(guò)和AI(人工智能)玩劇本殺嗎,會(huì)是一種什么樣的體驗(yàn)?最近,一群腦洞大開(kāi)的開(kāi)發(fā)者們基于浪潮 源1.0大模型,開(kāi)發(fā)出了一個(gè)能和人玩劇本殺的AI(以下簡(jiǎn)稱:劇本殺AI)。這個(gè)AI不但可以從容回答你提出的各種相關(guān)問(wèn)題,還能向你拋出反問(wèn)。在游戲劇情解謎過(guò)程中,其余真人玩家可能察覺(jué)不出來(lái)他們是和AI在玩游戲。

浪潮 源1.0大模型是2021年9月浪潮發(fā)布的全球最大巨量模型(或稱單體模型)之一。源1.0大模型的模型參數(shù)規(guī)模達(dá)2457億,其中文訓(xùn)練數(shù)據(jù)集多達(dá)5TB,在2128個(gè)GPU上運(yùn)行了16天就完成了其參數(shù)的訓(xùn)練。參數(shù)規(guī)模、數(shù)據(jù)集、算力效率均超過(guò)業(yè)界知名的大模型GPT-3。

其實(shí)隨著浪潮 源1.0等各類大模型的陸續(xù)發(fā)布和開(kāi)源,這些算法基礎(chǔ)設(shè)施為各行業(yè)開(kāi)發(fā)者實(shí)現(xiàn)其創(chuàng)意構(gòu)想提供了強(qiáng)大的支撐,也為AI產(chǎn)業(yè)的發(fā)展和其他產(chǎn)業(yè)的數(shù)字化轉(zhuǎn)型提供了助力。同時(shí),大模型的出現(xiàn)為強(qiáng)人工智能的實(shí)現(xiàn)提供了更多的可能。

強(qiáng)人工智能即具備和人類一樣甚至超過(guò)人類的AI一直是AI領(lǐng)域的研究目標(biāo)之一。目前的AI已經(jīng)能完成一些需要?jiǎng)?chuàng)造力的任務(wù),如作詩(shī)、寫歌、畫畫等。

人們期待著AI能夠理解人的情感或者博弈,所以不斷有開(kāi)發(fā)者嘗試像劇本殺AI類似的創(chuàng)造性AI項(xiàng)目的開(kāi)發(fā)。那么這樣一個(gè)能與人互相博弈的AI是如何開(kāi)發(fā)出來(lái)的?為什么其開(kāi)發(fā)者說(shuō)浪潮 源1.0大模型給項(xiàng)目開(kāi)發(fā)和創(chuàng)意實(shí)現(xiàn)帶來(lái)了顛覆性變化?

元宇宙的智能核心竟然是大模型?智東西與浪潮人工智能研究院首席研究員吳韶華、劇本殺AI開(kāi)發(fā)者、VR/AR資深從業(yè)者無(wú)空(工作昵稱)進(jìn)行了深入交流,發(fā)現(xiàn)想要實(shí)現(xiàn)真正的強(qiáng)人工智能存在多重困難,讓AI擁有類人的情感和思考更是充滿巨大的挑戰(zhàn),不過(guò)浪潮等AI前沿技術(shù)探索者們一直在這方面進(jìn)行不斷的探索和嘗試。

01.只有一位有代碼經(jīng)驗(yàn)5人團(tuán)如何開(kāi)發(fā)出劇本殺AI?

無(wú)空談道,他一直關(guān)注AI驅(qū)動(dòng)內(nèi)容生成相關(guān)的產(chǎn)業(yè)進(jìn)展,留意到2021年以來(lái)不少國(guó)內(nèi)科技企業(yè)紛紛發(fā)布了其開(kāi)發(fā)的大模型,其中就有像浪潮 源1.0這種針對(duì)中文自然語(yǔ)言處理的大模型。他說(shuō),看到浪潮 源1.0大模型開(kāi)源的消息后,他就去申請(qǐng)了浪潮 源1.0大模型的API,想體驗(yàn)浪潮開(kāi)源出來(lái)的這個(gè)大模型。

2022年1月份,API申請(qǐng)通過(guò),拿到浪潮 源1.0大模型的API后,無(wú)空就嘗試了一個(gè)簡(jiǎn)單的demo試驗(yàn)。在他看來(lái)利用大模型生成的模擬對(duì)話都是符合正常人表達(dá)邏輯的,這讓他很震驚,因?yàn)檫@強(qiáng)于之前所見(jiàn)的大多數(shù)模型。體驗(yàn)到浪潮 源1.0大模型在目的性對(duì)話生成方面具備的突出性能后,無(wú)空想到劇本殺可能是更好的一個(gè)利用大模型的思路。

然后,他和與他有相同興趣的四名高校學(xué)生一起組成了一個(gè)團(tuán)隊(duì),開(kāi)始嘗試用源1.0大模型來(lái)實(shí)現(xiàn)他們?cè)O(shè)想的能與人一起玩劇本殺的AI。劇本殺AI團(tuán)隊(duì)選定了一個(gè)線上微型劇本殺游戲劇本。這個(gè)劇本需要五位玩家共同參與,游戲過(guò)程在微信上進(jìn)行。

劇本殺AI團(tuán)隊(duì)設(shè)定其中的四個(gè)角色由真人玩家扮演,剩下的一個(gè)角色由AI扮演,本著細(xì)節(jié)拉滿的原則,開(kāi)發(fā)者為AI也準(zhǔn)備了一個(gè)微信賬號(hào),并設(shè)好了昵稱、頭像和近三天的朋友圈內(nèi)容。

這個(gè)劇本殺的劇情設(shè)置是:經(jīng)過(guò)科技公司巨頭“北極鵝”腦機(jī)接口改造的AI人蔡曉(劇本殺AI)已經(jīng)加入到某高校的推理社團(tuán),計(jì)劃推動(dòng)社團(tuán)的其余人同意和科技公司巨頭“北極鵝”合作,控制推理社,從而幫助“北極鵝”擴(kuò)大其腦機(jī)接口試驗(yàn)范圍。其余真人玩家也有各自有要達(dá)成的目標(biāo)。通過(guò)文字交流,各角色之間進(jìn)行博弈。

如何實(shí)現(xiàn)讓AI能像真人一樣參與到劇本殺游戲中?浪潮 源1.0大模型是一種生成式預(yù)訓(xùn)練模型(GPT),其使用的模型結(jié)構(gòu)是Language Model(LM),擅長(zhǎng)零樣本和小樣本學(xué)習(xí)。劇本殺AI開(kāi)發(fā)團(tuán)隊(duì)最終采取的方案是建立example語(yǔ)料庫(kù),然后針對(duì)每次的提問(wèn)內(nèi)容,從example語(yǔ)料庫(kù)中選取三個(gè)最符合的example作為模型生成的小樣本輸入。

因?yàn)锳I需要根據(jù)劇情對(duì)不同角色要采取不同的回答策略,所以語(yǔ)料庫(kù)被分裝為4個(gè)TXT文件,AI會(huì)根據(jù)提問(wèn)者選擇對(duì)應(yīng)的語(yǔ)料來(lái)源,然后生成其回復(fù)內(nèi)容。除了無(wú)空之外,其余四位劇本殺AI團(tuán)隊(duì)成員并沒(méi)有代碼經(jīng)驗(yàn),他們主要負(fù)責(zé)的就是語(yǔ)料庫(kù)的完善,不斷根據(jù)公測(cè)結(jié)果對(duì)AI回答的比較差的問(wèn)題進(jìn)行相關(guān)語(yǔ)料的補(bǔ)充。

無(wú)空說(shuō),他們團(tuán)隊(duì)在開(kāi)發(fā)劇本殺AI后,已經(jīng)進(jìn)行了三輪公測(cè),主要收到了三類反饋。第一類反饋是有些出乎劇本殺AI團(tuán)隊(duì)意料之外的,無(wú)空談道其實(shí)他們是不想讓人類玩家意識(shí)到是有一位AI玩家的,從實(shí)際的玩家反饋來(lái)看,不少人的第一反應(yīng)是沒(méi)發(fā)現(xiàn)其中一位玩家是AI,他們更關(guān)注游戲劇情進(jìn)展。而當(dāng)玩家得知是和AI一起玩劇本殺,他們也樂(lè)意去和AI進(jìn)行更多的交流。第二類反饋是目前版本的劇本殺AI還存在一些限制,比如需要有4個(gè)真人玩家才能開(kāi)始劇本殺游戲測(cè)試;單純的文字交流影響游戲體驗(yàn),因?yàn)榫€上文字劇本殺不如線下劇本殺還能觀察其他玩家的肢體、面部表情等語(yǔ)言之外輔助推理的細(xì)節(jié)。

第三類是玩家感覺(jué)AI的回復(fù)效果還有很大提升空間,AI生成的回復(fù)有很大的不確定性。在體驗(yàn)過(guò)浪潮 源1.0大模型在助力開(kāi)發(fā)方面的能力后,劇本殺AI團(tuán)隊(duì)還提煉出了一套端到端的對(duì)話生成機(jī)制方案,該方案比傳統(tǒng)的對(duì)話生成模式更靈活,開(kāi)發(fā)周期更短,效果更好。

他們還嘗試將這種方案應(yīng)用在社區(qū)基層工作效率提升方面,幫助社區(qū)志愿者解決難以短時(shí)間內(nèi)將同樣的公告內(nèi)容發(fā)到幾十個(gè)微信群中的困難。無(wú)空講到未來(lái)他們會(huì)基于浪潮 源1.0的升級(jí)迭代,將其劇本殺AI進(jìn)行進(jìn)一步的優(yōu)化和迭代,開(kāi)發(fā)出更成熟的作品,讓更多人可以體驗(yàn)劇本殺AI。同時(shí),他們還會(huì)進(jìn)一步研究其提煉出的端到端的對(duì)話能力如何更好地在治理、服務(wù)等領(lǐng)域?qū)崿F(xiàn)應(yīng)用和賦能。他總結(jié)說(shuō),大模型對(duì)于相關(guān)AI應(yīng)用開(kāi)發(fā)來(lái)說(shuō),帶來(lái)的變化是顛覆性的,不僅僅是開(kāi)發(fā)時(shí)間和開(kāi)發(fā)流程上的優(yōu)化。

未來(lái),或許有開(kāi)發(fā)者可以通過(guò)大模型為元宇宙中的虛擬數(shù)字人注入“靈魂”,讓虛擬人能更自然和靈活地與人交流。同時(shí),大模型運(yùn)算對(duì)于數(shù)據(jù)和算力有較高的要求,對(duì)于想使用大模型的開(kāi)發(fā)者來(lái)說(shuō)這可能是其面臨的主要難題之一。

不同大模型的開(kāi)源程度不同,無(wú)空說(shuō),浪潮 源1.0以API的形式為開(kāi)發(fā)者提供開(kāi)源服務(wù),降低了開(kāi)發(fā)者的使用門檻,讓開(kāi)發(fā)者可以將其精力更多的投入到創(chuàng)意構(gòu)思方面。

02.4個(gè)技能模型助力大模型落地API模式實(shí)現(xiàn)深度開(kāi)源

2020年時(shí)OpenAI推出GPT-3,引發(fā)了AI行業(yè)對(duì)于大模型的各種思考。浪潮人工智能研究院首席研究員吳韶華談道,浪潮當(dāng)時(shí)選擇進(jìn)行大模型的研究主要有兩方面的考量。

一是浪潮當(dāng)時(shí)就看到了GPT-3這類大模型在小樣本、零樣本情況下的學(xué)習(xí)能力,以及基于此的自然語(yǔ)言處理能力;還有就是大模型能夠同時(shí)支撐多個(gè)不同任務(wù)的能力。

浪潮認(rèn)為大模型會(huì)對(duì)AI算法研發(fā)產(chǎn)生非常深刻的影響,也代表著一種新的趨勢(shì)。

二是,吳韶華補(bǔ)充說(shuō),能開(kāi)發(fā)大模型也是依托浪潮在大規(guī)模算力算法上面有多年的持續(xù)積累,并且有相關(guān)的基礎(chǔ)?;谶@些考量,浪潮研發(fā)并推出了源1.0大模型。

源1.0大模型專注于NLP(自然語(yǔ)言處理)領(lǐng)域,能夠創(chuàng)建生成任何具有語(yǔ)言結(jié)構(gòu)的語(yǔ)言表達(dá),能夠做到包括自動(dòng)問(wèn)答、論文撰寫、詩(shī)歌寫作、新聞報(bào)道、總結(jié)長(zhǎng)文本、翻譯語(yǔ)言等任務(wù),甚至還可以“寫”計(jì)算機(jī)代碼。

更重要的一點(diǎn)是源1.0大模型還可以理解文字背后的含義,并抽取其中的關(guān)鍵信息,如應(yīng)用于智能客服對(duì)話時(shí)感知用戶情緒,更智能地給出回應(yīng)。

在發(fā)布后不久,2021年10月,浪潮開(kāi)源了源1.0,并發(fā)布“源1.0”開(kāi)源開(kāi)放計(jì)劃,在GitHub等開(kāi)源社區(qū)開(kāi)源了其大模型的模型訓(xùn)練代碼、推理代碼、應(yīng)用代碼,開(kāi)放API等,助力開(kāi)發(fā)者更高效地實(shí)現(xiàn)AI應(yīng)用的開(kāi)發(fā)。

浪潮不僅開(kāi)放了相關(guān)的代碼以及大模型使用的API,同時(shí)還開(kāi)放出了1TB的語(yǔ)料數(shù)據(jù)集,這些語(yǔ)料數(shù)據(jù)集是來(lái)自當(dāng)初浪潮訓(xùn)練大模型的基礎(chǔ)數(shù)據(jù)集。吳韶華提到浪潮開(kāi)源 源1.0大模型從四個(gè)方面為開(kāi)發(fā)者提供支撐或說(shuō)提升開(kāi)發(fā)者創(chuàng)意實(shí)現(xiàn)的效率。

一是浪潮開(kāi)源了直接可用的代碼示例,可以幫助開(kāi)發(fā)者節(jié)省各類研發(fā)開(kāi)支。二是浪潮 源1.0大模型的開(kāi)源模式之一是向開(kāi)發(fā)者提供大模型API,顯著降低了開(kāi)發(fā)者應(yīng)用開(kāi)發(fā)的門檻。不同知識(shí)背景的各行業(yè)用戶可以驅(qū)動(dòng)大模型創(chuàng)造更多的可能,就像劇本殺AI一樣。用戶可以完全通過(guò)模型的能力和開(kāi)發(fā)的API就能創(chuàng)造各種不同的任務(wù),實(shí)現(xiàn)不同內(nèi)容的交互,將部分繁瑣的開(kāi)發(fā)流程省略。

浪潮在降低開(kāi)發(fā)門檻上面還進(jìn)行了兩類探索,一個(gè)是APIExp的工具,讓用戶直接通過(guò)網(wǎng)頁(yè)與大模型交流,一個(gè)是研發(fā)了一款沙箱工具,同樣是通過(guò)網(wǎng)頁(yè)直接選擇用戶所需的創(chuàng)意效果。三是浪潮將源1.0大模型相關(guān)的訓(xùn)練數(shù)據(jù)開(kāi)源,能助力用戶實(shí)現(xiàn)業(yè)務(wù)模型或代碼優(yōu)化。吳韶華舉例說(shuō),有開(kāi)發(fā)者直接利用浪潮開(kāi)源的數(shù)據(jù)集來(lái)對(duì)其模型進(jìn)行二次訓(xùn)練,得到了明顯的精度提升,訓(xùn)練結(jié)果甚至登頂CLUE基準(zhǔn)評(píng)測(cè)榜單。四是浪潮會(huì)給到利用源1.0大模型的開(kāi)發(fā)者一些持續(xù)的支撐,進(jìn)而實(shí)現(xiàn)開(kāi)源社區(qū)交流共贏。

浪潮為開(kāi)發(fā)者提供持續(xù)的支持,有專門的運(yùn)營(yíng)團(tuán)隊(duì)與開(kāi)發(fā)者建立聯(lián)系,建立社區(qū),增進(jìn)彼此之間的交流,更及時(shí)地了解開(kāi)發(fā)者在技術(shù)和使用方式上的問(wèn)題。同時(shí)浪潮也會(huì)第一時(shí)間給出相關(guān)問(wèn)題的反饋。一些深入的技術(shù)問(wèn)題,浪潮會(huì)投入專門的研發(fā)團(tuán)隊(duì)進(jìn)行進(jìn)一步的研究和支持,交流的成果還會(huì)以代碼的方式進(jìn)行開(kāi)源。

吳韶華談道,因?yàn)樵?.0大模型的應(yīng)用場(chǎng)景多元,浪潮目前基于大模型推出了4個(gè)面向不同場(chǎng)景的技能模型。這四個(gè)模型都經(jīng)過(guò)了場(chǎng)景化數(shù)據(jù)的增強(qiáng),表現(xiàn)精度更好,所需算力相對(duì)更小一些。

第一個(gè)是古文模型,可以“寫”詩(shī)詞歌賦,同時(shí)具備古文解析能力。第二個(gè)技能模型是對(duì)話模型,主要面向虛擬人、智能助手場(chǎng)景。第三個(gè)是翻譯技能模型,中英文翻譯準(zhǔn)確度和流暢度上均有不錯(cuò)表現(xiàn)。第四個(gè)技能模型是問(wèn)答模型,主要是面向智能客服場(chǎng)景,該模型具備語(yǔ)義級(jí)知識(shí)檢索能力,可以做到多領(lǐng)域支持。

03.大模型或成元宇宙智能核心源2.0瞄準(zhǔn)多模態(tài)交互

當(dāng)了解完劇本殺AI和源1.0大模型后,我們還能看到,其實(shí)這個(gè)劇本殺AI開(kāi)發(fā)項(xiàng)目也引發(fā)了一些人對(duì)于大模型與元宇宙之間關(guān)系更多的思考。其實(shí),源1.0大模型以及基于大模型的四個(gè)技能模型,都是專注于自然語(yǔ)言理解的,可幫助人機(jī)交互場(chǎng)景的實(shí)現(xiàn),可應(yīng)用于虛擬人、元宇宙領(lǐng)域。

劇本殺AI開(kāi)發(fā)者提到他感覺(jué)在未來(lái)的元宇宙中,虛擬人的數(shù)量將數(shù)倍于真人,這樣才能帶來(lái)比現(xiàn)實(shí)更好的體驗(yàn)。然而目前的虛擬人外表都很好看,但是都是“提線木偶”,更多地依賴于開(kāi)發(fā)者的設(shè)定,而他們希望為虛擬人注入“靈魂”,讓它能更靈活自然地與人交互。

這也是他們進(jìn)行劇本殺AI開(kāi)發(fā)的另一層考慮。吳韶華說(shuō),關(guān)于大模型和元宇宙這兩個(gè)智能行業(yè)的熱門方向,他認(rèn)為在元宇宙中大模型會(huì)成為其智能的核心,主要有兩方面原因,一是大模型的泛化能力,可以支撐多任務(wù);二是大模型體現(xiàn)了更高的智能化水平,在人機(jī)交互中,會(huì)給人更真實(shí)地感受。

浪潮一直在持續(xù)優(yōu)化源1.0大模型,未來(lái)可能面向更多場(chǎng)景,基于開(kāi)發(fā)者的需求,推出更多的類似技能模型的新模型。吳韶華還透露,浪潮目前也在規(guī)劃源2.0大模型的開(kāi)發(fā)工作。源2.0大模型會(huì)瞄準(zhǔn)多模態(tài)交互進(jìn)行相關(guān)的研發(fā)布局。

04.結(jié)語(yǔ):開(kāi)源大模型泛化應(yīng)用有望助力產(chǎn)業(yè)轉(zhuǎn)型

劇本殺AI的開(kāi)發(fā)一方面體現(xiàn)了業(yè)界對(duì)于強(qiáng)人工智能、人機(jī)交互的更多探索,另一方面也為我們展示了開(kāi)源大模型在其他行業(yè)智能應(yīng)用開(kāi)發(fā)方面的能力。

除了劇本殺AI之外,詩(shī)詞寫作、智能客服、個(gè)人智能助手等等基于浪潮 源1.0大模型開(kāi)發(fā)的各種應(yīng)用也陸續(xù)進(jìn)入大眾的視野。未來(lái)在智能客服、虛擬數(shù)字人等方面,基于大模型的開(kāi)發(fā)存在更多泛化的應(yīng)用場(chǎng)景。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。