文|數(shù)智前線 徐鑫
編輯|任曉漁
大模型熱潮下,數(shù)字人賽道變得熱鬧起來(lái)。文旅、電商、金融等多個(gè)行業(yè),形形色色的虛擬數(shù)字人,正代替真人,扮演著代言人、主播、客服和智能助理的角色。
市場(chǎng)的參與者也肉眼可見(jiàn)變多?;ヂ?lián)網(wǎng)大廠、創(chuàng)業(yè)公司、老牌AI公司和一些此前做智能客服營(yíng)銷的數(shù)字服務(wù)商都卷進(jìn)了這個(gè)賽道。IDC中國(guó)研究總監(jiān)盧言霞告訴數(shù)智前線,入口屬性是大量企業(yè)爭(zhēng)相布局這一賽道的原因。生成式AI熱潮下,數(shù)字人被視作未來(lái)使用自然語(yǔ)言與機(jī)器交互的入口級(jí)產(chǎn)品之一,推動(dòng)了市場(chǎng)熱度提升。
2022年6月IDC在報(bào)告中預(yù)計(jì),到2026年中國(guó)AI數(shù)字人市場(chǎng)規(guī)模將達(dá)到102.4億元人民幣。隨著熱度大增,數(shù)字人市場(chǎng)規(guī)??赡軐⒏爝_(dá)到這一水平。
值得一提的是,當(dāng)下仍處在大模型驅(qū)動(dòng)數(shù)字人產(chǎn)品應(yīng)用落地的早期階段。一方面,業(yè)界認(rèn)為,數(shù)字人市場(chǎng)體量的變化要到明年有規(guī)?;涞睾蟛拍苷嬲谑袌?chǎng)端有所體現(xiàn)。現(xiàn)階段,技術(shù)成熟度、成本和效率等仍然是制約因素。另一方面,不同的廠商呈現(xiàn)出差異化競(jìng)爭(zhēng)趨勢(shì),企業(yè)正基于優(yōu)勢(shì)積累構(gòu)建自身的壁壘。
幾天前,GPT-4V版本更新,TTS(Text To Speech 文本轉(zhuǎn)語(yǔ)音技術(shù))進(jìn)步,文本驅(qū)動(dòng)語(yǔ)音的表現(xiàn)在停頓、重音和交互自然程度上都有了極大提升。一些資深人士認(rèn)為,大模型驅(qū)動(dòng)的數(shù)字人真正落地有望加速迎來(lái)爆發(fā)。
01 狂飆的數(shù)字人賽道
數(shù)字人賽道今年肉眼可見(jiàn)地火起來(lái)了。今年2月以來(lái),“數(shù)字人”一詞的微信指數(shù)達(dá)到了去年十月的幾倍到幾十倍水平。
AI視頻直播SaaS創(chuàng)業(yè)公司特看科技CEO樂(lè)乘告訴數(shù)智前線,相比去年,今年整個(gè)賽道熱度明顯提升,前兩個(gè)月尤其明顯,呈現(xiàn)出泛濫乃至內(nèi)卷的狀態(tài)。
“去年就只有幾家在實(shí)驗(yàn),有點(diǎn)飄在半空中,主要是元宇宙、3D數(shù)字人方向,整體成本很高,很難商業(yè)化落地。今年一下子掉到地上來(lái)了。”
市場(chǎng)火爆下,也出現(xiàn)了一些亂象,有微商代理入場(chǎng)掘金。業(yè)內(nèi)人士統(tǒng)計(jì),市面上大概有一千多家代理商在賣(mài)各種數(shù)字人。
大廠、創(chuàng)業(yè)團(tuán)隊(duì)、AI公司和一些此前做智能客服營(yíng)銷的數(shù)字化服務(wù)商都在這一賽道頻繁動(dòng)作。
大廠的布局其實(shí)早已有之。騰訊、百度、阿里、京東、火山引擎等平臺(tái)此前在元宇宙概念下或基于直播帶貨等多個(gè)場(chǎng)景,都推出過(guò)數(shù)字人產(chǎn)品平臺(tái)或服務(wù)。例如,騰訊云小微在2021年11月發(fā)布了數(shù)智人產(chǎn)品矩陣,提供3D超寫(xiě)實(shí)、2D真人、2D卡通等五種風(fēng)格數(shù)智人產(chǎn)品。百度也在2021年AI開(kāi)發(fā)者大會(huì)上發(fā)布了百度智能云曦靈平臺(tái),具有數(shù)字人生產(chǎn)、內(nèi)容創(chuàng)作、業(yè)務(wù)配置服務(wù)等功能,百度還打造出了“度曉曉”等數(shù)字人IP。
大模型到來(lái)后,廠商們推出新的數(shù)字人平臺(tái),相比上一階段,制作效率和成本管理能力有大幅提升。騰訊云智能數(shù)智人產(chǎn)品總經(jīng)理陳磊介紹,4月騰訊云發(fā)布的小樣本數(shù)智人生產(chǎn)平臺(tái),12小時(shí)就能夠出來(lái)Demo,成本也大幅降至千元級(jí)別??焓衷诮衲?月發(fā)布的AIGC數(shù)字人產(chǎn)品快手智播,產(chǎn)品功能主打的也是降低制作門(mén)檻,3~5分鐘真人視頻和音頻素材,成本實(shí)現(xiàn)大幅降低。
知名的AI公司們緊鑼密鼓秀出了肌肉。今年4月,商湯科技在其技術(shù)交流日上展示了2D數(shù)字人視頻生成平臺(tái)“如影SenseAvatar”,官方介紹,僅需一段5分鐘的真人視頻素材,就可以生成出聲音及動(dòng)作自然、口型準(zhǔn)確、多語(yǔ)種精通的數(shù)字人分身。7月世界人工智能大會(huì)上,如影升級(jí)到2.0版本,重點(diǎn)提升數(shù)字人在多語(yǔ)種的語(yǔ)音和口型的流暢度。
一些在數(shù)字人賽道投入已久的公司也積極推新。8月中旬,在3D虛擬人賽道投入已有5年的技術(shù)服務(wù)商魔琺科技一口氣出了視頻AIGC生成平臺(tái)、AIGC直播平臺(tái)和虛擬人服務(wù)AIGC平臺(tái)三款消費(fèi)級(jí)產(chǎn)品,從高質(zhì)量、低成本和規(guī)?;瘡?fù)制三個(gè)層面,降低3D虛擬人的應(yīng)用落地門(mén)檻。
熱潮還吸引了跨界玩家,典型的有薇婭旗下的直播MCN機(jī)構(gòu)謙尋控股布局。8月8日,謙尋控股旗下子公司謙語(yǔ)智能和羚客分別發(fā)布了AI數(shù)字人直播解決方案和一站式AI智能直播綜合服務(wù)平臺(tái)。
資深人士認(rèn)為,入口屬性是大量企業(yè)爭(zhēng)相布局這一賽道的原因?!吧墒紸I,未來(lái)的入口之一是數(shù)字人。今天用的是簡(jiǎn)單web版,未來(lái)數(shù)字人可能體驗(yàn)更豐富。也是這個(gè)原因,企業(yè)開(kāi)始紛紛進(jìn)入這一市場(chǎng)?!北R言霞告訴數(shù)智前線。
魔琺科技創(chuàng)始人柴金祥在8月中旬的消費(fèi)級(jí)產(chǎn)品發(fā)布會(huì)上則把3D虛擬人視作未來(lái)的一種基礎(chǔ)設(shè)施?!跋窬W(wǎng)頁(yè)和APP一樣,作為一種內(nèi)容載體的升級(jí),未來(lái)會(huì)重塑所有的行業(yè)”,柴金祥說(shuō)。在這個(gè)認(rèn)知下,魔琺科技除了消費(fèi)級(jí)產(chǎn)品,還研發(fā)了3D虛擬人OS,用于管理未來(lái)的基礎(chǔ)設(shè)施。
嘗試將數(shù)字人形象和智能客服的對(duì)話能力結(jié)合的智能外呼公司云蝠智能看重的則是數(shù)字人的可互動(dòng)性和未來(lái)的潛力?!白罱袀€(gè)表達(dá)我特別認(rèn)同,數(shù)字人其實(shí)就是大模型的 UI”,云蝠智能CEO魏佳星告訴數(shù)智前線,“把時(shí)間都拉到5~10年看,數(shù)字人可能是在創(chuàng)造硅基生命。今天只是可互動(dòng)的數(shù)字人,沒(méi)有靈魂,并不代表未來(lái)它鉆不進(jìn)去靈魂?!?/p>
總體而言,大模型熱潮正在點(diǎn)燃數(shù)字人賽道。中航證券的一份報(bào)告指出,乘風(fēng)AI大模型的涌現(xiàn),虛擬數(shù)字人將加速釋放多元商業(yè)價(jià)值。數(shù)字人制造和運(yùn)營(yíng)服務(wù)的B端市場(chǎng)不斷擴(kuò)大,將面向更廣大的C端用戶提供服務(wù),深耕數(shù)字人相關(guān)業(yè)務(wù)的企業(yè)有望迎來(lái)黃金發(fā)展期。
02 差異場(chǎng)景,各顯神通
市場(chǎng)火爆之下,企業(yè)們盯上的卻非同一塊蛋糕。
文旅、電商、金融和企業(yè)內(nèi)應(yīng)用等不同細(xì)分市場(chǎng)里,數(shù)字人的商業(yè)化前景也并不一致,樂(lè)乘認(rèn)為未來(lái)數(shù)字人更應(yīng)視作是一種能力,不同細(xì)分賽道對(duì)數(shù)字人專業(yè)能力要求也不同。
文旅行業(yè)數(shù)字人應(yīng)用不是新鮮事。數(shù)字人已經(jīng)在不少景區(qū)和文化機(jī)構(gòu),扮演了代言人或景區(qū)智能大屏里的智能導(dǎo)游角色。典型案例有以“敦煌飛天”為藍(lán)本打造的虛擬數(shù)字人“天妤”、中國(guó)文物交流中心的“文夭夭”、敦煌研究院的“伽瑤”、國(guó)家博物館的“艾雯雯”等。一家文旅公司提及,有了數(shù)字人后,一些歷史人物與游客個(gè)性化互動(dòng)交流,展廳效果更豐富。
目前,百度、騰訊等不少?gòu)S商都在發(fā)力這一市場(chǎng)。幾個(gè)月前,一名百度的數(shù)字化服務(wù)商告訴數(shù)智前線,他們做了一個(gè)河北的項(xiàng)目,打的是文旅市場(chǎng),千萬(wàn)元級(jí)別。不過(guò),也有行業(yè)人士提到,景區(qū)數(shù)字人并非單獨(dú)報(bào)價(jià)千萬(wàn),通常是整一套景區(qū)數(shù)字化解決方案中的一個(gè)能力,項(xiàng)目整體才能到千萬(wàn)級(jí)別??傮w而言,相比一些企業(yè)內(nèi)服務(wù)場(chǎng)景里千元級(jí)別的應(yīng)用,文旅場(chǎng)景稱得上頭部市場(chǎng)。
IDC介紹,金融行業(yè)是當(dāng)下數(shù)字人應(yīng)用相對(duì)更成熟的領(lǐng)域。以銀行業(yè)為例,國(guó)內(nèi)最早“聘用”數(shù)字員工的是浦發(fā)銀行,3D數(shù)字人“小浦”在2019年由浦發(fā)銀行聯(lián)手百度智能云打造。據(jù)介紹,目前“小浦”已經(jīng)在20多個(gè)崗位任職,包括財(cái)富規(guī)劃師、文檔審核員、大堂經(jīng)理、電話客服等。9月初,IDC中國(guó)副總裁兼首席分析師武連峰在外灘大會(huì)銀行業(yè)數(shù)字化論壇發(fā)布《銀行數(shù)字科技五大趨勢(shì)》時(shí)提到,到2025年,超過(guò)80%的銀行都將部署數(shù)字人,承擔(dān)90%的客服和理財(cái)咨詢服務(wù)。
一位城商行財(cái)富管理版塊的IT負(fù)責(zé)人告訴數(shù)智前線,他們也打算采購(gòu)部署一套數(shù)字人,當(dāng)下正處于緊鑼密鼓考察其他銀行的數(shù)字人方案及不同廠商產(chǎn)品等階段?!盎鶎訂T工有非常多指標(biāo),騰不出手來(lái)做更重要的工作”,該人士介紹,數(shù)字人可把他們從繁重的客服接待等工作中解放出來(lái),去做更重要的客戶維護(hù)等運(yùn)維類工作。目前火山引擎、商湯科技、騰訊云、百度智能云、京東云等多家廠商都在金融行業(yè)里有數(shù)字人落地應(yīng)用案例。
電商直播場(chǎng)景里,不少頭部品牌已經(jīng)開(kāi)始在嘗試數(shù)字人直播方案。樂(lè)乘介紹,大品牌樂(lè)于積極嘗試數(shù)字人與企業(yè)一把手的AI戰(zhàn)略有關(guān),高層提了擁抱AI后,中層就會(huì)在營(yíng)銷等場(chǎng)景嘗試數(shù)字人工具。目前他們已經(jīng)服務(wù)了寶潔、歐萊雅等多個(gè)KA品牌,數(shù)據(jù)表現(xiàn)看數(shù)字人主播已經(jīng)達(dá)到了真人主播銷售額的70%。
數(shù)智前線了解到,電商直播場(chǎng)景里數(shù)字人服務(wù)模式有兩種:一種是給KA品牌提供了數(shù)字人直播軟件和代運(yùn)營(yíng)的打包服務(wù),通常這個(gè)模式下每月報(bào)價(jià)在兩到三萬(wàn)之間。另外一種是買(mǎi)一套軟件自己播,市場(chǎng)報(bào)價(jià)目前在兩千到四千之間。
看中直播市場(chǎng)的廠商不少,也出現(xiàn)了產(chǎn)品方案良莠不齊的現(xiàn)象,其中不乏“割韭菜”行為。一位電商行業(yè)資深人士介紹,目前使用數(shù)字人后數(shù)據(jù)好的品牌普遍特征是貨品本身有產(chǎn)品力,傳統(tǒng)無(wú)人直播方法也能賣(mài)得不錯(cuò),用了數(shù)字人之后效果再往上提升了幾成。
“那些吹噓數(shù)字人賣(mài)貨多么牛逼的數(shù)字人廠商,都是割韭菜,吹的越猛,鐮刀越鋒利?!痹撊耸空J(rèn)為,數(shù)字人當(dāng)下只是可以低成本規(guī)?;颜嫒四苜u(mài)好的貨能自動(dòng)化完成銷售。
IDC指出,目前各類玩家的產(chǎn)品和解決方案在應(yīng)用方向上存在差異,企業(yè)都基于自身優(yōu)勢(shì)賽道來(lái)打造數(shù)字人的場(chǎng)景。大廠會(huì)有一定的優(yōu)勢(shì),但小廠可以擇賽道而行,差異化競(jìng)爭(zhēng)。
魏佳星告訴數(shù)智前線,他們切入數(shù)字人賽道,就選了一些又苦又累的場(chǎng)景。比如官網(wǎng)的客服用數(shù)字人又垂直又累,客單價(jià)還不高。普通的官網(wǎng)客服一般一年費(fèi)用在2000元,加一個(gè)數(shù)字人能力,價(jià)格可能不超過(guò)五千元。這是巨頭看不上的市場(chǎng),一般的創(chuàng)業(yè)公司現(xiàn)在開(kāi)始做,能力又追不上。這種差異化競(jìng)爭(zhēng)是他們這類創(chuàng)業(yè)公司的機(jī)會(huì)。
03 規(guī)?;涞厍耙?/h4>
雖然聲量不小,動(dòng)作頻頻,不過(guò)業(yè)內(nèi)普遍認(rèn)識(shí)到當(dāng)下仍然存在的挑戰(zhàn)。
盧言霞觀察,當(dāng)下大模型應(yīng)用尚未規(guī)?;涞兀矫髂瓴拍茉谑袌?chǎng)端有數(shù)據(jù)變動(dòng)。目前階段,數(shù)字人開(kāi)發(fā)周期,開(kāi)發(fā)成本,形象定制,真正的AIGC化,都是挑戰(zhàn)。
以技術(shù)成熟度為例,不少數(shù)字人產(chǎn)品在語(yǔ)音、表情、互動(dòng)表現(xiàn)上目前還比較生硬。一些資深人士甚至認(rèn)為,不成熟的解決方案甚至?xí)褲撛诘目蛻粲脩粝闯隽耸袌?chǎng)。
不過(guò)這波AIGC浪潮下,技術(shù)更迭速度也很快。樂(lè)乘告訴數(shù)智前線,他們看到此前大模型跟數(shù)字人結(jié)合在文本轉(zhuǎn)語(yǔ)音技術(shù)(TTS)有突破的跡象?!爸拔谋咀兂蓴?shù)字人的自然度有問(wèn)題,銜接上一直不太容易。大模型是一條線,數(shù)字人是一條線。他們需要TTS技術(shù)突破,才能實(shí)現(xiàn)很好的融合?!?/p>
9月底,OpenAI新發(fā)布了版本更新 GPT-4V中,TTS技術(shù)由一個(gè)全新的TTS模型提供支持。它能夠僅從文本和幾秒鐘的樣本語(yǔ)音中生成類似人類的音頻,結(jié)合Whisper模型的語(yǔ)音轉(zhuǎn)文本,保證用戶與ChatGPT進(jìn)行語(yǔ)音交流的質(zhì)量和流暢度。
行業(yè)人士觀察,在一些用戶已經(jīng)灰度測(cè)試的新版本里,文本轉(zhuǎn)語(yǔ)音表現(xiàn)頗令人驚艷,AI在停頓、語(yǔ)氣和抑揚(yáng)頓挫感上已經(jīng)非常接近真人?!拔遗袛郥TS技術(shù)端到端成熟后,對(duì)行業(yè)格局的改變會(huì)很大。”樂(lè)乘說(shuō),相當(dāng)于有了一個(gè)膠水,大模型驅(qū)動(dòng)數(shù)字人從兩條線能夠結(jié)合到一起,企業(yè)后面去優(yōu)化數(shù)字人的表現(xiàn)力就可以了。
數(shù)字人產(chǎn)品的價(jià)值呈現(xiàn)及規(guī)?;瘡?fù)制能力也是業(yè)界關(guān)注的重點(diǎn)。
魔琺科技創(chuàng)始人柴金祥介紹,早期的虛擬人行業(yè)發(fā)展的一大痛點(diǎn)就是規(guī)?;瘡?fù)制問(wèn)題。從長(zhǎng)內(nèi)容時(shí)代的動(dòng)畫(huà)、電影和游戲領(lǐng)域里的虛擬人到短內(nèi)容時(shí)代的虛擬偶像,例如初音未來(lái)、柳夜熙等,也包括魔琺早期打造的虛擬偶像翎__Ling都是手工制作,周期長(zhǎng),成本高。
一位觀察者提到,此前的頂流虛擬人偶像“柳夜熙”需要配備超百人的創(chuàng)意團(tuán)隊(duì),制作一個(gè)作品的投入成本可能超過(guò)百萬(wàn)級(jí)別。
柴金祥接受數(shù)智前線采訪時(shí)提到,魔琺的AIGC技術(shù)已突破內(nèi)容行業(yè)虛擬人此前無(wú)法被規(guī)?;瘡?fù)制的問(wèn)題。此外,消費(fèi)級(jí)產(chǎn)品如果想讓企業(yè)持續(xù)使用,一定要解決企業(yè)的痛點(diǎn)問(wèn)題,并且ROI是值得的?!靶枰越K為始思考,我們的產(chǎn)品有沒(méi)有能力給企業(yè)帶來(lái)價(jià)值,有沒(méi)有能力ROI為正?!边@幾年他們的產(chǎn)品思路也沿著規(guī)模化復(fù)制、細(xì)分行業(yè)的專業(yè)能力以及形象上高質(zhì)量、能表達(dá)可互動(dòng)等角度發(fā)力。
行業(yè)內(nèi)都重視降低產(chǎn)品的使用門(mén)檻,不少?gòu)S商發(fā)布產(chǎn)品時(shí)都提到了通過(guò)極小樣本素材,實(shí)現(xiàn)數(shù)字人一鍵生成。在電商場(chǎng)景里,許多企業(yè)為了降低品牌客戶使用數(shù)字人的門(mén)檻,還提供了數(shù)字人代運(yùn)營(yíng)模式。這一模式下,技術(shù)和服務(wù)一體,企業(yè)可以把數(shù)字人相關(guān)的工作整體交由機(jī)構(gòu)負(fù)責(zé),不用自己剪輯視頻,也不用自己去操作數(shù)字人后臺(tái),按月支付軟件加服務(wù)費(fèi)用即可。
這種業(yè)態(tài)模式,數(shù)字人服務(wù)商的角色實(shí)際已經(jīng)與電商場(chǎng)景里的傳統(tǒng)MCN機(jī)構(gòu)和代運(yùn)營(yíng)廠商的角色產(chǎn)生了重合。正如薇婭旗下公司提供數(shù)字人直播平臺(tái)和工具一樣,數(shù)字人廠商們的服務(wù)范圍也在延伸。觀察人士認(rèn)為,未來(lái)隨著數(shù)字人這類技術(shù)的規(guī)?;瘧?yīng)用和落地,在多個(gè)行業(yè)里,不同類型服務(wù)商角色邊界模糊和融合是大趨勢(shì)。
一些從業(yè)者認(rèn)為未來(lái)數(shù)字人將在許多企業(yè)服務(wù)場(chǎng)景里替代原有的白領(lǐng)角色,市場(chǎng)空間無(wú)限寬廣。不過(guò)也有人為,以直播帶貨為例,社交平臺(tái)在流量機(jī)制上不會(huì)讓所有的主播都由數(shù)字人代替,因此市場(chǎng)規(guī)模上會(huì)存在上限。
喧囂近半年后,從業(yè)者們也觀察到,市場(chǎng)已經(jīng)在呈現(xiàn)理性回歸狀態(tài)。“相比過(guò)去兩個(gè)月,一些喧囂和割韭菜類的角色在加速出清,市場(chǎng)熱度逐漸回到了年初狀態(tài)。”樂(lè)乘告訴數(shù)智前線,長(zhǎng)遠(yuǎn)看留下的會(huì)是更專注技術(shù)積累的公司。
業(yè)界共識(shí)是,賽道的周期挺長(zhǎng),當(dāng)下行業(yè)發(fā)展仍處于早期。盧言霞此前指出,“行業(yè)用戶一方面可以從相對(duì)成熟的應(yīng)用場(chǎng)景開(kāi)始引入AI數(shù)字人;另一方面也需對(duì)應(yīng)用場(chǎng)景保持耐心,不設(shè)置過(guò)高的期望值?!?/p>