文 | DoNews 李信馬
剛剛過(guò)去的“618”,火了一群“AI主播”。
直接看戰(zhàn)報(bào)吧,2024年“618”期間,京東直播訂單量同比增長(zhǎng)超200%。其中,京東云言犀數(shù)字人:
- 在超過(guò)5000個(gè)品牌直播間開播;
- 累計(jì)時(shí)長(zhǎng)超過(guò)40萬(wàn)小時(shí);
- 累計(jì)觀看人次超過(guò)1億;
- 互動(dòng)頻次超過(guò)500萬(wàn)次。
按照京東的統(tǒng)計(jì),截至目前,言犀數(shù)字人已累計(jì)帶動(dòng)了超百億的GMV(商品交易總額)。這個(gè)數(shù)字,放在今天的直播帶貨行業(yè),實(shí)在不算個(gè)大數(shù)字。
據(jù)艾瑞咨詢剛剛發(fā)布的《2023年中國(guó)直播電商行業(yè)研究報(bào)告》顯示,2023年,我國(guó)直播電商市場(chǎng)規(guī)模高達(dá)4.9萬(wàn)億人民幣,增速達(dá)到35.2%,并預(yù)測(cè)未來(lái)三年還將保持18%的年復(fù)合增長(zhǎng)率。100億,甚至比不過(guò)頭部達(dá)人的年度GMV。
不過(guò),對(duì)京東來(lái)說(shuō),這算是很不錯(cuò)的成績(jī)。在直播帶貨賽道如火如荼之際,老牌電商平臺(tái)京東卻掉了隊(duì),談到直播帶貨達(dá)人,淘寶有李佳琦,抖音有瘋狂小楊哥、羅永浩,快手有辛巴,而京東卻讓人想不到有可以相提并論的。
雖然近一年來(lái),京東沒(méi)少花心思做直播,但培養(yǎng)頭部達(dá)人并不是個(gè)容易速成的事情。山不轉(zhuǎn)水轉(zhuǎn),用AI數(shù)字人主播代替真人主播,成為一種“彎道超車”的選擇。
從京東“618”戰(zhàn)報(bào)來(lái)看,AI主播也算是小有成績(jī)。只是,這樣的成績(jī)會(huì)是曇花一現(xiàn),還是真的能走出一條通天大路?
一、日不落的直播間
前幾天,“鐘薛高老林”直播間發(fā)生了驚魂一幕,女主播在介紹產(chǎn)品時(shí),突然身體開始搖晃,然后猛然摔倒,伴隨著直播間里的尖叫聲,話題也沖上熱搜第一。
好在虛驚一場(chǎng),女主播表示只是身體不適。不過(guò),就此事而言,卻體現(xiàn)了AI主播相比真人主播的優(yōu)勢(shì)之一:不會(huì)疲憊,也不需要休息。
DoNews聯(lián)系了一位資深帶貨主播嘉琪,在我們和她討論AI主播時(shí),她的第一反應(yīng)是,有了AI主播,直播間就可以“日不落”了。
“直播帶貨最少一個(gè)主播一個(gè)助播,還要有人投流,也就上班時(shí)間能湊一起,至于達(dá)人,更不可能一直播?!奔午髂壳懊恐軉涡菀惶?,工作日每天直播4小時(shí)。而她所在的公司,同一個(gè)直播間會(huì)由三名主播早中晚三班輪班,一天播滿12小時(shí)。
每天24小時(shí),嘉琪所在的直播間只播一半,主要問(wèn)題就是剩下的時(shí)間能夠賺錢,但性價(jià)比不高。比如她們的最后一班是晚上7點(diǎn)半結(jié)束,之后到11點(diǎn)半的4小時(shí),直播帶貨的效果不一定比白天好,但成本和麻煩程度只高不低,因此就被公司放棄了。
按嘉琪估計(jì),她們直播間平均每天GMV在4萬(wàn)元左右,投流的成本大約是1萬(wàn)元,而主播的工資是200元每小時(shí)?!懊總€(gè)平臺(tái)的投流不太一樣,比如小紅書是點(diǎn)進(jìn)來(lái)(直播間)一次我們要給2塊多,抖音是另一套規(guī)則,它們投流很細(xì)?!?/p>
因此,流量高的黃金時(shí)段,要直播而且要多投流;流量低的閑時(shí),投流沒(méi)意義,純自然流量可能連人力成本都覆蓋不了,就沒(méi)必要直播了。
至于200元/小時(shí)的收入水平,在北京的直播帶貨圈子里算中等偏上,嘉琪介紹,不同平臺(tái)、不同品類的直播間主播的收入水平會(huì)有所差異,此外還會(huì)有不同比例的提成點(diǎn),“像是服飾類,提成可能在2%-5%,但像糧油這樣的,可能就只有千分之幾了?!?/p>
能有這樣的待遇,是因?yàn)橹辈ж浀拇_有其門檻,她們直播間表現(xiàn)最好的一天,GMV達(dá)到了25萬(wàn),投流成本不到3萬(wàn),除了運(yùn)氣和產(chǎn)品銷售策略,主播的個(gè)人能力影響很大。
而且這也是“體力活”。“一場(chǎng)直播下來(lái),可能就休息幾分鐘,去上一次洗手間,每天4小時(shí)感覺(jué)不多,但持續(xù)播一段時(shí)間就會(huì)很疲憊,嗓子也會(huì)難受?!奔午鞑畈欢嘁粋€(gè)月會(huì)請(qǐng)假一兩次來(lái)休息,不請(qǐng)假的話“卷”兩個(gè)月,她就要休息一個(gè)小長(zhǎng)假才能恢復(fù)過(guò)來(lái)。
相比真人,AI主播的成本非常低廉,閑時(shí)也可以一直在線。比如京東,就表示言犀數(shù)字人直播成本僅為真人1/10,在今年4月,百度發(fā)布了曦靈數(shù)字人,采訪中百度智能云副總裁喻友平也對(duì)DoNews表示,在不投流的情況下,6小時(shí)直播比對(duì)中,數(shù)字人的成本大概是真人的15%左右,GMV則是真人85%。
京東對(duì)使用數(shù)字人直播有三個(gè)階段的目標(biāo),其中第一階段是向真人看齊,可以和真人接力,在黃金時(shí)段之外帶貨。有AI主播做閑時(shí)補(bǔ)充,直播間可以24小時(shí)日不落,比如聯(lián)想的京東直播間,據(jù)統(tǒng)計(jì)AI主播的每小時(shí)成交量,能達(dá)到真人的45%,成本只有10%;珠寶品牌潮宏基的AI主播平均每天播22小時(shí),每月比真人10小時(shí)直播能省下兩三萬(wàn)。
只是,如果AI主播止步于降本,那就不值得討論了,因?yàn)橹辈ж浶袠I(yè)還是銷售為王。而從今年京東“618”來(lái)看,AI主播表現(xiàn)出來(lái)了更大的潛力——也許真的可以替代真人。
二、AI主播是怎樣煉成的?
AI主播并不是新鮮事,2022年起,言犀虛擬主播就在青蛙王子、六神、同仁堂、百雀羚等上百家國(guó)貨品牌直播間上崗,在去年的“618”,京東曾發(fā)布消息“開門紅開啟10分鐘,言犀虛擬主播開播商家較去年11.11增幅近4倍”。
但以前沒(méi)火起來(lái),本質(zhì)還是太“菜”了,完全比不上真人。
在百度發(fā)布曦靈數(shù)字人時(shí),喻友平的描述就很謙虛:“未來(lái)要覆蓋到更多原本都沒(méi)有能力做直播的商家或者企業(yè),讓他們能夠低成本的把直播用起來(lái)。雖然客觀來(lái)說(shuō),肯定沒(méi)法代替那些頂級(jí)的直播,沒(méi)法達(dá)到他們那么高的水平,但是達(dá)到70%的水平,或者說(shuō)我們隨便找10個(gè)素人出來(lái),肯定比他們水平高?!?/p>
而同一時(shí)間,京東卻選擇挑戰(zhàn)高難度。在4月16日,京東直接做出了劉強(qiáng)東的AI數(shù)字人“采銷東哥”,并亮相直播間開啟了首場(chǎng)直播賣貨。
直接上“老板”賣貨,有魄力也很好玩,看一下銷售數(shù)據(jù):在42分鐘的上播時(shí)間里,“東哥”講解了13款產(chǎn)品(主要是家電),直播間的觀看數(shù)量超過(guò)了2000萬(wàn),創(chuàng)下了京東超市采銷直播間開播以來(lái)觀看人數(shù)的最高峰,最終訂單數(shù)突破了10萬(wàn),銷售額超過(guò)了5000萬(wàn)元。
DoNews當(dāng)時(shí)也特意觀看了這場(chǎng)直播,說(shuō)實(shí)話,前面一小段時(shí)間,真的沒(méi)分辨出是不是真人,不止是長(zhǎng)得像,一口宿遷味的普通話也頗具迷惑性。(也有原因是一開始的消息“京東創(chuàng)始人、董事局主席劉強(qiáng)東即將在京東APP上開啟直播”中沒(méi)有說(shuō)是AI主播)看了一會(huì),才隱約覺(jué)得表情和微動(dòng)作有些重復(fù)和不自然。而多久能分辨出來(lái)是否是真人,就是京東對(duì)AI主播進(jìn)行效果評(píng)判的核心指標(biāo)。
京東云言犀負(fù)責(zé)人在第一次直播后的采訪中說(shuō):“觀眾在進(jìn)入直播間的前120秒,如果不覺(jué)得是數(shù)字人,就有可能跨過(guò)‘恐怖谷’效應(yīng),對(duì)主播產(chǎn)生信任感。這能大幅提高下單率?!?/p>
一旦跨越了這條鴻溝,AI主播就可以進(jìn)入京東預(yù)期的第二階段:媲美真人,能夠承擔(dān)一些重要獨(dú)立的任務(wù),比如重要時(shí)段的直播、講解等。以“采銷東哥”為起點(diǎn),“618”的京東直播間里,冒出了不少“AI老板”,有格力董明珠、海信胡劍涌、LG李東善、名創(chuàng)優(yōu)品葉國(guó)富、潔麗雅石展承等十幾位企業(yè)總裁,也算是趕上了雷軍、周鴻祎等商界大佬直播的熱潮。
能達(dá)到這樣的效果,不得不說(shuō),要感謝人工智能尤其是大模型技術(shù)的突飛猛進(jìn),我們現(xiàn)在管訓(xùn)練大模型叫煉丹,那京東的AI主播,就是主打一個(gè)“菜就多煉”。簡(jiǎn)單的說(shuō)下,京東言犀數(shù)字人背后的技術(shù)。
建立數(shù)字人形象,主要分為外觀和聲音兩部分。以“采銷東哥”為例,在外觀部分,言犀團(tuán)隊(duì)利用劉強(qiáng)東的高清視頻,配合 3D Mesh 技術(shù)方案,快速建立擬真的真人形象,并支持?jǐn)?shù)字人做出大姿態(tài)、有感染力的動(dòng)作,比如揮舞手臂,或者側(cè)臉看手機(jī)。簡(jiǎn)單理解,就是專精人物視頻生成的“Sora”。
在聲音方面,言犀團(tuán)隊(duì)設(shè)計(jì)了聲音供應(yīng)鏈的概念,從開始供應(yīng)聲音最基礎(chǔ)的元素上進(jìn)行規(guī)范,制定標(biāo)準(zhǔn),后面技術(shù)進(jìn)行相應(yīng)的適配。模型在預(yù)訓(xùn)練中已經(jīng)掌握了人類普遍的發(fā)聲特征,再錄制幾句劉強(qiáng)東講話,就能學(xué)習(xí)到他“宿遷普通話”的說(shuō)話風(fēng)格。直播中一句東哥特色的“兄弟們”,誰(shuí)聽了不迷糊?
三、暢想:未來(lái)的AI主播會(huì)是怎樣?
以假亂真是很厲害,但大家看直播,不只是為了看“真實(shí)”。
除了折扣外,消費(fèi)者也喜歡看主播們唱跳Rap,最好再給家人們上上才藝整整花活兒。眼下AI主播們的風(fēng)頭,其實(shí)是借著商界大佬們的形象,頗有些“狐假虎威”的意思,絕大多數(shù)人一輩子也聽不到劉強(qiáng)東面對(duì)面喊自己一聲“兄弟”,更不用說(shuō)給介紹下商品了。
另一方面,由于多種原因,直播帶貨行業(yè)正由達(dá)人帶貨向店播的模式傾斜,再加上最近流行“一把手”出鏡(但有時(shí)間和能力的企業(yè)家并不多),因此,京東帶頭發(fā)起的““總裁數(shù)字人直播”可以說(shuō)搔到了不少企業(yè)的癢處。
等新鮮感過(guò)去后,AI主播還能吸引消費(fèi)者們觀看和購(gòu)買嗎?畢竟,目前的AI主播,只能在直播間里說(shuō)話做表情,并不具備真正人類的行動(dòng)力。反觀真人直播帶貨還在不斷的推陳出新,比如 ZARA 在去年年底的一場(chǎng)直播,請(qǐng)來(lái)了超模游天翼現(xiàn)場(chǎng)走秀。
空間挑高近8米,面積達(dá)500平,有5臺(tái)阿萊攝影機(jī)和3臺(tái)斯坦尼康等頂尖設(shè)備,再加上軌道車與機(jī)械搖臂,12盞阿萊400W聚光燈,這樣超豪華的配置,營(yíng)造出了至少價(jià)值50萬(wàn)的光影效果。長(zhǎng)達(dá)約5小時(shí)的直播里,鏡頭全程跟蹤超模與兩位主播,從T臺(tái)走秀到介紹產(chǎn)品、分享時(shí)尚見解,甚至補(bǔ)妝的小細(xì)節(jié)也毫無(wú)保留地展示出來(lái),這樣的視覺(jué)盛宴,吸引了近122萬(wàn)的觀眾。
這樣的直播,現(xiàn)在的AI主播顯然做不到。
同樣是在4月時(shí),DoNews采訪了虛擬動(dòng)點(diǎn)董事長(zhǎng)劉耀東,虛擬動(dòng)點(diǎn)專注于空間計(jì)算技術(shù),他們的一大業(yè)務(wù)是做電影動(dòng)作特效。劉耀東提到一個(gè)觀點(diǎn),現(xiàn)在的視頻生成技術(shù),包括Sora,都“不懂物理世界”。不懂物理世界的結(jié)果,就是生成的視頻,會(huì)發(fā)生“穿?!钡膯?wèn)題。而問(wèn)題的原因,是因?yàn)槲覀內(nèi)粘?吹囊曨l、電影,本質(zhì)上就是二維圖像的堆疊,所以大模型在訓(xùn)練時(shí),獲得的數(shù)據(jù)也是加上時(shí)間軸的二維圖像集,這樣生成的視頻其實(shí)也是圖像的組合罷了。
“你會(huì)發(fā)現(xiàn),所有電商(AI主播)直播的場(chǎng)景,(AI)主播是不能動(dòng)的,它只能同軸位移,就是手可以動(dòng),表情可以動(dòng),但身體不能動(dòng)。為什么它不能離開這個(gè)軸?因?yàn)樗悄靡曨l訓(xùn)出來(lái)的,就是一個(gè)人坐在那里,拍足夠多的視頻來(lái)訓(xùn)練這個(gè)AI,然后再用口型和聲音數(shù)據(jù)同步訓(xùn)練它的表情。它如果大幅度移動(dòng)的話,就會(huì)發(fā)生明顯的抖動(dòng)等其他問(wèn)題?!眲⒁珫|解釋道。
如果AI主播一直在畫面正中間,那問(wèn)題不大,但除此之外——比如只是簡(jiǎn)單的站起來(lái)——那問(wèn)題都很大。虛擬動(dòng)點(diǎn)同樣通過(guò)大模型訓(xùn)練數(shù)字人,但他們采集的空間數(shù)據(jù)是三維的,和視頻數(shù)據(jù)的區(qū)別大概相當(dāng)于(x,y,z,T)和(x,y,T),這樣從根本上解決大模型“不懂物理世界”的問(wèn)題,而劉耀東理想中的AI主播,可以站起來(lái),可以走動(dòng)、做日常動(dòng)作,甚至可以做物理交互。
“我覺(jué)得如果真的要實(shí)現(xiàn)到理想中的電商直播場(chǎng)景,那一定要有同步的一套AI算法,加上我們動(dòng)作的算法,進(jìn)行重新組合,完成數(shù)字人的驅(qū)動(dòng),它肯定不會(huì)是一個(gè)二維數(shù)字人。”劉耀東總結(jié)道。
不過(guò),這樣靈活的AI主播距離我們還有些遙遠(yuǎn),真人主播為主、AI主播為輔,兩者共存的模式未來(lái)將在電商直播領(lǐng)域長(zhǎng)期存在,并且行業(yè)仍充滿了機(jī)會(huì),用真金白銀獎(jiǎng)勵(lì)技術(shù)和模式上的突破。
暢想一下,未來(lái)可能就是《頭號(hào)玩家》或者《失控玩家》里的場(chǎng)景??赡苡幸惶欤萍家呀?jīng)進(jìn)步到構(gòu)建出電影里的虛擬世界,也許真人主播不會(huì)消失,但AI主播卻可以飛天遁地,不再需要模仿真人,就能完成令我們驚嘆的表演了。