正在閱讀:

AI“改造”直播間

掃一掃下載界面新聞APP

AI“改造”直播間

數(shù)字人開始搶主播的飯碗。

圖片來源:界面新聞 匡達

文|光子星球 何芙蓉

編輯|吳先之

“歡迎xx來到直播間” “我們這款產(chǎn)品……”

凌晨,打開抖音、淘寶、攜程等平臺,仍然有主播在直播間循環(huán)介紹著店里的幾款商品。但她們略顯機械的語句停頓與固定的幾個手勢循環(huán),可以看出,這些主播并不是真人出鏡,而是AI數(shù)字人。

AI浪潮下,虛擬主播在今年618之際加速卷入直播間。

618期間,京東更是推出“言犀虛擬主播”產(chǎn)品,幫助商家減負增收。據(jù)京東戰(zhàn)報顯示,開門紅開啟10分鐘,數(shù)字人直播間開播商家數(shù)較去年雙11增幅近400%。另外,像雅詩蘭黛、歐萊雅、寶潔等品牌也已經(jīng)在嘗試接入虛擬主播服務于直播電商。

今年上半年,ChatGPT、Midjourney、文心一言等產(chǎn)品的出現(xiàn),掀起了AI新一輪的技術革新浪潮。AI在給一些行業(yè)帶來更多想象空間的同時,也給很多“打工人”帶來了危機。

一時間,關于“AI替代人類” “AI導致失業(yè)”的討論也甚囂塵上。

如今, AIGC 技術率先被電商行業(yè)廣泛應用于實踐,伴隨著越來越多的AI主播出現(xiàn)在直播間,AI替代論似乎也開始從預知變?yōu)楝F(xiàn)實。

AIGC“落地”直播間

將虛擬人應用于文娛、短視頻、直播帶貨等領域其實并不算什么新鮮事。在此之前,已經(jīng)有洛天依、A-Soul這樣的二次元虛擬IP,也有3D超寫實數(shù)字人柳夜熙出圈。

而當前風靡直播間的AI主播屬于2D超寫實數(shù)字人,這一技術以真人為原型,復刻主播的形象、聲音,以及表情動作,打造出一個與真人相似度極高的仿真人。2D超寫實數(shù)字人更像是專門為直播場景量身打造的。

雖然像文旅展廳、新聞資訊、學校等也都已經(jīng)在接入數(shù)字人,但AI主播在直播帶貨場景的應用則意味著AIGC的商業(yè)化落地開始轉向C端變現(xiàn)。

“AI主播這一塊可以說是AIGC技術最容易應用實踐的,或者說更容易變現(xiàn)的一個領域?!泵鎸I主播的風潮,即構科技一位內部人士如此評價。

即構科技在2019年之前就開始投入對AI的研究,基于微博、陌陌、映客、TT 語音等客戶基礎,此前其AI技術主要運用于泛娛樂以及社交領域?!氨热缫曨l美顏、聲音降噪,視頻的摳圖,都會應用到AI技術?!?/p>

事實上,AIGC產(chǎn)業(yè)鏈逐步完善和成熟是AI數(shù)字人涌入直播間的主要推力。例如實時音頻的即構科技、AI作畫平臺研發(fā)供應6pen、超擬人大模型研發(fā)商聆心智能等?!叭ツ?,虛擬人就已經(jīng)作為我們元宇宙解決方案里面的其中一個產(chǎn)品出現(xiàn),即用戶在元宇宙里面的數(shù)字分身,當時是偏3D建模的方向,我們的虛擬人Zego Avatar可以做到面部表情到四肢動作隨動,將真人姿態(tài)在虛擬形象上進行實時的還原渲染,在交互空間里轉身、跳躍等完成一些更復雜的動作?!?/p>

“到了今年,我們就從AI團隊專門抽調了一部分人去做數(shù)字人項目,這次做的則類似于仿真人,主要用途就是在口播這一領域。”目前也已經(jīng)有很多MCN、廣告公司、設計公司、學校在與其數(shù)字人服務進行合作接洽。

而之所選擇從“口播”切入,數(shù)字人技術廠商們也是看準了短視頻、直播行業(yè)的切實需求。

上述人士直言,對于MCN等公司來說,引進虛擬主播可以說是一個很好的規(guī)避風險、降本增效手段。

“譬如發(fā)生像李子柒這類大IP與MCN公司分道揚鑣的事件,很多MCN是保不住IP資產(chǎn)的。若主播一開始就在公司錄制了數(shù)字分身,并明確了歸屬,那么這個數(shù)字分身會一直作為公司資產(chǎn),不會因為主播出走而流失?!?/p>

另外,虛擬主播最直接需求便是打破真人主播在直播時長等方面的制約,做到24小時不間斷直播。在現(xiàn)有案例中,一些商家已經(jīng)選擇將AI主播用于夜間直播,作為真人主播在時間上的補充。

一位MCN人士表示,在直播帶貨的過程中,場景搭建也是一塊不小的支出,而且很多物料不能被重復利用,常常被浪費。數(shù)字化場景的搭建同樣有AI技術的用武之地。

另一個層面來看,與其說是AI替代真人主播,它其實也正在作為一種工具促進生產(chǎn)力與創(chuàng)造力的解放,為內容創(chuàng)作者騰出了時間和空間在“幕后”做更多的創(chuàng)意性的工作,比如產(chǎn)品特色梳理、直播互動體驗優(yōu)化、直播間搭設升級等。

據(jù)光子星球了解,目前市面上定制一個仿真主播,其成本價基本在一萬多的水平,這對比真人直播的人力成本,顯然能夠縮減開銷。

理想狀態(tài)下,若虛擬主播能夠在逼真程度、即時反饋等方面做到與真人主播無異,這對于直播行業(yè)的影響不言而喻。

但實際效果還遠沒達到這個程度。

另一位數(shù)字人廠商人士志輝(化名)表示:“我們目前已經(jīng)有一些MCN、本地生活服務商達成合作,另外像保潔、貝亦美、奧迪汽車等品牌也即將會展開合作,但直播效果還是要視情況而定?!?/p>

“目前來看,數(shù)字人的服務場景是有限的。現(xiàn)在在本地生活團購、文旅產(chǎn)品等直播話術相對固定,且重復頻率較高的直播間運用的比較多。而像美妝等口紅產(chǎn)品需要沉浸式介紹,AI主播還難以做到?!?/p>

除此之外,像快消百貨等標品介紹、知識型的短視頻與直播,講解話術相對統(tǒng)一,也能夠適用虛擬主播。

要論結果,目前AI主播還遠不能達到真人直播的效果。但正如一位抖音本地生活服務商人士所言:“我們大家都還在‘試’,前期肯定是有一個探索完善的過程?!?/p>

AI主播不夠“AI”

AI主播不夠“AI”,也是目前制約其直播效果的最直接因素。

對于虛擬主播的工作原理,上述數(shù)字人廠商人士志輝表示,作為技術廠商,我們主要是為客戶提供一個saas軟件,通過軟件直接推流到第三方平臺去做直播。然后客戶在這個軟件后臺去設定所謂的“人貨場”,即開播前在后臺選擇虛擬主播、提前設定好產(chǎn)品介紹,以及可以去生成數(shù)字化的直播場景。

“我們現(xiàn)在的商業(yè)邏輯主要就是把軟件功能做好,然后客戶通過軟件去管理直播間,以更方便的在后臺去編輯、更改直播內容?!?/p>

可以看出,廠商更多的是將AI技術應用于數(shù)字人的生成上,但是涉及到具體的直播時,他們更像是提供了一個輔助直播的管理工具。

直播時,現(xiàn)場互動以及反饋直播間用戶的提問是提升直播效果非常重要的一個部分。

但上述即構科技內部人士坦言:“現(xiàn)階段數(shù)字人直播時都需要提前準備一個問題庫,直播過程中收到相關彈幕或提問,就在問題庫內調取相關回答,問題庫的內容越全面、越細致,數(shù)字人直播的互動體驗才能相應提高?!?/p>

相當于AI主播在工作時,工作人員不僅要事先準備相關產(chǎn)品介紹話術,涉及臨場互動的問答也要提前預設好。

目前,數(shù)字人直播仍然囿于問題庫的預設來驅動實時反饋和互動效果,若要做到真正的開放性回答,這其中既有技術的難題,也有監(jiān)管等問題,譬如對一些敏感詞的觸碰。

“未來肯定會接入ChatGPT那樣的能力做開放性的回答,比如做個圍欄限定開放性回答的可控范圍,目前還在技術研究的過程中?!?/p>

當前,行業(yè)對于AI數(shù)字人直播的探索仍然停留在工具階段,還代替不了運營。但技術的突破與以及價格的下降已經(jīng)使得虛擬主播具備了走向大眾化的基礎。

如今AI主播的定制過程并不復雜,用戶只需提供一段形象視頻與直播話術音頻,幾天后就能拿到一個1:1克隆的數(shù)字人。

隨著數(shù)字人在直播等場景的需求被開發(fā)出來,需求攀升的同時也使得更多的科技公司加入數(shù)字人研發(fā)的大潮,進而推動數(shù)字人價格的下降?!皫啄昵?,茅臺定制一個數(shù)字人,就要花幾十萬?!?/p>

一位淘寶數(shù)字人定制廠商則表示,基于真人的聲音與形象定制一個數(shù)字人的價格為11000元,終身使用,后續(xù)再無其他費用。若是購買公司的固定數(shù)字人模板,價格則更低。

在這個過程中,越來越多自稱是AI數(shù)字人定制的商家逐漸滲透至淘寶、抖音、快手、閑魚等平臺,品牌、用戶等接觸到AI定制服務的門檻也在降低。

而那些散落在各個平臺的商家,則更多的是代理商,或者其他中間商。這其中也混雜著不少假AI商家,比如一段視頻動作循環(huán)播放,并未體現(xiàn)多少的智能化。

“目前真的在做技術研發(fā)、產(chǎn)品開發(fā)的源頭廠商,整個行業(yè)也就二十多家,我們作為其中一家自研企業(yè),也正處在打渠道的階段?!币晃粯I(yè)內人士表示。

探索與不確定性

一位電商行業(yè)人士表示,2021年他們便開始在TikTok嘗試虛擬直播,但沒做幾個月就不得不停了?!爱敃r虛擬直播同質化很嚴重,互動少,平臺封得厲害?!?/p>

國內電商平臺同樣如此,此前也有類似于動畫人物形態(tài)的虛擬主播被用于淘寶天貓直播間,可惜在直播效果、視覺化、互動等方面始終差強人意,虛擬直播并沒有被廣泛的應用。

“現(xiàn)在抖音已經(jīng)明確開放了數(shù)字人直播,其實從這些平臺的態(tài)度就已經(jīng)能夠看到AI直播的大趨勢。”一位電商行業(yè)人士表示。

AI直播作為一個新型事物,目前處在發(fā)展應用的初期,但平臺、商家,以及MCN等都表現(xiàn)出了擁抱探索的心態(tài)。

5月9日,抖音發(fā)布《抖音關于人工智能生成內容的平臺規(guī)范暨行業(yè)倡議》,針對人工智能生成的視頻、圖片和衍生的虛擬人直播,首次明確其在平臺內的行為規(guī)范。本次新規(guī)推出,虛擬主播不再游走于抖音審核邊界,正式“合法化”??焓?、淘寶直播等平臺目前暫時還未跟進。

抖音強調內容為王,利用人工智能輔助的創(chuàng)作內容與其他內容擁有同等的流量分配規(guī)則,用戶可以依托技術進行輔助創(chuàng)作具有更高質量的內容,但不提倡利用低成本技術優(yōu)勢生成低質內容。同時需要進行實名注冊,并標識虛擬人直播。

“平臺是開放的,但它最根本的標準在于你得輸出一些高質量的內容。比如你不能錄播,在直播過程中得有實時的提問和反饋等?!盇I生成內容成本低,容易陷入低質內容的漩渦,平臺開放后同樣會對低質內容進行管控。

“我們只能盡量做到合規(guī)?!鄙鲜鋈耸恐毖?。

技術的發(fā)展有一個過程,目前AI直播在互動反饋、畫面效果等方面仍然存在著短板,而技術的突破也直接決定了數(shù)字人直播的發(fā)展走向。

本文為轉載內容,授權事宜請聯(lián)系原著作權人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

AI“改造”直播間

數(shù)字人開始搶主播的飯碗。

圖片來源:界面新聞 匡達

文|光子星球 何芙蓉

編輯|吳先之

“歡迎xx來到直播間” “我們這款產(chǎn)品……”

凌晨,打開抖音、淘寶、攜程等平臺,仍然有主播在直播間循環(huán)介紹著店里的幾款商品。但她們略顯機械的語句停頓與固定的幾個手勢循環(huán),可以看出,這些主播并不是真人出鏡,而是AI數(shù)字人。

AI浪潮下,虛擬主播在今年618之際加速卷入直播間。

618期間,京東更是推出“言犀虛擬主播”產(chǎn)品,幫助商家減負增收。據(jù)京東戰(zhàn)報顯示,開門紅開啟10分鐘,數(shù)字人直播間開播商家數(shù)較去年雙11增幅近400%。另外,像雅詩蘭黛、歐萊雅、寶潔等品牌也已經(jīng)在嘗試接入虛擬主播服務于直播電商。

今年上半年,ChatGPT、Midjourney、文心一言等產(chǎn)品的出現(xiàn),掀起了AI新一輪的技術革新浪潮。AI在給一些行業(yè)帶來更多想象空間的同時,也給很多“打工人”帶來了危機。

一時間,關于“AI替代人類” “AI導致失業(yè)”的討論也甚囂塵上。

如今, AIGC 技術率先被電商行業(yè)廣泛應用于實踐,伴隨著越來越多的AI主播出現(xiàn)在直播間,AI替代論似乎也開始從預知變?yōu)楝F(xiàn)實。

AIGC“落地”直播間

將虛擬人應用于文娛、短視頻、直播帶貨等領域其實并不算什么新鮮事。在此之前,已經(jīng)有洛天依、A-Soul這樣的二次元虛擬IP,也有3D超寫實數(shù)字人柳夜熙出圈。

而當前風靡直播間的AI主播屬于2D超寫實數(shù)字人,這一技術以真人為原型,復刻主播的形象、聲音,以及表情動作,打造出一個與真人相似度極高的仿真人。2D超寫實數(shù)字人更像是專門為直播場景量身打造的。

雖然像文旅展廳、新聞資訊、學校等也都已經(jīng)在接入數(shù)字人,但AI主播在直播帶貨場景的應用則意味著AIGC的商業(yè)化落地開始轉向C端變現(xiàn)。

“AI主播這一塊可以說是AIGC技術最容易應用實踐的,或者說更容易變現(xiàn)的一個領域?!泵鎸I主播的風潮,即構科技一位內部人士如此評價。

即構科技在2019年之前就開始投入對AI的研究,基于微博、陌陌、映客、TT 語音等客戶基礎,此前其AI技術主要運用于泛娛樂以及社交領域。“比如視頻美顏、聲音降噪,視頻的摳圖,都會應用到AI技術。”

事實上,AIGC產(chǎn)業(yè)鏈逐步完善和成熟是AI數(shù)字人涌入直播間的主要推力。例如實時音頻的即構科技、AI作畫平臺研發(fā)供應6pen、超擬人大模型研發(fā)商聆心智能等?!叭ツ?,虛擬人就已經(jīng)作為我們元宇宙解決方案里面的其中一個產(chǎn)品出現(xiàn),即用戶在元宇宙里面的數(shù)字分身,當時是偏3D建模的方向,我們的虛擬人Zego Avatar可以做到面部表情到四肢動作隨動,將真人姿態(tài)在虛擬形象上進行實時的還原渲染,在交互空間里轉身、跳躍等完成一些更復雜的動作。”

“到了今年,我們就從AI團隊專門抽調了一部分人去做數(shù)字人項目,這次做的則類似于仿真人,主要用途就是在口播這一領域?!蹦壳耙惨呀?jīng)有很多MCN、廣告公司、設計公司、學校在與其數(shù)字人服務進行合作接洽。

而之所選擇從“口播”切入,數(shù)字人技術廠商們也是看準了短視頻、直播行業(yè)的切實需求。

上述人士直言,對于MCN等公司來說,引進虛擬主播可以說是一個很好的規(guī)避風險、降本增效手段。

“譬如發(fā)生像李子柒這類大IP與MCN公司分道揚鑣的事件,很多MCN是保不住IP資產(chǎn)的。若主播一開始就在公司錄制了數(shù)字分身,并明確了歸屬,那么這個數(shù)字分身會一直作為公司資產(chǎn),不會因為主播出走而流失?!?/p>

另外,虛擬主播最直接需求便是打破真人主播在直播時長等方面的制約,做到24小時不間斷直播。在現(xiàn)有案例中,一些商家已經(jīng)選擇將AI主播用于夜間直播,作為真人主播在時間上的補充。

一位MCN人士表示,在直播帶貨的過程中,場景搭建也是一塊不小的支出,而且很多物料不能被重復利用,常常被浪費。數(shù)字化場景的搭建同樣有AI技術的用武之地。

另一個層面來看,與其說是AI替代真人主播,它其實也正在作為一種工具促進生產(chǎn)力與創(chuàng)造力的解放,為內容創(chuàng)作者騰出了時間和空間在“幕后”做更多的創(chuàng)意性的工作,比如產(chǎn)品特色梳理、直播互動體驗優(yōu)化、直播間搭設升級等。

據(jù)光子星球了解,目前市面上定制一個仿真主播,其成本價基本在一萬多的水平,這對比真人直播的人力成本,顯然能夠縮減開銷。

理想狀態(tài)下,若虛擬主播能夠在逼真程度、即時反饋等方面做到與真人主播無異,這對于直播行業(yè)的影響不言而喻。

但實際效果還遠沒達到這個程度。

另一位數(shù)字人廠商人士志輝(化名)表示:“我們目前已經(jīng)有一些MCN、本地生活服務商達成合作,另外像保潔、貝亦美、奧迪汽車等品牌也即將會展開合作,但直播效果還是要視情況而定。”

“目前來看,數(shù)字人的服務場景是有限的?,F(xiàn)在在本地生活團購、文旅產(chǎn)品等直播話術相對固定,且重復頻率較高的直播間運用的比較多。而像美妝等口紅產(chǎn)品需要沉浸式介紹,AI主播還難以做到。”

除此之外,像快消百貨等標品介紹、知識型的短視頻與直播,講解話術相對統(tǒng)一,也能夠適用虛擬主播。

要論結果,目前AI主播還遠不能達到真人直播的效果。但正如一位抖音本地生活服務商人士所言:“我們大家都還在‘試’,前期肯定是有一個探索完善的過程?!?/p>

AI主播不夠“AI”

AI主播不夠“AI”,也是目前制約其直播效果的最直接因素。

對于虛擬主播的工作原理,上述數(shù)字人廠商人士志輝表示,作為技術廠商,我們主要是為客戶提供一個saas軟件,通過軟件直接推流到第三方平臺去做直播。然后客戶在這個軟件后臺去設定所謂的“人貨場”,即開播前在后臺選擇虛擬主播、提前設定好產(chǎn)品介紹,以及可以去生成數(shù)字化的直播場景。

“我們現(xiàn)在的商業(yè)邏輯主要就是把軟件功能做好,然后客戶通過軟件去管理直播間,以更方便的在后臺去編輯、更改直播內容?!?/p>

可以看出,廠商更多的是將AI技術應用于數(shù)字人的生成上,但是涉及到具體的直播時,他們更像是提供了一個輔助直播的管理工具。

直播時,現(xiàn)場互動以及反饋直播間用戶的提問是提升直播效果非常重要的一個部分。

但上述即構科技內部人士坦言:“現(xiàn)階段數(shù)字人直播時都需要提前準備一個問題庫,直播過程中收到相關彈幕或提問,就在問題庫內調取相關回答,問題庫的內容越全面、越細致,數(shù)字人直播的互動體驗才能相應提高?!?/p>

相當于AI主播在工作時,工作人員不僅要事先準備相關產(chǎn)品介紹話術,涉及臨場互動的問答也要提前預設好。

目前,數(shù)字人直播仍然囿于問題庫的預設來驅動實時反饋和互動效果,若要做到真正的開放性回答,這其中既有技術的難題,也有監(jiān)管等問題,譬如對一些敏感詞的觸碰。

“未來肯定會接入ChatGPT那樣的能力做開放性的回答,比如做個圍欄限定開放性回答的可控范圍,目前還在技術研究的過程中?!?/p>

當前,行業(yè)對于AI數(shù)字人直播的探索仍然停留在工具階段,還代替不了運營。但技術的突破與以及價格的下降已經(jīng)使得虛擬主播具備了走向大眾化的基礎。

如今AI主播的定制過程并不復雜,用戶只需提供一段形象視頻與直播話術音頻,幾天后就能拿到一個1:1克隆的數(shù)字人。

隨著數(shù)字人在直播等場景的需求被開發(fā)出來,需求攀升的同時也使得更多的科技公司加入數(shù)字人研發(fā)的大潮,進而推動數(shù)字人價格的下降?!皫啄昵?,茅臺定制一個數(shù)字人,就要花幾十萬?!?/p>

一位淘寶數(shù)字人定制廠商則表示,基于真人的聲音與形象定制一個數(shù)字人的價格為11000元,終身使用,后續(xù)再無其他費用。若是購買公司的固定數(shù)字人模板,價格則更低。

在這個過程中,越來越多自稱是AI數(shù)字人定制的商家逐漸滲透至淘寶、抖音、快手、閑魚等平臺,品牌、用戶等接觸到AI定制服務的門檻也在降低。

而那些散落在各個平臺的商家,則更多的是代理商,或者其他中間商。這其中也混雜著不少假AI商家,比如一段視頻動作循環(huán)播放,并未體現(xiàn)多少的智能化。

“目前真的在做技術研發(fā)、產(chǎn)品開發(fā)的源頭廠商,整個行業(yè)也就二十多家,我們作為其中一家自研企業(yè),也正處在打渠道的階段?!币晃粯I(yè)內人士表示。

探索與不確定性

一位電商行業(yè)人士表示,2021年他們便開始在TikTok嘗試虛擬直播,但沒做幾個月就不得不停了?!爱敃r虛擬直播同質化很嚴重,互動少,平臺封得厲害。”

國內電商平臺同樣如此,此前也有類似于動畫人物形態(tài)的虛擬主播被用于淘寶天貓直播間,可惜在直播效果、視覺化、互動等方面始終差強人意,虛擬直播并沒有被廣泛的應用。

“現(xiàn)在抖音已經(jīng)明確開放了數(shù)字人直播,其實從這些平臺的態(tài)度就已經(jīng)能夠看到AI直播的大趨勢?!币晃浑娚绦袠I(yè)人士表示。

AI直播作為一個新型事物,目前處在發(fā)展應用的初期,但平臺、商家,以及MCN等都表現(xiàn)出了擁抱探索的心態(tài)。

5月9日,抖音發(fā)布《抖音關于人工智能生成內容的平臺規(guī)范暨行業(yè)倡議》,針對人工智能生成的視頻、圖片和衍生的虛擬人直播,首次明確其在平臺內的行為規(guī)范。本次新規(guī)推出,虛擬主播不再游走于抖音審核邊界,正式“合法化”??焓?、淘寶直播等平臺目前暫時還未跟進。

抖音強調內容為王,利用人工智能輔助的創(chuàng)作內容與其他內容擁有同等的流量分配規(guī)則,用戶可以依托技術進行輔助創(chuàng)作具有更高質量的內容,但不提倡利用低成本技術優(yōu)勢生成低質內容。同時需要進行實名注冊,并標識虛擬人直播。

“平臺是開放的,但它最根本的標準在于你得輸出一些高質量的內容。比如你不能錄播,在直播過程中得有實時的提問和反饋等?!盇I生成內容成本低,容易陷入低質內容的漩渦,平臺開放后同樣會對低質內容進行管控。

“我們只能盡量做到合規(guī)。”上述人士直言。

技術的發(fā)展有一個過程,目前AI直播在互動反饋、畫面效果等方面仍然存在著短板,而技術的突破也直接決定了數(shù)字人直播的發(fā)展走向。

本文為轉載內容,授權事宜請聯(lián)系原著作權人。