正在閱讀:

火了一整年的數(shù)字人,誰在收割焦慮的商家

掃一掃下載界面新聞APP

火了一整年的數(shù)字人,誰在收割焦慮的商家

數(shù)字人也需要專業(yè)。

文 | 財經(jīng)無忌 白嘉嘉

作為AI的分支,數(shù)字人堪稱2023年最炙手可熱的商業(yè)故事之一。只要幾千元的成本,再花上一些時間錄制音頻和視頻,大模型就能訓練出數(shù)字分身,從嘴形、說話節(jié)奏到肢體語言,幾乎和本人一模一樣的。

然而,這片藍海最近起了一些波瀾——一家叫Heygen的數(shù)字人企業(yè),遭到了行業(yè)頭部企業(yè)的聲討。

Heygen是它的美國名字,在國內(nèi),它叫詩云科技。兩邊都注冊公司的直接收獲是,Heygen可以分別在兩個市場開展業(yè)務,卻不需要履行相應的合規(guī)義務。

譬如,為了防止AI技術被用于違法行為,國內(nèi)的企業(yè)在為客戶提供服務時都需要進行身份認定,而Heygen卻沒有設立相應的機制,不僅破壞了行業(yè)的成本邏輯,還讓這個本就年輕的市場更加脆弱。

一個現(xiàn)象是,瞄準中小商戶的流量焦慮,大量投機者利用Heygen來制作數(shù)字人,并聲稱有技術和能力運營數(shù)字人直播,但真正開播后,商戶收到的卻是無盡的違規(guī)和封禁。

這個現(xiàn)象背后反映的問題是,數(shù)字人產(chǎn)業(yè)鏈嚴重割裂,部分掌握技術的廠商為了擴大市場份額和影響力,故意放任下游“野蠻生長”。而商戶則被部分服務商過度吹噓數(shù)字人能力的話術蒙蔽,成為了惡性競爭的代價。

1、數(shù)字人亂象:貼牌、套殼、盜版......

2023年7月,孫旭感受到了餐飲市場的寒意,他頻繁地在朋友圈刷到同行關店或轉(zhuǎn)行的消息,剩下的另一部分同行,正為了自救猛烈地推出各種優(yōu)惠活動。“這個行業(yè)淘汰率一直不低,但今年(2023年)明顯更高了”,他說。

2023年堪稱餐飲業(yè)的“死亡之年”。 企查查數(shù)據(jù)顯示,2023年1月到9月,全國餐飲累計吊銷99萬家,是2022年的4倍。其中僅6月就吊銷了18.05萬家,包括一些曾經(jīng)在行業(yè)內(nèi)有一席之地的頭部品牌。

眼見市場越來越卷,孫旭想找一些新渠道來為店里引流。直播是他的首選,但一上鏡就怯場,另招一名主播又太貴。后來又嘗試約了一些本地的小網(wǎng)紅來探店,但轉(zhuǎn)化率同樣堪憂。

或許是因為算法“洞察”了孫旭的意圖,幾個數(shù)字人視頻被推送到了他的手機里。

雖然當時還沒出現(xiàn)泰勒斯威夫特的爆款視頻,但那些被拋出來的成品已經(jīng)足夠逼真,幾乎分辨不出來與真人的區(qū)別。這類視頻往往遵循同一個套路,在片頭讓觀眾猜接下來出現(xiàn)的幾個人中誰才是數(shù)字人,在片尾揭秘其實都是數(shù)字人。

如果追根溯源的話,這些視頻確實都由數(shù)字人技術制作而成。但推送這些數(shù)字人視頻到“孫旭們”面前的,卻未必是具備全鏈條能力的公司。

為了降低用戶使用門檻,頭部數(shù)字人公司往往會提供一批公共數(shù)字人給不愿意克隆自己形象的用戶選擇,就像在游戲里選擇角色那樣。同時,為了讓更多人愿意嘗試這項新技術,企業(yè)往往還會提供一定的免費時長。

這些“福利”為大量不具備底層技術和運營、開發(fā)能力的公司提供了鉆空子的余地。它們直接以個人的身份在頭部企業(yè)的官網(wǎng)定制視頻,并用來為自己的公司招攬業(yè)務,更有甚者選擇直接搬運其他公司的視頻到自己的引流賬號上。

在尋找數(shù)字人公司的過程中,孫旭幾乎“挑花了眼”,“198元AI虛擬主播數(shù)字人”、“17.6元虛擬主播教程”等廣告比比皆是。期間他也感到過不對勁,總感覺對方提供的樣品中有一些面孔很眼熟,“現(xiàn)在想起來可能是在短視頻上刷到過”。

其實不光是用戶,頭部企業(yè)也對市場上的套殼、貼牌亂象頗為頭疼。

成立于南京的硅基智能是國內(nèi)頂尖的數(shù)字人廠商之一,與北京的風平智能一同被稱為數(shù)字人界的“南慕容,北喬峰”。

硅基智能創(chuàng)始人司馬華鵬曾在接受財經(jīng)無忌采訪時表示,硅基智能的數(shù)字人視頻經(jīng)常被其他人盜用去吸引客戶。 這些公司不具備后期運營能力,無法幫助客戶取得較好的收益,但很擅長通過營銷引流,用破壞市場的超低價來招攬客戶。

事實上,數(shù)字人行業(yè)的亂象已經(jīng)在一定范圍內(nèi)引起了社會的關注。定焦、自象限、AI技術評論等多家媒體均展開過相關報道。

2、亂象叢生因為數(shù)字人“太年輕”?

數(shù)字人行業(yè)之所以顯得亂象叢生,本質(zhì)上是因為它還“年輕”。

數(shù)字人年輕?可能許多從業(yè)者不會接受這個看法,如果從手繪數(shù)字人起算,這門技術已經(jīng)發(fā)展了接近40年。

但很長的一段時間內(nèi),數(shù)字人制作只能通過手繪、CG、動作捕捉等手段,成本高昂且智能水平不足,與其說它是數(shù)字人,更像是一個沒有靈魂的數(shù)字皮套。

2018年雖然得益于深度學習算法的進步,數(shù)字人制作成本從萬元、幾十萬元降低到了千元級別,但本質(zhì)上解決的仍是數(shù)字人的外形問題,沒有形成真正的生產(chǎn)力,因此2019年和2020年數(shù)字人創(chuàng)業(yè)潮很快就回歸了平靜。

直到2023年,以ChatGPT為代表的大語言模型帶來了賦予數(shù)字人“靈魂”的曙光,行業(yè)才迎來了它真正的質(zhì)變。來自清華大學的《數(shù)字人研究報告2.0》顯示,2025年數(shù)字人產(chǎn)業(yè)規(guī)模有望超過1000億。

前景廣闊的背面是市場缺乏對數(shù)字人的共識。

目前,“數(shù)字人”的概念非常寬泛,從動畫作品里的虛擬角色,到微軟小冰,再到通過全息技術“復活”的鄧麗君,甚至是讓照片“動嘴”,都被裝進了數(shù)字人的口袋。

消費者除非對數(shù)字人進行了深入的研究,否則很容易被賣家“數(shù)字人只能這樣”“這就是數(shù)字人”的話術迷惑,認為這只不過是又一個商業(yè)噱頭。

年輕帶來的第二個問題,是市場也還在適應這項新技術,規(guī)則常常發(fā)生變化。

2023年5月,抖音發(fā)布《抖音關于人工智能生成內(nèi)容的平臺規(guī)范暨行業(yè)倡議(以下簡稱數(shù)字人行業(yè)倡議)》,率先開放AI生成的圖片、視頻和數(shù)字人直播,但同時也意味著數(shù)字人要被“管”了。

《倡議》在圈里掀起了不小討論,作為最容易變現(xiàn)的領域,許多企業(yè)都寄希望于用數(shù)字人來降本增效。但同時,隨著數(shù)字人直播間的數(shù)量增加,質(zhì)疑聲也越來越多,諸如效果太假、市場混亂、價格不透明等。人們開始關心,在已經(jīng)信息爆炸的情況下,是否要允許“生育能力超強”的數(shù)字人來搶占大家本就已經(jīng)碎片化的時間。

雖然目前還沒有其他平臺跟進,但國家層面的立法卻從未停下,幾乎每個月都能看到新的規(guī)范或法規(guī)出臺。

變換的市場規(guī)則考驗著上游數(shù)字人供應商,即便有心踏實做生意,在團隊規(guī)模有限的情況下,也很難將服務做扎實。 目前,數(shù)字人直播間和賬戶被封仍是用戶反饋最多的問題之一。

3、專業(yè)才是數(shù)字人唯一的出路

在被封了3次之后,孫旭逐漸意識到,自己似乎被割了韭菜。

最初他對數(shù)字人員工很滿意,曾經(jīng)用它連續(xù)13個小時賣門店的團購券。雖然過程中數(shù)字人對觀眾的提問置若罔聞,但當時他相信自己已經(jīng)坐上了新時代的便車,數(shù)字人越來越智能只是時間問題。

然而問題很快就出現(xiàn)了,因為被判定為錄播,孫旭的直播間迎來了它的第一次封禁。

錄播是目前數(shù)字人直播最容易踩的坑之一,它只是根據(jù)提前錄入的腳本循環(huán)播放數(shù)字人視頻,與背靠大模型實時生成內(nèi)容的數(shù)字人有本質(zhì)區(qū)別。這些區(qū)別很難用肉眼辨別,但在數(shù)據(jù)監(jiān)測后臺上卻能被一目了然地辨認出來。

“最早一批嘗試數(shù)字人直播技術的商家,很多是被錄播割了韭菜?!睌?shù)字人代理公司負責人張現(xiàn)說,很多商家此前沒做過直播,不熟悉平臺規(guī)則,但對數(shù)字人很感興趣,花萬八千,從代理商那里買到一款錄好視頻的數(shù)字人,但很容易被封”。

除了錄播,數(shù)字人質(zhì)量差、口型對不上、交互能力低下、視頻質(zhì)量等問題均有可能導致客戶的使用體驗下降,甚至封禁。雖然有些公司提供指導服務,會一步步教客戶如何解封直播間,但整體來說,仍沒有公司能保證不會被封號。

不過也有一些企業(yè)確實利用數(shù)字人實現(xiàn)了效率翻倍。

硅基智能透露,某酒旅行業(yè)頭部品牌的數(shù)字人直播間內(nèi),2023年已經(jīng)收獲了超過10億的GMV(商品交易總額);某咖啡品牌的單一數(shù)字人直播間,僅在單日的5小時內(nèi),就收獲了85.6萬的營收。

為什么有的人能用數(shù)字人賺錢,有的人不行?

本質(zhì)上,數(shù)字人仍舊是一款工具,而不是具有主觀能動性的人,它所能發(fā)揮出的潛力,與使用者對行業(yè)的理解程度高度相關。換而言之,只有懂得KnowHow的人,才能用好數(shù)字人。

以最基本的交互為例。為了防止大模型幻覺導致數(shù)字人在直播間內(nèi)胡說八道,市場上90%以上的數(shù)字人公司使用的都是“關鍵詞匹配”技術。通過關鍵詞來匹配問題和答案,只要觸發(fā)了關鍵詞,它就能匹配到并反饋給觀眾。

機械的匹配機制下,數(shù)字人直播間往往枯燥乏味。但如果直播間運營商儲備了相應的語料庫,知道主播說哪些話、怎么安排直播節(jié)奏能調(diào)動直播間氛圍,即便同樣基于“關鍵詞匹配”技術,直播效果上也會呈現(xiàn)出較大的差異。

客觀來說,數(shù)字人直播的門檻其實并不低,它既需要客戶對技術有一定了解,能分辨錄播與真正的數(shù)字人之間的區(qū)別,還需要客戶對直播行業(yè)有基本的常識。

指數(shù)起量,打破真人直播的上限,24小時無休……這些詞句常被用于介紹數(shù)字人的優(yōu)點。與單獨的個體相比,數(shù)字人固然在“繁衍能力”和“勞動時長”上有先天優(yōu)勢。但如果放到整個直播大盤中,24小時無休和主播數(shù)量爆炸早已經(jīng)在多年前就成為了現(xiàn)實。

或許,直播平臺并不在意屏幕前的那個是數(shù)字人還是真人,嚴密的平臺規(guī)則和推薦機制已經(jīng)注定,只有“專業(yè)”才是突出重圍的殺手锏。

本文為轉(zhuǎn)載內(nèi)容,授權事宜請聯(lián)系原著作權人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

火了一整年的數(shù)字人,誰在收割焦慮的商家

數(shù)字人也需要專業(yè)。

文 | 財經(jīng)無忌 白嘉嘉

作為AI的分支,數(shù)字人堪稱2023年最炙手可熱的商業(yè)故事之一。只要幾千元的成本,再花上一些時間錄制音頻和視頻,大模型就能訓練出數(shù)字分身,從嘴形、說話節(jié)奏到肢體語言,幾乎和本人一模一樣的。

然而,這片藍海最近起了一些波瀾——一家叫Heygen的數(shù)字人企業(yè),遭到了行業(yè)頭部企業(yè)的聲討。

Heygen是它的美國名字,在國內(nèi),它叫詩云科技。兩邊都注冊公司的直接收獲是,Heygen可以分別在兩個市場開展業(yè)務,卻不需要履行相應的合規(guī)義務。

譬如,為了防止AI技術被用于違法行為,國內(nèi)的企業(yè)在為客戶提供服務時都需要進行身份認定,而Heygen卻沒有設立相應的機制,不僅破壞了行業(yè)的成本邏輯,還讓這個本就年輕的市場更加脆弱。

一個現(xiàn)象是,瞄準中小商戶的流量焦慮,大量投機者利用Heygen來制作數(shù)字人,并聲稱有技術和能力運營數(shù)字人直播,但真正開播后,商戶收到的卻是無盡的違規(guī)和封禁。

這個現(xiàn)象背后反映的問題是,數(shù)字人產(chǎn)業(yè)鏈嚴重割裂,部分掌握技術的廠商為了擴大市場份額和影響力,故意放任下游“野蠻生長”。而商戶則被部分服務商過度吹噓數(shù)字人能力的話術蒙蔽,成為了惡性競爭的代價。

1、數(shù)字人亂象:貼牌、套殼、盜版......

2023年7月,孫旭感受到了餐飲市場的寒意,他頻繁地在朋友圈刷到同行關店或轉(zhuǎn)行的消息,剩下的另一部分同行,正為了自救猛烈地推出各種優(yōu)惠活動?!斑@個行業(yè)淘汰率一直不低,但今年(2023年)明顯更高了”,他說。

2023年堪稱餐飲業(yè)的“死亡之年”。 企查查數(shù)據(jù)顯示,2023年1月到9月,全國餐飲累計吊銷99萬家,是2022年的4倍。其中僅6月就吊銷了18.05萬家,包括一些曾經(jīng)在行業(yè)內(nèi)有一席之地的頭部品牌。

眼見市場越來越卷,孫旭想找一些新渠道來為店里引流。直播是他的首選,但一上鏡就怯場,另招一名主播又太貴。后來又嘗試約了一些本地的小網(wǎng)紅來探店,但轉(zhuǎn)化率同樣堪憂。

或許是因為算法“洞察”了孫旭的意圖,幾個數(shù)字人視頻被推送到了他的手機里。

雖然當時還沒出現(xiàn)泰勒斯威夫特的爆款視頻,但那些被拋出來的成品已經(jīng)足夠逼真,幾乎分辨不出來與真人的區(qū)別。這類視頻往往遵循同一個套路,在片頭讓觀眾猜接下來出現(xiàn)的幾個人中誰才是數(shù)字人,在片尾揭秘其實都是數(shù)字人。

如果追根溯源的話,這些視頻確實都由數(shù)字人技術制作而成。但推送這些數(shù)字人視頻到“孫旭們”面前的,卻未必是具備全鏈條能力的公司。

為了降低用戶使用門檻,頭部數(shù)字人公司往往會提供一批公共數(shù)字人給不愿意克隆自己形象的用戶選擇,就像在游戲里選擇角色那樣。同時,為了讓更多人愿意嘗試這項新技術,企業(yè)往往還會提供一定的免費時長。

這些“福利”為大量不具備底層技術和運營、開發(fā)能力的公司提供了鉆空子的余地。它們直接以個人的身份在頭部企業(yè)的官網(wǎng)定制視頻,并用來為自己的公司招攬業(yè)務,更有甚者選擇直接搬運其他公司的視頻到自己的引流賬號上。

在尋找數(shù)字人公司的過程中,孫旭幾乎“挑花了眼”,“198元AI虛擬主播數(shù)字人”、“17.6元虛擬主播教程”等廣告比比皆是。期間他也感到過不對勁,總感覺對方提供的樣品中有一些面孔很眼熟,“現(xiàn)在想起來可能是在短視頻上刷到過”。

其實不光是用戶,頭部企業(yè)也對市場上的套殼、貼牌亂象頗為頭疼。

成立于南京的硅基智能是國內(nèi)頂尖的數(shù)字人廠商之一,與北京的風平智能一同被稱為數(shù)字人界的“南慕容,北喬峰”。

硅基智能創(chuàng)始人司馬華鵬曾在接受財經(jīng)無忌采訪時表示,硅基智能的數(shù)字人視頻經(jīng)常被其他人盜用去吸引客戶。 這些公司不具備后期運營能力,無法幫助客戶取得較好的收益,但很擅長通過營銷引流,用破壞市場的超低價來招攬客戶。

事實上,數(shù)字人行業(yè)的亂象已經(jīng)在一定范圍內(nèi)引起了社會的關注。定焦、自象限、AI技術評論等多家媒體均展開過相關報道。

2、亂象叢生因為數(shù)字人“太年輕”?

數(shù)字人行業(yè)之所以顯得亂象叢生,本質(zhì)上是因為它還“年輕”。

數(shù)字人年輕?可能許多從業(yè)者不會接受這個看法,如果從手繪數(shù)字人起算,這門技術已經(jīng)發(fā)展了接近40年。

但很長的一段時間內(nèi),數(shù)字人制作只能通過手繪、CG、動作捕捉等手段,成本高昂且智能水平不足,與其說它是數(shù)字人,更像是一個沒有靈魂的數(shù)字皮套。

2018年雖然得益于深度學習算法的進步,數(shù)字人制作成本從萬元、幾十萬元降低到了千元級別,但本質(zhì)上解決的仍是數(shù)字人的外形問題,沒有形成真正的生產(chǎn)力,因此2019年和2020年數(shù)字人創(chuàng)業(yè)潮很快就回歸了平靜。

直到2023年,以ChatGPT為代表的大語言模型帶來了賦予數(shù)字人“靈魂”的曙光,行業(yè)才迎來了它真正的質(zhì)變。來自清華大學的《數(shù)字人研究報告2.0》顯示,2025年數(shù)字人產(chǎn)業(yè)規(guī)模有望超過1000億。

前景廣闊的背面是市場缺乏對數(shù)字人的共識。

目前,“數(shù)字人”的概念非常寬泛,從動畫作品里的虛擬角色,到微軟小冰,再到通過全息技術“復活”的鄧麗君,甚至是讓照片“動嘴”,都被裝進了數(shù)字人的口袋。

消費者除非對數(shù)字人進行了深入的研究,否則很容易被賣家“數(shù)字人只能這樣”“這就是數(shù)字人”的話術迷惑,認為這只不過是又一個商業(yè)噱頭。

年輕帶來的第二個問題,是市場也還在適應這項新技術,規(guī)則常常發(fā)生變化。

2023年5月,抖音發(fā)布《抖音關于人工智能生成內(nèi)容的平臺規(guī)范暨行業(yè)倡議(以下簡稱數(shù)字人行業(yè)倡議)》,率先開放AI生成的圖片、視頻和數(shù)字人直播,但同時也意味著數(shù)字人要被“管”了。

《倡議》在圈里掀起了不小討論,作為最容易變現(xiàn)的領域,許多企業(yè)都寄希望于用數(shù)字人來降本增效。但同時,隨著數(shù)字人直播間的數(shù)量增加,質(zhì)疑聲也越來越多,諸如效果太假、市場混亂、價格不透明等。人們開始關心,在已經(jīng)信息爆炸的情況下,是否要允許“生育能力超強”的數(shù)字人來搶占大家本就已經(jīng)碎片化的時間。

雖然目前還沒有其他平臺跟進,但國家層面的立法卻從未停下,幾乎每個月都能看到新的規(guī)范或法規(guī)出臺。

變換的市場規(guī)則考驗著上游數(shù)字人供應商,即便有心踏實做生意,在團隊規(guī)模有限的情況下,也很難將服務做扎實。 目前,數(shù)字人直播間和賬戶被封仍是用戶反饋最多的問題之一。

3、專業(yè)才是數(shù)字人唯一的出路

在被封了3次之后,孫旭逐漸意識到,自己似乎被割了韭菜。

最初他對數(shù)字人員工很滿意,曾經(jīng)用它連續(xù)13個小時賣門店的團購券。雖然過程中數(shù)字人對觀眾的提問置若罔聞,但當時他相信自己已經(jīng)坐上了新時代的便車,數(shù)字人越來越智能只是時間問題。

然而問題很快就出現(xiàn)了,因為被判定為錄播,孫旭的直播間迎來了它的第一次封禁。

錄播是目前數(shù)字人直播最容易踩的坑之一,它只是根據(jù)提前錄入的腳本循環(huán)播放數(shù)字人視頻,與背靠大模型實時生成內(nèi)容的數(shù)字人有本質(zhì)區(qū)別。這些區(qū)別很難用肉眼辨別,但在數(shù)據(jù)監(jiān)測后臺上卻能被一目了然地辨認出來。

“最早一批嘗試數(shù)字人直播技術的商家,很多是被錄播割了韭菜?!睌?shù)字人代理公司負責人張現(xiàn)說,很多商家此前沒做過直播,不熟悉平臺規(guī)則,但對數(shù)字人很感興趣,花萬八千,從代理商那里買到一款錄好視頻的數(shù)字人,但很容易被封”。

除了錄播,數(shù)字人質(zhì)量差、口型對不上、交互能力低下、視頻質(zhì)量等問題均有可能導致客戶的使用體驗下降,甚至封禁。雖然有些公司提供指導服務,會一步步教客戶如何解封直播間,但整體來說,仍沒有公司能保證不會被封號。

不過也有一些企業(yè)確實利用數(shù)字人實現(xiàn)了效率翻倍。

硅基智能透露,某酒旅行業(yè)頭部品牌的數(shù)字人直播間內(nèi),2023年已經(jīng)收獲了超過10億的GMV(商品交易總額);某咖啡品牌的單一數(shù)字人直播間,僅在單日的5小時內(nèi),就收獲了85.6萬的營收。

為什么有的人能用數(shù)字人賺錢,有的人不行?

本質(zhì)上,數(shù)字人仍舊是一款工具,而不是具有主觀能動性的人,它所能發(fā)揮出的潛力,與使用者對行業(yè)的理解程度高度相關。換而言之,只有懂得KnowHow的人,才能用好數(shù)字人。

以最基本的交互為例。為了防止大模型幻覺導致數(shù)字人在直播間內(nèi)胡說八道,市場上90%以上的數(shù)字人公司使用的都是“關鍵詞匹配”技術。通過關鍵詞來匹配問題和答案,只要觸發(fā)了關鍵詞,它就能匹配到并反饋給觀眾。

機械的匹配機制下,數(shù)字人直播間往往枯燥乏味。但如果直播間運營商儲備了相應的語料庫,知道主播說哪些話、怎么安排直播節(jié)奏能調(diào)動直播間氛圍,即便同樣基于“關鍵詞匹配”技術,直播效果上也會呈現(xiàn)出較大的差異。

客觀來說,數(shù)字人直播的門檻其實并不低,它既需要客戶對技術有一定了解,能分辨錄播與真正的數(shù)字人之間的區(qū)別,還需要客戶對直播行業(yè)有基本的常識。

指數(shù)起量,打破真人直播的上限,24小時無休……這些詞句常被用于介紹數(shù)字人的優(yōu)點。與單獨的個體相比,數(shù)字人固然在“繁衍能力”和“勞動時長”上有先天優(yōu)勢。但如果放到整個直播大盤中,24小時無休和主播數(shù)量爆炸早已經(jīng)在多年前就成為了現(xiàn)實。

或許,直播平臺并不在意屏幕前的那個是數(shù)字人還是真人,嚴密的平臺規(guī)則和推薦機制已經(jīng)注定,只有“專業(yè)”才是突出重圍的殺手锏。

本文為轉(zhuǎn)載內(nèi)容,授權事宜請聯(lián)系原著作權人。