正在閱讀:

百度將推數(shù)字人直播平臺(tái),一到兩年內(nèi)要讓數(shù)字人更像人

掃一掃下載界面新聞APP

百度將推數(shù)字人直播平臺(tái),一到兩年內(nèi)要讓數(shù)字人更像人

百度的數(shù)字人業(yè)務(wù)主要聚焦三個(gè)賽道:直播帶貨、企業(yè)營(yíng)銷以及娛樂(lè)主播方向。

圖片來(lái)源:視覺(jué)中國(guó)

記者|崔鵬

虛擬數(shù)字人賽道正在成為各大互聯(lián)網(wǎng)公司爭(zhēng)相追趕的新風(fēng)口。

7月19日,百度數(shù)字人與機(jī)器人業(yè)務(wù)負(fù)責(zé)人李士巖接受了界面新聞在內(nèi)的多家媒體采訪,詳細(xì)介紹了百度智能云曦靈平臺(tái)和數(shù)字直播人業(yè)務(wù)的最新進(jìn)展。

該平臺(tái)于2021年底在百度AI開(kāi)發(fā)者大會(huì)上正式發(fā)布,集數(shù)字人生產(chǎn)、內(nèi)容創(chuàng)作、業(yè)務(wù)配置服務(wù)為一體,主要為廣電、互娛、金融、政務(wù)、運(yùn)營(yíng)商、零售等行業(yè)提供虛擬主持人、虛擬員工、虛擬偶像、品牌代言人的創(chuàng)建與運(yùn)營(yíng)服務(wù)。

據(jù)李士巖介紹,曦靈目前擁有四個(gè)比較成熟的子平臺(tái):數(shù)字人手語(yǔ)平臺(tái)、數(shù)字明星運(yùn)營(yíng)平臺(tái)、數(shù)字人直播平臺(tái)以及與交互能力相關(guān)的對(duì)話配置平臺(tái)。通過(guò)它們來(lái)支撐廣電、互娛、MCN、藝人經(jīng)紀(jì)公司和品牌商等解決方案,支持平臺(tái)的商業(yè)化業(yè)務(wù)。

百度認(rèn)為,數(shù)字人產(chǎn)業(yè)目前最大的痛點(diǎn)是鏈條非常長(zhǎng):除了做模型、做綁定、做動(dòng)力學(xué),還要軟件公司幫忙做集成;如果需要語(yǔ)音則要找做語(yǔ)音的公司,需要視覺(jué)再找做視覺(jué)的AI公司,最后讓工程師來(lái)做集成。

在李士巖看來(lái),百度是國(guó)內(nèi)唯一一家既有視覺(jué)能力,又有語(yǔ)音、語(yǔ)義相關(guān)包括計(jì)算機(jī)圖靈學(xué)自動(dòng)生成全鏈路AI能力平臺(tái)型的公司,底層全棧AI能力是曦靈的優(yōu)勢(shì);再往上是各個(gè)類型人像生產(chǎn)線,以及人設(shè)管理平臺(tái)。人設(shè)生產(chǎn)出來(lái)之后,百度再通過(guò)交互服務(wù)或者生產(chǎn)內(nèi)容的方式,滿足客戶的需求。

這里還牽扯到數(shù)字人的類型劃分問(wèn)題,百度將自己的數(shù)字人產(chǎn)品分為服務(wù)型跟演藝型兩類。

“在我們來(lái)看,數(shù)字人的第一性原理就是兩件事:第一是交互,第二是內(nèi)容?!崩钍繋r解釋稱,交互就是通過(guò)問(wèn)答等交互手段幫客戶達(dá)成目標(biāo),內(nèi)容則主要通過(guò)生產(chǎn)短視頻、圖片、直播等形式達(dá)成。

這些目標(biāo)包括降低閑時(shí)直播的成本并提高效率,以及在企業(yè)營(yíng)銷賽道上擴(kuò)展新的邊界。

因此,百度的數(shù)字人業(yè)務(wù)主要聚焦三個(gè)賽道:直播帶貨場(chǎng)景,企業(yè)營(yíng)銷(主要做新客戶的轉(zhuǎn)化、留存等),以及一些娛樂(lè)主播方向的事情。

其中落地最快的當(dāng)屬直播場(chǎng)景。百度表示,即將在2022年百度世界大會(huì)期間推出的數(shù)字人直播制作平臺(tái),能夠?qū)崿F(xiàn)24小時(shí)純AI直播,數(shù)字人可以隨意切換妝發(fā)、場(chǎng)景和造型,大量中小商家通過(guò)平臺(tái)創(chuàng)設(shè)自己的直播帶貨數(shù)字人主播。

直播帶貨雖已成為商家重要的營(yíng)銷形式,但成本并不低,需要承擔(dān)場(chǎng)地租用、雇主播以及整個(gè)運(yùn)營(yíng)團(tuán)隊(duì)的費(fèi)用。

百度曾做過(guò)一項(xiàng)調(diào)研,在一線城市雇一個(gè)比較好的主播一般月薪在1萬(wàn)塊左右,場(chǎng)地費(fèi)用一年3-4萬(wàn),即便拋去運(yùn)營(yíng)團(tuán)隊(duì)費(fèi)用、補(bǔ)光燈和導(dǎo)播臺(tái)硬件設(shè)備費(fèi)用等等,每年也至少需要15萬(wàn)元,對(duì)于中小品牌來(lái)說(shuō)負(fù)擔(dān)比較大。

“有了我們這個(gè)直播平臺(tái),一個(gè)軟件就能解決問(wèn)題,成本下降了30%甚至50%以上?!崩钍繋r表示。

不過(guò),做數(shù)字人直播平臺(tái),還要克服很多技術(shù)難點(diǎn)。比如在人像維度,百度已經(jīng)迭代了三個(gè)版本,借助于超寫(xiě)實(shí)數(shù)字人SaaS軟件、超智能問(wèn)答對(duì)話系統(tǒng),以及口型合成技術(shù)、面部綁定技術(shù)以及動(dòng)作系統(tǒng),包括口型合成準(zhǔn)確率目前達(dá)到98.5%。

在至關(guān)重要的交互能力上,百度將語(yǔ)音、語(yǔ)義和視覺(jué)等能力集成到一款產(chǎn)品上,不僅需要底層技術(shù)的突破,也需要非常強(qiáng)的工程化能力。

“我們相信經(jīng)過(guò)持續(xù)努力,非常有機(jī)會(huì)在1-2年內(nèi)讓數(shù)字人的表現(xiàn)力和交互能力,無(wú)限制趨近于真人的水平?!崩钍繋r表示。

官方信息顯示,目前百度智能云曦靈已經(jīng)擁有幾十家客戶,包括今年冬奧會(huì)央視總臺(tái)的實(shí)時(shí)播報(bào)手語(yǔ)主播,與國(guó)家航天局合作的火星車數(shù)字人祝融號(hào),以及國(guó)內(nèi)首個(gè)文博虛擬宣推官“文夭夭”等,都基于該平臺(tái)進(jìn)行設(shè)計(jì)、研發(fā)、集成和應(yīng)用。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。

百度

6.2k
  • 百度推出外貿(mào)企業(yè)AI扶持計(jì)劃
  • 百度智能駕駛參與香港引進(jìn)辦第4批重點(diǎn)企業(yè)簽約儀式

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

百度將推數(shù)字人直播平臺(tái),一到兩年內(nèi)要讓數(shù)字人更像人

百度的數(shù)字人業(yè)務(wù)主要聚焦三個(gè)賽道:直播帶貨、企業(yè)營(yíng)銷以及娛樂(lè)主播方向。

圖片來(lái)源:視覺(jué)中國(guó)

記者|崔鵬

虛擬數(shù)字人賽道正在成為各大互聯(lián)網(wǎng)公司爭(zhēng)相追趕的新風(fēng)口。

7月19日,百度數(shù)字人與機(jī)器人業(yè)務(wù)負(fù)責(zé)人李士巖接受了界面新聞在內(nèi)的多家媒體采訪,詳細(xì)介紹了百度智能云曦靈平臺(tái)和數(shù)字直播人業(yè)務(wù)的最新進(jìn)展。

該平臺(tái)于2021年底在百度AI開(kāi)發(fā)者大會(huì)上正式發(fā)布,集數(shù)字人生產(chǎn)、內(nèi)容創(chuàng)作、業(yè)務(wù)配置服務(wù)為一體,主要為廣電、互娛、金融、政務(wù)、運(yùn)營(yíng)商、零售等行業(yè)提供虛擬主持人、虛擬員工、虛擬偶像、品牌代言人的創(chuàng)建與運(yùn)營(yíng)服務(wù)。

據(jù)李士巖介紹,曦靈目前擁有四個(gè)比較成熟的子平臺(tái):數(shù)字人手語(yǔ)平臺(tái)、數(shù)字明星運(yùn)營(yíng)平臺(tái)、數(shù)字人直播平臺(tái)以及與交互能力相關(guān)的對(duì)話配置平臺(tái)。通過(guò)它們來(lái)支撐廣電、互娛、MCN、藝人經(jīng)紀(jì)公司和品牌商等解決方案,支持平臺(tái)的商業(yè)化業(yè)務(wù)。

百度認(rèn)為,數(shù)字人產(chǎn)業(yè)目前最大的痛點(diǎn)是鏈條非常長(zhǎng):除了做模型、做綁定、做動(dòng)力學(xué),還要軟件公司幫忙做集成;如果需要語(yǔ)音則要找做語(yǔ)音的公司,需要視覺(jué)再找做視覺(jué)的AI公司,最后讓工程師來(lái)做集成。

在李士巖看來(lái),百度是國(guó)內(nèi)唯一一家既有視覺(jué)能力,又有語(yǔ)音、語(yǔ)義相關(guān)包括計(jì)算機(jī)圖靈學(xué)自動(dòng)生成全鏈路AI能力平臺(tái)型的公司,底層全棧AI能力是曦靈的優(yōu)勢(shì);再往上是各個(gè)類型人像生產(chǎn)線,以及人設(shè)管理平臺(tái)。人設(shè)生產(chǎn)出來(lái)之后,百度再通過(guò)交互服務(wù)或者生產(chǎn)內(nèi)容的方式,滿足客戶的需求。

這里還牽扯到數(shù)字人的類型劃分問(wèn)題,百度將自己的數(shù)字人產(chǎn)品分為服務(wù)型跟演藝型兩類。

“在我們來(lái)看,數(shù)字人的第一性原理就是兩件事:第一是交互,第二是內(nèi)容。”李士巖解釋稱,交互就是通過(guò)問(wèn)答等交互手段幫客戶達(dá)成目標(biāo),內(nèi)容則主要通過(guò)生產(chǎn)短視頻、圖片、直播等形式達(dá)成。

這些目標(biāo)包括降低閑時(shí)直播的成本并提高效率,以及在企業(yè)營(yíng)銷賽道上擴(kuò)展新的邊界。

因此,百度的數(shù)字人業(yè)務(wù)主要聚焦三個(gè)賽道:直播帶貨場(chǎng)景,企業(yè)營(yíng)銷(主要做新客戶的轉(zhuǎn)化、留存等),以及一些娛樂(lè)主播方向的事情。

其中落地最快的當(dāng)屬直播場(chǎng)景。百度表示,即將在2022年百度世界大會(huì)期間推出的數(shù)字人直播制作平臺(tái),能夠?qū)崿F(xiàn)24小時(shí)純AI直播,數(shù)字人可以隨意切換妝發(fā)、場(chǎng)景和造型,大量中小商家通過(guò)平臺(tái)創(chuàng)設(shè)自己的直播帶貨數(shù)字人主播。

直播帶貨雖已成為商家重要的營(yíng)銷形式,但成本并不低,需要承擔(dān)場(chǎng)地租用、雇主播以及整個(gè)運(yùn)營(yíng)團(tuán)隊(duì)的費(fèi)用。

百度曾做過(guò)一項(xiàng)調(diào)研,在一線城市雇一個(gè)比較好的主播一般月薪在1萬(wàn)塊左右,場(chǎng)地費(fèi)用一年3-4萬(wàn),即便拋去運(yùn)營(yíng)團(tuán)隊(duì)費(fèi)用、補(bǔ)光燈和導(dǎo)播臺(tái)硬件設(shè)備費(fèi)用等等,每年也至少需要15萬(wàn)元,對(duì)于中小品牌來(lái)說(shuō)負(fù)擔(dān)比較大。

“有了我們這個(gè)直播平臺(tái),一個(gè)軟件就能解決問(wèn)題,成本下降了30%甚至50%以上?!崩钍繋r表示。

不過(guò),做數(shù)字人直播平臺(tái),還要克服很多技術(shù)難點(diǎn)。比如在人像維度,百度已經(jīng)迭代了三個(gè)版本,借助于超寫(xiě)實(shí)數(shù)字人SaaS軟件、超智能問(wèn)答對(duì)話系統(tǒng),以及口型合成技術(shù)、面部綁定技術(shù)以及動(dòng)作系統(tǒng),包括口型合成準(zhǔn)確率目前達(dá)到98.5%。

在至關(guān)重要的交互能力上,百度將語(yǔ)音、語(yǔ)義和視覺(jué)等能力集成到一款產(chǎn)品上,不僅需要底層技術(shù)的突破,也需要非常強(qiáng)的工程化能力。

“我們相信經(jīng)過(guò)持續(xù)努力,非常有機(jī)會(huì)在1-2年內(nèi)讓數(shù)字人的表現(xiàn)力和交互能力,無(wú)限制趨近于真人的水平?!崩钍繋r表示。

官方信息顯示,目前百度智能云曦靈已經(jīng)擁有幾十家客戶,包括今年冬奧會(huì)央視總臺(tái)的實(shí)時(shí)播報(bào)手語(yǔ)主播,與國(guó)家航天局合作的火星車數(shù)字人祝融號(hào),以及國(guó)內(nèi)首個(gè)文博虛擬宣推官“文夭夭”等,都基于該平臺(tái)進(jìn)行設(shè)計(jì)、研發(fā)、集成和應(yīng)用。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。