正在閱讀:

數(shù)字人:始于顏值,終于價(jià)值

掃一掃下載界面新聞APP

數(shù)字人:始于顏值,終于價(jià)值

未來(lái)將會(huì)有大規(guī)模的數(shù)字人與人類共存。

文|MetaPost

隨著ChatGPT爆火,生成式AI算法的突破,使得AIGC(人工智能生產(chǎn)內(nèi)容)進(jìn)入應(yīng)用爆發(fā)期,將給元宇宙相關(guān)產(chǎn)業(yè)鏈帶來(lái)全新的想象空間。

近日,天娛數(shù)科等多家上市公司宣布,要將ChatGPT與公司虛擬數(shù)字人融合,研發(fā)出更加智能化、擬人化的虛擬數(shù)字人。

作為當(dāng)前數(shù)字技術(shù)與文藝創(chuàng)作深度融合的產(chǎn)物,虛擬數(shù)字人(或數(shù)字人)體現(xiàn)了數(shù)字文化新業(yè)態(tài)、新模式的發(fā)展趨勢(shì),也打開(kāi)了網(wǎng)絡(luò)文藝新媒介產(chǎn)品的審美想象和創(chuàng)新創(chuàng)意空間。

所謂數(shù)字人,是指通過(guò)計(jì)算機(jī)圖形渲染、動(dòng)作捕捉、深度學(xué)習(xí)、語(yǔ)音合成等技術(shù)打造的虛擬或仿真人物。自2020年以來(lái),隨著資本加速進(jìn)入數(shù)字人市場(chǎng),促進(jìn)了技術(shù)的快速發(fā)展和應(yīng)用場(chǎng)景的加速探索,現(xiàn)在的數(shù)字人技術(shù)也在朝著多樣化、智能化、便捷化、精細(xì)化的方向發(fā)展。

據(jù)IDC《中國(guó)AI數(shù)字人市場(chǎng)現(xiàn)狀與機(jī)會(huì)分析,2022》報(bào)告顯示,中國(guó)AI數(shù)字人市場(chǎng)規(guī)模呈現(xiàn)高速增長(zhǎng)趨勢(shì),預(yù)計(jì)到2026年將達(dá)到102.4億元人民幣。

然而,透過(guò)豐富的“數(shù)字人景觀”可以發(fā)現(xiàn),令人過(guò)目不忘的優(yōu)質(zhì)數(shù)字人卻不多,而一些頻繁出場(chǎng)的數(shù)字人形象總體上趨向單一化、標(biāo)簽化、扁平化,尚不能清晰傳遞數(shù)字人的功能、內(nèi)涵及審美。

如何賦予數(shù)字人豐富的文化內(nèi)涵,創(chuàng)造一批兼具中國(guó)文化品格和“流量密碼”的優(yōu)質(zhì)形象,滿足人們?nèi)找嬖鲩L(zhǎng)的優(yōu)質(zhì)數(shù)字內(nèi)容需求,是數(shù)字人發(fā)展需要思考的問(wèn)題。

01 對(duì)數(shù)字人同樣適用的“顏值即正義”

數(shù)字人的發(fā)展歷史由來(lái)已久。

早在20世紀(jì)80年代,人們就開(kāi)始嘗試將虛擬人物引入到現(xiàn)實(shí)世界,比如1982年,世界上第一位虛擬歌姬林明美出現(xiàn)了,雖然當(dāng)時(shí)技術(shù)是以傳統(tǒng)的手繪為主,但呈示出了虛擬人概念的萌芽。

21世紀(jì)初,計(jì)算機(jī)技術(shù)飛速發(fā)展,CG(計(jì)算機(jī)動(dòng)畫)技術(shù)和動(dòng)作捕捉技術(shù)發(fā)展日益成熟,日本制作了第一個(gè)被廣泛認(rèn)可的虛擬偶像——初音未來(lái),對(duì)虛擬數(shù)字人的探索越來(lái)越豐富。

近5年來(lái),隨著深度學(xué)習(xí)的算法取得突破,數(shù)字人的制作過(guò)程也得到了有效簡(jiǎn)化。

數(shù)字人的制作流程一般包括模型綁定、動(dòng)作捕捉、動(dòng)畫解算、實(shí)時(shí)渲染等步驟,其中要運(yùn)用到大量的現(xiàn)實(shí)增強(qiáng)、深度學(xué)習(xí)等高科技前沿技術(shù)。比較簡(jiǎn)單的動(dòng)漫形象數(shù)字人,一般1個(gè)月就能完成;而制作一個(gè)超寫實(shí)的3D數(shù)字人,從角色設(shè)計(jì)到完成渲染需要3至6個(gè)月甚至更久。數(shù)字人越是精致、逼真,越花費(fèi)時(shí)間、人力和金錢成本。

在數(shù)字人的形象表達(dá)方面,目前,在大多數(shù)VR、游戲、會(huì)議等場(chǎng)景中,供應(yīng)商往往會(huì)選擇“樂(lè)高式卡通”或其他二次元風(fēng)格的3D模型,如元宇宙第一股Roblox。

哪怕是微軟在Ignite大會(huì)上引以為傲的虛擬世界項(xiàng)目,也尚且沒(méi)有涉足到真實(shí)形象還原的階段??植拦刃?yīng)的存在使得虛擬形象“真人化”的難度極高,除此之外,超高精度的真身復(fù)刻3D數(shù)字人制作成本高也是一個(gè)制約因素,高成本意味著技術(shù)供應(yīng)商很難在短時(shí)間內(nèi)將技術(shù)進(jìn)行商業(yè)化落地,更別說(shuō)使其成為數(shù)字資產(chǎn),打造一個(gè)集中的交易平臺(tái),去消費(fèi)與收藏。

時(shí)拓智能創(chuàng)始人指出,真身復(fù)刻的孿生數(shù)字人,可以說(shuō)是元宇宙的主角,金字塔的頂尖。在所有類型的復(fù)刻中,人的構(gòu)建無(wú)疑是最難的,對(duì)技術(shù)的要求不能與靜物相提并論,從皮膚質(zhì)感,到眼神和面部對(duì)于環(huán)境的判別,都非常復(fù)雜而精細(xì)。

時(shí)拓智能作為入選上??苿?chuàng)企業(yè)上市培育庫(kù)的數(shù)字人企業(yè),選擇采用陣列相機(jī)結(jié)合自主研發(fā)LFM技術(shù)的方案,通過(guò)200余臺(tái)相機(jī)進(jìn)行光學(xué)立體三維建模,模型生成效率被大幅提高,從拍攝到建模完成最快只需要75秒,而目前即使是最先進(jìn)的手持掃描儀激光點(diǎn)云建模方案,生成一個(gè)高清3D模型也需要數(shù)天的時(shí)間。

在人像真實(shí)度上,時(shí)拓智能已經(jīng)聚焦到了“毛孔級(jí)別”,一次拍攝可產(chǎn)生12億像素的數(shù)據(jù)量,經(jīng)過(guò)拓?fù)?、法線貼圖、粗糙度貼圖、金屬貼圖、光線貼圖、AO閉環(huán)等20余層還原處理,3D模型最高可實(shí)現(xiàn)700億像素,靜態(tài)模型的分辨率達(dá)到6μm(約為頭發(fā)直徑的1/8),遠(yuǎn)超人眼可分辨的極限。同時(shí),時(shí)拓智能的技術(shù)支持以每秒60幀的速率捕獲3D模型,使得動(dòng)態(tài)模型的分辨率能夠突破8K。

數(shù)字人的設(shè)計(jì)制作并非易事,既需要技術(shù)支撐,又需要“有趣的靈魂”賦予其文化與內(nèi)涵。

02 始于顏值,終于價(jià)值

2022年,數(shù)字人大量涌現(xiàn),中國(guó)文物交流中心的“文夭夭”、新華網(wǎng)的“筱竹”、浙江衛(wèi)視的“谷小雨”、敦煌研究院的“伽瑤”、國(guó)家博物館的“艾雯雯”、中華書局的“蘇東坡數(shù)字人”……他們或化身為文博場(chǎng)所的導(dǎo)游,或成為文化短劇的主角,或擔(dān)任對(duì)外傳播的文化大使,以又潮又酷的方式講述著傳統(tǒng)文化的故事。

不難看出,數(shù)字人要在弘揚(yáng)傳承中華優(yōu)秀傳統(tǒng)文化方面發(fā)揮作用??梢允加陬佒?,但最后還是要終于價(jià)值,因?yàn)槿藗冮_(kāi)發(fā)數(shù)字人,不是為了觀賞,而是為了使用。2022年被業(yè)界稱為“數(shù)字人元年”,數(shù)字人的相關(guān)應(yīng)用剛剛起步。傳統(tǒng)文化領(lǐng)域是應(yīng)用數(shù)字人比較多的領(lǐng)域,且應(yīng)用場(chǎng)景越來(lái)越豐富。

2022年7月,身著漢服的“艾雯雯”在國(guó)家博物館上崗。她穿梭于國(guó)博各展廳,為慕名而來(lái)的全球游客介紹著國(guó)博140多萬(wàn)件館藏文物。中國(guó)文物交流中心的“文夭夭”,除了在各大博物館提供講解、導(dǎo)覽服務(wù),還擔(dān)任“文博虛擬新聞官”,經(jīng)常跟隨展覽出海,傳播中華文化。

圖 | 數(shù)字人艾雯雯

除了文化價(jià)值,數(shù)字人的商業(yè)價(jià)值也不可或缺。

今年2月,涉及數(shù)字人業(yè)務(wù)的企業(yè)世優(yōu)科技、風(fēng)語(yǔ)筑等均提到正在研發(fā)相關(guān)技術(shù),試圖將數(shù)字人接入ChatGPT。

這其中,吸引了大半科技圈關(guān)注的是,百度在短短一周時(shí)間內(nèi),連發(fā)四條官方推文,介紹其即將推出中國(guó)版“GPT大模型”文心一言。

而發(fā)布這條消息的責(zé)任編輯,正是百度的希加加、度曉曉等數(shù)字人“成員”。數(shù)字人和“ChatGPT”的聯(lián)動(dòng),讓不少網(wǎng)友期待不已。

據(jù)了解,目前已經(jīng)有包括互聯(lián)網(wǎng)、媒體、金融、保險(xiǎn)、汽車、企業(yè)軟件等行業(yè)的近300家頭部企業(yè)宣布加入百度“文心一言”生態(tài)。

圖 | 不同類型的虛擬數(shù)字人

天娛數(shù)科證券部人士認(rèn)為,AI和數(shù)字人結(jié)合會(huì)成為一種趨勢(shì)?!奥斆髑胰诵曰膶?duì)話體驗(yàn),不再只依托于文字,而是以生動(dòng)形象的數(shù)字人形式輸出,或?qū)⒊删虯IGC數(shù)字人的另一個(gè)里程碑?!?/p>

不過(guò),業(yè)界也有觀點(diǎn)認(rèn)為,當(dāng)前ChatGPT尚處于發(fā)展的早期探索階段,關(guān)鍵核心技術(shù)發(fā)展尚不成熟。從數(shù)據(jù)上來(lái)看,目前ChatGPT背后的GPT3.5大模型,參數(shù)大概1750億個(gè),而人腦擁有近1000億個(gè)神經(jīng)元和100萬(wàn)億個(gè)連接,模型的參數(shù)量級(jí)還遠(yuǎn)沒(méi)有達(dá)到人腦的數(shù)量級(jí)。同時(shí),AIGC模型需要大量數(shù)據(jù)參與訓(xùn)練,因此對(duì)算力基礎(chǔ)設(shè)施有較高要求。

IDC中國(guó)助理研究總監(jiān)盧言霞指出,當(dāng)前AI數(shù)字人在部分領(lǐng)域已經(jīng)發(fā)揮出明顯的商業(yè)價(jià)值,未來(lái)在生活與工作中,將會(huì)有大規(guī)模的數(shù)字人隊(duì)伍與人類共存。不過(guò),也要理性看待行業(yè)發(fā)展,盡管目前數(shù)字人市場(chǎng)火熱,前行仍需腳踏實(shí)地。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

數(shù)字人:始于顏值,終于價(jià)值

未來(lái)將會(huì)有大規(guī)模的數(shù)字人與人類共存。

文|MetaPost

隨著ChatGPT爆火,生成式AI算法的突破,使得AIGC(人工智能生產(chǎn)內(nèi)容)進(jìn)入應(yīng)用爆發(fā)期,將給元宇宙相關(guān)產(chǎn)業(yè)鏈帶來(lái)全新的想象空間。

近日,天娛數(shù)科等多家上市公司宣布,要將ChatGPT與公司虛擬數(shù)字人融合,研發(fā)出更加智能化、擬人化的虛擬數(shù)字人。

作為當(dāng)前數(shù)字技術(shù)與文藝創(chuàng)作深度融合的產(chǎn)物,虛擬數(shù)字人(或數(shù)字人)體現(xiàn)了數(shù)字文化新業(yè)態(tài)、新模式的發(fā)展趨勢(shì),也打開(kāi)了網(wǎng)絡(luò)文藝新媒介產(chǎn)品的審美想象和創(chuàng)新創(chuàng)意空間。

所謂數(shù)字人,是指通過(guò)計(jì)算機(jī)圖形渲染、動(dòng)作捕捉、深度學(xué)習(xí)、語(yǔ)音合成等技術(shù)打造的虛擬或仿真人物。自2020年以來(lái),隨著資本加速進(jìn)入數(shù)字人市場(chǎng),促進(jìn)了技術(shù)的快速發(fā)展和應(yīng)用場(chǎng)景的加速探索,現(xiàn)在的數(shù)字人技術(shù)也在朝著多樣化、智能化、便捷化、精細(xì)化的方向發(fā)展。

據(jù)IDC《中國(guó)AI數(shù)字人市場(chǎng)現(xiàn)狀與機(jī)會(huì)分析,2022》報(bào)告顯示,中國(guó)AI數(shù)字人市場(chǎng)規(guī)模呈現(xiàn)高速增長(zhǎng)趨勢(shì),預(yù)計(jì)到2026年將達(dá)到102.4億元人民幣。

然而,透過(guò)豐富的“數(shù)字人景觀”可以發(fā)現(xiàn),令人過(guò)目不忘的優(yōu)質(zhì)數(shù)字人卻不多,而一些頻繁出場(chǎng)的數(shù)字人形象總體上趨向單一化、標(biāo)簽化、扁平化,尚不能清晰傳遞數(shù)字人的功能、內(nèi)涵及審美。

如何賦予數(shù)字人豐富的文化內(nèi)涵,創(chuàng)造一批兼具中國(guó)文化品格和“流量密碼”的優(yōu)質(zhì)形象,滿足人們?nèi)找嬖鲩L(zhǎng)的優(yōu)質(zhì)數(shù)字內(nèi)容需求,是數(shù)字人發(fā)展需要思考的問(wèn)題。

01 對(duì)數(shù)字人同樣適用的“顏值即正義”

數(shù)字人的發(fā)展歷史由來(lái)已久。

早在20世紀(jì)80年代,人們就開(kāi)始嘗試將虛擬人物引入到現(xiàn)實(shí)世界,比如1982年,世界上第一位虛擬歌姬林明美出現(xiàn)了,雖然當(dāng)時(shí)技術(shù)是以傳統(tǒng)的手繪為主,但呈示出了虛擬人概念的萌芽。

21世紀(jì)初,計(jì)算機(jī)技術(shù)飛速發(fā)展,CG(計(jì)算機(jī)動(dòng)畫)技術(shù)和動(dòng)作捕捉技術(shù)發(fā)展日益成熟,日本制作了第一個(gè)被廣泛認(rèn)可的虛擬偶像——初音未來(lái),對(duì)虛擬數(shù)字人的探索越來(lái)越豐富。

近5年來(lái),隨著深度學(xué)習(xí)的算法取得突破,數(shù)字人的制作過(guò)程也得到了有效簡(jiǎn)化。

數(shù)字人的制作流程一般包括模型綁定、動(dòng)作捕捉、動(dòng)畫解算、實(shí)時(shí)渲染等步驟,其中要運(yùn)用到大量的現(xiàn)實(shí)增強(qiáng)、深度學(xué)習(xí)等高科技前沿技術(shù)。比較簡(jiǎn)單的動(dòng)漫形象數(shù)字人,一般1個(gè)月就能完成;而制作一個(gè)超寫實(shí)的3D數(shù)字人,從角色設(shè)計(jì)到完成渲染需要3至6個(gè)月甚至更久。數(shù)字人越是精致、逼真,越花費(fèi)時(shí)間、人力和金錢成本。

在數(shù)字人的形象表達(dá)方面,目前,在大多數(shù)VR、游戲、會(huì)議等場(chǎng)景中,供應(yīng)商往往會(huì)選擇“樂(lè)高式卡通”或其他二次元風(fēng)格的3D模型,如元宇宙第一股Roblox。

哪怕是微軟在Ignite大會(huì)上引以為傲的虛擬世界項(xiàng)目,也尚且沒(méi)有涉足到真實(shí)形象還原的階段??植拦刃?yīng)的存在使得虛擬形象“真人化”的難度極高,除此之外,超高精度的真身復(fù)刻3D數(shù)字人制作成本高也是一個(gè)制約因素,高成本意味著技術(shù)供應(yīng)商很難在短時(shí)間內(nèi)將技術(shù)進(jìn)行商業(yè)化落地,更別說(shuō)使其成為數(shù)字資產(chǎn),打造一個(gè)集中的交易平臺(tái),去消費(fèi)與收藏。

時(shí)拓智能創(chuàng)始人指出,真身復(fù)刻的孿生數(shù)字人,可以說(shuō)是元宇宙的主角,金字塔的頂尖。在所有類型的復(fù)刻中,人的構(gòu)建無(wú)疑是最難的,對(duì)技術(shù)的要求不能與靜物相提并論,從皮膚質(zhì)感,到眼神和面部對(duì)于環(huán)境的判別,都非常復(fù)雜而精細(xì)。

時(shí)拓智能作為入選上??苿?chuàng)企業(yè)上市培育庫(kù)的數(shù)字人企業(yè),選擇采用陣列相機(jī)結(jié)合自主研發(fā)LFM技術(shù)的方案,通過(guò)200余臺(tái)相機(jī)進(jìn)行光學(xué)立體三維建模,模型生成效率被大幅提高,從拍攝到建模完成最快只需要75秒,而目前即使是最先進(jìn)的手持掃描儀激光點(diǎn)云建模方案,生成一個(gè)高清3D模型也需要數(shù)天的時(shí)間。

在人像真實(shí)度上,時(shí)拓智能已經(jīng)聚焦到了“毛孔級(jí)別”,一次拍攝可產(chǎn)生12億像素的數(shù)據(jù)量,經(jīng)過(guò)拓?fù)洹⒎ň€貼圖、粗糙度貼圖、金屬貼圖、光線貼圖、AO閉環(huán)等20余層還原處理,3D模型最高可實(shí)現(xiàn)700億像素,靜態(tài)模型的分辨率達(dá)到6μm(約為頭發(fā)直徑的1/8),遠(yuǎn)超人眼可分辨的極限。同時(shí),時(shí)拓智能的技術(shù)支持以每秒60幀的速率捕獲3D模型,使得動(dòng)態(tài)模型的分辨率能夠突破8K。

數(shù)字人的設(shè)計(jì)制作并非易事,既需要技術(shù)支撐,又需要“有趣的靈魂”賦予其文化與內(nèi)涵。

02 始于顏值,終于價(jià)值

2022年,數(shù)字人大量涌現(xiàn),中國(guó)文物交流中心的“文夭夭”、新華網(wǎng)的“筱竹”、浙江衛(wèi)視的“谷小雨”、敦煌研究院的“伽瑤”、國(guó)家博物館的“艾雯雯”、中華書局的“蘇東坡數(shù)字人”……他們或化身為文博場(chǎng)所的導(dǎo)游,或成為文化短劇的主角,或擔(dān)任對(duì)外傳播的文化大使,以又潮又酷的方式講述著傳統(tǒng)文化的故事。

不難看出,數(shù)字人要在弘揚(yáng)傳承中華優(yōu)秀傳統(tǒng)文化方面發(fā)揮作用。可以始于顏值,但最后還是要終于價(jià)值,因?yàn)槿藗冮_(kāi)發(fā)數(shù)字人,不是為了觀賞,而是為了使用。2022年被業(yè)界稱為“數(shù)字人元年”,數(shù)字人的相關(guān)應(yīng)用剛剛起步。傳統(tǒng)文化領(lǐng)域是應(yīng)用數(shù)字人比較多的領(lǐng)域,且應(yīng)用場(chǎng)景越來(lái)越豐富。

2022年7月,身著漢服的“艾雯雯”在國(guó)家博物館上崗。她穿梭于國(guó)博各展廳,為慕名而來(lái)的全球游客介紹著國(guó)博140多萬(wàn)件館藏文物。中國(guó)文物交流中心的“文夭夭”,除了在各大博物館提供講解、導(dǎo)覽服務(wù),還擔(dān)任“文博虛擬新聞官”,經(jīng)常跟隨展覽出海,傳播中華文化。

圖 | 數(shù)字人艾雯雯

除了文化價(jià)值,數(shù)字人的商業(yè)價(jià)值也不可或缺。

今年2月,涉及數(shù)字人業(yè)務(wù)的企業(yè)世優(yōu)科技、風(fēng)語(yǔ)筑等均提到正在研發(fā)相關(guān)技術(shù),試圖將數(shù)字人接入ChatGPT。

這其中,吸引了大半科技圈關(guān)注的是,百度在短短一周時(shí)間內(nèi),連發(fā)四條官方推文,介紹其即將推出中國(guó)版“GPT大模型”文心一言。

而發(fā)布這條消息的責(zé)任編輯,正是百度的希加加、度曉曉等數(shù)字人“成員”。數(shù)字人和“ChatGPT”的聯(lián)動(dòng),讓不少網(wǎng)友期待不已。

據(jù)了解,目前已經(jīng)有包括互聯(lián)網(wǎng)、媒體、金融、保險(xiǎn)、汽車、企業(yè)軟件等行業(yè)的近300家頭部企業(yè)宣布加入百度“文心一言”生態(tài)。

圖 | 不同類型的虛擬數(shù)字人

天娛數(shù)科證券部人士認(rèn)為,AI和數(shù)字人結(jié)合會(huì)成為一種趨勢(shì)?!奥斆髑胰诵曰膶?duì)話體驗(yàn),不再只依托于文字,而是以生動(dòng)形象的數(shù)字人形式輸出,或?qū)⒊删虯IGC數(shù)字人的另一個(gè)里程碑。”

不過(guò),業(yè)界也有觀點(diǎn)認(rèn)為,當(dāng)前ChatGPT尚處于發(fā)展的早期探索階段,關(guān)鍵核心技術(shù)發(fā)展尚不成熟。從數(shù)據(jù)上來(lái)看,目前ChatGPT背后的GPT3.5大模型,參數(shù)大概1750億個(gè),而人腦擁有近1000億個(gè)神經(jīng)元和100萬(wàn)億個(gè)連接,模型的參數(shù)量級(jí)還遠(yuǎn)沒(méi)有達(dá)到人腦的數(shù)量級(jí)。同時(shí),AIGC模型需要大量數(shù)據(jù)參與訓(xùn)練,因此對(duì)算力基礎(chǔ)設(shè)施有較高要求。

IDC中國(guó)助理研究總監(jiān)盧言霞指出,當(dāng)前AI數(shù)字人在部分領(lǐng)域已經(jīng)發(fā)揮出明顯的商業(yè)價(jià)值,未來(lái)在生活與工作中,將會(huì)有大規(guī)模的數(shù)字人隊(duì)伍與人類共存。不過(guò),也要理性看待行業(yè)發(fā)展,盡管目前數(shù)字人市場(chǎng)火熱,前行仍需腳踏實(shí)地。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。