文|游戲茶館 小豬
近日,進(jìn)入飛速發(fā)展階段的AI可謂是科技行業(yè)新晉“當(dāng)紅炸子雞”,稍微一點(diǎn)風(fēng)吹雨動(dòng),就能輕松登上熱搜榜單。但是我們今天要聊的,不是人們熱議的ChatGPT和AI繪圖,而是早已以更加成熟的姿態(tài)進(jìn)入商業(yè)市場(chǎng)的AI配音。
盡管在短視頻平臺(tái)上,影視解說(shuō)賬號(hào)開頭的吟唱魔音罐耳,深入人心,但AI能說(shuō)的,早已不止“注意看,這個(gè)女孩叫小美……”
尤其是在游戲市場(chǎng),AI配音已經(jīng)得到了相當(dāng)不錯(cuò)的玩家反饋。3月20日,網(wǎng)易旗下的乙女游戲《時(shí)空中的繪旅人》就發(fā)布微博表示,游戲角色葉瑄采用的AI新聲音模型得到了更多玩家的好評(píng),游戲內(nèi)問(wèn)卷調(diào)查結(jié)果顯示,新配音實(shí)裝后的用戶評(píng)價(jià)均高于早期AI配音(2022年與卿書版本)。
01 聲優(yōu)塌房,AI救場(chǎng)
聊到乙女游戲使用AI配音,我們就不得不提前幾天剛上熱搜的配音圈大佬姜廣濤對(duì)此做出的“貢獻(xiàn)”。
姜廣濤這個(gè)名字你可能沒(méi)聽說(shuō)過(guò),但是他的聲音你一定不會(huì)陌生。經(jīng)典影視劇《小魚兒與花無(wú)缺》里面的花無(wú)缺、《泰坦尼克號(hào)》中的Jack、《宮鎖心玉》里的八阿哥,用的都是他的配音。在游戲領(lǐng)域,他配過(guò)的角色有《時(shí)空中的繪旅人》中的葉瑄、《未定事件簿》中的莫弈、《花亦山心之月》的玉澤、《陰陽(yáng)師》帝釋天(CG)、《仙劍奇?zhèn)b傳五》姜云凡和《奇跡暖暖》鐘離梓等等。
去年7月,網(wǎng)上出現(xiàn)爆料稱姜廣濤被警方帶走,隨即姜廣濤旗下工作室光合積木發(fā)表聲明,說(shuō)是因?yàn)樯虡I(yè)糾紛正在配合調(diào)查。在線下活動(dòng)取消、配音項(xiàng)目停更的同時(shí),有“知情人”出面爆料,姜被帶走的真實(shí)原因是因?yàn)橐月殑?wù)之便騙錢,藏賬目,藏公章,藏營(yíng)業(yè)執(zhí)照,涉及了刑事犯罪。不久后,網(wǎng)友查到反饋回復(fù)信息是職務(wù)侵占2000萬(wàn)元,再次證實(shí)了這一消息。
瓜還沒(méi)吃完,網(wǎng)易的《時(shí)空中的繪旅人》和米哈游《未定事件簿》就前后腳宣布,游戲中姜廣濤配音的角色,后續(xù)將更換為AI配音。
而這次AI的出場(chǎng),也著實(shí)讓人驚艷了一把。下面是網(wǎng)友整理的聲優(yōu)與AI配音的對(duì)比,大家可以淺淺感受一下。
我們從視頻下方的評(píng)論風(fēng)向也不難看出,實(shí)裝的AI配音效果超出了大多數(shù)玩家的預(yù)期。盡管AI的聲音還不“完美”,但是其表現(xiàn)“一點(diǎn)也不AI”,相對(duì)自然的聲音效果和永遠(yuǎn)不會(huì)塌房的優(yōu)勢(shì)讓不少玩家直呼“太牛了”!
當(dāng)然,還是有少部分玩家不太能接受AI,認(rèn)為某些語(yǔ)句的語(yǔ)調(diào)、氣息和情感仍能聽出瑕疵,也有玩家認(rèn)為沒(méi)有人類聲音情感支撐的純紙片人,就等于失去了靈魂。
但整體來(lái)看,大多數(shù)玩家對(duì)于剛進(jìn)入游戲的AI配音仍抱以相對(duì)寬容的態(tài)度。
3月17日,吼浪工作室發(fā)布通告表示,姜廣濤等人因?qū)嵤┲卮笄趾?,涉嫌刑事犯罪被公安和檢察機(jī)關(guān)處理。官方發(fā)聲后,姜廣濤事件的性質(zhì)終于有了最終定論,而已經(jīng)上線了半年多的AI配音,也已有了顯著的進(jìn)步。
3月20日,《時(shí)空中的繪旅人》官博發(fā)文,表示2023年2月游戲內(nèi)的問(wèn)卷調(diào)查結(jié)果顯示,葉瑄新聲音模型實(shí)裝后的用戶評(píng)價(jià)均高于早期AI配音,未來(lái)游戲官方計(jì)劃逐漸迭代并替換掉初代技術(shù)方案的配音內(nèi)容。
至此,AI配音在游戲市場(chǎng)的首輪嘗試已經(jīng)取得了喜聞樂(lè)見的成果。
02 AI聲音背后的技術(shù)支持
AI配音效果迭代的背后當(dāng)然是技術(shù)的發(fā)展。而站在《未定事件簿》莫弈和《時(shí)空中的繪旅人》葉瑄的AI聲帶背后,提供主要技術(shù)支持的,分別是逆熵科技和網(wǎng)易互娛AI Lab。
早在2019年,大偉哥就曾在上海交大的一次演講中分享過(guò),逆熵AI的目標(biāo)是通過(guò)深度學(xué)習(xí)某一個(gè)聲優(yōu)的音色和情感,做到輸入文字自動(dòng)得到該聲優(yōu)的配音結(jié)果。以避免檔期不足等情況,還能將該聲音塑造成IP,永久保留,甚至出售聲音版權(quán)。
或是這一想法的推動(dòng),組建于2018年的逆熵研究部門,在2020年正式升級(jí)為主攻DeepLearning等AI技術(shù)的逆熵科技。
在工作室正式成立后,逆熵AI很快就開始了炫技。2021年2月,米哈游旗下的虛擬偶像@yoyo鹿鳴_Lumi(下稱鹿鳴)發(fā)布了一則名為“想聽我講野豬公主的故事嗎?”的視頻,簡(jiǎn)介中明確標(biāo)注聲音由逆熵AI生成。
這次成果展示驚呆了不少觀眾,原來(lái)AI的聲音已經(jīng)發(fā)展到了遠(yuǎn)超“Hi,Siri”的程度。斷句流暢自然、語(yǔ)氣活潑、難辨AI痕跡的聽覺(jué)效果,讓粉絲們狂喜:老婆終于有聲音了!黑科技賽高!
2022年7月,鹿鳴在B站開啟首次直播。時(shí)長(zhǎng)半小時(shí)的直播吸引了超66萬(wàn)用戶觀看,收獲了322位艦長(zhǎng)(折合收入約6萬(wàn)多元)。在直播結(jié)束后,該直播錄屏播放量突破了200萬(wàn)次,鹿鳴的B站關(guān)注人數(shù)也很快超過(guò)了150萬(wàn)。而在此次直播內(nèi)容中,獲得粉絲們最多討論的除了精細(xì)的動(dòng)作與畫面外,還有明確標(biāo)注由“逆熵AI生成”的聲音。
在直播結(jié)束的兩個(gè)月后,受姜廣濤事件影響,《未定事件簿》正式宣布將為莫弈裝上AI聲帶,積累的數(shù)年時(shí)間的逆熵AI配音能力,終于正式進(jìn)入游戲應(yīng)用階段的探索。
網(wǎng)易對(duì)于AI語(yǔ)音的技術(shù)探索也開始得很早。2017年,專攻計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、語(yǔ)音信號(hào)處理、游戲AI等技術(shù)的網(wǎng)易AI Lab成立。
2020年,網(wǎng)易AI Lab在全球最大的語(yǔ)音會(huì)議INTERSPEECH上,拿到了與文本相關(guān)聲紋識(shí)別賽道的雙料大獎(jiǎng),展示了網(wǎng)易 AI Lab 在在聲紋識(shí)別技術(shù)探索上的領(lǐng)先成果。
但在早期階段,網(wǎng)易 AI Lab 的聲紋識(shí)別技術(shù)似乎并未進(jìn)入配音場(chǎng)景,而是主要被應(yīng)用于身份驗(yàn)證、針對(duì)音色對(duì)玩家進(jìn)行分類等場(chǎng)景。
甚至在2021年,與《羊城晚報(bào)》合作推出廣東媒體首個(gè)視頻類AI合成主播“羊小晚”和“羊小派”的時(shí)候,網(wǎng)易AI Lab的語(yǔ)音識(shí)別技術(shù),也僅被用于與實(shí)現(xiàn)與語(yǔ)音適配的唇動(dòng)效果,其中的配音部分,則采用了科大訊飛的語(yǔ)音合成技術(shù)。
據(jù)《羊城晚報(bào)》報(bào)道,該AI主播系統(tǒng)只需輸入文本或音頻,即可在幾分鐘內(nèi)快速生成AI合成主播的新聞播報(bào)視頻。從最終呈現(xiàn)效果來(lái)看,科大訊飛的語(yǔ)音合成技術(shù),在當(dāng)時(shí)已基本能夠滿足吐字清晰、音色自然、蘊(yùn)含感情等新聞播報(bào)等基礎(chǔ)需求。
2022年8月,《時(shí)空中的繪旅人》游戲官方宣布將與網(wǎng)易互娛AI Lab合作,分析提取葉瑄角色原有配音聲紋特征,錄制新的語(yǔ)音,網(wǎng)易AI Lab終于開啟了為游戲角色配音的新旅程。
03 悶聲發(fā)大財(cái)?shù)腁I語(yǔ)音
除了以上兩個(gè)AI工作室,還有更多人工智能團(tuán)隊(duì)在不斷探索AI語(yǔ)音的應(yīng)用可能性。而且,可能出乎你預(yù)料的是,AI語(yǔ)音目前已經(jīng)創(chuàng)造出了十分可觀的商業(yè)化效益。相對(duì)于高調(diào)來(lái)襲、不斷引起廣泛討論的AI繪畫,AI語(yǔ)音可以說(shuō)是“悶聲發(fā)大財(cái)”的典型。
據(jù)Market.us統(tǒng)計(jì),2022年全球Ai語(yǔ)音生成市場(chǎng)規(guī)模約達(dá)12.1億美元,預(yù)計(jì)在2032年,該數(shù)據(jù)將增長(zhǎng)至48.89億美元,復(fù)合年增長(zhǎng)度達(dá)15.4%。
相當(dāng)能掙錢的AI語(yǔ)音生成技術(shù)落地到配音,主要有以下幾種應(yīng)用形式。一是聲音克隆,讓AI學(xué)習(xí)已有聲紋特征,在用戶輸入目標(biāo)文本后,模仿合成相應(yīng)的聲音效果?!稌r(shí)空中的繪旅人》葉瑄的配音就是這一類,再比如2018年,央視九套推出的全球首部AI配音紀(jì)錄片《創(chuàng)新中國(guó)》也屬此類。據(jù)了解,該紀(jì)錄片合成模仿的是“配音大師”李易的聲音。目前,該紀(jì)錄片依然在豆瓣上保持著9.0的高分。
二是聲音合成,在大量聲音數(shù)據(jù)的基礎(chǔ)上,根據(jù)輸入文本,直接產(chǎn)出AI合成音色的效果。今年年初,科大訊飛發(fā)布的雨水節(jié)氣短片,也是由AI合成聲演繹的,該視頻呈現(xiàn)出的“以假亂真”的配音效果,引起了大量用戶的主動(dòng)傳播。
三是音色轉(zhuǎn)換,利用聲紋技術(shù),將輸入的音頻內(nèi)容,替換成目標(biāo)音色。有粉絲猜測(cè),米哈游鹿鳴的聲音就是這種情況。這類玩法技術(shù)相對(duì)更加成熟,門檻更低,因此被網(wǎng)友們普遍應(yīng)用于視頻配音與整活。在視頻網(wǎng)站上常見的“拜登教奧巴馬玩源氏”、“美國(guó)總統(tǒng)給魂系游戲排名”等整活視頻,都是通過(guò)這種方式產(chǎn)出的。
盡管AI配音的應(yīng)用方式多樣、適用場(chǎng)景廣泛,且在游戲市場(chǎng)上已有案例可供參考。但實(shí)際上,在目前要將該技術(shù)大規(guī)模應(yīng)用于游戲開發(fā)依然不太現(xiàn)實(shí)。
有嘗試過(guò)AI配音的開發(fā)者告訴茶館,AI配音和單純的電子書朗讀不同,想要AI呈現(xiàn)出類似聲優(yōu)一樣的、貼合角色的表達(dá)效果,需要耗費(fèi)大量的時(shí)間對(duì)聲音模型進(jìn)行訓(xùn)練,這個(gè)時(shí)間成本相較于演員配音,高達(dá)數(shù)十倍不止;而且由于對(duì)白文本承載的情感理解量過(guò)高,最終呈現(xiàn)出來(lái)的效果基本無(wú)法達(dá)到完美,細(xì)節(jié)處的切分和語(yǔ)氣轉(zhuǎn)換總會(huì)與真人有所差異,這些微小差異很有可能會(huì)對(duì)游戲的沉浸感造成負(fù)面影響。
因此,目前真正將AI配音用進(jìn)游戲中的廠商仍是少數(shù),畢竟不是每個(gè)游戲廠商都有網(wǎng)易和米哈游一樣的票子和技術(shù)。盡管如此,面對(duì)迎頭打來(lái)的新浪潮,茶館發(fā)現(xiàn)身邊有越來(lái)越多同行開始積極關(guān)注和研究AI配音??梢?,積極迎接技術(shù)變化,正在成為業(yè)內(nèi)常態(tài)。