正在閱讀:

喜馬拉雅IPO:用AI為創(chuàng)作者賦能的同時(shí)構(gòu)建龐大內(nèi)容生態(tài)

掃一掃下載界面新聞APP

喜馬拉雅IPO:用AI為創(chuàng)作者賦能的同時(shí)構(gòu)建龐大內(nèi)容生態(tài)

馬拉雅公布過(guò)一則數(shù)據(jù),其用單田芳AI合成音制作的TTS(語(yǔ)音合成)專輯總播放量已經(jīng)破億。這一數(shù)據(jù),喻示著在喜馬拉雅“UGC+PGC+PUGC”內(nèi)容生態(tài)之外,又多了一個(gè)AIGC的內(nèi)容生態(tài)。

圖片來(lái)源: 圖蟲(chóng)創(chuàng)意

喜馬拉雅公布過(guò)一則數(shù)據(jù),其用單田芳AI合成音制作的TTS(語(yǔ)音合成)專輯總播放量已經(jīng)破億。這一數(shù)據(jù),喻示著在喜馬拉雅“UGC+PGC+PUGC”內(nèi)容生態(tài)之外,又多了一個(gè)AIGC的內(nèi)容生態(tài)。

事實(shí)上,音頻行業(yè)其實(shí)一直存在著許多問(wèn)題,比如單個(gè)創(chuàng)作者創(chuàng)作形式單一、生產(chǎn)周期長(zhǎng)、內(nèi)容成本高等等。而為了突破這些問(wèn)題,音頻行業(yè)一直也都在做各種嘗試。比如,喜馬拉雅最近上線了喜韻音坊創(chuàng)作者平臺(tái),試圖用AI為創(chuàng)作者賦能的方式,以技術(shù)手段來(lái)解決行業(yè)沉疴。恰好也是今年,喜馬拉雅的兩項(xiàng)智能語(yǔ)音技術(shù)相關(guān)論文被2022年國(guó)際音頻、語(yǔ)音與信號(hào)處理會(huì)議(ICASSP)收錄。

喜馬拉雅創(chuàng)始人兼CEO余建軍之前也提過(guò),喜馬拉雅是一家科技驅(qū)動(dòng)的內(nèi)容公司,科技是手段,文化是目的。那么,在這次喜馬拉雅以通過(guò)科技賦能文化的過(guò)程中,又是如何改變音頻行業(yè)的呢?配音小說(shuō)用AI工具一天更新上百集“以前從來(lái)沒(méi)有想過(guò),音頻節(jié)目可以一天更新上百集?!边@是喜馬拉雅的音頻主播“CV千索”用過(guò)喜韻音坊之后的感嘆。

喜韻音坊是喜馬拉雅上的一個(gè)創(chuàng)作者平臺(tái),它通過(guò)TTS技術(shù)幫助主播實(shí)現(xiàn)與AI共同創(chuàng)作音頻節(jié)目。“CV千索”就是通過(guò)這項(xiàng)技術(shù)在喜馬拉雅上創(chuàng)作了有聲書(shū)《史上最強(qiáng)撿漏王》,上線一個(gè)多月,播放量已經(jīng)超過(guò)300萬(wàn)。工欲善其事必先利其器,創(chuàng)作者有了AI工具,就可以大幅提升創(chuàng)作效率,進(jìn)而提升收益。

但要打造一個(gè)好工具也并非易事,喜韻音坊對(duì)于喜馬拉雅來(lái)說(shuō),就如同剪映之于抖音,但音頻制作本身又有不同的技術(shù)難點(diǎn)?!癟TS”是將輸入的文本轉(zhuǎn)換為語(yǔ)音的技術(shù)統(tǒng)稱,在許多場(chǎng)景中都有應(yīng)用。但在不少場(chǎng)景中,比如在電話客服、機(jī)器人等身上,經(jīng)常會(huì)有冷冰冰的“機(jī)器音”讓人非?!俺鰬颉?。但在音頻節(jié)目中,我們需要聲音有情緒、有溫度:聽(tīng)童話故事的時(shí)候,聲音俏皮可愛(ài);講軍旅故事的聲音,鏗鏘有力;聽(tīng)歷史故事,又需要它深沉雄渾。

喜馬拉雅智能語(yǔ)音實(shí)驗(yàn)室自主設(shè)計(jì)了單獨(dú)的韻律提取模塊,并將其融入到HiTTS技術(shù)框架中。而針對(duì)單老評(píng)書(shū)中區(qū)別于標(biāo)準(zhǔn)普通話的發(fā)音,團(tuán)隊(duì)還設(shè)計(jì)了口音模塊對(duì)這些特殊發(fā)音進(jìn)行標(biāo)注,使得AI合成音能夠原汁原味地還原出老味道。由于技術(shù)上的創(chuàng)新,喜馬拉雅用TTS合成語(yǔ)音所制作的AIGC專輯幾乎能夠以假亂真。

如今,喜馬拉雅多情感、多風(fēng)格、多語(yǔ)種聲音的TTS技術(shù)模型已經(jīng)廣泛被運(yùn)用于評(píng)書(shū)、新聞、小說(shuō)、財(cái)經(jīng)等多種類型AIGC內(nèi)容的制作中。


未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。如需轉(zhuǎn)載請(qǐng)聯(lián)系:youlianyunpindao@163.com

喜馬拉雅

139
  • 喜馬拉雅IPO:AI技術(shù)成驅(qū)動(dòng)企業(yè)成長(zhǎng)的關(guān)鍵動(dòng)力
  • 喜馬拉雅在深圳成立新公司

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

喜馬拉雅IPO:用AI為創(chuàng)作者賦能的同時(shí)構(gòu)建龐大內(nèi)容生態(tài)

馬拉雅公布過(guò)一則數(shù)據(jù),其用單田芳AI合成音制作的TTS(語(yǔ)音合成)專輯總播放量已經(jīng)破億。這一數(shù)據(jù),喻示著在喜馬拉雅“UGC+PGC+PUGC”內(nèi)容生態(tài)之外,又多了一個(gè)AIGC的內(nèi)容生態(tài)。

圖片來(lái)源: 圖蟲(chóng)創(chuàng)意

喜馬拉雅公布過(guò)一則數(shù)據(jù),其用單田芳AI合成音制作的TTS(語(yǔ)音合成)專輯總播放量已經(jīng)破億。這一數(shù)據(jù),喻示著在喜馬拉雅“UGC+PGC+PUGC”內(nèi)容生態(tài)之外,又多了一個(gè)AIGC的內(nèi)容生態(tài)。

事實(shí)上,音頻行業(yè)其實(shí)一直存在著許多問(wèn)題,比如單個(gè)創(chuàng)作者創(chuàng)作形式單一、生產(chǎn)周期長(zhǎng)、內(nèi)容成本高等等。而為了突破這些問(wèn)題,音頻行業(yè)一直也都在做各種嘗試。比如,喜馬拉雅最近上線了喜韻音坊創(chuàng)作者平臺(tái),試圖用AI為創(chuàng)作者賦能的方式,以技術(shù)手段來(lái)解決行業(yè)沉疴。恰好也是今年,喜馬拉雅的兩項(xiàng)智能語(yǔ)音技術(shù)相關(guān)論文被2022年國(guó)際音頻、語(yǔ)音與信號(hào)處理會(huì)議(ICASSP)收錄。

喜馬拉雅創(chuàng)始人兼CEO余建軍之前也提過(guò),喜馬拉雅是一家科技驅(qū)動(dòng)的內(nèi)容公司,科技是手段,文化是目的。那么,在這次喜馬拉雅以通過(guò)科技賦能文化的過(guò)程中,又是如何改變音頻行業(yè)的呢?配音小說(shuō)用AI工具一天更新上百集“以前從來(lái)沒(méi)有想過(guò),音頻節(jié)目可以一天更新上百集?!边@是喜馬拉雅的音頻主播“CV千索”用過(guò)喜韻音坊之后的感嘆。

喜韻音坊是喜馬拉雅上的一個(gè)創(chuàng)作者平臺(tái),它通過(guò)TTS技術(shù)幫助主播實(shí)現(xiàn)與AI共同創(chuàng)作音頻節(jié)目?!癈V千索”就是通過(guò)這項(xiàng)技術(shù)在喜馬拉雅上創(chuàng)作了有聲書(shū)《史上最強(qiáng)撿漏王》,上線一個(gè)多月,播放量已經(jīng)超過(guò)300萬(wàn)。工欲善其事必先利其器,創(chuàng)作者有了AI工具,就可以大幅提升創(chuàng)作效率,進(jìn)而提升收益。

但要打造一個(gè)好工具也并非易事,喜韻音坊對(duì)于喜馬拉雅來(lái)說(shuō),就如同剪映之于抖音,但音頻制作本身又有不同的技術(shù)難點(diǎn)?!癟TS”是將輸入的文本轉(zhuǎn)換為語(yǔ)音的技術(shù)統(tǒng)稱,在許多場(chǎng)景中都有應(yīng)用。但在不少場(chǎng)景中,比如在電話客服、機(jī)器人等身上,經(jīng)常會(huì)有冷冰冰的“機(jī)器音”讓人非常“出戲”。但在音頻節(jié)目中,我們需要聲音有情緒、有溫度:聽(tīng)童話故事的時(shí)候,聲音俏皮可愛(ài);講軍旅故事的聲音,鏗鏘有力;聽(tīng)歷史故事,又需要它深沉雄渾。

喜馬拉雅智能語(yǔ)音實(shí)驗(yàn)室自主設(shè)計(jì)了單獨(dú)的韻律提取模塊,并將其融入到HiTTS技術(shù)框架中。而針對(duì)單老評(píng)書(shū)中區(qū)別于標(biāo)準(zhǔn)普通話的發(fā)音,團(tuán)隊(duì)還設(shè)計(jì)了口音模塊對(duì)這些特殊發(fā)音進(jìn)行標(biāo)注,使得AI合成音能夠原汁原味地還原出老味道。由于技術(shù)上的創(chuàng)新,喜馬拉雅用TTS合成語(yǔ)音所制作的AIGC專輯幾乎能夠以假亂真。

如今,喜馬拉雅多情感、多風(fēng)格、多語(yǔ)種聲音的TTS技術(shù)模型已經(jīng)廣泛被運(yùn)用于評(píng)書(shū)、新聞、小說(shuō)、財(cái)經(jīng)等多種類型AIGC內(nèi)容的制作中。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。