界面新聞?dòng)浾?| 尹清露
界面新聞編輯 | 黃月
繼生成式人工智能攻入繪畫(huà)領(lǐng)域并引發(fā)爭(zhēng)議后,5月,引起軒然大波的AI孫燕姿及其它人工智能翻唱事件讓音樂(lè)行業(yè)成為了下一個(gè)備受關(guān)注的焦點(diǎn)。在B站視頻中,孫燕姿唱起了周杰倫的《發(fā)如雪》,王心凌匪夷所思地唱起《套馬桿》,有些視頻播放量已達(dá)百萬(wàn),彈幕評(píng)論上千條。
孫燕姿本人事后在社交媒體上發(fā)文回應(yīng),認(rèn)為人類(lèi)無(wú)法超越AI已指日可待,對(duì)于未來(lái),則是“凡事皆有可能,凡事皆無(wú)所謂”,充滿(mǎn)了無(wú)所掛礙又無(wú)可奈何的意味。面對(duì)迅猛發(fā)展的AI技術(shù),一切仍模糊而未知,但孫燕姿的回應(yīng)為我們打開(kāi)了一個(gè)更大的思考缺口:在音樂(lè)行業(yè),人工智能可能導(dǎo)向怎樣的未來(lái)?會(huì)解放藝術(shù)家的創(chuàng)造力嗎,還是炮制出更多千篇一律的口水歌曲?
界面文化(ID:booksandfun)綜合既有分析,并采訪了兩名資深音樂(lè)行業(yè)從業(yè)者,以期探索一點(diǎn)初步的答案。
在AI學(xué)會(huì)創(chuàng)作之前,算法已經(jīng)破壞了音樂(lè)行業(yè)
實(shí)際上,音樂(lè)在探索新技術(shù)方面一直處于領(lǐng)先地位。早在近四十年前,法國(guó)學(xué)者雅克·阿達(dá)利(Jacques Attali)就在著作《噪音:音樂(lè)的政治經(jīng)濟(jì)學(xué)》里提出,音樂(lè)就其本質(zhì)而言與金融或者數(shù)學(xué)類(lèi)似,它們都是純粹的心智活動(dòng)(speculation of mind),比起繪畫(huà)這類(lèi)借助物理形態(tài)的藝術(shù)創(chuàng)作,音樂(lè)往往能更快地應(yīng)用最新科技來(lái)擴(kuò)展創(chuàng)造力的邊界。
現(xiàn)場(chǎng)調(diào)音師鄧成龍?jiān)诮邮芙缑嫖幕牟稍L時(shí)表示,聽(tīng)眾之所以會(huì)對(duì)AI孫燕姿感到驚訝,很大程度上是出于心理上的恐怖谷效應(yīng),從原理來(lái)看,用技術(shù)模擬人聲與用電腦采集鋼琴音色相類(lèi)似,這中間只存在技術(shù)層面的進(jìn)步。
曾為多名歌手制作專(zhuān)輯,同時(shí)也是獨(dú)立音樂(lè)人與聲音空間設(shè)計(jì)師的李星宇在采訪中提到,AI在音樂(lè)行業(yè)的應(yīng)用早已非常廣泛,許多網(wǎng)紅歌曲就是用較為基礎(chǔ)的大數(shù)據(jù)進(jìn)行分析,再結(jié)合人力制作而成的。根據(jù)李星宇的推測(cè),由于技術(shù)迭代的速度飛快,今年將會(huì)出現(xiàn)一批“相當(dāng)像樣”的AI創(chuàng)作者。1月份,谷歌就發(fā)布了有“音樂(lè)版ChatGPT”之稱(chēng)的MusicLM,它可以自由混搭不同類(lèi)型的風(fēng)格和樂(lè)器,通過(guò)輸入“晚宴上的爵士樂(lè)”這類(lèi)指定地點(diǎn)和時(shí)間的文字,就能讓機(jī)器創(chuàng)作出符合當(dāng)下情緒的樂(lè)曲。
只不過(guò),僅靠AI的算力,至今還未出現(xiàn)真正的爆款歌曲,這也是李星宇眼中的關(guān)鍵節(jié)點(diǎn):“如果AI能做出爆款,以制作網(wǎng)紅歌曲為生的公司和最主流的音樂(lè)人肯定會(huì)受到重創(chuàng),音樂(lè)行業(yè)將會(huì)面臨重組。”相比之下,小眾獨(dú)立音樂(lè)人受到的沖擊較小。這不禁引人遐思——如果功能性的樣板音樂(lè)和口水歌可以交給AI,人類(lèi)能否解放生產(chǎn)力,創(chuàng)造出更多有水準(zhǔn)的原創(chuàng)歌曲?
設(shè)想很美好,現(xiàn)實(shí)能否如愿卻難以判定。畢竟在生成式AI學(xué)會(huì)創(chuàng)作之前,算法AI就已經(jīng)極大地破壞了音樂(lè)行業(yè)。Chokepoint Capitalism: How Big Tech and Big Content Captured Creative Labor Markets and How We'll Win Them Back(《阻塞點(diǎn)資本主義》)一書(shū)提出,在數(shù)字技術(shù)和互聯(lián)網(wǎng)民主化初期,權(quán)力曾經(jīng)罕見(jiàn)地從唱片公司流向藝術(shù)家,但好景不長(zhǎng),如今流媒體平臺(tái)取代唱片公司,攫取了音樂(lè)的大部分價(jià)值。
按照書(shū)中的觀點(diǎn),流媒體帶來(lái)的一個(gè)顯著的現(xiàn)象是“播放列表文化”,聽(tīng)眾變成需要呵護(hù)的孩子,更喜歡被動(dòng)收聽(tīng)算法推薦的音樂(lè)而非自主探索。聆聽(tīng)的場(chǎng)景也在不斷細(xì)分,甚至出現(xiàn)了“騎車(chē)專(zhuān)用嘻哈曲”“賴(lài)在床上吃早餐”這樣精準(zhǔn)定位的列表。由于播放列表變得如此重要,被排除在外的藝術(shù)家很可能會(huì)面臨歌曲發(fā)行的失敗,所以他們必須不斷創(chuàng)作出悅耳且具備走紅潛質(zhì)的曲目,而這往往會(huì)產(chǎn)生更多平庸、千篇一律作品。另一方面,為了讓聽(tīng)眾盡可能多地收聽(tīng)音樂(lè),從而增加平臺(tái)收入,名為“Chill Vibes”、“Peaceful Piano”的氛圍音樂(lè)播放列表大量涌現(xiàn),它們沒(méi)有審美上的挑戰(zhàn)性,聽(tīng)一整天也不會(huì)疲勞,而這正是人工智能擅長(zhǎng)創(chuàng)作的那種音樂(lè)。
雪上加霜的是,由于流媒體平臺(tái)會(huì)從有限的現(xiàn)金池中分配版稅費(fèi),一首歌被播放得越多,創(chuàng)作者的收入就越多,某些創(chuàng)作者求助于作弊手段,也就是委托第三方讓機(jī)器人bot收聽(tīng)歌曲,沒(méi)有作弊的藝術(shù)家的生存空間進(jìn)一步被擠壓。法國(guó)國(guó)家音樂(lè)中心的一項(xiàng)研究發(fā)現(xiàn),2021年法國(guó)各種平臺(tái)上的音樂(lè)中,有1%-3%是由機(jī)器人收聽(tīng)的,換算成數(shù)字是總計(jì)10億-30億次。
李星宇談到,與海外相比,國(guó)內(nèi)的情況更加糟糕。近年來(lái)國(guó)內(nèi)音樂(lè)生態(tài)本來(lái)就不好,流媒體平臺(tái)把大部分資源推給流量藝人,剩下的資源靠獨(dú)立音樂(lè)人廝殺拼搶?zhuān)@導(dǎo)致行業(yè)內(nèi)只有頭部和底部,不再存在中間層。再加上疫情期間音樂(lè)綜藝爆火,獨(dú)立音樂(lè)人需要通過(guò)《樂(lè)隊(duì)的夏天》等節(jié)目試圖躋身頭部行列,所以現(xiàn)在演出市場(chǎng)也不健康,觀眾要么涌向五月天這樣的大型演唱會(huì),要么去看音樂(lè)綜藝捧紅的樂(lè)隊(duì)——新褲子或五條人樂(lè)隊(duì)就是最好的例子,他們雖然也很優(yōu)秀,但無(wú)一例外具有強(qiáng)烈的娛樂(lè)屬性。
在此背景下,即使AI作曲的技術(shù)提升,對(duì)市場(chǎng)來(lái)說(shuō)也不一定是好消息。首先,對(duì)于聽(tīng)歌品味已經(jīng)被算法形塑的聽(tīng)眾來(lái)說(shuō),是否還需要超出認(rèn)知的音樂(lè)?另一方面,資源的分配也是問(wèn)題,李星宇在采訪中悲觀地指出:“最有可能出現(xiàn)的情況是,平臺(tái)將資源分給自家的AI,同時(shí)頭部藝人仍然會(huì)索要自己那一份,最后就不剩什么給其他創(chuàng)作者了?!?/p>
藝術(shù)家能奪回AI嗎?版權(quán)與聲音的身份問(wèn)題
李星宇的擔(dān)憂或許是正確的。大型唱片公司當(dāng)然不會(huì)錯(cuò)過(guò)這個(gè)新興市場(chǎng),環(huán)球音樂(lè)集團(tuán)于2019年簽約了一名形象為黑人的虛擬說(shuō)唱歌手FN meka,除了聲音來(lái)自人類(lèi),歌曲旋律、節(jié)奏和歌詞都由AI生成,在鼎盛時(shí)期,F(xiàn)N meka每個(gè)月可以獲得超50萬(wàn)名Spotify訂閱者和超10億的TikTok瀏覽量。
而頗為諷刺的是,由于手握鮑勃·迪倫等巨星的歌曲版權(quán),環(huán)球音樂(lè)集團(tuán)同時(shí)也對(duì)人工智能的入侵感到焦慮,其執(zhí)行副總裁邁克爾·納什就曾表示,“AI生成的音樂(lè)正在稀釋市場(chǎng),侵犯了藝術(shù)家從作品中獲得報(bào)酬的合法權(quán)利?!?nbsp;
真正傷害藝術(shù)家權(quán)利的到底是誰(shuí)?界面文化此前的一篇藝術(shù)家專(zhuān)訪指出,版權(quán)日益成為保護(hù)既得利益者、而非小眾創(chuàng)作者的體制。文章《創(chuàng)作零工,普遍貧窮:從“B站停更潮”談起》也談到,科技產(chǎn)業(yè)的邏輯不再是投資藝術(shù)家,而是通過(guò)提供內(nèi)容來(lái)吸引用戶(hù),用定價(jià)極低的流媒體播放費(fèi)壓榨創(chuàng)作者;技術(shù)門(mén)檻的降低并沒(méi)有帶來(lái)“人人都是藝術(shù)家”的美好未來(lái),而是將創(chuàng)意工作者置于競(jìng)爭(zhēng)更加激烈且毫無(wú)保障的境地。
正是在此刻,技術(shù)的雙面性突顯了出來(lái)。出于對(duì)大平臺(tái)壟斷的不滿(mǎn),已經(jīng)有些藝術(shù)家開(kāi)始主動(dòng)使用AI來(lái)探索新的經(jīng)濟(jì)模式。電子音樂(lè)藝術(shù)家Holly Herndon就是其中一位,她認(rèn)為,現(xiàn)在有許多關(guān)于技術(shù)的反烏托邦敘述,但如果藝術(shù)家能擁有訓(xùn)練數(shù)據(jù)主動(dòng)權(quán),技術(shù)也可以成為一個(gè)機(jī)會(huì)。Holly的做法是深度偽造自己的聲音,用它來(lái)演唱不同語(yǔ)言的歌曲,并將其授權(quán)給一個(gè)封閉的合作者網(wǎng)絡(luò),從而換取后續(xù)作品的收入分成。她的觀點(diǎn)很明確:是藝術(shù)家——而不是公司——應(yīng)該決定AI在音樂(lè)中的使用。
有趣的是,與其說(shuō)是“使用”AI作為工具,藝術(shù)家自主克隆聲音的想法更接近于一個(gè)圍繞身份展開(kāi)的游戲。鄧成龍?jiān)诓稍L中提到,在思考聲音的歸屬與版權(quán)問(wèn)題時(shí),我們也可以換個(gè)角度,AI孫燕姿模擬出的并不是孫燕姿真正的聲音,而是一個(gè)完全二次元的存在,“只不過(guò)它也有它自己的真實(shí)”。這帶來(lái)的錯(cuò)亂和疑惑便是,如果模擬的聲音不屬于藝術(shù)家本人,那它屬于誰(shuí)?以及,聲音在多大程度上屬于個(gè)體?
這種錯(cuò)亂和困惑的感覺(jué),正是Holly進(jìn)行深度偽造的目的之一。她援引音樂(lè)學(xué)家Nina Sun Eidsheim的觀點(diǎn)指出,聲音在本質(zhì)上是公共的。比如人的聲音并不是一個(gè)獨(dú)特的實(shí)體,而是連續(xù)的物質(zhì)領(lǐng)域的一部分;歌手的嗓音是由一系列身體器官、感受聲音的聲學(xué)條件,以及歌手平時(shí)在訓(xùn)練時(shí)涉及的風(fēng)格和技巧組成的,簡(jiǎn)而言之,這與他人他物緊緊相連。Holly認(rèn)為,這一點(diǎn)對(duì)重新思考版權(quán)問(wèn)題來(lái)說(shuō)十分重要,正如她在某次采訪中所說(shuō):
我們居住在一個(gè)懲罰性的知識(shí)產(chǎn)權(quán)環(huán)境中,這并不適合音樂(lè)領(lǐng)域的發(fā)展。因?yàn)閷?shí)力較弱的人會(huì)不斷被抄襲,本可以為行業(yè)做出貢獻(xiàn)的人卻無(wú)法謀生,最有說(shuō)服力的新想法往往被緣化。
另一名采取相似策略的流行音樂(lè)人是Grimes。今年4月,她宣布將允許人們使用她聲音的AI版本制作音樂(lè)并做商用,并與對(duì)方均分50%的母帶錄音版稅。事實(shí)上,Grimes經(jīng)常在作品中反思人機(jī)關(guān)系,也曾想象過(guò)AI有朝一日統(tǒng)治世界后的可怕末日,歌曲《We Appreciate Power》就設(shè)想了一個(gè)致力于服務(wù)AI獨(dú)裁者的女子團(tuán)體,她們載歌載舞地獻(xiàn)上諂媚和好意,歌詞也寫(xiě)著“向世界上最強(qiáng)大的計(jì)算機(jī)宣誓效忠,模擬技術(shù)便是未來(lái)”;某張混音專(zhuān)輯的反抗意味更為直接,標(biāo)題簡(jiǎn)單粗暴:This story is dedicated to all those cyberpunks who fight against injustice and corruption every day of their lives!(《這個(gè)故事獻(xiàn)給那些每天都與不公正和腐敗作斗爭(zhēng)的賽博朋克們》)。
Grimes的想象并不荒謬。正如前文所述,技術(shù)經(jīng)常會(huì)歸順于大企業(yè)的盈利目標(biāo),這讓技術(shù)本身看起來(lái)十分“邪惡”。但是邪惡的并不是技術(shù)本身,鄧成龍?jiān)诓稍L最后說(shuō)到,自己還是希望保持樂(lè)觀,因?yàn)楦鶕?jù)過(guò)往經(jīng)驗(yàn),音樂(lè)行業(yè)的每次技術(shù)進(jìn)步都是好事。他認(rèn)為音樂(lè)中的AI是中性的,它可以讓審美直接轉(zhuǎn)化為生產(chǎn)力,也可以成為抄襲和偷懶的工具,具體會(huì)怎樣發(fā)展,還需要繼續(xù)觀望。
參考資料:
《噪音 : 音樂(lè)的政治經(jīng)濟(jì)學(xué)》 [法]賈克·阿達(dá)利 著 宋素鳳 / 翁桂堂 譯 河南大學(xué)出版社 2017-9
Chokepoint Capitalism: How Big Tech and Big Content Captured Creative Labor Markets and How We'll Win Them Back. Rebecca Giblin, Cory Doctorow, Beacon Press, 2022-9
創(chuàng)作零工,普遍貧窮:從“B站停更潮”談起
http://m.learnwithfaith.com/article/9224254.html
中國(guó)美院教師抄襲事件,暴露的是國(guó)內(nèi)藝術(shù)體制的問(wèn)題 | 專(zhuān)訪
http://m.learnwithfaith.com/article/9333500.html
This Singer Deepfaked Her Own Voice—and Thinks You Should Too | WIRED
https://www.wired.com/story/holly-herndon-ai-deepfakes-music/