界面新聞記者 | 尹清露
界面新聞編輯 | 黃月
繼生成式人工智能攻入繪畫領(lǐng)域并引發(fā)爭議后,5月,引起軒然大波的AI孫燕姿及其它人工智能翻唱事件讓音樂行業(yè)成為了下一個備受關(guān)注的焦點。在B站視頻中,孫燕姿唱起了周杰倫的《發(fā)如雪》,王心凌匪夷所思地唱起《套馬桿》,有些視頻播放量已達百萬,彈幕評論上千條。
孫燕姿本人事后在社交媒體上發(fā)文回應(yīng),認為人類無法超越AI已指日可待,對于未來,則是“凡事皆有可能,凡事皆無所謂”,充滿了無所掛礙又無可奈何的意味。面對迅猛發(fā)展的AI技術(shù),一切仍模糊而未知,但孫燕姿的回應(yīng)為我們打開了一個更大的思考缺口:在音樂行業(yè),人工智能可能導(dǎo)向怎樣的未來?會解放藝術(shù)家的創(chuàng)造力嗎,還是炮制出更多千篇一律的口水歌曲?
界面文化(ID:booksandfun)綜合既有分析,并采訪了兩名資深音樂行業(yè)從業(yè)者,以期探索一點初步的答案。
在AI學(xué)會創(chuàng)作之前,算法已經(jīng)破壞了音樂行業(yè)
實際上,音樂在探索新技術(shù)方面一直處于領(lǐng)先地位。早在近四十年前,法國學(xué)者雅克·阿達利(Jacques Attali)就在著作《噪音:音樂的政治經(jīng)濟學(xué)》里提出,音樂就其本質(zhì)而言與金融或者數(shù)學(xué)類似,它們都是純粹的心智活動(speculation of mind),比起繪畫這類借助物理形態(tài)的藝術(shù)創(chuàng)作,音樂往往能更快地應(yīng)用最新科技來擴展創(chuàng)造力的邊界。
現(xiàn)場調(diào)音師鄧成龍在接受界面文化的采訪時表示,聽眾之所以會對AI孫燕姿感到驚訝,很大程度上是出于心理上的恐怖谷效應(yīng),從原理來看,用技術(shù)模擬人聲與用電腦采集鋼琴音色相類似,這中間只存在技術(shù)層面的進步。
曾為多名歌手制作專輯,同時也是獨立音樂人與聲音空間設(shè)計師的李星宇在采訪中提到,AI在音樂行業(yè)的應(yīng)用早已非常廣泛,許多網(wǎng)紅歌曲就是用較為基礎(chǔ)的大數(shù)據(jù)進行分析,再結(jié)合人力制作而成的。根據(jù)李星宇的推測,由于技術(shù)迭代的速度飛快,今年將會出現(xiàn)一批“相當像樣”的AI創(chuàng)作者。1月份,谷歌就發(fā)布了有“音樂版ChatGPT”之稱的MusicLM,它可以自由混搭不同類型的風格和樂器,通過輸入“晚宴上的爵士樂”這類指定地點和時間的文字,就能讓機器創(chuàng)作出符合當下情緒的樂曲。
只不過,僅靠AI的算力,至今還未出現(xiàn)真正的爆款歌曲,這也是李星宇眼中的關(guān)鍵節(jié)點:“如果AI能做出爆款,以制作網(wǎng)紅歌曲為生的公司和最主流的音樂人肯定會受到重創(chuàng),音樂行業(yè)將會面臨重組?!毕啾戎?,小眾獨立音樂人受到的沖擊較小。這不禁引人遐思——如果功能性的樣板音樂和口水歌可以交給AI,人類能否解放生產(chǎn)力,創(chuàng)造出更多有水準的原創(chuàng)歌曲?
設(shè)想很美好,現(xiàn)實能否如愿卻難以判定。畢竟在生成式AI學(xué)會創(chuàng)作之前,算法AI就已經(jīng)極大地破壞了音樂行業(yè)。Chokepoint Capitalism: How Big Tech and Big Content Captured Creative Labor Markets and How We'll Win Them Back(《阻塞點資本主義》)一書提出,在數(shù)字技術(shù)和互聯(lián)網(wǎng)民主化初期,權(quán)力曾經(jīng)罕見地從唱片公司流向藝術(shù)家,但好景不長,如今流媒體平臺取代唱片公司,攫取了音樂的大部分價值。
按照書中的觀點,流媒體帶來的一個顯著的現(xiàn)象是“播放列表文化”,聽眾變成需要呵護的孩子,更喜歡被動收聽算法推薦的音樂而非自主探索。聆聽的場景也在不斷細分,甚至出現(xiàn)了“騎車專用嘻哈曲”“賴在床上吃早餐”這樣精準定位的列表。由于播放列表變得如此重要,被排除在外的藝術(shù)家很可能會面臨歌曲發(fā)行的失敗,所以他們必須不斷創(chuàng)作出悅耳且具備走紅潛質(zhì)的曲目,而這往往會產(chǎn)生更多平庸、千篇一律作品。另一方面,為了讓聽眾盡可能多地收聽音樂,從而增加平臺收入,名為“Chill Vibes”、“Peaceful Piano”的氛圍音樂播放列表大量涌現(xiàn),它們沒有審美上的挑戰(zhàn)性,聽一整天也不會疲勞,而這正是人工智能擅長創(chuàng)作的那種音樂。
雪上加霜的是,由于流媒體平臺會從有限的現(xiàn)金池中分配版稅費,一首歌被播放得越多,創(chuàng)作者的收入就越多,某些創(chuàng)作者求助于作弊手段,也就是委托第三方讓機器人bot收聽歌曲,沒有作弊的藝術(shù)家的生存空間進一步被擠壓。法國國家音樂中心的一項研究發(fā)現(xiàn),2021年法國各種平臺上的音樂中,有1%-3%是由機器人收聽的,換算成數(shù)字是總計10億-30億次。
李星宇談到,與海外相比,國內(nèi)的情況更加糟糕。近年來國內(nèi)音樂生態(tài)本來就不好,流媒體平臺把大部分資源推給流量藝人,剩下的資源靠獨立音樂人廝殺拼搶,這導(dǎo)致行業(yè)內(nèi)只有頭部和底部,不再存在中間層。再加上疫情期間音樂綜藝爆火,獨立音樂人需要通過《樂隊的夏天》等節(jié)目試圖躋身頭部行列,所以現(xiàn)在演出市場也不健康,觀眾要么涌向五月天這樣的大型演唱會,要么去看音樂綜藝捧紅的樂隊——新褲子或五條人樂隊就是最好的例子,他們雖然也很優(yōu)秀,但無一例外具有強烈的娛樂屬性。
在此背景下,即使AI作曲的技術(shù)提升,對市場來說也不一定是好消息。首先,對于聽歌品味已經(jīng)被算法形塑的聽眾來說,是否還需要超出認知的音樂?另一方面,資源的分配也是問題,李星宇在采訪中悲觀地指出:“最有可能出現(xiàn)的情況是,平臺將資源分給自家的AI,同時頭部藝人仍然會索要自己那一份,最后就不剩什么給其他創(chuàng)作者了?!?/p>
藝術(shù)家能奪回AI嗎?版權(quán)與聲音的身份問題
李星宇的擔憂或許是正確的。大型唱片公司當然不會錯過這個新興市場,環(huán)球音樂集團于2019年簽約了一名形象為黑人的虛擬說唱歌手FN meka,除了聲音來自人類,歌曲旋律、節(jié)奏和歌詞都由AI生成,在鼎盛時期,F(xiàn)N meka每個月可以獲得超50萬名Spotify訂閱者和超10億的TikTok瀏覽量。
而頗為諷刺的是,由于手握鮑勃·迪倫等巨星的歌曲版權(quán),環(huán)球音樂集團同時也對人工智能的入侵感到焦慮,其執(zhí)行副總裁邁克爾·納什就曾表示,“AI生成的音樂正在稀釋市場,侵犯了藝術(shù)家從作品中獲得報酬的合法權(quán)利?!?nbsp;
真正傷害藝術(shù)家權(quán)利的到底是誰?界面文化此前的一篇藝術(shù)家專訪指出,版權(quán)日益成為保護既得利益者、而非小眾創(chuàng)作者的體制。文章《創(chuàng)作零工,普遍貧窮:從“B站停更潮”談起》也談到,科技產(chǎn)業(yè)的邏輯不再是投資藝術(shù)家,而是通過提供內(nèi)容來吸引用戶,用定價極低的流媒體播放費壓榨創(chuàng)作者;技術(shù)門檻的降低并沒有帶來“人人都是藝術(shù)家”的美好未來,而是將創(chuàng)意工作者置于競爭更加激烈且毫無保障的境地。
正是在此刻,技術(shù)的雙面性突顯了出來。出于對大平臺壟斷的不滿,已經(jīng)有些藝術(shù)家開始主動使用AI來探索新的經(jīng)濟模式。電子音樂藝術(shù)家Holly Herndon就是其中一位,她認為,現(xiàn)在有許多關(guān)于技術(shù)的反烏托邦敘述,但如果藝術(shù)家能擁有訓(xùn)練數(shù)據(jù)主動權(quán),技術(shù)也可以成為一個機會。Holly的做法是深度偽造自己的聲音,用它來演唱不同語言的歌曲,并將其授權(quán)給一個封閉的合作者網(wǎng)絡(luò),從而換取后續(xù)作品的收入分成。她的觀點很明確:是藝術(shù)家——而不是公司——應(yīng)該決定AI在音樂中的使用。
有趣的是,與其說是“使用”AI作為工具,藝術(shù)家自主克隆聲音的想法更接近于一個圍繞身份展開的游戲。鄧成龍在采訪中提到,在思考聲音的歸屬與版權(quán)問題時,我們也可以換個角度,AI孫燕姿模擬出的并不是孫燕姿真正的聲音,而是一個完全二次元的存在,“只不過它也有它自己的真實”。這帶來的錯亂和疑惑便是,如果模擬的聲音不屬于藝術(shù)家本人,那它屬于誰?以及,聲音在多大程度上屬于個體?
這種錯亂和困惑的感覺,正是Holly進行深度偽造的目的之一。她援引音樂學(xué)家Nina Sun Eidsheim的觀點指出,聲音在本質(zhì)上是公共的。比如人的聲音并不是一個獨特的實體,而是連續(xù)的物質(zhì)領(lǐng)域的一部分;歌手的嗓音是由一系列身體器官、感受聲音的聲學(xué)條件,以及歌手平時在訓(xùn)練時涉及的風格和技巧組成的,簡而言之,這與他人他物緊緊相連。Holly認為,這一點對重新思考版權(quán)問題來說十分重要,正如她在某次采訪中所說:
我們居住在一個懲罰性的知識產(chǎn)權(quán)環(huán)境中,這并不適合音樂領(lǐng)域的發(fā)展。因為實力較弱的人會不斷被抄襲,本可以為行業(yè)做出貢獻的人卻無法謀生,最有說服力的新想法往往被緣化。
另一名采取相似策略的流行音樂人是Grimes。今年4月,她宣布將允許人們使用她聲音的AI版本制作音樂并做商用,并與對方均分50%的母帶錄音版稅。事實上,Grimes經(jīng)常在作品中反思人機關(guān)系,也曾想象過AI有朝一日統(tǒng)治世界后的可怕末日,歌曲《We Appreciate Power》就設(shè)想了一個致力于服務(wù)AI獨裁者的女子團體,她們載歌載舞地獻上諂媚和好意,歌詞也寫著“向世界上最強大的計算機宣誓效忠,模擬技術(shù)便是未來”;某張混音專輯的反抗意味更為直接,標題簡單粗暴:This story is dedicated to all those cyberpunks who fight against injustice and corruption every day of their lives!(《這個故事獻給那些每天都與不公正和腐敗作斗爭的賽博朋克們》)。
Grimes的想象并不荒謬。正如前文所述,技術(shù)經(jīng)常會歸順于大企業(yè)的盈利目標,這讓技術(shù)本身看起來十分“邪惡”。但是邪惡的并不是技術(shù)本身,鄧成龍在采訪最后說到,自己還是希望保持樂觀,因為根據(jù)過往經(jīng)驗,音樂行業(yè)的每次技術(shù)進步都是好事。他認為音樂中的AI是中性的,它可以讓審美直接轉(zhuǎn)化為生產(chǎn)力,也可以成為抄襲和偷懶的工具,具體會怎樣發(fā)展,還需要繼續(xù)觀望。
參考資料:
《噪音 : 音樂的政治經(jīng)濟學(xué)》 [法]賈克·阿達利 著 宋素鳳 / 翁桂堂 譯 河南大學(xué)出版社 2017-9
Chokepoint Capitalism: How Big Tech and Big Content Captured Creative Labor Markets and How We'll Win Them Back. Rebecca Giblin, Cory Doctorow, Beacon Press, 2022-9
創(chuàng)作零工,普遍貧窮:從“B站停更潮”談起
http://m.learnwithfaith.com/article/9224254.html
中國美院教師抄襲事件,暴露的是國內(nèi)藝術(shù)體制的問題 | 專訪
http://m.learnwithfaith.com/article/9333500.html
This Singer Deepfaked Her Own Voice—and Thinks You Should Too | WIRED
https://www.wired.com/story/holly-herndon-ai-deepfakes-music/