文 | 娛樂資本論 James
前幾天,迪士尼旗下漫威發(fā)布新片《秘密入侵》,因其片頭為AI工具生成,而受到網(wǎng)上輿論猛烈抨擊。
批評者認為,作為財大氣粗的工作室,漫威理應(yīng)雇傭真人完成工序,但卻用AI節(jié)省成本,特別在好萊塢導演編劇罷工期間,更顯得不合時宜。也有人得知是AI做的以后,又批評該片頭粗制濫造,是漫威歷史片頭中最難看的之一。
娛樂資本論旗下的視智未來認為:
站在本片本身想表達的世界觀上,AI所體現(xiàn)的風格是相得益彰的
但這部片頭遭遇的質(zhì)疑源于好萊塢正在進行的罷工,因此承擔了很多不屬于它本身的爭議和罵名。
受到技術(shù)限制,AI 繪畫和生成視頻目前只能呈現(xiàn)某種“特殊風格”。在適當場合應(yīng)用“AI風格”無可厚非。
在技術(shù)突破后,AI生成內(nèi)容將越來越精細和多樣化,能替代人類勞動的部分也越來越多。從效果,易用性和成本三方面看, AI普及的速度將快于以往的新技術(shù)。
單純情緒化地抵抗AI意義不大。它將讓新從業(yè)者掌握的“技術(shù)?!备淖儯藗円丛俅闻嘤?,要么下崗。這一點跟過去區(qū)別不大,但可能不是漸進式的,而是突然發(fā)生,因此造成比較大的動蕩。
跟此事比較接近的國內(nèi)案例,可能是淘寶跟B站合拍的紀錄片《這貨哪來的》。其片頭動畫有明顯的AI風格,即主體形象不變的同時畫面的細節(jié)在抖動。有消息說,該片頭做得比較早,技術(shù)上采用了Stable Diffusion的前輩Disco Diffusion。
對此,在紀錄片上映時也并沒有太大的抵制聲音,以“賽博朋克風”的贊譽為主。
郭帆導演在我們的“首屆上海文娛科創(chuàng)沙龍”上講,AIGC用于影視制作可以“彎道超車好萊塢”。這事情確實有可能成真的原因之一,就是國內(nèi)也許缺少一種阻礙AI進化的“道德壓力”。
技術(shù)還不完善,AI現(xiàn)在只是一種“畫風”
讓我們回到那個最初的問題:迪士尼完全用得起制作片頭的這點人工,他們?yōu)槭裁催x擇了AI來制作這個片頭?
《秘密入侵》導演塞里姆(Ali Selim)對《綜藝》雜志表示,使用AI是為了營造一種“不祥”的氣氛:
“我們可以和電腦談?wù)撓敕?、主題、詞句(指輸入prompt),然后它就會去做某些事情。接著我們可以透過改變詞匯(指prompt)來做一些修改,它就會發(fā)生變化。這探索性的感覺令人興奮,又不同尋常?!?/p>
截至目前,AI處理靜幀導致的抖動問題仍然難以徹底根治,因此,當多幅靜幀組成動畫的時候,實際上形成了一種特殊的藝術(shù)風格,就是會產(chǎn)生那種稍微抖動的畫面,傳遞著一種不安定和躁動的情緒(比如說國內(nèi)觀眾更為熟悉的《蜘蛛俠:縱橫宇宙》)。
這實際上是因為藝術(shù)實現(xiàn)的材質(zhì)、介質(zhì)不同而導致的一種特殊的“藝術(shù)風格”。將技術(shù)達不到時候只能得到的偶然結(jié)果雅稱為“風格”只是權(quán)宜之計,就好像:
宋代瓷器“五大名窯”會因為土質(zhì)、微量元素、燒制時間等等的不同,而有各種風格上的差異。
早期相機的膠卷、相紙、沖印工藝差異帶來了黑白、拍立得、LOMO等風格。
在計算機分辨率較低的時候,出現(xiàn)了類似馬賽克拼貼的像素藝術(shù);以及利用當時簡單的MIDI音源,因陋就簡而創(chuàng)造的8-Bit音樂等等。
在AI生成視頻還只是一種“風格”的時候,使用它其實是可以少一點“取代人類”的道德恐慌的,因為人們需要的多樣化的藝術(shù)風格,它此時還只能滿足其中的一兩種。
藝術(shù)評論家Chris Lambert就認為,選擇使用AI創(chuàng)造與實現(xiàn)某種藝術(shù)形式,并非完全出于迪士尼“降本增效”的貪婪,而是有其藝術(shù)上的原因。
《秘密入侵》根據(jù)2008-2009年的漫威漫畫改編而成,講述一種稱為Skrull的變形外星物種,潛伏在地球上發(fā)動攻擊。這種潛伏依賴于Skrull具備模仿其他人外貌的能力,但他們無法完美地體現(xiàn)所模仿人的個性,因此細心觀察者可能會察覺到其中的不對勁之處。人們需要嘗試弄清楚誰是真正的人類,誰是Skrull。這種偏執(zhí)、懷疑和猜測的感覺,使得《秘密入侵》成為一個受歡迎的故事。
同樣地,AI能夠生成驚人且高質(zhì)量的藝術(shù)作品,但由于缺乏真正的感知和判斷能力,其作品往往帶有某種不真實感,從最初的六指、到后來的象形文字。隨著AI技術(shù)的不斷改進,這種事實錯誤正在日益減少,但仍可能讓人感受到一絲絲的不對勁。
因此,將AI制作的片頭動畫與《秘密入侵》的劇情相配,是因為它們都涉及到一種微妙而引人注目的交互關(guān)系,一種不安定感。這在藝術(shù)創(chuàng)作中相互呼應(yīng),具有重要意義,實現(xiàn)了形式(介質(zhì))和功能(創(chuàng)作主題)的統(tǒng)一。
實際上,與《太空歌劇院》或《剪刀石頭布》等作品相比,《秘密入侵》片頭包含了前置的很多深刻的思考和立意,最后才轉(zhuǎn)化為prompt(提示詞)。受到技術(shù)限制,人類員工也做了不少收尾工作,比如各個場景畫面之間的無縫轉(zhuǎn)換。
AIGC絕不會止步于此
不過,AI生成視頻技術(shù)并不是僅僅為了創(chuàng)造一種新的藝術(shù)風格,而是希望最終快速生成任何人類歷史上已有的藝術(shù)形式;特別是當在訓練過程中使用了不同人類藝術(shù)家的風格數(shù)據(jù)后,輸入這個藝術(shù)家的名字,就可以還原其畫風的時候。
即使只看現(xiàn)有技術(shù),特定“畫風”的定格動畫或動態(tài)漫畫,其實也可以大差不差地交給AI來做了。實際上,我們娛樂資本論(對,我們!娛樂資本論!一家媒體?。┮舱谧鲆粋€綜合使用Stable Diffusion 和 Midjourney 來參與電影級動畫短片制作的項目,會在適當時機披露更多信息。
這就好像:
瓷器制作的技術(shù)不斷進步,其目標是量產(chǎn)出沒有瑕疵的、耐用的產(chǎn)品,并大幅降低售價,使平民百姓也可以使用。
如今的相機融入手機當中,可以高度還原現(xiàn)場真實,也可以后期處理成想要的任何一種“相紙”或“畫風”。
計算機的多媒體能力日新月異,顯示更復雜、逼真的圖像,發(fā)出更有臨場感的聲音,直到VR/AR沉浸式地模擬環(huán)境。
技術(shù)發(fā)展的目標有三個:效果好,操作簡單,價格低廉,最后完成從專業(yè)人士向大眾的普及。之前的多個技術(shù)進步最后都同時實現(xiàn)了這些目標。假以時日,AIGC也會做到這些,分歧只在于是需要5年還是20年。
但是,這個時間上的區(qū)別可能決定了有些人的人生軌跡。如果替代是和風細雨的、漸進式的,他也許可以軟著陸安全退休;如果替代在一夜之間發(fā)生,他將不得不轉(zhuǎn)行。
文娛傳媒行業(yè)歷史上多次發(fā)生過這種“技術(shù)?!北粡氐最嵏驳那闆r:
激光照排技術(shù)讓書報印刷業(yè)淘汰了擅長挑出鉛字并嵌入字板,來“物理”排版的員工。
電腦和噴繪進入戶外廣告行業(yè),取代了原來以畫壁畫、寫美術(shù)字和使用裁紙刀為業(yè)的廣告員工。
Photoshop和InDesign等產(chǎn)品改變了平面設(shè)計行業(yè)的面貌,同時終結(jié)了手繪修圖和拼貼排版兩大流派。如今,“手繪”一詞也可以指使用手寫板畫畫。
我們能手動拉住技術(shù)前進的韁繩嗎?
這些被替代的過程各自持續(xù)了多久呢?這個問題,是由這些技術(shù)的上述三個維度決定的:效果好不好,操作是否簡易,以及特別是價格的高低。
在中國,1980年代末“麥金塔”電腦進入一線城市和省會的廣告市場,但直到十年后,廣大的中國小城鎮(zhèn)和農(nóng)村還是能看到傳統(tǒng)的剪刀裁剪的燈箱牌匾上的藝術(shù)字,以及刷墻工藝。與此同時,噴繪機器的精細度也是與時俱進,幾年前城里淘汰下來的粗顆粒點噴繪機會流傳到更小的城市。
與之類似,AIGC技術(shù)也有一個逐步下放的過程。如果今年高考作文題有人提到ChatGPT,農(nóng)村孩子會因為不了解而無法作答。但問題在于,好萊塢代表的影視行業(yè)是一個嚴格限定于第一世界、一線城市的行業(yè),任何新技術(shù)都將第一時間在他們這里試驗和應(yīng)用。假設(shè)AI工具要有個下沉傳導,那唯一沾點邊的只有土味短視頻了,跟現(xiàn)在討論的事情關(guān)系不大。
其實,如果按照以往這些技術(shù)的發(fā)展速度,那么截至去年,AI在影視行業(yè)的應(yīng)用還保持在讓大部分從業(yè)者非常安心的程度,比如換臉,配音,對口型,改臺詞。今年三四月份有一個演示視頻,展現(xiàn)了某個獲獎的影片如何使用AI來屏蔽其中的臟話,并將其語言修改為日語,而此時演員的口型會跟著變。
現(xiàn)在抱怨《秘密入侵》的人,在那些案例出現(xiàn)時并沒有恐慌。這些每一個工作背后,也都是一些人收入下降,或者失去本應(yīng)有的一單,但看起來就比全片AI直出好受多了。
可以說,現(xiàn)在AI帶來技術(shù)棧顛覆的速度,確實是超過了從業(yè)者的心理預(yù)期。這一替代過程如果不是漸進式的,就會帶來行業(yè)的動蕩。因此,他們寄希望于用政治正確的宣言,促進相關(guān)法規(guī),來延緩一些已經(jīng)研發(fā)出來的技術(shù)被實際應(yīng)用的進度,給從業(yè)人員轉(zhuǎn)型提供喘息之機。然而如果像中國這樣的第三國市場并沒有同步剎車,那么好萊塢在這方面就反而會落后。
在AI多出點力之后,中國人做的電影,是沒法翻譯成29種語言呢,還是沒法把演員換個膚色呢?是沒法被搬運到Y(jié)ouTube呢,還是不能組織專業(yè)影評呢?AIGC能做到更好的自動翻譯,換臉技術(shù)也已經(jīng)很成熟,這些不是愿景,而是現(xiàn)在就做得到的事。現(xiàn)在國產(chǎn)電影譯制出海還是挺麻煩的,當這些工作的綜合成本低到一定程度時,參與進來的影片數(shù)量和質(zhì)量就會迎來一場爆發(fā)。
語言障礙的消除,有助于西方觀眾不帶濾鏡地對待其它文化區(qū)的優(yōu)秀靈感,而不是以“異域風情”的心態(tài),僅僅接受異質(zhì)性明顯的外語片。最終這會稀釋掉好萊塢對全球電影工業(yè)的頭部把控力,進一步消除罷工者們手中握著的稀缺性。
挑戰(zhàn)好萊塢在電影業(yè)獨一份的特殊地位,是世界其他多元文化長期以來的一個夢想。歷史告訴我們,最容易實現(xiàn)這個夢想的方法,是自下而上的,是創(chuàng)作能力的民主化——就像在OpenAI和MJ之外,最有可能實現(xiàn)AIGC夢想的辦法是開源。
寫在最后
在上文引用到的評論中,Lambert很遺憾人們因為罷工期間的“大是大非”問題,而忽略了探究AI生成內(nèi)容的藝術(shù)性批判。他希望后人有機會以更客觀的姿態(tài)來看待這些作品。
或許是因為“事不關(guān)己”,我們在審視《秘密入侵》片頭的藝術(shù)性時,倒是可以摘掉一層“有色眼鏡”,不至于因為知道作者是AI,就對畫作看低一眼。盡管如此,在小的藝術(shù)圈子內(nèi),比如寫詩的貼吧和豆瓣群組、畫師聚集的論壇等地方,還是會出現(xiàn)跟好萊塢一樣的偏見。
某個AI團隊早在2018-19年,就試驗性地將AI生成的古體詩、現(xiàn)代詩、抽象畫等發(fā)布到人類聚集的討論組,并假裝是人類發(fā)布,收獲其他人煞有介事的藝術(shù)評論。有時他們主動公開身份后,會收到一些氣急敗壞的辱罵。當時的技術(shù)肯定沒有現(xiàn)在這樣成熟和更具威脅性。
就像被命名為《泉》的小便池,和名為《丑角》的一根香蕉那樣,某個藝術(shù)作品的好壞判斷往往不跟其中包含的人類勞動多少直接掛鉤。對于明確由人類操刀創(chuàng)作的藝術(shù)品,其評價體系是多元而寬容的。
我們相信,隨著時間推移,一些現(xiàn)在工作受到AI潛在影響的人,都會逐步完成再培訓或新機會的分流。當人們更多“事不關(guān)己”的時候,類似這樣非理性的抵制聲音將會越來越少。大家也就可以就事論事,一視同仁地看待AI生成的作品和產(chǎn)品。