文|壹娛觀察 大娛樂家
一夜之間,各行各業(yè)幾乎都想要與AIGC發(fā)生一些聯(lián)系。不論是單純?yōu)榱颂嵘掝}拉高股價,還是真的希望趕上這波熱潮重塑行業(yè)格局。
從2023年開始,AIGC對于各種傳統(tǒng)行業(yè)的改造已經(jīng)開始。
在商業(yè)史的角度來看,影視娛樂行業(yè)對新技術的接納與活用并不滯后,很多時候甚至還站在了前沿。在被游戲等娛樂形式?jīng)_擊的當下,視頻行業(yè)顯然也不會對AIGC的興起袖手旁觀,尤其是在中外公司都在熱切追求”降本增效“的大背景下,如果AI能夠貢獻出一份力量,更是何樂而不為。
事實上,就在ChatGPT和它的各種后輩占據(jù)著版面的時候,Netflix在1月31日發(fā)布了一部實驗性的動畫短片——《犬與少年》。從劇情上這部作品并無太多創(chuàng)新,整部作品實驗性其實在于最后的演職人員表,從中才能發(fā)現(xiàn),這部動畫原來有不少部分是并非真人創(chuàng)作,而是由AIGC代勞。
《犬與少年》劇照
當然,對于更加重工業(yè)與精細分工的長視頻影視行業(yè)而言,如今AIGC不論是能力還是工具豐富度都仍處在萌芽期,要最終應用到真正的大型項目中或許尚需時日。但對于更加輕量化的PUGC和UGC內(nèi)容而言,從利用ChatGPT的能力寫腳本到使用AI視頻工具一鍵生成,如今已經(jīng)涌現(xiàn)出一批新工具可以為創(chuàng)作者所用。
AIGC對視頻創(chuàng)作最直觀的影響自然還是效率的提升,尤其是在后期方面,而當腳本、拍攝甚至剪輯都不再是視頻創(chuàng)作者的門檻時,視頻創(chuàng)作者最終要比拼則是更加極限的頭腦風暴。
對于平臺來說,借助AIGC工具的內(nèi)容增長速度或許會以指數(shù)級出現(xiàn),不論是平臺算法對注意力的吸引,還是對高風險內(nèi)容的審核機制都將面臨更大的考驗。
AIGC可以不眠不休的生產(chǎn),但用戶的肉體凡胎終歸是需要休息的。
流媒體的一枚“AIGC試驗炸彈”
1月最后一天,流媒體巨頭Netflix與微軟、WIT STUDIO共同創(chuàng)作的首支AIGC動畫短片《犬與少年》正式發(fā)布。說是AIGC其實有些蹭熱點嫌疑,該動畫其實并非完全由AI生成,后者只是負責部分動畫場景的繪制。
從劇情角度來看,這部不足4分鐘的動畫所講述的故事,以及展現(xiàn)的畫面都較為簡單,動畫展現(xiàn)了許多遠景鏡頭,比如火車行駛中的富士山及靜岡海岸線、主角下山時背后那傍水而生的村莊和高聳的山峰等等。
其中幾乎沒有太多復雜的轉(zhuǎn)場動畫或是高難度的動作場景,并且只要有一些追番經(jīng)驗的人都不難發(fā)現(xiàn),這部動畫不論是畫風還是背景展現(xiàn)都算不上精細,尤其是在如此之短的時長內(nèi)僅僅只做到了這個水平,目前是很入門的水平。
不過這種入門的粗糙感或許恰恰是這部動畫短片的亮點,畢竟這是一部借助了基礎AIGC工具輔助的動畫。
《犬與少年》劇照
《犬與少年》相比不少AIGC作品最大的不同,大概在于其非常好的降低了AI的存在感,如果不是在片尾制作團隊專門拆分其中的AI創(chuàng)作鏡頭,估計很難有人會看出這其中的差別在哪。
在動畫結尾,制作團隊透露了AI輔助場景制作的大致過程,總體來說,過程可以分為四個步驟:手繪場景、一次AI生成、二次AI生成、最終成稿(手工修改)。
即動畫師先手繪大致的場景,然后交給AI進行2次生成,最后動畫師在AI生成的基礎上再做最后的修改。
這一過程,基本上就是將動畫的背景制作中繁瑣的第2步和第3步完全交由AI操作,人工只需要在最初的創(chuàng)意與最終成稿階段介入即可,最大限度的節(jié)約了動畫師的人力。
在AIGC意外大火的2023年年初突然放出這樣一個實驗性短片,的確像是在整個動畫以及流媒體行業(yè)投下了一顆威力驚人的炸彈。原本外界對于AIGC能夠介入工業(yè)化的影視流程還抱有懷疑,Netflix卻早已和微軟暗通款曲,開始了這方面的嘗鮮。
只不過相較于看熱鬧的觀眾與激動的資本市場,原本就因為AIGC出現(xiàn)而感到焦慮的業(yè)內(nèi)工作者,不少都在社交媒體上展現(xiàn)出對于這部AI參與動畫的反感,尤其是在日本動畫界長期以來以壓榨底層畫師而聞名的情況下,如今平臺不僅不考慮提升創(chuàng)作者待遇來提升整體水準,反而開始希望借由AI去替代原先的人力工作。
海外觀眾與業(yè)內(nèi)人員對使用AI的反對態(tài)度
就目前而言,勞資雙方的矛盾反而沖淡了AIGC創(chuàng)作本身這一更具有前沿性的技術探索。
實際上,人力不足的確長期都影響著日本動畫的生產(chǎn),尤其是在越來越多流媒體平臺開始對動漫作品有大量需求的情況下。從平臺生產(chǎn)效率的角度出發(fā),Netflix動畫團隊自然是非??春萌斯づcAI協(xié)同創(chuàng)作的模式。從更技術細節(jié)的角度出發(fā),Netflix已經(jīng)在謀劃開發(fā)更通用的AIGC創(chuàng)作工具。
在接受Business Insider日本的采訪時,Netflix動畫的總制片人櫻井大樹就提到,這一次《犬與少年》使用的AIGC并非通用工具而是完全與rinna從零合作開發(fā)的,基于版權原因,其接受訓練的素材則全部來自之前的Netflix原創(chuàng)系列,也正是這個原因?qū)е缕溆柧毩窟h遠不夠做出足夠高質(zhì)量的動畫。
而櫻井也談到了他們之后的愿景:“我認為如果能夠收集到日本所有的動畫公司在完成創(chuàng)作的背景原畫,并創(chuàng)建一個關于背景原畫的AI,這將是一個好主意。它不會屬于任何一家公司,但會成為日本動畫行業(yè)的共同資產(chǎn)。也許我們應該做這樣的事情,與大家分享我們的知識和技術。”
顯然Netflix還是想要走開源之路,而非完全自己閉門造車。
壹娛觀察(ID:yiyuguancha)在《中國版ChatGPT爭奪戰(zhàn),誰能脫穎而出》一文中就已經(jīng)提到過,任何大型AI模型的訓練都需要付出極高的金錢與時間成本,如果沒有更廣泛的合作,單靠Netflix自己也很難最終做出具有實用價值的AIGC泛用工具,遑論將其真正轉(zhuǎn)化到自己的內(nèi)容生產(chǎn)當中去。
《犬與少年》幕后采訪
從訓練素材的豐富程度來看,有百年歷史的迪士尼或許更有開發(fā)專用型AIGC的潛力,尤其是其在幾年前就已經(jīng)開始探索使用模型將文本轉(zhuǎn)換視頻的技術,并且進一步使用該模型自動生成動畫。
就在近日,愛奇藝也宣布將會介入百度隨后會推出的“文心一言”AIGC工具,只不過單純的文本內(nèi)容生成工具能對長視頻平臺帶來什么內(nèi)容生產(chǎn)上的改變,依然還值得長期觀察。
相比于影視行業(yè)需要面對觀眾對內(nèi)容精細度的高要求,以及幕后創(chuàng)作者本身對AIGC的抵觸,PUGC和短視頻行業(yè)顯然少了很多包袱,尤其對后者而言,即便在AIGC概念火爆之前,大量應用的泛AI工具其實就已經(jīng)是在為降低短視頻制作門檻不斷努力了,而AIGC的到來無疑更是為短視頻平臺添了一把新柴。
短視頻不應止于AI配音,AIGC批量生產(chǎn)指日可待
長期浸淫在抖音、快手上的用戶,對于小美、小帥、喪彪等AI配音大咖的聲音想必不會陌生。AI生成配音可以說是當下各種短視頻內(nèi)容最依賴的工具,但隨著AIGC工具的不斷拓展,顯然AI能夠為短視頻帶來的不僅僅只有配音一項。
在ChatGPT類型的工具大火之后,不少人已經(jīng)發(fā)現(xiàn)其現(xiàn)有能力已經(jīng)完全能夠勝任簡單場景下的視頻腳本創(chuàng)作。一旦有了腳本,剩下的其實就是拍攝、剪輯以及配音等工作。那如果這其中的每一項都有AIGC工具能夠使用,豈不是單靠AI就能自動生成出短視頻。在探索用文本或圖片直接生成視頻上,不少硅谷大廠已經(jīng)拿出了實驗性產(chǎn)品。
去年10月,META曾公布過旗下一款視頻AI工具“Make-A-Video”。簡單來說,該工具是通過AI生成連續(xù)的圖片,再將這些圖片鏈接成一段視頻。不過從最終的成品來看,Meta生成的短視頻顯得過于單調(diào),更重要的是分辨率實在有限。
Make-A-Video展示案例
作為AI大廠的谷歌則非常超前,選擇直接打造能夠生成超長并且高分辨率的AI文字轉(zhuǎn)圖片模型,并且一次性就拿出了兩個:Imagen(基于大型語言模型和行業(yè)流行的擴散模型),和 Parti(基于谷歌自家的 Pathways 框架)。
前者能夠進一步提升AI文字生成圖片的分辨率,而后者則依靠大語言模型來生成具有劇情復雜度的視頻內(nèi)容。
就目前來說,這兩家大公司給出的產(chǎn)品都還只是具有學術價值,談不上實用性。因為大公司在對于AIGC工具的開發(fā)上依然還有非常多的考慮,一旦產(chǎn)品打磨不夠理想可能就會出現(xiàn)前幾天谷歌版本ChatGPT翻車導致千億市值蒸發(fā)的情況。
初創(chuàng)公司就沒有這些顧慮,在ChatGPT爆紅幾天后,一鍵生成短視頻的平臺工具QuickVid就問世了。Bug確實不少,但可以說這個工具是目前各種AIGC開源項目的超級大雜燴。
依托GPT-3的生成文本功能生成短視頻腳本,再從腳本中自動提取或手動輸入的關鍵字,基于這些關鍵字其便可以免費從Pexels庫中調(diào)用背景視頻,同時疊加由DALL-E 2生成的文字轉(zhuǎn)圖像,并調(diào)用Google Cloud的文本轉(zhuǎn)語音 API添加來自YouTube上免版稅音樂庫的合成畫外音和背景音樂。
靠著各種現(xiàn)成的AIGC工具接口與大量免費素材庫,QuickVid的創(chuàng)始人Daniel Habib花了幾周時間就讓這一產(chǎn)品成功上線。關鍵是其使用體驗的確稱得上是“傻瓜”,例如只需要輸入一個單詞——貓(cat),點擊生成之后三分鐘就能呈現(xiàn)出一個48秒的粗剪版本,如果不做調(diào)整直接選擇輸出,這個工具甚至能幫你起好短視頻的標題與簡介以及各種需要tag的關鍵詞。
QuickVid截圖
整個過程花費不到十分鐘時間,雖然目前該平臺還只支持視頻下載后用戶自行上傳到短視頻平臺,網(wǎng)站上寫著一鍵上傳YouTube和TikTok等功能也正在開發(fā)中。從產(chǎn)品角度出發(fā),QuickVid還處于非常初級的階段,只有一項核心功能且還是Beta版就敢收每月10美元的訂閱費,也屬于藝高人膽大。
對于正在瘋狂加速的國內(nèi)AIGC賽道來說,類似工具的出現(xiàn)顯然只是時間問題,像是字節(jié)旗下的剪輯工具剪映,移動版早就有了AI圖片轉(zhuǎn)視頻功能,接下來只要再接入部分相關AI模型,就很容易搖身一變成為與QuickVid類似的短視頻AIGC工具。
另一邊,對于更加依靠算法而非內(nèi)容品質(zhì)的短視頻來說,多快好省的AIGC工具無疑對創(chuàng)作者和平臺都各有益處,前者能夠?qū)⒏嘈乃蓟ㄔ诟鞣N極限創(chuàng)意上,后者當然是樂見平臺內(nèi)容數(shù)量的爆炸式增長。
當然這一切的前提都還需要建立在AIGC工具的已經(jīng)打磨完善上。
事實上,不論是長視頻還是短視頻的AIGC創(chuàng)作,目前最有前景的領域大概還是在B端商業(yè)投放上,尤其是那些過去需要花費大量人力物力財力才能產(chǎn)出視頻內(nèi)容用于視頻廣告投放的品牌公司,不論是消費品還是游戲公司,AIGC視頻創(chuàng)作的出現(xiàn)無疑都能讓社交媒體營銷“買量”這件事最大程度的“降本”,至于最終能不能“增效”,則依然還需要不斷試錯并等待用戶的檢驗。
AIGC應用視圖
《人工智能生成內(nèi)容(AIGC)白皮書(2022年)》
至于版權問題與對抗虛假信息等問題,或許還得等到百度等國產(chǎn)ChatGPT產(chǎn)品出現(xiàn)之后才有討論的價值。
就目前而言,AIGC對各行各業(yè)的改造已然開始,過去被認為是高門檻的視頻行業(yè)必然也無法逃過這一命運,不論是長視頻還是短視頻,最終只有創(chuàng)意才會成為真正的門檻,畢竟這是目前AI唯一還無法代勞的環(huán)節(jié)。
*參考文章:
極客公園《只需一段話,“一鍵生成”短視頻的工具來了》
*微信公眾號:壹娛觀察(ID: yiyuguancha)