文|首席消費(fèi)官 李東耳
生成式AI不僅成為國(guó)外科技領(lǐng)域的熱門投資賽道,也正在逼瘋內(nèi)容創(chuàng)作者。
近期,Meta和谷歌先后發(fā)布了幾條引爆科技圈的短視頻。這些視頻引發(fā)關(guān)注并非內(nèi)容做得多優(yōu)秀,反而都非常簡(jiǎn)單,比如一匹正在喝水的馬,一只畫畫的玩具熊,或者一段騎摩托車的第一視角錄像,隨便找個(gè)高中生都可以隨手錄下一段。這些視頻引爆全球的真正原因則在于它們的制作方式:AI內(nèi)容生成。
這些短視頻的創(chuàng)作方式非常簡(jiǎn)單,創(chuàng)作者僅僅需要向AI輸入一段話,甚至只是說(shuō)一下要求,AI就可以根據(jù)需要生成一段視頻。
很多人在第一時(shí)間就認(rèn)為,這對(duì)于短視頻行業(yè)將是個(gè)巨大的沖擊。盡管短視頻的火熱還只是近幾年的事,但從生成式AI的發(fā)展速度來(lái)看,對(duì)視頻創(chuàng)作者的沖擊會(huì)在不久來(lái)臨。
AI不會(huì)的藝術(shù)又少了一個(gè)
從文字到語(yǔ)音再到圖片,Meta和谷歌已經(jīng)用實(shí)際作品向大家宣布,AI已經(jīng)可以根據(jù)使用者的需要“創(chuàng)作”人類目前大部分的藝術(shù)作品了。
這聽上去很玄幻,但已經(jīng)有人在這么做了。如AI語(yǔ)音播報(bào)也已經(jīng)大量被應(yīng)用在自媒體上;AIVA等AI制作軟件讓創(chuàng)作者可以在毫無(wú)音樂知識(shí)的情況下,僅僅通過(guò)AI就可以制作各種類型的音樂,并已經(jīng)有AI歌曲作品出現(xiàn)。
近期生成式AI最火的事情除了這一次兩大科技巨頭發(fā)布的AI生成視頻外,就是前段時(shí)間AI作畫奪冠了。雖然AI生成視頻這還是第一次,但AI作畫已經(jīng)出現(xiàn)了一段時(shí)間了,并且已經(jīng)出現(xiàn)了不少可免費(fèi)試用的工具。
隨著AI開始能夠創(chuàng)作視頻作品后,也將有望進(jìn)入電影等藝術(shù)領(lǐng)域,或許隨著AI生成視頻得到應(yīng)用后,影視行業(yè)也將迎來(lái)一次大升級(jí),特別是在場(chǎng)景和特效方面,未來(lái)也可只用短短幾句話完成特效師加班一個(gè)月的工作。因此,AI生成視頻作品一經(jīng)公布,就有不少人想要讓Meta和谷歌開源。
不過(guò),谷歌表示出于安全和倫理的考慮,暫時(shí)不會(huì)發(fā)布兩個(gè)視頻生成模型的代碼或Demo。雖然不知道谷歌何時(shí)能夠解決這些問(wèn)題,但也只是時(shí)間問(wèn)題,更何況并非沒有其他企業(yè)在研究相關(guān)技術(shù)。
國(guó)內(nèi)也已經(jīng)有不少生成式AI的應(yīng)用。除AI續(xù)寫、AI語(yǔ)音外,2022年1月,網(wǎng)易推出了一站式AI音樂創(chuàng)作平臺(tái)“網(wǎng)易天音”,將用戶編輯的新年祝福AI生成為歌曲,并在上半年推出了web端專業(yè)版。
此次亮相的AI自動(dòng)生成視頻也并非第一次被提出,國(guó)內(nèi)字節(jié)跳動(dòng)旗下的剪映APP提供AI生成視頻功能,并可以免費(fèi)使用。比如剪映的圖文成片功能和谷歌類似,創(chuàng)作者可以通過(guò)幾個(gè)關(guān)鍵詞或一小段文字生成一段創(chuàng)意小視頻。剪映還可以根據(jù)文字描述智能匹配視頻素材,將視頻包裝為更垂直的內(nèi)容作品,包括財(cái)經(jīng)、歷史、人文等類別。
生成式AI沖擊內(nèi)容生產(chǎn)者
AI生成視頻與其他AI生成作品的方式并沒有本質(zhì)上的不同,只不過(guò)生成視頻要比生成其他目前可以生成的作品要復(fù)雜一些,不僅計(jì)算成本高,還很依賴高質(zhì)量文本視頻數(shù)據(jù)數(shù)量。
但與其他類型生成類AI不同的是,若只是生成一個(gè)幾秒鐘的有聲音的動(dòng)圖可能還沒那么麻煩,但只能生成這種非常短的片段對(duì)人們的工作生活意義不大,人們需要的是讓AI能夠用視頻的方式講故事。
這也是相對(duì)于Meta而言,谷歌這次能夠引起更多關(guān)注的原因。
谷歌發(fā)布的兩個(gè)AI生成視頻分別來(lái)自于Imagen Video和Phenaki,前者主要突出的是高清,與Meta的Make-A-Video沒有太多的差別。在Make-A-Video公布了AI生成的視頻后,AI圈就已經(jīng)玩了一波梗,一個(gè)能夠做出更高清視頻的AI還不足以在短時(shí)間內(nèi)戳中興奮點(diǎn)。
Phenaki更加令人震驚的地方在于,它可以制作出超過(guò)2分鐘的連貫的也有確切內(nèi)容的視頻,這才是真正讓人們感到恐懼的地方。因?yàn)闊o(wú)論AI生成的視頻多么高清,也只能是為內(nèi)容生產(chǎn)者提供一個(gè)靈感,一個(gè)素材,一個(gè)過(guò)場(chǎng)動(dòng)畫。但能夠制作出有具體劇情內(nèi)容的短視頻就意味著,一些短視頻創(chuàng)作由AI代替人工完成已經(jīng)初步有了可能。
自AI誕生之日起,就一直有人擔(dān)心人工會(huì)被AI取代,事實(shí)證明,當(dāng)前的AI還無(wú)法勝任大部分創(chuàng)作工作,很多時(shí)候只是拿來(lái)娛樂,比如AI續(xù)寫系列能夠大火,就是因?yàn)锳I總能在續(xù)寫過(guò)程中創(chuàng)造出來(lái)一些非常搞笑甚至毫無(wú)邏輯的橋段。這樣的作品娛樂足矣,或者可以在作者沒有思緒的時(shí)候給他提供一些創(chuàng)作靈感,但真投入到工作中,必然需要大量的人工修改才能成為一個(gè)基本合格的作品。
但AI的發(fā)展速度已經(jīng)超過(guò)大部分人的想象,并已經(jīng)開始影響到人們的工作。
近日,成都的一份兼職插畫師招聘啟示引發(fā)了不少人的討論。雖然該招聘啟示文字讀起來(lái)有點(diǎn)咄咄逼人,但只是直截了當(dāng)?shù)卣f(shuō)出招聘需求而已,不足以擊垮一個(gè)成年人內(nèi)心。真正讓其崩潰的是工作內(nèi)容。
該招聘啟事顯示,該兼職的工作內(nèi)容就一個(gè),使用AI(人工智能)繪圖生成不同風(fēng)格的插畫,篩選后精修。具體而言就是使用AI繪制軟件,使用關(guān)鍵詞生成圖片,以及對(duì)作品進(jìn)行清晰的圖層文件夾整理工作。
從其招聘啟事來(lái)看,這份名為插畫師的工作實(shí)際上與插畫師并沒有什么關(guān)系,至少不涉及傳統(tǒng)意義上的插畫師的能力要求,只要能熟練掌握PS,能夠翻墻,能夠快速交稿,審美在正常人的范圍內(nèi)就可以。至于其繪畫水平等專業(yè)素養(yǎng)反倒沒有要求。
過(guò)去插畫師這樣的工作常被插畫師們吐槽錢少事多沒前途,但至少還算是個(gè)技術(shù)工種,但這種招聘需求的出現(xiàn)意味著插畫師的門檻進(jìn)一步降低了,競(jìng)爭(zhēng)越來(lái)越激烈,還是一次對(duì)插畫師職業(yè)前景的否定。當(dāng)前AI生成還不夠成熟,還需要“AI生成+人工干預(yù)”的方式進(jìn)行插畫繪制工作,那隨著AI生成技術(shù)的成熟,未來(lái)這些底層的插畫師們將何去何從?
如今常常被吐槽是“人工智障”的AI繪圖已經(jīng)威脅到了插畫師們的職業(yè)生涯,已經(jīng)初步具備視頻制作能力的生成式AI的出現(xiàn),進(jìn)一步加深了人們對(duì)于人與AI如何共生的思考。這或許也是谷歌所說(shuō)的倫理問(wèn)題的一部分。
生成式AI元年到來(lái)
盡管生成式AI當(dāng)前還離不開人工干預(yù),但不可否認(rèn)的是,生成式AI仍是AI發(fā)展的一個(gè)重要方向,具有非常大的發(fā)展?jié)摿?。在Meta、谷歌公布AI生成視頻前就有觀點(diǎn)認(rèn)為,2022年將是生成式AI從技術(shù)成熟到深入社會(huì)基本面的元年。根據(jù)Gartner上半年的數(shù)據(jù),預(yù)計(jì)到 2025 年,生成式AI將占所有生成數(shù)據(jù)的10%,當(dāng)前這一比例不到1%。
生成式AI的應(yīng)用場(chǎng)景也非常廣闊,除了文創(chuàng)、新聞等內(nèi)容生產(chǎn)行業(yè)外,生成式AI在醫(yī)療保健、數(shù)字商業(yè)、制造業(yè)、農(nóng)業(yè)等多個(gè)行業(yè)都有豐富的應(yīng)用前景,如幫助醫(yī)生檢測(cè)X射線、CT等設(shè)備掃描中的病變、創(chuàng)建商品的數(shù)字孿生體、輔助檢測(cè)產(chǎn)品質(zhì)量等。在XR、數(shù)字孿生、自動(dòng)駕駛汽車等熱門技術(shù)上也有豐富的應(yīng)用空間。
但當(dāng)前生成式AI仍有很多問(wèn)題需要解決。
如文娛領(lǐng)域,不少人采用生成式AI進(jìn)行創(chuàng)作的一個(gè)原因就是可以避免版權(quán)問(wèn)題,但這并不代表沒有隱患。
一方面,AI的創(chuàng)作也是將學(xué)習(xí)到數(shù)據(jù)按照要求重新組合起來(lái),雖然顆粒度越來(lái)越細(xì),但難免還是有眼尖的人會(huì)看出可能是參考了哪些作品,甚至有網(wǎng)友在社交平臺(tái)上表示曾在某AI生成圖片上隱約看到疑似簽名的痕跡。另一方面,當(dāng)前大部分AI生成平臺(tái)多不主張版權(quán)或明確表示可以進(jìn)行商用,但隨著生成式AI逐步商業(yè)化,這樣的版權(quán)環(huán)境是否存在,是否會(huì)出現(xiàn)新的版權(quán)問(wèn)題也是需要討論的。
生成式AI的邏輯與安全性也有待提升。當(dāng)前的生成式AI很容易犯一些常識(shí)性的錯(cuò)誤,在一些需要長(zhǎng)期記憶的地方也容易出現(xiàn)問(wèn)題。如在AI生成小說(shuō)的過(guò)程中,經(jīng)常會(huì)因?yàn)槠^長(zhǎng)而出現(xiàn)前后矛盾的地方。
因此,即便生成式AI已經(jīng)可以在很多領(lǐng)域得到應(yīng)用,真要讓生成式AI投入工作,還要通過(guò)大量的訓(xùn)練來(lái)避免因AI的“錯(cuò)誤”造成的重大損失。畢竟醫(yī)療、制造業(yè)這些應(yīng)用場(chǎng)景沒有文創(chuàng)行業(yè)那樣的試錯(cuò)空間。