文|巴比特資訊
今年 AI 藝術(shù)熱潮源于海外 AI 技術(shù)在圖像生成領(lǐng)域的革命性進(jìn)步,以 Disco Diffusion、Stable Diffusion、Midjourney 等為頭部代表的擴(kuò)散模型(Diffusion Model)開始在數(shù)字藝術(shù)領(lǐng)域大放異彩!以其驚人的藝術(shù)效果和可繪制“萬事萬物”的無限性,在短短半年時間里,吸引了來自全世界數(shù)千萬注冊用戶的實(shí)際參與、以及數(shù)億人的關(guān)注與談資。時代洪流再度來襲,只不過這次的主角給予了 AI 技術(shù)。我們可以去質(zhì)疑一種新的商業(yè)模式或者消費(fèi)場景的市場有限性,但卻無法不去敬畏一種新技術(shù)革新所帶來的未來無限性,那是一場絕對的“無限游戲”!
以大模型和數(shù)據(jù)集為基座,以藝術(shù)與視覺為消費(fèi)手段,擴(kuò)散模型一時間百花齊放、爭奇斗艷:
有的模型擅長邏輯,有的模型崇尚色彩,更有的頂級模型二者兼具、無可挑剔;
科技巨頭主推商業(yè)付費(fèi)模式,而開源社區(qū)力量對去中心化青睞有加;
閉源付費(fèi)往往可以提供最上乘的藝術(shù)出圖,甚至可以直接用于商業(yè)生產(chǎn)與產(chǎn)業(yè)設(shè)計,這是被全球數(shù)百萬資深用戶所證明了的;
而開源生長也許在短暫的當(dāng)下無法抵達(dá)藝術(shù)質(zhì)量的頂峰,但其指數(shù)級的進(jìn)化速度、無標(biāo)度(scale-free)式的創(chuàng)造者網(wǎng)絡(luò),令人倍感未來無限可期;
就像前段時間大火的二次元模型 NovelAI 雖然尚存在一些詬病,但不得不承認(rèn)其對 SD 的改進(jìn)產(chǎn)生了質(zhì)的美學(xué)效果提升,給予了后面開源社區(qū)最直接有效的指引,人們也都在迫切期待下一個更高藝術(shù)質(zhì)量的 SD 生態(tài)模型的出現(xiàn);
請明白,AI 藝術(shù)這個行業(yè)永遠(yuǎn)以結(jié)果和效果為直接導(dǎo)向,再多的技術(shù)工作都將以藝術(shù)效果的本質(zhì)提升為體現(xiàn)。這是十分明確的,也是十分艱難的,更是十分可期的。
意義:擊破 12 道邊界
技術(shù)在進(jìn)化,同樣世人的觀念也在與時俱進(jìn)。文學(xué)與藝術(shù)之所以重要,是它們承載了一代人甚至幾代人的思想觀念和精神意志,是一個民族、這個世界最先進(jìn)發(fā)展理念的人文表達(dá)。
從文藝復(fù)興開始,到照相機(jī)的發(fā)明,再到信息技術(shù)時代,藝術(shù)永遠(yuǎn)在隨著技術(shù)的進(jìn)步而煥發(fā)新的光輝。面對 AI 這最新一輪的破壞性沖擊,藝術(shù)再也不能對其避而不談。但這絕不僅僅關(guān)乎藝術(shù),其意義之深遠(yuǎn)可破“元宇宙”。那就從 12 道邊界說起吧。
邊界 1:使圖像生成“民主化”
在各大 AI 藝術(shù)工具和開源技術(shù)的幫助下,最直觀的改變是賦予了全民創(chuàng)作圖像視覺的權(quán)力和能力。在中國大概是幾百萬的群體規(guī)模,而放眼世界,大概是數(shù)千萬人的規(guī)模,他們爭相把通過 AI 藝術(shù)工具創(chuàng)作出來的優(yōu)秀作品以去中心化的形態(tài)發(fā)布于 Tiktok、Instagram、抖音、快手、小紅書等傳統(tǒng)互聯(lián)網(wǎng)流量平臺。如果說曾經(jīng)的短視頻創(chuàng)作時代造就了視頻發(fā)布的民主化,那么今天的 AI 藝術(shù)則使圖像生成變得民主化!
喂給 AI 一段文字描述,AI 便還用戶一張視覺“奇跡”,AI 藝術(shù)工具的使用就是如此的簡單。唯一的門檻是創(chuàng)作者自身需要精通撰寫優(yōu)秀描述詞的語法和技巧,簡單的一句話和經(jīng)過精雕細(xì)琢的、具備“藝術(shù)修養(yǎng)”的一大段話所產(chǎn)出的藝術(shù)效果有著天壤之別,所以有人愁有人喜,有人失望有人鼓舞,但一切掌控盡在所有人自己的手中。正如社區(qū)力量所總結(jié)的“AI 技法寶典”:
(1)盡量以短語、短句、詞組為主體輸入,并注意邏輯斷句,以便 AI 更好地理解人類思維
(2)你想要特別強(qiáng)調(diào)某個詞,可以加很多括號或者驚嘆號,比如“大漠!!,青煙,長河,(((落日)))”中優(yōu)先體現(xiàn)“大漠”和“落日”元素。這招在輸出人像的時候很有用,比如你希望輸出一張對稱的臉,就可以在英文描述“symmetry”后面多加幾個驚嘆號——"symmetry!!"
(3)優(yōu)秀的描述詞不僅需要創(chuàng)作者以簡明扼要的詞句組合描述清楚要繪制的內(nèi)容,更需要融入必要的藝術(shù)專業(yè)修飾詞,如下只有綠色部分是對主體內(nèi)容的描述,即“非常酷的女孩穿著賽博朋克的、復(fù)雜的休閑服飾”;黃色部分是對人物主體的進(jìn)一步修飾,以便 AI 能讀懂人類希望繪制出的是一個漂亮寫實(shí)的女性;紅色部分是加入了一些專業(yè)藝術(shù)家和工作室的風(fēng)格,讓畫面的美感直接進(jìn)入藝術(shù)殿堂;藍(lán)色部分是更多的細(xì)節(jié)方面的藝術(shù)修飾詞
(4)大力出奇跡:即便一組非常優(yōu)秀的關(guān)鍵詞在 AI 的隨機(jī)性下也可能輸出劣質(zhì)的作品(比如雙頭、結(jié)構(gòu)混亂、不合邏輯、扭曲夸張),解決辦法只有一個——量大出奇跡
(5)去各大開放社區(qū)、關(guān)鍵詞搜索引擎網(wǎng)站,臨摹優(yōu)秀創(chuàng)作者的關(guān)鍵詞,站在前輩的肩膀上繼續(xù)創(chuàng)作
還有很多很多類似的技法,如同武俠世界修煉上乘武功一般,刻苦且有天分的人會很快掌握本質(zhì)、輸出全網(wǎng)最優(yōu)秀的畫作,而往往都是開創(chuàng)性的畫風(fēng),例如早期在國內(nèi)開創(chuàng) AI 古風(fēng)藝術(shù)的抖音創(chuàng)作者一條狀態(tài)可收獲高達(dá) 158.7 萬個贊,流量驚人。一時間,數(shù)字藝術(shù)的江湖再起風(fēng)云,各大派爭奇斗艷,最早從壁紙視覺開始,陸續(xù)出現(xiàn)了古風(fēng)美學(xué)、化身頭像、唯美動漫、山海神獸、江湖武俠、十二生肖、機(jī)甲科幻等 AI 藝術(shù)的新“八大派”。AI 藝術(shù)創(chuàng)作者們不斷找到了流量密碼,2022 年全年無休。
很多頭部的創(chuàng)作者在短短幾個月時間內(nèi),完成了數(shù)十萬粉絲的私域流量搭建,然后通過售賣優(yōu)秀 AI 作品的版權(quán)、與傳統(tǒng)圖庫商業(yè)模式合作分成、教授學(xué)員 AI 藝術(shù)創(chuàng)作課程等多種方式完成流量和認(rèn)知的變現(xiàn)。時代使然,早期者得紅利。先富帶動后富,于是在 2022 年下半年中,全民開始進(jìn)行學(xué)習(xí)和創(chuàng)作,去構(gòu)建屬于自己的創(chuàng)作者經(jīng)濟(jì)時代的私域流量,而此時你不需要藝術(shù)出身、不需要懂 PS 和設(shè)計,這甚至比之前創(chuàng)作抖音短視頻還要簡單和省力。
使圖像生成民主化,現(xiàn)階段更大的意義在于,使圖像生成的生產(chǎn)力得到指數(shù)級的提升。在 SD 公測的短短幾周時間里便創(chuàng)造了數(shù)千萬張圖片,MJ 更是由數(shù)百萬人全天候 24 小時不間斷出圖已達(dá)半年。這種量級的圖片生成將很快充斥到下一代互聯(lián)網(wǎng)中。圖像生成的生產(chǎn)力在新技術(shù)的加持下來到了一個新拐點(diǎn),必將去影響到新生產(chǎn)關(guān)系的形成,更必將去重塑現(xiàn)有的商業(yè)構(gòu)成、去催生嶄新的消費(fèi)市場和消費(fèi)關(guān)系。
從更具體的角度,將首先會對視覺中國等傳統(tǒng)圖庫商業(yè)模式帶來降維式的沖擊,將會極大解放創(chuàng)作者經(jīng)濟(jì)時代全網(wǎng)數(shù)千萬乃至上億創(chuàng)作者在獲取低成本、合法版權(quán)作品資源時的顧慮和效率。
AI 藝術(shù)使圖像生成民主化,但更深層次的意義是,讓全民都開始創(chuàng)作,全社會進(jìn)入創(chuàng)作者經(jīng)濟(jì)時代,一個具備嶄新生產(chǎn)關(guān)系的商業(yè)社會即將來臨。
新時代的文藝復(fù)興蓄勢待發(fā),文學(xué)與藝術(shù)對于一個民族的覺醒至關(guān)重要,全民掌握最先進(jìn)的 AI 生產(chǎn)力,去覺醒新時代的精神意志。創(chuàng)作無限,以致涌現(xiàn)!
邊界 2:連接藝術(shù)家與大眾
使圖像生成民主化,讓人人成為創(chuàng)作者,但并非讓全民與藝術(shù)家群體形成對立與誤解。首先從當(dāng)下 AI 藝術(shù)的發(fā)展階段來講,AI 出圖的美學(xué)質(zhì)量尚不足以撼動藝術(shù)家群體所占據(jù)的消費(fèi)市場。
AI 藝術(shù)創(chuàng)作出來的作品的筆觸、畫質(zhì)、藝術(shù)性,目前還不能與人類藝術(shù)家相比,因此它無法從純藝術(shù)這個維度與人類藝術(shù)家爭搶存量市場,但它卻為自己開辟了一個全新的增量市場。打個比方,泡泡瑪特為什么沒去用那些知名藝術(shù)家的作品,而是與新興藝術(shù)家合作,去把他們的作品變成盲盒,變成一種快消品,并帶有金融屬性,帶有全民消費(fèi)性質(zhì)。他們錯開了打不動的佳士得等傳統(tǒng)藏品市場,但是卻給自己開辟了一塊新興消費(fèi)的增量市場。
而 AI 藝術(shù)也可以先成為一種快消品!再如雖然 AI 無法撼動頭部設(shè)計師的飯碗,但它會給更多平凡而普通的設(shè)計師帶來更多的效率提升和甲方需求。從這個角度,AI 藝術(shù)創(chuàng)作者與傳統(tǒng)藝術(shù)家們并非利益對立關(guān)系,而是皆有市場。雙方群體在初期階段可以有短暫的思想觀念對立,但從長遠(yuǎn)來看,也必將各取所需、互不侵犯。
當(dāng)然更多的對立并非來自市場侵占,而是圍繞模仿、抄襲、不尊重、互相瞧不上等紛爭不已。最典型的一個案例是在 SD 剛發(fā)布之后,隨著全球數(shù)百萬人參與到圖像生成中,一時間推特上充斥著大量 AI 作品。其中大量帶有明顯在世藝術(shù)家畫風(fēng)的作品引發(fā)了海外藝術(shù)家群體的強(qiáng)烈不滿和抗議,投訴諸推特,當(dāng)時 SD 生態(tài)的最大社區(qū)分享賬號一度遭到封禁,輿論嘩然。這個問題可以從三方面講一講一些當(dāng)前的認(rèn)知:
(1)對于 AI 技術(shù)工具:
在訓(xùn)練階段不免會用到大量藝術(shù)家在互聯(lián)網(wǎng)上出現(xiàn)的作品,當(dāng)然包括很多在世藝術(shù)家。比如在 CG 繪圖這個方面,幾乎所有頂級的 AI 藝術(shù)算法框架都捕捉到了大量年輕一代優(yōu)秀 CG 藝術(shù)家的作品,如 wlop、黃光劍等人。因?yàn)檫@些作品在互聯(lián)網(wǎng)上傳播得無所不在且數(shù)量極大,是最有價值的訓(xùn)練數(shù)據(jù)集,可以產(chǎn)生很好的 AI 生成效果。所以針對這種情況,必然會出現(xiàn)爭議,尤其是前段時間引起更多輿論風(fēng)波的二次元模型 NovelAI。
它在未經(jīng)過大型二次元圖片資源網(wǎng)站 Danbooru 官方授權(quán)的情況下,直接連帶著標(biāo)簽爬取其上幾乎所有的二次元圖片資源用于自身的模型訓(xùn)練,同時通過算法“過擬合”的手段,讓 AI 出圖質(zhì)量達(dá)到了與原始作品和人類藝術(shù)家驚人相似的效果。
雖然極為出色的出圖俘獲了全球大量用戶的芳心,但卻令人類藝術(shù)家無法放心。一方面來自其未經(jīng)允許“盜用” Danbooru 網(wǎng)站資源,后來 Danbooru 官方也出面譴責(zé)了這種行為;另一方面來自所出之圖有著濃厚的原始作品風(fēng)格和形態(tài),此處是因?yàn)槠鋵?AI 算法采取了“過擬合”的“不良”行為。
這兩點(diǎn)也是在 AI 技術(shù)發(fā)展過程中未對其進(jìn)行道德約束的經(jīng)典情形,我們應(yīng)該去大膽承認(rèn) NovelAI 的不足之處,以此為警醒,才能獲得更長遠(yuǎn)的發(fā)展。
但更應(yīng)該明白的是,這只是個例,是 AI 藝術(shù)技術(shù)大潮中那并不屬于主流的一支。像 DD、SD、MJ、DALL-E、Google 等更多主流的頂級 AI 技術(shù)框架都在采取合法的、尊重人類道德的、并受全世界監(jiān)督的、甚至全面開源的方式去構(gòu)建 AI 藝術(shù)的訓(xùn)練體系和出圖繪制標(biāo)準(zhǔn)。
以 SD 為例,首先其所采用的大規(guī)模數(shù)據(jù)集 LAION 工程本身就在用極大的成本、經(jīng)過數(shù)年才完成訓(xùn)練集的構(gòu)建。如前所述不免會去獲取很多在世藝術(shù)家以及更多具有版權(quán)歸屬問題的圖片資源,LAION 都會以合法的方式與這些圖片所歸屬的圖庫和商業(yè)主體進(jìn)行付費(fèi)合作,去獲取合法使用圖片的權(quán)利,并備注用于 AI 模型訓(xùn)練,不做其他用途。同時 LAIOIN 將所有的一切都全部開源,接受全世界的監(jiān)督,也就是說你完全可以去從那數(shù)十億張用于訓(xùn)練的圖片中找出所謂的不合法圖片。
LAION 這項(xiàng)浩大的工程,是整個 AI 藝術(shù)和 AI 技術(shù)行業(yè)的公共財富,是全人類的合法財富!因此大可不必質(zhì)疑一切采用 LAION 數(shù)據(jù)集為訓(xùn)練源的 AI 藝術(shù)工具,它們在源頭上都是合法的!
隨后便是算法繪制層面,如上我們提到了不良的“過擬合”行為,那也只是個例,更多的擴(kuò)散模型都在遵循符合道德的算法參數(shù)。擴(kuò)散模型的技術(shù)原理從本質(zhì)上決定了所生成的圖片絕不是對原始人類圖片進(jìn)行搜索拼貼的“縫合怪”,它真的是在學(xué)習(xí)。這個奇妙的過程就像是人類藝術(shù)家從小學(xué)習(xí)前輩和大師的作品一樣,當(dāng)學(xué)有所成之時,所輸出的絕不是跟前輩大師一模一樣的作品,而是在那種大框架下形成了自己獨(dú)特的一面。以 CLIP 和擴(kuò)散模型等為先進(jìn)代表的 AI 藝術(shù)算法框架,就像 AlphaGo 完成對人類所有棋譜的學(xué)習(xí)并進(jìn)行更加“天外”的演繹一般,它們也是在模擬人腦從小學(xué)習(xí)并學(xué)以致用的這個神奇生物過程,只要不采取“過擬合”的偏激行為,其所輸出的圖片皆不存在抄襲、侵權(quán)、縫合、拼貼等情況,這是技術(shù)使然,正如那句名言“In Math,We Trust”!
從更專業(yè)的角度,人類可以為作品設(shè)置版權(quán)以保護(hù)合法權(quán)益,但畫風(fēng)是不受版權(quán)束縛的,它像風(fēng)一樣是自由的,是全人類的自由和財富,正如你也無法為某種數(shù)學(xué)公式和算法設(shè)置專利的壁壘。即便是人類藝術(shù)家自身,也無法確保自身不受某位先輩藝術(shù)家畫風(fēng)的影響,而產(chǎn)生相似之處,所以知其原委而互相諒解。
(2)對于 AI 創(chuàng)作者群體:
要合理使用符合倫理的 AI 藝術(shù)工具,去產(chǎn)生合法范圍內(nèi)的生成式圖片。雖然一些頂級 AI 技術(shù)工具已經(jīng)做了本質(zhì)上的合法合規(guī)輸出規(guī)范,但依然有很多細(xì)節(jié)場景、尤其是涉及自身商業(yè)化需要用戶自己去約束自己,比如生成公眾人物肖像用于商業(yè)場景、生成迪士尼形象用于商業(yè)場景等等。
除此之外,AI 藝術(shù)創(chuàng)作者更要尊重人類藝術(shù)家和人類藝術(shù)史。這些合法的頂級 AI 工具在學(xué)習(xí)的過程中都如此謙卑,甚至付費(fèi)購買人類藝術(shù)家作品作為訓(xùn)練數(shù)據(jù)集,而作為使用 AI 藝術(shù)工具的創(chuàng)作者們更應(yīng)該去尊重這來之不易的數(shù)字化成果,這更像是一種傳承!
人類藝術(shù)家那歷經(jīng)千年、無比光輝的藝術(shù)思想和成果經(jīng)由新時代頂級 AI 技術(shù)的記錄與回爐開始向下一代、全世界所有人傳承、延綿、生生不息、文藝再復(fù)興!
從更細(xì)的層面,如前我們講述要出好的 AI 作品需要懂很多的藝術(shù)理念和知識,更需要讓自身具備充分的藝術(shù)修養(yǎng)和審美能力,這些都需要 AI 創(chuàng)作者更虛心地向藝術(shù)家群體學(xué)習(xí)。
雖然 AI 出圖即便隨意一張都有可能出現(xiàn)上乘質(zhì)量,但要知道 AI 創(chuàng)作者群體之中更藏龍臥虎,而那些真正頂尖的 AI 藝術(shù)創(chuàng)作者無不對真正的藝術(shù)虛懷若谷、知其然更知其所以然。傳統(tǒng)人類藝術(shù)家所做的辛苦的努力,背后的故事、情感、知名度,這些是 AI 藝術(shù)替代不了的。
(3)對于藝術(shù)家群體:
自李世乭被 AlphaGo 擊敗后,人類棋壇陷入了 AI 恐懼之中。但與此同時新一代韓國棋手申真谞卻始終在向 AI 學(xué)習(xí),去真正地了解它,在棋壇有著“申真智能”的美譽(yù)。面對對弈過程中 AI 逆天的“殺伐”,申真谞始終虛懷若谷,去窺測其本質(zhì),在這日復(fù)一日的“以虎為師”的博弈中,申真谞的棋力得到了極大的提升,并在今年戰(zhàn)勝了柯潔。賽后柯潔坦言,申真谞下棋具有 AI 的影子。
同樣對于人類藝術(shù)家來說,AI 藝術(shù)可以對幾千年人類藝術(shù)史進(jìn)行學(xué)習(xí)、融合和再塑,且一直處于不斷進(jìn)化的階段,其必有可取之處。不論是對于創(chuàng)作靈感的啟迪,還是對新畫風(fēng)的創(chuàng)造,抑或是對自身創(chuàng)作效率的提升,AI 藝術(shù)都應(yīng)該成為人類藝術(shù)家在數(shù)字時代最有力的工具和伙伴。就像一百多年前的照相機(jī)一樣,更具智慧的藝術(shù)家選擇與其和解,將自身從現(xiàn)實(shí)主義的嚴(yán)格束縛中解放出來,進(jìn)而引發(fā)了印象派、立體主義和抽象藝術(shù)等現(xiàn)代藝術(shù)運(yùn)動,深刻影響了人類現(xiàn)代文明的建立。
再從更細(xì)的角度,誠如前所述,AI 藝術(shù)的進(jìn)化離不開對人類藝術(shù)家作品的獲取和學(xué)習(xí),像波蘭概念藝術(shù)家 Greg Rutkowski 已成為 AI 藝術(shù)全網(wǎng)引用量最高的藝術(shù)家,國內(nèi)也有一大批青年藝術(shù)家被全世界的 AI 創(chuàng)作群體所喜愛和引用。因此,藝術(shù)家們?yōu)楹尾唤柚@種時代的機(jī)遇進(jìn)一步擴(kuò)大自己的市場和粉絲群體呢,也為自己帶來一塊更加龐大的增量市場,去鞏固自己的藝術(shù)地位、去獲得更大的粉絲流量、去捕獲更大的價值變現(xiàn)、去贏得全世界的“高被引”榮譽(yù)。也許在 AI 藝術(shù)流行之前知道 greg 的只有少數(shù),但今天相信至少一千萬人都在自己的作品中寫下“by Greg Rutkowski”!
所以,藝術(shù)家與 AI,需要“柯潔”,但更需要和解。
邊界 3:社區(qū)的力量,共同的想象
這個邊界是給所有人來擊破的。AI 藝術(shù)從來不應(yīng)該是一個人的單打獨(dú)斗,社區(qū)的力量凌駕于 AI 藝術(shù)之上,而所有人的想象力凌駕于社區(qū)之上。每一位進(jìn)入 AI 藝術(shù)領(lǐng)域的新朋友都會在很短的時間內(nèi)上手,輸出高質(zhì)量的作品,正是因?yàn)樗皇且粋€人在埋頭苦干,而是身處于一個巨大的開放社區(qū)之中。
同時在這個社區(qū)之中,所有人的知識經(jīng)驗(yàn)都處于共享的、疊加的、彼此增強(qiáng)的狀態(tài),也就是說你的創(chuàng)作來自別人的經(jīng)驗(yàn),別人也可以基于你的優(yōu)秀探索去演繹更加精彩的想象力空間,而這一切的知識共享都是唾手可得,且無時無刻不在發(fā)生的。
正如 MJ 創(chuàng)始人在 Midjourney 社區(qū)規(guī)模達(dá) 100 萬時所感慨到:當(dāng)一群人在一個社區(qū)共同創(chuàng)作時,一開始有人會說“狗”,隨后會有人提議“太空狗”,緊接著是“阿茲特克太空狗”,在那一瞬間,所有人都明白了那種令人振奮的無限可能性。這些人,包括你自己,在試圖創(chuàng)造一種被增強(qiáng)的想象力。是的,人們真的喜歡社交,更真的喜歡在一種社交的氛圍里一起想象。在這個巨大的 Discord 社區(qū)中,大約有 100 萬人在這個共享空間中共同想象??!
時至今日,這個共同想象力已經(jīng)擴(kuò)充到了近 500 萬人的規(guī)模,這才剛剛過去幾個月而已。這種想象力邊界的擊碎,帶來的是一種全民共同想象力的公共物品,這種公共物品將一種增強(qiáng)的、遠(yuǎn)超單個人類個體的想象力置之于公共領(lǐng)域,被全世界人所汲取,并在汲取的過程中也不斷令自身去進(jìn)化,這是多么可怕的新群體智能!
邊界 4:版權(quán)界定與合法使用
AI 藝術(shù)作品的版權(quán)歸屬問題與 AI 藝術(shù)工具或產(chǎn)品的協(xié)議聲明有關(guān)。一般而言,以 SD 所代表的開源生態(tài)為例,SD 在向社區(qū)開源時,明確在協(xié)議中聲明任何將 SD 部署于自有計算資源的個體或者商業(yè)實(shí)體在對外提供圖片生成服務(wù)時,有權(quán)自主決定生成圖片的版權(quán)歸屬問題。于是可以出現(xiàn)多種選擇:
(1)有的產(chǎn)品會選擇將用戶生成的作品版權(quán)歸屬于公共領(lǐng)域,即 Web3.0 倡導(dǎo)的 CC0(知識共享零許可)運(yùn)動。在 CC0 下,圖片將失去個體所有權(quán)的概念,即任何人都有權(quán)將該圖片用于任何商業(yè)用途,所有人都不能單獨(dú)擁有它,這是絕對的商業(yè)自由,但也存在所有權(quán)缺失帶來的商業(yè)保護(hù)和個體創(chuàng)作積極性問題;
(2)因此更多一部分商業(yè)化產(chǎn)品會選擇將用戶用 SD 生成的圖片所有權(quán)還歸于創(chuàng)作者本身,即誰創(chuàng)作的誰擁有 AI 藝術(shù)作品的所有權(quán),然后自主決定其商業(yè)用途和授權(quán);
(3)除此之外,還有像閉源性質(zhì)的商業(yè)化產(chǎn)品如 MJ 選擇平臺與用戶共同享有所創(chuàng)作圖片的所有權(quán),以及一些傳統(tǒng)科技巨頭如百度選擇平臺擁有所有生成圖片的所有權(quán),而創(chuàng)作用戶并不享有版權(quán)。
SD開源發(fā)布,協(xié)議界定版權(quán)
版權(quán)界定是會隨著時代發(fā)展、法律完善和技術(shù)進(jìn)步而不斷發(fā)生變化的,起碼在 AI 藝術(shù)發(fā)展初期,版權(quán)問題更多會讓步于技術(shù)革新,會首先服務(wù)于讓全民創(chuàng)作實(shí)現(xiàn)摩擦最小化、利益最大化。但不論如何,合法合理使用 AI 作品的版權(quán)始終是最為明確的要求。任何 AI 藝術(shù)商業(yè)平臺和產(chǎn)品都不會漠視侵犯版權(quán)行為的滋生,因?yàn)槟遣攀钦麄€行業(yè)共同的敵人。
邊界 5:元宇宙從數(shù)字孿生到數(shù)字原生再到數(shù)字永生
真假清明上河圖,張擇端你永生了嗎?
AI 藝術(shù)來自現(xiàn)實(shí),更超脫于現(xiàn)實(shí)。在學(xué)習(xí)了大量人類語言和圖像之后,它似乎可以在數(shù)字的疆域上再造一個自己理解的新世界。就像這張“真假清明上河圖”一樣,上為真,下為微軟頂級 AI 藝術(shù)工具 Nuwa 在經(jīng)過大量學(xué)習(xí)后演繹出的新時代清明上河圖,不僅讓人感慨到:張擇端,你永生了嗎?
如果說“真假清明上河圖”還停留在數(shù)字孿生,那么再看下面這張 Miss Journey 的肖像畫,她并不存在于千年人類文明長河中的任何一角,她從來沒有存在過。是 MJ 社區(qū)數(shù)百萬人的共同想象力讓 AI 算法“憑空”產(chǎn)生了這樣一位“新人類”,她會經(jīng)常出現(xiàn)在 MJ 的用戶創(chuàng)作中,令人匪夷所思,但卻沒人知道她從何而來,她是誰,她要到哪里去。這便是數(shù)字原生的經(jīng)典案例。
Miss Journey,來自 MJ 社區(qū)的共同想象力的產(chǎn)物
這不禁讓人聯(lián)想起了元宇宙的一些理念。宇宙的進(jìn)化歷程實(shí)際上以是人類文明數(shù)字化進(jìn)程為標(biāo)志的,人類向數(shù)字文明遷徙過程可以概括為三個階段:數(shù)字孿生、數(shù)字原生和數(shù)字永生。
(1)數(shù)字孿生( Digital Twin)現(xiàn)實(shí)物理世界向數(shù)字世界的映射,以數(shù)字化方式創(chuàng)建物理實(shí)體的虛擬實(shí)體,需要借助歷史數(shù)據(jù)、實(shí)時數(shù)據(jù)以及算法模型等。
(2) 數(shù)字原生(Digital Native)數(shù)字原生是生產(chǎn)人類認(rèn)知之外的新知識。就像“阿爾法狗”從黑白落子的行為數(shù)據(jù)中,面向答案(輸贏)學(xué)習(xí)中間不確定性的過程,生產(chǎn)出新的知識。數(shù)字原生才是元宇宙成功的關(guān)鍵之鑰。元宇宙不是要復(fù)制一個現(xiàn)實(shí)中的宇宙,而是要創(chuàng)造一個目前不存在的宇宙。
(3)數(shù)字永生(Digital immortality)現(xiàn)實(shí)世界與數(shù)字世界共同構(gòu)成人類的生命空間,密不可分。數(shù)字世界的藝術(shù)、資產(chǎn)、文化具有與現(xiàn)實(shí)世界一樣的價值與影響力。更重要的是,人類的生命不再以肉體生命為標(biāo)志,由于科技的發(fā)展,人類的意識與記憶可以上傳到元宇宙當(dāng)中,最終實(shí)現(xiàn)數(shù)字世界與現(xiàn)實(shí)世界的二元融合,人類在元宇宙中數(shù)字化永生。隨著張擇端的作品不斷被全球千萬人復(fù)現(xiàn)在新數(shù)字空間中,他的思想、藝術(shù)修養(yǎng)和精神意志也從另外一個角度獲得了永生。數(shù)字生命將擁有與現(xiàn)實(shí)生命同等的權(quán)利。
AI 藝術(shù)的過程不正像美劇《上載新生》中所講述的那般:未來社會當(dāng)你身體即將死亡,你可以把全部記憶和意識上載到數(shù)字虛擬空間,數(shù)字空間本身就是另一個人類社會,而你還可以隨時與現(xiàn)實(shí)空間的親友可視化的場景互動,從而實(shí)現(xiàn)數(shù)字永生。如果全部記憶和意識可以“上載”,那么同樣也可以“下載”。我們需要的只是克隆、3D 打印或者什么更高技術(shù)創(chuàng)造的碳基軀體,作為靈魂植入、意識下載的載體。
元宇宙三階段,《元宇宙:通往無限游戲之路》
邊界 6:從虛擬到現(xiàn)實(shí)
AI 藝術(shù)并未停留在永恒的數(shù)字空間中,它可以與實(shí)體、與現(xiàn)實(shí)世界產(chǎn)生跨越。從簡單可見的層面講,普通人獲得了藝術(shù)創(chuàng)作的權(quán)力,可以將自己生成的好作品變成現(xiàn)實(shí)世界中的一副掛畫用于家庭裝修、發(fā)展成一種別具一格的 IP 用于制造廣受歡迎的潮玩配飾、更可以讓 AI 藝術(shù)出現(xiàn)在大街小巷的廣告牌中去宣揚(yáng)新時代的力量……從長遠(yuǎn)的商業(yè)本質(zhì)來看,即便是曾經(jīng)更加虛擬的直播間,如今也成為電商最強(qiáng)大的流量平臺和新模式,為更多普通人帶來參與實(shí)體的機(jī)遇。AI 藝術(shù)及平臺在具備同樣等級的流量效應(yīng)時,也會產(chǎn)生服務(wù)實(shí)體、影響實(shí)體的時代使命。
邊界 7:開源與商業(yè)
開源是無私而博大的,它將人類最頂級的技術(shù)還給了人類,就像 StabilityAI 的口號一樣:“AI by the people, for the people(AI,來自人民,為人民服務(wù))”。其實(shí)更應(yīng)該 of the people(屬于人民)。所有的商業(yè)化都應(yīng)該建立在尊重開源的基礎(chǔ)之上。在這個大家彼此心照不宣的規(guī)則空間之下,誕生了很多初級的 AI 藝術(shù)商業(yè)模式。AI 藝術(shù)生態(tài)每日海量的新生成圖片極大沖擊了傳統(tǒng)付費(fèi)圖片版權(quán)庫,在中國如視覺中國,在海外如 Getty Images、Shutterstock。與后者動輒一張圖幾十塊的付費(fèi)體驗(yàn)形成強(qiáng)烈反差,使用頂級 AI 藝術(shù)工具 Dalle-2 生成同樣質(zhì)量的風(fēng)景圖片僅需 0.03 美金甚至更少,而 SD 可以將成本進(jìn)一步降到 1 毛錢以下,且用戶“所需即所得”。
除此之外 AI 藝術(shù)商業(yè)模式的建立更多是圍繞流量效應(yīng)開展而來,AI 藝術(shù)如同當(dāng)年的短視頻創(chuàng)作一樣,具有與生俱來的創(chuàng)作者經(jīng)濟(jì)網(wǎng)絡(luò)效應(yīng),是最符合數(shù)字原住民的網(wǎng)絡(luò)行為體驗(yàn),是未來社交媒體平臺都不可忽視的一環(huán),不論對于內(nèi)容還是用戶,都息息相關(guān)。
邊界 8:AI 技術(shù)的進(jìn)化邊界
AI 藝術(shù)在技術(shù)進(jìn)化上是無邊界的,雖然從 2022 年初發(fā)展至今已近一年之久,但給人的感覺是 AI 技術(shù)尚未發(fā)揮出更具革命性的威力,很多頂級 AI 藝術(shù)平臺,包括 MJ,都似乎存在更大的進(jìn)化空間。我們會在“下篇”中詳細(xì)敘述所追蹤到的一切與 AI 藝術(shù)相關(guān)的前沿技術(shù)動向,以及對未來邊界的預(yù)判。
邊界 9:Web3.0 與加密世界
現(xiàn)階段 AI 藝術(shù)更多發(fā)生在主流世界,或者更多發(fā)生在互聯(lián)網(wǎng)世界中,在國內(nèi)更多的新用戶來自抖音、小紅書、設(shè)計圈、微博等傳統(tǒng)互聯(lián)網(wǎng)世界的原住民。但就像 SD 所展露的像 CC0 等極具去中心化精神的跡象一般,AI 藝術(shù)在下一階段也必然會滲透到整個 Web3.0 大潮中,為 Web3.0 所倡導(dǎo)的下一大互聯(lián)網(wǎng)大框架豐富其骨架、完善其肉身、增強(qiáng)其實(shí)際價值。而今天,加密世界也從 NFT 的角度以更大的姿態(tài)開始擁抱 AI 藝術(shù),通過 AI 藝術(shù)所具備的社群力量和新生產(chǎn)力,完成對 DAO 的實(shí)踐、對公共物品的描繪、對加密創(chuàng)作者經(jīng)濟(jì)網(wǎng)絡(luò)的搭建。
邊界 10:本質(zhì)是文字、圖片還是想象力
有人說 AI 藝術(shù)的本質(zhì)是視覺輸出,但也有人認(rèn)為其本質(zhì)是文字輸入。有人會說即便是文字輸入,但也應(yīng)該先在腦海中形成藝術(shù)畫面,才能有所文字輸出,進(jìn)而轉(zhuǎn)化為 AI 的文字輸入。然而真正的本質(zhì)是文字與藝術(shù)共性——想象力。Midjourney 創(chuàng)始人 David Holz 曾說:AI 藝術(shù)是想象力的發(fā)動機(jī)。
邊界 11:破除邊界的最佳方式——涌現(xiàn)
無論一個中心化的團(tuán)隊、平臺或者生態(tài)如何努力,他們的創(chuàng)造力都無法與一個去中心化生態(tài)相比。今天面對 AI 藝術(shù)我們有太多的未知、太多的難題、太多的迷茫,而這些問題的解決都將由“涌現(xiàn)”實(shí)現(xiàn)——一個所有節(jié)點(diǎn)都能夠去解決問題的超大規(guī)模網(wǎng)絡(luò)的創(chuàng)造力是無限的。今天面對 AI 藝術(shù),我們更多從圖片生成去認(rèn)知,是為創(chuàng)作;然而隨著 AI 藝術(shù)帶動“開放模型”時代的到來,任何類似圖像生成的人類需求都能夠在開放 AI 的時代得到新的解決方案,是為創(chuàng)造!如 StabilityAI 所言:
人工智能的下一個轉(zhuǎn)折點(diǎn):開放基礎(chǔ)模型(foundation models)的時代。
在 Stability,我們認(rèn)為只有當(dāng)人工智能輻射到世界各地的人時,它才會真正實(shí)現(xiàn)變革。當(dāng)一個人或幾個人有智能手機(jī)時,這沒有什么有趣的。只有當(dāng)我們把 10 億臺智能手機(jī)連接在一起時,它才變得有趣。
是時候讓我們往大的方面想了,想象一下我們可以在更大的范圍內(nèi)用這些模型做些什么,想象一下我們?nèi)绾我砸磺ХN方式將基礎(chǔ)模型編織到全世界的各種軟件中去。
當(dāng)基礎(chǔ)模型無處不在時,一切都會改變。
想象一下這樣一個世界:不久之后,基礎(chǔ)模型即服務(wù)(FMaaS)將涌入我們生活的方方面面,并徹底改變工作和娛樂的方方面面。
歡迎來到環(huán)境(ambient)AI時代。
所有這一切都將發(fā)生,因?yàn)榄h(huán)境 AI 模型的巨大全球網(wǎng)絡(luò)。人工智能無處不在,每個設(shè)備都在蘇醒,變得越來越智能。一旦我們將智能工業(yè)化,它將在我們的工作和娛樂方式上引發(fā)一場革命。
但要成為現(xiàn)實(shí),這個行業(yè)現(xiàn)在就必須做出改變。
首先,我們必須更加開放。
最后一道邊界:無限游戲!