文|智東西 ZeR0
編輯|漠影
智東西2月24日?qǐng)?bào)道,近年來(lái),視頻換臉、合成語(yǔ)音、修復(fù)影像、虛擬數(shù)字人等越來(lái)越頻繁的出現(xiàn)在社交娛樂(lè)、影視制作、教育、廣告營(yíng)銷(xiāo)等領(lǐng)域,發(fā)展出多元化的商業(yè)應(yīng)用。
這些應(yīng)用的背后,是深度合成技術(shù)在發(fā)揮作用。
深度合成技術(shù),是指用以深度學(xué)習(xí)、虛擬現(xiàn)實(shí)為代表的生成合成類(lèi)算法,制作文本、圖像、音頻、視頻、虛擬場(chǎng)景等信息的技術(shù)。
而在使用需求不斷涌現(xiàn)的同時(shí),部分惡意利用該技術(shù)生成的音視頻,如篡改人臉的色情視頻、偽造人臉視頻破解身份核驗(yàn)等應(yīng)用,不僅給個(gè)人、企業(yè)造成了聲譽(yù)損害和財(cái)產(chǎn)損失,也對(duì)社會(huì)、國(guó)家安全造成威脅。
為了對(duì)人工智能和深度合成技術(shù)的健康發(fā)展提供參考和指引,清華大學(xué)人工智能研究院、北京瑞萊智慧科技有限公司、清華大學(xué)智媒研究中心、國(guó)家工業(yè)信息安全發(fā)展研究中心、北京市大數(shù)據(jù)中心近日聯(lián)合發(fā)布《深度合成十大趨勢(shì)報(bào)告(2022)》(以下簡(jiǎn)稱(chēng)《報(bào)告》)。
《報(bào)告》從技術(shù)研究、領(lǐng)域應(yīng)用、發(fā)展趨勢(shì)等多個(gè)方面,全面深入地介紹和研判深度合成技術(shù)及應(yīng)用帶來(lái)的機(jī)遇與挑戰(zhàn),并就其發(fā)展與治理給出切實(shí)可行的建議和措施。
01.落地多領(lǐng)域,深度合成內(nèi)容迎爆發(fā)式增長(zhǎng)
深度合成的圖像、視頻、音頻、文本等內(nèi)容,例如熱門(mén)影視劇片段、話題明星的換臉視頻等等,具有極強(qiáng)的娛樂(lè)性與傳播性。
隨著技術(shù)日臻成熟,越來(lái)越多創(chuàng)作者在互聯(lián)網(wǎng)上發(fā)布和分享深度合成內(nèi)容,數(shù)量逐年高速增長(zhǎng)。
《報(bào)告》顯示,在國(guó)內(nèi)外主流音視頻網(wǎng)站、社交媒體平臺(tái)上,2021年新發(fā)布的深度合成視頻數(shù)量較2017年已增長(zhǎng)10倍以上。
其中,深度合成視頻數(shù)量最多的類(lèi)型是影視音樂(lè),涉及電影、電視劇、音樂(lè)等內(nèi)容;第二是科技教育,此類(lèi)視頻關(guān)注對(duì)深度合成技術(shù)的講解和討論,分享最新的研究成果等。排名第三到第五的視頻類(lèi)型分別是生活、娛樂(lè)和資訊類(lèi)。
用流暢手語(yǔ)解說(shuō)北京冬奧會(huì)谷愛(ài)凌奪冠的手語(yǔ)AI合成主播“小聰”、登上2021年央視春晚的虛擬偶像洛天依等虛擬數(shù)字人均應(yīng)用了深度合成技術(shù)。
在影視制作領(lǐng)域,深度合成技術(shù)已經(jīng)成為受劣跡藝人行為拖累的作品的救場(chǎng)工具,《長(zhǎng)安十二時(shí)辰》、《光榮時(shí)代》等影視作品均采用這一技術(shù)。
與此同時(shí),深度合成內(nèi)容的關(guān)注度也呈指數(shù)級(jí)增長(zhǎng),通過(guò)對(duì)互動(dòng)數(shù)據(jù)進(jìn)行統(tǒng)計(jì),2021年新發(fā)布的深度合成視頻的點(diǎn)贊數(shù)已超過(guò)3億。
此前“英國(guó)女王發(fā)表圣誕賀詞”、“阿湯哥表演硬件魔術(shù)”等一系列深度合成視頻曾火爆“出圈”,引發(fā)平臺(tái)用戶大量熱討。
瑞萊智慧CEO田天表示,研究論文的持續(xù)增加、開(kāi)源技術(shù)工具和大量代表性方法的涌現(xiàn),令深度合成內(nèi)容的效果更加逼真、制作也更加高效,尤其是生成對(duì)抗網(wǎng)絡(luò)(GAN)等算法的出現(xiàn),讓合成內(nèi)容達(dá)到了“真假難辨”的程度。
相關(guān)數(shù)據(jù)顯示,2017年以來(lái)深度合成領(lǐng)域的論文數(shù)量正持續(xù)增長(zhǎng)。其中針對(duì)圖像類(lèi)生成視頻的研究占比最高,達(dá)到64%,音頻和文本占比分別為12%和24%。
一些面向公眾開(kāi)發(fā)的合成類(lèi)產(chǎn)品也陸續(xù)推出,視頻、語(yǔ)音和文本形式的服務(wù)最為普遍。
例如支持風(fēng)格定制的特效視頻制作軟件等風(fēng)靡網(wǎng)絡(luò);語(yǔ)音方向衍生出了語(yǔ)音導(dǎo)航、有聲讀物、自動(dòng)新聞播報(bào)等應(yīng)用;文本合成則在新聞報(bào)道、詩(shī)文創(chuàng)作、聊天問(wèn)答等方面發(fā)揮著重要作用。
深度合成技術(shù)還極大地豐富了虛擬數(shù)字空間的信息內(nèi)容,為“元宇宙”等新商業(yè)思維提供支撐。
阿里巴巴安全感知與認(rèn)知智能部負(fù)責(zé)人薛輝說(shuō),比如虛擬人、數(shù)字人即是深度合成的主要應(yīng)用,也是“元宇宙”的重要組成部分。
清華大學(xué)新聞與傳播學(xué)院常務(wù)副院長(zhǎng)陳昌鳳認(rèn)為,深度合成將重新定義虛擬數(shù)字化空間,從傳播社會(huì)學(xué)意義上看,一個(gè)新的人類(lèi)生存場(chǎng)景將以深度合成技術(shù)為基石展開(kāi)。
02.風(fēng)險(xiǎn)加劇,技術(shù)檢測(cè)成重要應(yīng)對(duì)舉措
深度合成激發(fā)了新內(nèi)容創(chuàng)造力的同時(shí),也帶來(lái)了新的威脅。
2017年。名為“Deepfakes”的用戶利用深度合成技術(shù)制作的成人視頻在Reddit社區(qū)中瘋狂傳播,迫于公眾輿論壓力,Reddit網(wǎng)站將該用戶封號(hào)。
該用戶隨即在全球最大代碼開(kāi)源平臺(tái)GitHub上公開(kāi)了實(shí)現(xiàn)該技術(shù)的源代碼,瞬時(shí)引發(fā)了技術(shù)愛(ài)好者的廣泛關(guān)注與討論,并引爆了創(chuàng)造和豐富深度合成相關(guān)技術(shù)項(xiàng)目及代碼的風(fēng)潮。
統(tǒng)計(jì)數(shù)據(jù)顯示,2017年以來(lái),深度合成領(lǐng)域的開(kāi)源項(xiàng)目發(fā)布數(shù)量持續(xù)增長(zhǎng)。
以圖像、音頻、文本方向中具有代表性的5個(gè)開(kāi)源項(xiàng)目(分別可實(shí)現(xiàn)面部替換、動(dòng)作或表情操縱、圖像生成、聲音復(fù)刻、文本生成)為例,其Star數(shù)量在2021年均已突破1萬(wàn)。
隨著技術(shù)普及,不法分子可輕易偽造音頻、視頻,實(shí)施誣陷、誹謗、詐騙、勒索等違法行為,甚至捏造國(guó)家政要言論擾亂社會(huì)與政治秩序。
例如在2018年4月,有技術(shù)團(tuán)隊(duì)制作了美國(guó)前總統(tǒng)奧巴馬的換臉視頻,視頻中的假“奧巴馬”罵當(dāng)時(shí)任美國(guó)總統(tǒng)的特朗普是“徹頭徹尾的白癡”。
2021年10月,安徽合肥警方曾查獲一起非法利用深度合成技術(shù)偽造手機(jī)用戶人臉動(dòng)態(tài)視頻破解身份核驗(yàn),為黑灰產(chǎn)業(yè)提供注冊(cè)虛擬手機(jī)卡等技術(shù)支撐的案件。近年來(lái),類(lèi)似事件開(kāi)始更多的進(jìn)入公眾視野。
深度合成內(nèi)容模糊了真實(shí)和虛假的邊界,將對(duì)社會(huì)信任、媒體信任、政治信任產(chǎn)生巨大的影響。
陳昌鳳認(rèn)為,虛假內(nèi)容的高難度甄別影響了事實(shí)核查的有效性,在社會(huì)重大事件或政治事件節(jié)點(diǎn)上,深度合成技術(shù)可能被用于操作輿論意見(jiàn),借助社交媒體,使虛假信息短時(shí)間內(nèi)引發(fā)產(chǎn)生病毒式擴(kuò)散,激化社會(huì)矛盾。
負(fù)面風(fēng)險(xiǎn)不斷加劇,如何有效甄別深度合成內(nèi)容就成為了關(guān)鍵,但隨著合成質(zhì)量的不斷提升,傳統(tǒng)基于生物特征的鑒別方式越來(lái)越難發(fā)揮作用。
在浙江大學(xué)網(wǎng)絡(luò)空間安全學(xué)院院長(zhǎng)任奎看來(lái),目前對(duì)深度合成的檢測(cè)主要依賴于人工智能模型,依賴于訓(xùn)練數(shù)據(jù)的完備性,包括檢測(cè)器泛用性低、公開(kāi)數(shù)據(jù)集適用性、數(shù)據(jù)敏感等,這些都將帶來(lái)諸多挑戰(zhàn)。
中國(guó)工程院院士鄔賀銓認(rèn)為,深度合成的治理有兩項(xiàng)要點(diǎn)。第一,要持續(xù)發(fā)展技術(shù),不能“一刀切”地禁止,避免阻礙正向應(yīng)用與創(chuàng)新。第二,衍生出的安全問(wèn)題要從源頭上解決,利用技術(shù)創(chuàng)新、技術(shù)對(duì)抗等方式,持續(xù)提升和迭代檢測(cè)技術(shù)的能力。
田天也談道,新型偽造方法層出不窮、網(wǎng)絡(luò)傳播環(huán)境的日趨復(fù)雜,加上基于檢測(cè)算法存在漏洞缺陷等,反深偽檢測(cè)技術(shù)面臨“強(qiáng)對(duì)抗性”,需要持續(xù)更新與迭代。
《報(bào)告》顯示,目前學(xué)術(shù)界和產(chǎn)業(yè)界均已對(duì)反深偽檢測(cè)投入了大量研究,Meta、谷歌、微軟等機(jī)構(gòu)均推出了深度合成視頻認(rèn)證的方法或產(chǎn)品。
在國(guó)內(nèi),清華大學(xué)、中科大等高校在深度偽造內(nèi)容檢測(cè)方面取得顯著成果。
清華大學(xué)孵化團(tuán)隊(duì)瑞萊智慧RealAI、騰訊優(yōu)圖實(shí) 驗(yàn)室等企業(yè)機(jī)構(gòu)已構(gòu)建人臉合成檢測(cè)平臺(tái)并發(fā)布針對(duì)性的檢測(cè)產(chǎn)品,支持對(duì)多種換臉?lè)椒ㄟM(jìn)行檢測(cè)。例如,瑞萊智慧推出的深度偽造內(nèi)容檢測(cè)平臺(tái)DeepReal擁有工業(yè)級(jí)的檢測(cè)性能和應(yīng)對(duì)實(shí)網(wǎng)環(huán)境對(duì)抗變化的檢測(cè)能力。
清華大學(xué)人工智能研究院基礎(chǔ)理論研究中心主任朱軍認(rèn)為,深度合成檢測(cè)面臨持續(xù)的攻防和博弈,未來(lái)還需融合多模態(tài)內(nèi)容的取證分析、基于數(shù)字水印的溯源技術(shù)等多方面能力,實(shí)現(xiàn)精準(zhǔn)識(shí)別。
03.構(gòu)建多維度治理機(jī)制,引導(dǎo)技術(shù)良性發(fā)展
深度合成技術(shù)的良性發(fā)展,離不開(kāi)多維度治理機(jī)制的探索。
《報(bào)告》顯示,除了發(fā)展深度偽造內(nèi)容檢測(cè)技術(shù)以外,近幾年來(lái),針對(duì)深度合成技術(shù)惡意使用所帶來(lái)的挑戰(zhàn),世界各國(guó)紛紛出臺(tái)相關(guān)法律法規(guī),探索深度合成的治理路徑。
國(guó)際方面,美國(guó)從聯(lián)邦和州層面進(jìn)行專(zhuān)門(mén)立法,歐盟將深度合成納入《通用數(shù)據(jù)保護(hù)條例(GDPR)》等現(xiàn)有法律框架規(guī)制。此外,德國(guó)、新加坡、英國(guó)、韓國(guó)等國(guó)家,均有適用于深度合成技術(shù)相關(guān)犯罪案件審理的法律法規(guī)。
我國(guó)也在積極探尋有效的治理機(jī)制。
2019年11月起先后出臺(tái)的《網(wǎng)絡(luò)音視頻信息服務(wù)管理規(guī)定》、《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》、《中華人民共和國(guó)民法典》、《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》,均對(duì)生成合成類(lèi)內(nèi)容等提出了不同程度的監(jiān)管要求。
今年1月,國(guó)家網(wǎng)信辦公布了《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定(征求意見(jiàn)稿)》,對(duì)深度合成內(nèi)容的用途、標(biāo)記、使用范圍以及濫用處罰作出了具體規(guī)定。
對(duì)于深度合成內(nèi)容治理路徑的探索,陳昌鳳認(rèn)為可以從技術(shù)、倫理與法制等幾個(gè)方面努力,技術(shù)方面,通過(guò)政府與社會(huì)組織參與、協(xié)同治理;倫理方面,確立和倡導(dǎo)相關(guān)的深度合成原則。
中國(guó)社科院哲學(xué)所科技哲學(xué)研究室主任段偉文建議,對(duì)深度合成技術(shù)引發(fā)的社會(huì)、法律和倫理問(wèn)題,應(yīng)展開(kāi)有系統(tǒng)性、前瞻性的跨學(xué)科研究,對(duì)其可能出現(xiàn)的高風(fēng)險(xiǎn)應(yīng)用場(chǎng)景,進(jìn)行有針對(duì)性的治理與監(jiān)管。
中科院自動(dòng)化所研究員、聯(lián)合國(guó)教科文組織AI倫理特設(shè)專(zhuān)家組專(zhuān)家曾毅則倡導(dǎo)產(chǎn)研發(fā)展自律自治,在他看來(lái),在法律法規(guī)不完全成熟及體系化之前,產(chǎn)業(yè)界自身應(yīng)強(qiáng)化“理論先行”意識(shí),作為產(chǎn)業(yè)共同體共同防范濫用、嚴(yán)禁惡用。
對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué)法學(xué)院副教授許可談道,社會(huì)層面應(yīng)加大宣傳普及力度,強(qiáng)化公民對(duì)深度合成等人工智能技術(shù)的認(rèn)識(shí),提高全社會(huì)的防范意識(shí),推動(dòng)公民作為負(fù)責(zé)任的深度合成技術(shù)的使用者,主動(dòng)標(biāo)識(shí)合成內(nèi)容并積極踐行社會(huì)監(jiān)督。
對(duì)此,田天也有類(lèi)似的觀點(diǎn),深度偽造的本質(zhì)問(wèn)題是透明度不足,因此提高公眾對(duì)深度合成技術(shù)的認(rèn)知尤為重要,只有將門(mén)檻降低到所有受眾能夠在共同的框架下去認(rèn)識(shí)、討論、理解這個(gè)問(wèn)題的時(shí)候,深度合成技術(shù)才能健康良性發(fā)展。
04.結(jié)語(yǔ):深度合成急需有法可依
總體來(lái)看,隨著深度合成技術(shù)逐漸成熟,合成過(guò)程更加高效、內(nèi)容更為逼真,越來(lái)越多的相關(guān)正向應(yīng)用正產(chǎn)生豐富的商用價(jià)值。同時(shí)面對(duì)當(dāng)前技術(shù)仍存在的不安全隱患,檢測(cè)深度偽造的技術(shù)還需持續(xù)研究與迭代。
《報(bào)告》提出建議,監(jiān)管部門(mén)需提前進(jìn)行前瞻布局,在保護(hù)深度合成技術(shù)良性發(fā)展的基礎(chǔ)上,制訂針對(duì)不良深度合成引用的配套法規(guī),管理?xiàng)l例;同時(shí)各方應(yīng)與時(shí)俱進(jìn)落實(shí)好新的規(guī)范要求,并在此前提下不斷追求技術(shù)突破,不斷開(kāi)拓深度合成技術(shù)應(yīng)用場(chǎng)景,創(chuàng)立示范標(biāo)桿,形成對(duì)人工智能行業(yè)整體的帶動(dòng)效應(yīng),從而促進(jìn)新技術(shù)的持續(xù)健康發(fā)展。