正在閱讀:

別只關心315,來看看全年無休的AI打假

掃一掃下載界面新聞APP

別只關心315,來看看全年無休的AI打假

315之外的364天,你需要一本AI防騙指南。

文|腦極體

一年一度的“3·15”消費者權(quán)益日如期而至,這一天,全民最期待、各家公關最緊張的環(huán)節(jié),應該是“打老虎”的高光時刻。

但在3月15日這一天之外,人們?nèi)粘_€會面臨各式各樣、層出不窮的造假售假,不能都指望一天時間、一臺晚會來解決。

能夠全年無休的AI打假師,也就被科技企業(yè)推進了大眾的視野。不過,想要真的用好AI打假,還要對它的邏輯、能力和有限性,有一定的了解。

本文希望通過科普AI打假的段位,幫大家在日常維權(quán)時用好科技的武器。

初級段位:機器視覺PK假貨

提到打假,很多人日常接觸到的假東西,應該是各類假冒偽劣、以假亂真的消費品。以消費者服務平臺——黑貓投訴為例,對假貨、售假、貨不對板的投訴量非常之大。

先說AI應用在貨品打假上的基本邏輯。

邏輯:人工打假難、打假貴、周期長、套路多——通過機器視覺提升“眼力”。

人工打假難:隨著現(xiàn)代制作工藝技術越發(fā)精湛,越來越多的“大牌”包包、高仿潮鞋、收藏品偽作,不再是粗制濫造的“一眼假”,可以做到以假亂真的地步,看走眼的專家數(shù)不勝數(shù)。有些造假技藝出神入化的“古玩”,甚至連專業(yè)儀器都不能準確鑒定。

人工打假貴:人工甄別需要多名鑒定師“背靠背”鑒定,因此收費也往往是在線鑒定的數(shù)倍。國內(nèi)某奢侈品鑒定平臺,在線鑒定49元,實物鑒定收費則達到199元。

周期長:制假售假販假大多是流水線式團隊作戰(zhàn),批量生產(chǎn),加上越來越多生活富裕的人加入消費/收藏的隊伍,交易數(shù)量多,相應的投訴量也增多,維權(quán)周期也很長,很多消費者只能選擇自認倒霉。

套路多:很多人覺得,專家的意見很可靠,專業(yè)機構(gòu)出具的證書有背書作用,但架不住造假套路太多,市場上充斥著僅在鑒定培訓班學習過幾天而取得“結(jié)業(yè)證書”的廉價大師,還有不具備相應條件又未經(jīng)過合法審批的鑒定中介機構(gòu)渾水摸魚,證書只要給錢就能出,所以即使人工鑒定也可能陷入套路。

所以,近年來通過在線平臺,用戶拍攝照片上傳,AI系統(tǒng)比對鑒定,變得流行起來。有企業(yè)推出的“AI鑒定師”,一秒鐘能識別20個假冒商標,有的藝術品鑒定,可以對文物進行“一物一圖”的識別鑒定,規(guī)避仿造的問題。這些都是靠什么能力實現(xiàn)的呢?

能力:機器視覺的快、準、惠。

面對假貨,沒有“眼力”就會處于弱勢。機器視覺是AI的一個分支,讓機器能夠“看”和“理解”視覺信息,類似于人類的“眼力”。

首先,機器視覺系統(tǒng)會對物品的高精度圖像進行識別和分析,提取出物品的形狀、顏色、紋理等相關特征。

然后,系統(tǒng)結(jié)合已知真假貨的數(shù)據(jù)集,根據(jù)真假貨的規(guī)律和特征,比如正品大牌包包的五金件顏色,logo字母的形狀等,進行比照。

當然,隨著造假技術的提高,很多直觀的細節(jié)不再是造假的難點,僅僅單一特征的圖像比對是不夠的。比如有的古籍造假,會使用年代久遠的紙張,文字或圖案通過軟件調(diào)色貼近真跡,真中有假,假中藏真,讓很多專家也只能憑感覺“覺得哪里不對”,而AI算法可以快速找到多種特征的彼此矛盾之處,找到真假“雜拼”的違和感,再由人工鑒定師進行判斷。

通過機器視覺,可以快速、準確地識別出假貨特征,與人工鑒定相結(jié)合,降低鑒定的整體成本。

有限性:造假升級,數(shù)據(jù)瓶頸

當然,基于機器視覺的在線鑒定,還不能百分百取代人工鑒定,技術的有限性主要來自于:

一是造假手段的科技化。造假不可怕,就怕造假的人有文化,現(xiàn)在很多產(chǎn)品的造假技術也上了一個新的臺階,比如購入正品后,拆解成幾個部分,再拼湊在一起高價賣出;有的大牌包包在各種細節(jié)上都與正品一致,不同的可能是五金件的銅含量不一樣,這就需要借助專業(yè)的金屬檢測設備,僅靠機器視覺識別是不夠的。

二是真假數(shù)據(jù)的限制。機器視覺算法的準確率,需要龐大的真假貨特征數(shù)據(jù)集來支持,而大牌產(chǎn)品更新?lián)Q代很快,數(shù)據(jù)集的速迭代速度如果跟不上,就會讓新款假貨成為漏網(wǎng)之魚。此外,很多藝術品/收藏品都是孤件,收藏家沒有動力將其數(shù)字化后共享數(shù)據(jù),這也會影響算法結(jié)果的準確度。同時,很多鑒定標準都是行業(yè)專家口口相傳的口訣,沒有形成一定的算法規(guī)則,垂直品類如紫砂壺、明青花等,行業(yè)知識匱乏、數(shù)據(jù)稀疏,也會影響算法的有效性。

這里要說的是,以假亂真的造假,更多用于藝術品、奢侈品等價值昂貴的產(chǎn)品上,吸引的群體比較有限。正是市面上大量流通的大眾消費品,才導致了規(guī)模龐大的受害者,而這些產(chǎn)品的造假一般不會費心地精益求精,AI的到來,無疑提供了一把價廉物美的打假武器。

中級段位:Anti-Deepfake PK Deepfake

造謠一張嘴,辟謠跑斷腿。當深度偽造技術Deepfakes換臉輕而易舉,圖像、音頻以假亂真,很多人的臉被拿來做成虛假視頻,在網(wǎng)絡上瘋狂傳播,近年來越來越地引發(fā)維權(quán)。

邏輯:Deepfake帶來的偽造危機——更強大的Anti-Deepfake自動甄別技術 “攻子之盾”。

你也許會說,被改頭換面是公眾人物、明星的煩惱,自己只是個普通人,干嘛要擔心AI換臉。試想一下,這樣的形象造假越來越多,讓網(wǎng)絡上的信息真?zhèn)坞y辨,權(quán)威專家的嘴型可以p,領導人的臉可以換,那會讓沒有專業(yè)辨識能力的普羅大眾,陷入謠言和欺騙的信息海洋,在無形中損傷了整個社會的互信,引發(fā)集體信任危機。

此外,如果Deepfakes被用于非法用途,如詐騙、敲詐勒索等,很難保證黑客不會將其產(chǎn)業(yè)化、普及化,這樣就會對更廣大的群體帶來形象和經(jīng)濟上的損害。我

我曾采訪過一家智能金融機構(gòu),對方提到,通過在線視頻確認借款人身份時,就可能會遇到深度偽造視頻的攻擊,提高了風控的難度。

所以,檢測和消除深度偽造圖像和視頻,避免技術被惡意利用,也成為許多科技公司打造負責任的技術的一種選擇。

能力:基于GAN(生成式對抗網(wǎng)絡)的Anti-Deepfake算法,使用多個深度學習模型對輸入數(shù)據(jù)進行分析,提取出視覺、語音和動態(tài)特征,并將它們結(jié)合為一個特征向量,與已知的生物特征進行比較。

Deepfakes算法不是完美的,缺少常識,所以偽造的臉存在很多不對勁的特征,但這些面孔本身看起來很逼真,靠人的肉眼“找茬”有點費勁,但AI可以快速找到這些線索。

比如一只耳朵上沒有戴耳環(huán)(除非她是一個叛逆朋克少女),牙齒數(shù)量以及方向不對,衣服或背景的形態(tài)很不合常理。

有科學家找到了一種檢測偽造的方法,研究團隊發(fā)現(xiàn)Deepfakes難以準確再現(xiàn)常規(guī)的瞳孔。真正的人類瞳孔是一個規(guī)則的橢圓形,而Deepfakes生成的瞳孔明顯不規(guī)則,因為它對人臉結(jié)構(gòu)沒有生理常識。

此外,有的偽造線索是動態(tài)的,比如聲音和口型對不上,需要檢測算法提取視頻的音、畫特征進行分析匹配。

有限性:真?zhèn)斡螒颍罒o止境

通過AI自動檢測來識別深度偽造的音視頻,根本挑戰(zhàn)在于偽造技術進化得非常快。

2018年紐約州立大學開發(fā)出一款“反換臉”AI刑偵工具,通過預測眼睛是否眨動的狀態(tài)來識別偽造人臉,準確率達到 99%,但這款工具還沒推廣就失效了,因為Deepfakes技術進化了。

自動檢測算法需要在高質(zhì)量的數(shù)據(jù)集上進行訓練,這些數(shù)據(jù)集要包括真實數(shù)據(jù)和合成數(shù)據(jù),如果數(shù)據(jù)的多樣性不足,訓練視頻和測試視頻的相似性很高,那么實際檢測的效果也會不理想。

此外,用戶發(fā)現(xiàn)被深度偽造內(nèi)容侵權(quán)后,問責和維權(quán)是非常難的,一般首先問責的是平臺,對侵權(quán)視頻/賬號做出下架、刪除、處罰等處理,但整個過程不確定性很大,還要和平臺企業(yè)的客服、運營、公關、法務等多部門交鋒,非常繁瑣,很多用戶只能選擇不了了之。用戶監(jiān)督對檢測技術的升級,影響有限。

只能希望數(shù)據(jù)隱私保護的相關法律持續(xù)完善和落地,科技企業(yè)加強技術倫理和研發(fā),在這場真?zhèn)味贩ㄖ胁粩啾U嫌脩舻臋?quán)益。

高級段位:AI內(nèi)容識別器PK AI作弊

ChatGPT的出現(xiàn),將AIGC帶入了新的巔峰。據(jù)《紐約時報》報道,大型語言模型(LLM)生成的文本,與人類編寫的文本難以區(qū)分,資深大學教授也無法準確區(qū)分學生是否用ChatGPT寫了論文作業(yè)。

所以,為了防止學生用AI作弊,紐約公立學校已全面禁止使用ChatGPT,美國一些學區(qū)也開始采取這一措施。

還有科學家讓AI來檢測ChatGPT撰寫的醫(yī)學研究摘要,不僅比論文剽竊檢測器的效果好得多,而且比人類審稿人的成績還高。也就是說,ChatGPT撰寫的論文摘要,已經(jīng)可以讓人類專家都難辨真假了。

而就在今天,GPT-4問世,支持多模態(tài)的生成任務,對代碼有超強的理解能力,這也使得AI內(nèi)容識別器成為了一項必需品,來避免AIGC快速發(fā)展拉大“假內(nèi)容”的識別難度。

邏輯:大型語言模型強大的生成能力導致AI淪為作弊工具——AI內(nèi)容識別器,檢測內(nèi)容是人類寫的還是AI寫的。

能力:不詳。

是的,作為一種最新最前沿的造假手段,目前還沒有一種技術或軟件,能夠有效且準確地識別出用ChatGPT作弊內(nèi)容。

AI內(nèi)容識別的方法,目前有兩種:

一種是黑盒檢測,即通過統(tǒng)計特征的分析,找到AI文本和人類文本的區(qū)別,已經(jīng)有多個團隊或開發(fā)者,推出了相應的解決方案。

比如普林斯頓大學計算機科學專業(yè)的華裔學生Edward Tian開發(fā)的GPTZero,號稱可以通過分析語言模型對文本的“喜愛”程度,以及AI寫作一段文本時的“困惑”程度,通過“親AI”分數(shù)來判斷文章是否出自AI之手。

斯坦福大學提出的DetectGPT,認為人寫文章和模型樣本的攝動差異分布有顯著差異,通過這個差異來檢測一段文本是否由模型生成。

OpenAI也在前不久推出了AI生成內(nèi)容識別器,但博客數(shù)據(jù)顯示,檢出成功率只有26%,對英文以外的語言,檢測效果要差很多,并且不支持1000字符以內(nèi)的短文本(因為人類寫的和AI寫的答案可能是一樣的)。而且,一些AI生成的文本經(jīng)過編輯之后,也可能規(guī)避掉檢測。

大模型能力的提升,使得AIGC和人類的差距越來越小,導致AI內(nèi)容識別器的檢測準確性也難以保障。比如最新的GPT-4,表現(xiàn)相比GPT-3.5有了大幅提升,之前針對GPT-3等大型語言模型的檢測工具,都面臨失效的風險。

另一種是白盒檢測,即模型的開發(fā)人員對AI內(nèi)容進行一定的處理,從而滿足檢測目的。

此前OpenAI就聲稱,考慮給AI內(nèi)容加上水印,在詞匯選擇上加入“不引人注意的秘密信號”,這樣就能證明這段文字是 GPT 模型生成的。

這一方法的問題是,只能由模型開發(fā)者植入水印,模型開源之后可以通過微調(diào)來移除水印,也會失效。

有限性:AI檢測技術的進步,慢于AI生成技術的進步。

說了這么多,當然不是為了把AI等新技術生成的東西都“一棒子打死”。

今天,我們能在博物館里看到臨摹仿制的復制品,這種“假”與欺騙無關;能靠Deepfakes將失德藝人的臉換掉,讓作品繼續(xù)上映,保住整個制作團隊的心血;能用AI畫出自己想象中的場景,當然也不能算是造假……

物品沒有對錯,技術沒有好壞,錯的只是人心,只是握刀的那只手。

作為普通人,我們能做的就是“知己知彼”,了解造假技術的邏輯、能力和局限,將捍衛(wèi)自身權(quán)益的武器,掌握在自己手里。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

別只關心315,來看看全年無休的AI打假

315之外的364天,你需要一本AI防騙指南。

文|腦極體

一年一度的“3·15”消費者權(quán)益日如期而至,這一天,全民最期待、各家公關最緊張的環(huán)節(jié),應該是“打老虎”的高光時刻。

但在3月15日這一天之外,人們?nèi)粘_€會面臨各式各樣、層出不窮的造假售假,不能都指望一天時間、一臺晚會來解決。

能夠全年無休的AI打假師,也就被科技企業(yè)推進了大眾的視野。不過,想要真的用好AI打假,還要對它的邏輯、能力和有限性,有一定的了解。

本文希望通過科普AI打假的段位,幫大家在日常維權(quán)時用好科技的武器。

初級段位:機器視覺PK假貨

提到打假,很多人日常接觸到的假東西,應該是各類假冒偽劣、以假亂真的消費品。以消費者服務平臺——黑貓投訴為例,對假貨、售假、貨不對板的投訴量非常之大。

先說AI應用在貨品打假上的基本邏輯。

邏輯:人工打假難、打假貴、周期長、套路多——通過機器視覺提升“眼力”。

人工打假難:隨著現(xiàn)代制作工藝技術越發(fā)精湛,越來越多的“大牌”包包、高仿潮鞋、收藏品偽作,不再是粗制濫造的“一眼假”,可以做到以假亂真的地步,看走眼的專家數(shù)不勝數(shù)。有些造假技藝出神入化的“古玩”,甚至連專業(yè)儀器都不能準確鑒定。

人工打假貴:人工甄別需要多名鑒定師“背靠背”鑒定,因此收費也往往是在線鑒定的數(shù)倍。國內(nèi)某奢侈品鑒定平臺,在線鑒定49元,實物鑒定收費則達到199元。

周期長:制假售假販假大多是流水線式團隊作戰(zhàn),批量生產(chǎn),加上越來越多生活富裕的人加入消費/收藏的隊伍,交易數(shù)量多,相應的投訴量也增多,維權(quán)周期也很長,很多消費者只能選擇自認倒霉。

套路多:很多人覺得,專家的意見很可靠,專業(yè)機構(gòu)出具的證書有背書作用,但架不住造假套路太多,市場上充斥著僅在鑒定培訓班學習過幾天而取得“結(jié)業(yè)證書”的廉價大師,還有不具備相應條件又未經(jīng)過合法審批的鑒定中介機構(gòu)渾水摸魚,證書只要給錢就能出,所以即使人工鑒定也可能陷入套路。

所以,近年來通過在線平臺,用戶拍攝照片上傳,AI系統(tǒng)比對鑒定,變得流行起來。有企業(yè)推出的“AI鑒定師”,一秒鐘能識別20個假冒商標,有的藝術品鑒定,可以對文物進行“一物一圖”的識別鑒定,規(guī)避仿造的問題。這些都是靠什么能力實現(xiàn)的呢?

能力:機器視覺的快、準、惠。

面對假貨,沒有“眼力”就會處于弱勢。機器視覺是AI的一個分支,讓機器能夠“看”和“理解”視覺信息,類似于人類的“眼力”。

首先,機器視覺系統(tǒng)會對物品的高精度圖像進行識別和分析,提取出物品的形狀、顏色、紋理等相關特征。

然后,系統(tǒng)結(jié)合已知真假貨的數(shù)據(jù)集,根據(jù)真假貨的規(guī)律和特征,比如正品大牌包包的五金件顏色,logo字母的形狀等,進行比照。

當然,隨著造假技術的提高,很多直觀的細節(jié)不再是造假的難點,僅僅單一特征的圖像比對是不夠的。比如有的古籍造假,會使用年代久遠的紙張,文字或圖案通過軟件調(diào)色貼近真跡,真中有假,假中藏真,讓很多專家也只能憑感覺“覺得哪里不對”,而AI算法可以快速找到多種特征的彼此矛盾之處,找到真假“雜拼”的違和感,再由人工鑒定師進行判斷。

通過機器視覺,可以快速、準確地識別出假貨特征,與人工鑒定相結(jié)合,降低鑒定的整體成本。

有限性:造假升級,數(shù)據(jù)瓶頸

當然,基于機器視覺的在線鑒定,還不能百分百取代人工鑒定,技術的有限性主要來自于:

一是造假手段的科技化。造假不可怕,就怕造假的人有文化,現(xiàn)在很多產(chǎn)品的造假技術也上了一個新的臺階,比如購入正品后,拆解成幾個部分,再拼湊在一起高價賣出;有的大牌包包在各種細節(jié)上都與正品一致,不同的可能是五金件的銅含量不一樣,這就需要借助專業(yè)的金屬檢測設備,僅靠機器視覺識別是不夠的。

二是真假數(shù)據(jù)的限制。機器視覺算法的準確率,需要龐大的真假貨特征數(shù)據(jù)集來支持,而大牌產(chǎn)品更新?lián)Q代很快,數(shù)據(jù)集的速迭代速度如果跟不上,就會讓新款假貨成為漏網(wǎng)之魚。此外,很多藝術品/收藏品都是孤件,收藏家沒有動力將其數(shù)字化后共享數(shù)據(jù),這也會影響算法結(jié)果的準確度。同時,很多鑒定標準都是行業(yè)專家口口相傳的口訣,沒有形成一定的算法規(guī)則,垂直品類如紫砂壺、明青花等,行業(yè)知識匱乏、數(shù)據(jù)稀疏,也會影響算法的有效性。

這里要說的是,以假亂真的造假,更多用于藝術品、奢侈品等價值昂貴的產(chǎn)品上,吸引的群體比較有限。正是市面上大量流通的大眾消費品,才導致了規(guī)模龐大的受害者,而這些產(chǎn)品的造假一般不會費心地精益求精,AI的到來,無疑提供了一把價廉物美的打假武器。

中級段位:Anti-Deepfake PK Deepfake

造謠一張嘴,辟謠跑斷腿。當深度偽造技術Deepfakes換臉輕而易舉,圖像、音頻以假亂真,很多人的臉被拿來做成虛假視頻,在網(wǎng)絡上瘋狂傳播,近年來越來越地引發(fā)維權(quán)。

邏輯:Deepfake帶來的偽造危機——更強大的Anti-Deepfake自動甄別技術 “攻子之盾”。

你也許會說,被改頭換面是公眾人物、明星的煩惱,自己只是個普通人,干嘛要擔心AI換臉。試想一下,這樣的形象造假越來越多,讓網(wǎng)絡上的信息真?zhèn)坞y辨,權(quán)威專家的嘴型可以p,領導人的臉可以換,那會讓沒有專業(yè)辨識能力的普羅大眾,陷入謠言和欺騙的信息海洋,在無形中損傷了整個社會的互信,引發(fā)集體信任危機。

此外,如果Deepfakes被用于非法用途,如詐騙、敲詐勒索等,很難保證黑客不會將其產(chǎn)業(yè)化、普及化,這樣就會對更廣大的群體帶來形象和經(jīng)濟上的損害。我

我曾采訪過一家智能金融機構(gòu),對方提到,通過在線視頻確認借款人身份時,就可能會遇到深度偽造視頻的攻擊,提高了風控的難度。

所以,檢測和消除深度偽造圖像和視頻,避免技術被惡意利用,也成為許多科技公司打造負責任的技術的一種選擇。

能力:基于GAN(生成式對抗網(wǎng)絡)的Anti-Deepfake算法,使用多個深度學習模型對輸入數(shù)據(jù)進行分析,提取出視覺、語音和動態(tài)特征,并將它們結(jié)合為一個特征向量,與已知的生物特征進行比較。

Deepfakes算法不是完美的,缺少常識,所以偽造的臉存在很多不對勁的特征,但這些面孔本身看起來很逼真,靠人的肉眼“找茬”有點費勁,但AI可以快速找到這些線索。

比如一只耳朵上沒有戴耳環(huán)(除非她是一個叛逆朋克少女),牙齒數(shù)量以及方向不對,衣服或背景的形態(tài)很不合常理。

有科學家找到了一種檢測偽造的方法,研究團隊發(fā)現(xiàn)Deepfakes難以準確再現(xiàn)常規(guī)的瞳孔。真正的人類瞳孔是一個規(guī)則的橢圓形,而Deepfakes生成的瞳孔明顯不規(guī)則,因為它對人臉結(jié)構(gòu)沒有生理常識。

此外,有的偽造線索是動態(tài)的,比如聲音和口型對不上,需要檢測算法提取視頻的音、畫特征進行分析匹配。

有限性:真?zhèn)斡螒?,永無止境

通過AI自動檢測來識別深度偽造的音視頻,根本挑戰(zhàn)在于偽造技術進化得非??臁?/p>

2018年紐約州立大學開發(fā)出一款“反換臉”AI刑偵工具,通過預測眼睛是否眨動的狀態(tài)來識別偽造人臉,準確率達到 99%,但這款工具還沒推廣就失效了,因為Deepfakes技術進化了。

自動檢測算法需要在高質(zhì)量的數(shù)據(jù)集上進行訓練,這些數(shù)據(jù)集要包括真實數(shù)據(jù)和合成數(shù)據(jù),如果數(shù)據(jù)的多樣性不足,訓練視頻和測試視頻的相似性很高,那么實際檢測的效果也會不理想。

此外,用戶發(fā)現(xiàn)被深度偽造內(nèi)容侵權(quán)后,問責和維權(quán)是非常難的,一般首先問責的是平臺,對侵權(quán)視頻/賬號做出下架、刪除、處罰等處理,但整個過程不確定性很大,還要和平臺企業(yè)的客服、運營、公關、法務等多部門交鋒,非常繁瑣,很多用戶只能選擇不了了之。用戶監(jiān)督對檢測技術的升級,影響有限。

只能希望數(shù)據(jù)隱私保護的相關法律持續(xù)完善和落地,科技企業(yè)加強技術倫理和研發(fā),在這場真?zhèn)味贩ㄖ胁粩啾U嫌脩舻臋?quán)益。

高級段位:AI內(nèi)容識別器PK AI作弊

ChatGPT的出現(xiàn),將AIGC帶入了新的巔峰。據(jù)《紐約時報》報道,大型語言模型(LLM)生成的文本,與人類編寫的文本難以區(qū)分,資深大學教授也無法準確區(qū)分學生是否用ChatGPT寫了論文作業(yè)。

所以,為了防止學生用AI作弊,紐約公立學校已全面禁止使用ChatGPT,美國一些學區(qū)也開始采取這一措施。

還有科學家讓AI來檢測ChatGPT撰寫的醫(yī)學研究摘要,不僅比論文剽竊檢測器的效果好得多,而且比人類審稿人的成績還高。也就是說,ChatGPT撰寫的論文摘要,已經(jīng)可以讓人類專家都難辨真假了。

而就在今天,GPT-4問世,支持多模態(tài)的生成任務,對代碼有超強的理解能力,這也使得AI內(nèi)容識別器成為了一項必需品,來避免AIGC快速發(fā)展拉大“假內(nèi)容”的識別難度。

邏輯:大型語言模型強大的生成能力導致AI淪為作弊工具——AI內(nèi)容識別器,檢測內(nèi)容是人類寫的還是AI寫的。

能力:不詳。

是的,作為一種最新最前沿的造假手段,目前還沒有一種技術或軟件,能夠有效且準確地識別出用ChatGPT作弊內(nèi)容。

AI內(nèi)容識別的方法,目前有兩種:

一種是黑盒檢測,即通過統(tǒng)計特征的分析,找到AI文本和人類文本的區(qū)別,已經(jīng)有多個團隊或開發(fā)者,推出了相應的解決方案。

比如普林斯頓大學計算機科學專業(yè)的華裔學生Edward Tian開發(fā)的GPTZero,號稱可以通過分析語言模型對文本的“喜愛”程度,以及AI寫作一段文本時的“困惑”程度,通過“親AI”分數(shù)來判斷文章是否出自AI之手。

斯坦福大學提出的DetectGPT,認為人寫文章和模型樣本的攝動差異分布有顯著差異,通過這個差異來檢測一段文本是否由模型生成。

OpenAI也在前不久推出了AI生成內(nèi)容識別器,但博客數(shù)據(jù)顯示,檢出成功率只有26%,對英文以外的語言,檢測效果要差很多,并且不支持1000字符以內(nèi)的短文本(因為人類寫的和AI寫的答案可能是一樣的)。而且,一些AI生成的文本經(jīng)過編輯之后,也可能規(guī)避掉檢測。

大模型能力的提升,使得AIGC和人類的差距越來越小,導致AI內(nèi)容識別器的檢測準確性也難以保障。比如最新的GPT-4,表現(xiàn)相比GPT-3.5有了大幅提升,之前針對GPT-3等大型語言模型的檢測工具,都面臨失效的風險。

另一種是白盒檢測,即模型的開發(fā)人員對AI內(nèi)容進行一定的處理,從而滿足檢測目的。

此前OpenAI就聲稱,考慮給AI內(nèi)容加上水印,在詞匯選擇上加入“不引人注意的秘密信號”,這樣就能證明這段文字是 GPT 模型生成的。

這一方法的問題是,只能由模型開發(fā)者植入水印,模型開源之后可以通過微調(diào)來移除水印,也會失效。

有限性:AI檢測技術的進步,慢于AI生成技術的進步。

說了這么多,當然不是為了把AI等新技術生成的東西都“一棒子打死”。

今天,我們能在博物館里看到臨摹仿制的復制品,這種“假”與欺騙無關;能靠Deepfakes將失德藝人的臉換掉,讓作品繼續(xù)上映,保住整個制作團隊的心血;能用AI畫出自己想象中的場景,當然也不能算是造假……

物品沒有對錯,技術沒有好壞,錯的只是人心,只是握刀的那只手。

作為普通人,我們能做的就是“知己知彼”,了解造假技術的邏輯、能力和局限,將捍衛(wèi)自身權(quán)益的武器,掌握在自己手里。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。