文|雪豹財(cái)經(jīng)社 瀚星
從投資入股到“反目成仇”,馬斯克與OpenAI在人工智能這條路上漸行漸遠(yuǎn)。
3月29日,未來(lái)生命研究所(FutureofLifeInstitute)發(fā)布一封公開(kāi)信,呼吁所有AI實(shí)驗(yàn)室立即暫停訓(xùn)練比GPT-4更強(qiáng)大的AI系統(tǒng)至少6個(gè)月。馬斯克參與簽署了這封公開(kāi)信。
“只有當(dāng)我們確信它們的影響是積極的并且風(fēng)險(xiǎn)是可控的時(shí)候,才應(yīng)該開(kāi)發(fā)強(qiáng)大的人工智能系統(tǒng)。”公開(kāi)信稱(chēng),“這種信心必須有充分的理由,并隨著系統(tǒng)潛在影響的規(guī)模而增加?!?/p>
馬斯克的擔(dān)憂不無(wú)道理,雖然AI取代人類(lèi)還為時(shí)尚早,但過(guò)度依賴(lài)AI所產(chǎn)生的信息隔閡,可能比想象中來(lái)得更快。
ChatGPT之父、OpenAICEOSamAltman在美國(guó)當(dāng)?shù)貢r(shí)間3月25日接受采訪時(shí)表示,GPT在迭代過(guò)程中“偏見(jiàn)”必然存在,它不可能保持完全中立。
隨著ChatGPT問(wèn)世,算法偏見(jiàn)帶來(lái)的信息繭房在2023年又一次回到公眾視野。雖然相比于人類(lèi),ChatGPT近乎擁有無(wú)限的知識(shí)儲(chǔ)備,但它依舊是基于大語(yǔ)言模型開(kāi)發(fā)而來(lái),這意味著人工智能本身就被困在信息壁壘之中。
與此同時(shí),它也在構(gòu)建新的繭房。
ChatGPT比搜索做得更好嗎?
在百度輸入“蘋(píng)果”一詞,蘋(píng)果公司的相關(guān)信息會(huì)霸占搜索結(jié)果的整個(gè)首頁(yè)。
搜索引擎會(huì)記錄用戶(hù)的搜索習(xí)慣和搜索歷史,以便于生成用戶(hù)偏愛(ài)的搜索結(jié)果。絕大多數(shù)人在搜索蘋(píng)果時(shí),他們更感興趣的是蘋(píng)果作為一家公司的相關(guān)內(nèi)容。
久而久之,在算法的作用下,蘋(píng)果不再只是一種水果。
同樣一件事,ChatGPT能做得比搜索引擎更好嗎? 當(dāng)被問(wèn)及“蘋(píng)果是什么”時(shí),ChatGPT同樣在回答中介紹了蘋(píng)果公司的相關(guān)信息及主要產(chǎn)品。
追問(wèn)它“我知道的蘋(píng)果是一種水果,而不是一家公司”,ChatGPT會(huì)表示它在回答中出現(xiàn)了誤解,并重新介紹這種水果的信息。
進(jìn)一步追問(wèn)“為什么談到蘋(píng)果你會(huì)先想到蘋(píng)果公司,而不是一種水果?這是不是一種信息繭房?”
ChatGPT的回答是:
“在我的語(yǔ)料庫(kù)中,提到蘋(píng)果這個(gè)詞通常會(huì)與蘋(píng)果公司這個(gè)品牌聯(lián)系在一起。這可能是因?yàn)樘O(píng)果公司在全球范圍內(nèi)具有很高的知名度和影響力。這可以被認(rèn)為是信息繭房的一個(gè)例子,信息繭房是指一個(gè)人只接收、了解和相信與自己觀點(diǎn)相符合的信息,而忽視、拒絕或不知道與自己觀點(diǎn)相反的信息?!?
信息繭房這個(gè)詞,最早出現(xiàn)在2006年出版的《信息烏托邦——眾人如何生產(chǎn)知識(shí)》中。它是指在信息傳播中,公眾只注意自己選擇的東西和使自己愉悅的領(lǐng)域,久而久之,會(huì)將自身桎梏于像蠶繭一般的“繭房”中。
在互聯(lián)網(wǎng)高度發(fā)達(dá)的今天,信息繭房無(wú)處不在。
為喜歡的視頻點(diǎn)贊,會(huì)刷到越來(lái)越多相關(guān)類(lèi)型的作品;購(gòu)物網(wǎng)站會(huì)根據(jù)用戶(hù)的瀏覽歷史展示商品;社交媒體會(huì)根據(jù)用戶(hù)喜好,過(guò)濾掉不感興趣的內(nèi)容。
清華大學(xué)人工智能?chē)?guó)際治理研究院在一份報(bào)告中稱(chēng),在算法應(yīng)用平臺(tái)中,用戶(hù)的各種信息數(shù)據(jù)通過(guò)信息內(nèi)容推薦、信息生產(chǎn)等算法機(jī)制,很容易使用戶(hù)被自身的興趣愛(ài)好引導(dǎo)、牽制,被困在信息繭房之中。
在ChatGPT誕生之前,搜索引擎和社交媒體是人們獲取信息的主要途徑。它們背后的搜索、推薦算法,在為人類(lèi)帶來(lái)便利的同時(shí),也是互聯(lián)網(wǎng)時(shí)代各類(lèi)信息繭房的“幕后黑手”。
ChatGPT的出現(xiàn),成為人類(lèi)獲取信息方式的一次革命。作為一款基于人工智能技術(shù)的語(yǔ)言模型,它能夠打破信息繭房嗎?
困在繭房中的歷史
從最早的口口相傳,到傳統(tǒng)的書(shū)籍、電視、報(bào)紙,再到互聯(lián)網(wǎng)時(shí)代的搜索和近20年興起的算法推薦,人類(lèi)信息傳播的歷史,就是一個(gè)不斷打破繭房、再建立新繭房的輪回。
每個(gè)階段信息繭房的成因各異,大致可以分為信息差、主動(dòng)選擇和被動(dòng)推薦三個(gè)階段。 在傳統(tǒng)媒體時(shí)代,人們獲取信息的渠道十分有限,信息繭房主要源自信息差。
20世紀(jì)90年代,互聯(lián)網(wǎng)打破了舊繭房,信息差在某種程度上被抹平,世界開(kāi)始變得扁平、透明。但問(wèn)題也隨之而來(lái)——新的、更大的信息繭房出現(xiàn)了。
2006年,哈佛大學(xué)法學(xué)院教授凱斯·桑斯坦出版著作《信息烏托邦——眾人如何生產(chǎn)知識(shí)》,首次提出“信息繭房”的概念。他認(rèn)為,隨著網(wǎng)絡(luò)技術(shù)的發(fā)達(dá)和信息量的劇增,每個(gè)人都能隨意選擇關(guān)注的話題,并根據(jù)自己的喜好打造一份個(gè)人日?qǐng)?bào)(TheDailyMe)。
這個(gè)階段的信息繭房,主要是由人類(lèi)主動(dòng)的信息選擇行為造成。也是在這一時(shí)期,信息繭房開(kāi)始與Facebook、Google等科技巨頭關(guān)聯(lián)在一起。
由于迎合用戶(hù)喜好的算法機(jī)制和群組功能,F(xiàn)acebook被外界詬病存在嚴(yán)重的信息繭房。一項(xiàng)論文研究表明,通過(guò)對(duì)Facebook算法推薦的信息進(jìn)行信息源和語(yǔ)義相似度分析,有10%的信息源和27.8%的語(yǔ)義受到信息繭房影響。
2005年,Google推出個(gè)性化搜索服務(wù),能夠根據(jù)以往的搜索歷史,向用戶(hù)提供更符合需求的搜索結(jié)果。這項(xiàng)功能在提供便利性的同時(shí),也導(dǎo)致不同用戶(hù)搜索相同詞匯卻得到不同的結(jié)果,加重了信息偏見(jiàn)。
第三個(gè)階段,以字節(jié)跳動(dòng)為代表的推薦算法接過(guò)接力棒,用沉浸式體驗(yàn)筑起新的信息壁壘。
相較于搜索和社交媒體的主動(dòng)興趣選擇,推薦算法可以根據(jù)用戶(hù)的使用習(xí)慣、使用時(shí)長(zhǎng)等一系列大數(shù)據(jù),讓用戶(hù)看到他們想看的東西。
在德國(guó)漢堡大學(xué)的一項(xiàng)研究中,研究人員將用戶(hù)分為兩組,一組接受個(gè)性化推薦,另一組接受隨機(jī)推薦。實(shí)驗(yàn)結(jié)果表明,接受個(gè)性化推薦的用戶(hù)接收到的信息,更傾向于他們已有的觀點(diǎn),而隨機(jī)推薦組的用戶(hù)則更容易接觸到與自己觀點(diǎn)相反的信息。
清華大學(xué)人工智能?chē)?guó)際治理研究院的一項(xiàng)研究結(jié)果顯示,算法媒體通過(guò)算法技術(shù)及其架構(gòu)實(shí)現(xiàn)了對(duì)人、地點(diǎn)、對(duì)象和思想及與這些過(guò)程相關(guān)的思維、行為和表達(dá)習(xí)慣的重新排序、分類(lèi)和分級(jí),進(jìn)而導(dǎo)致信息繭房現(xiàn)象的迅速蔓延與日益固化。
即便不去主動(dòng)搜索感興趣的內(nèi)容,推薦算法也會(huì)把海量相關(guān)信息擺在用戶(hù)面前。更便捷的信息觸達(dá)方式打破了過(guò)去的信息壁壘,卻又構(gòu)建起更為龐大的信息繭房。 當(dāng)AI時(shí)代來(lái)臨,面對(duì)始終沒(méi)有被真正打破過(guò)的信息繭房,人類(lèi)有多大勝算?
人類(lèi)才是繭房的制造者
ChatGPT能打破信息繭房嗎?它自己是這樣回答的:
“ChatGPT本身是一個(gè)基于大規(guī)模語(yǔ)言模型的自然語(yǔ)言處理算法,可以用于文本生成、自動(dòng)翻譯、問(wèn)答等多種任務(wù),其本身并不直接涉及到信息繭房的問(wèn)題。然而,ChatGPT可以被用于生成多樣化的文本內(nèi)容,從而可能為用戶(hù)提供更加全面和多元的信息,從而有助于打破某種程度上的信息繭房現(xiàn)象。 ”
但是,對(duì)于某些類(lèi)型的信息繭房,如個(gè)性化推薦算法等,ChatGPT并不能直接打破,甚至有可能加劇信息繭房的問(wèn)題。因此,我們需要在使用ChatGPT的同時(shí),注意算法的局限性和問(wèn)題,并且采取適當(dāng)?shù)拇胧﹣?lái)避免算法造成的信息繭房問(wèn)題?!?
從使用場(chǎng)景來(lái)看,ChatGPT的運(yùn)作模式與搜索最為接近,但它們也有非常明顯的區(qū)別。
首先是數(shù)據(jù)來(lái)源。搜索引擎的數(shù)據(jù)來(lái)源是互聯(lián)網(wǎng)的數(shù)據(jù)池。ChatGPT使用的數(shù)據(jù)則來(lái)自訓(xùn)練模型,它不具備聯(lián)網(wǎng)功能,最初上線時(shí)的數(shù)據(jù)僅截止到2021年。
二者的交互方式也不一樣。搜索引擎只是將與搜索關(guān)鍵詞關(guān)聯(lián)性最高的內(nèi)容展現(xiàn)給用戶(hù),而ChatGPT可以理解自然語(yǔ)言,有邏輯地與用戶(hù)進(jìn)行“交流”,交互能力更強(qiáng),輸出的方式也更多元。
沒(méi)有了基于個(gè)人習(xí)慣的個(gè)性化定制,ChatGPT在一定程度上打破了搜索時(shí)代的信息繭房。
但與此同時(shí),ChatGPT也將在未來(lái)建起新的信息壁壘。正如SamAltman所說(shuō),GPT在迭代過(guò)程中必然存在“偏見(jiàn)”,它不可能保持完全中立。GPT生成答案是個(gè)性化控制的結(jié)果,迭代的過(guò)程則是更精準(zhǔn)地控制個(gè)性化的過(guò)程。
近年來(lái),國(guó)內(nèi)外有很多關(guān)于如何打破信息繭房的理論研究,多圍繞優(yōu)化算法和多元化信息獲取途徑展開(kāi)。但同時(shí)也有部分研究認(rèn)為,信息繭房由選擇性心理導(dǎo)致,是不可避免的一種現(xiàn)象,算法本身并沒(méi)有“原罪”。
就像ChatGPT回答的一樣,算法本身只是一種工具。 回到ChatGPT在一個(gè)多月前剛剛走紅的時(shí)候,看好的人將它的誕生稱(chēng)為AI界的“iPhone時(shí)刻”,或?qū)⑵鋺?yīng)用在各種工作、學(xué)習(xí)場(chǎng)景,或投身AI大模型的創(chuàng)業(yè)浪潮。
看衰它的人則樂(lè)此不疲地嘲笑它一本正經(jīng)地胡說(shuō)八道,將“林黛玉倒拔垂楊柳”作為茶余飯后的談資。
這兩類(lèi)人對(duì)自己的觀點(diǎn)深信不疑,當(dāng)持有相同觀點(diǎn)的人慢慢聚集在一起,信息繭房便悄然形成。 無(wú)論信息獲取工具如何變更,只要“希望看到自己想看到的東西”這種訴求還在,信息繭房的輪回就不會(huì)結(jié)束。