文|腦極體
“無窮”和“無窮+1”,哪個(gè)更大?
已經(jīng)吸收了不知道多少數(shù)據(jù)的AI模型,和比他多學(xué)習(xí)一條數(shù)據(jù)的模型,哪個(gè)更智能?
想聊聊這個(gè)問題,出于一個(gè)偶然的機(jī)會(huì)。很早之前我在測試ChatGPT的時(shí)候,突然想問他個(gè)刁鉆問題,于是就問它:“希爾伯特旅館悖論,對(duì)現(xiàn)實(shí)世界有什么影響?”
說實(shí)話,ChatGPT答的驢唇不對(duì)馬嘴,還硬拗出幾點(diǎn),有他一貫的特色。但其中一段回答值得琢磨。他答:“希爾伯特旅館對(duì)于計(jì)算機(jī)科學(xué)是有幫助的,因?yàn)楫?dāng)我們處理無限大的數(shù)據(jù)集時(shí),希爾伯特旅館可以作為我們思考方式?!?/p>
無限大的數(shù)據(jù)集,這東西顯然不存在。但當(dāng)大模型訓(xùn)練用的數(shù)據(jù)參數(shù)達(dá)到某種天文數(shù)字,當(dāng)真人反饋機(jī)制成為常態(tài),模型在使用過程中會(huì)接觸難以估量的數(shù)據(jù)。這難道不是某種無限嗎?
但人類能控制無限嗎?
今天這個(gè)話題,其實(shí)更接近某種科幻討論,或者一些關(guān)于AI未來的腦洞。可能大家讀完之后也不清楚在說什么。但也無妨,我們就當(dāng)一起舒展一下大腦,放松一下最近被ChatGPT弄得挺焦躁的心情。
一起去希爾伯特旅館,度個(gè)假吧。
歡迎來到,悖論旅館
這家旅館坐落在名叫“數(shù)學(xué)”的熱帶風(fēng)情度假勝地,有的人來了不想走,有的人一想到它就口干舌燥。
希爾伯特旅館,其實(shí)是德國數(shù)學(xué)家大衛(wèi)·希爾伯特在討論無窮這個(gè)概念時(shí),舉的一個(gè)生動(dòng)例子。它既是一個(gè)數(shù)學(xué)游戲,也經(jīng)常躋身知名的若干悖論之一。
它的具體意思是說,假設(shè)一家旅館有無窮個(gè)房間,但是都住滿了。這時(shí)候又來了一位旅客要訂房間,酒店主人就可以不慌不忙,讓1號(hào)房間客人移到2號(hào),2好移3號(hào)……以此類推,反正房間數(shù)量是無窮的,這樣新的旅客就可以住1號(hào)房間。
而這時(shí),又來了一車旅客。酒店主人依舊如法炮制,讓每個(gè)房間的客人都向后移動(dòng)N個(gè)房間,最終把新來的客人安置進(jìn)去。
以此類推,接下來會(huì)發(fā)生什么呢?假如新來了無窮個(gè)客人。那么酒店老板只需要讓每位客人都移到單號(hào)房間。比如2號(hào)房間移到3號(hào)房間,3號(hào)房間移到5號(hào)房間,把偶數(shù)房間都空出來,那么無窮個(gè)客人依舊可以住進(jìn)去。
即使來了無窮多個(gè)旅行團(tuán),每個(gè)旅行團(tuán)有無窮多位旅客,希爾伯特酒店依舊有辦法,只需要把非2n(n∈N+)號(hào)房間就都空出來就行了。
希爾伯特旅館之所以是個(gè)悖論,因?yàn)樗鼧?biāo)明了這樣一件事:無窮是無法比較的。
無窮+1等于無窮;無窮+N等于無窮,無窮加無窮,無窮乘無窮,那還是無窮,無窮是紋絲不動(dòng)的,又是隨時(shí)變化的,無窮是可以包含若干個(gè)無窮的。
總之,無窮是難以名狀的。
無窮這玩意,會(huì)有點(diǎn)怪
聽上去,希爾伯特旅館悖論好像沒啥用。其實(shí)不然,人類在很多領(lǐng)域幾乎都必然面對(duì)“無窮”這個(gè)問題,至少在理論推導(dǎo)和概念驗(yàn)證環(huán)節(jié),面對(duì)無窮幾乎是必然的。一個(gè)事物可以比另一個(gè)更無窮,但它們倆都還是無窮。這樣的思路可以進(jìn)行很多假設(shè),也可以解釋很多問題。
比如說,在物理學(xué)當(dāng)中,希爾伯特旅館悖論可以來解釋量子物理學(xué)中的很多現(xiàn)象,其中最典型的就是量子場論中關(guān)于虛粒子的假設(shè)。關(guān)于虛粒子是否真實(shí)存在,抑或是一種純粹的假設(shè)工具,這個(gè)問題有著非常多的爭論,但它確實(shí)可以用來解釋引力、光子、膠子等物理定義,進(jìn)而為解釋真空中的能量情況,分析宇宙輻射做出幫助。前提在于,我們需要用希爾伯特旅館的思維,來理解存在于無窮中的虛粒子。
在計(jì)算機(jī)科學(xué)中,數(shù)據(jù)存儲(chǔ)是個(gè)基本問題,而在設(shè)計(jì)數(shù)據(jù)結(jié)構(gòu)的時(shí)候,就需要考慮如果有海量數(shù)據(jù)需要存儲(chǔ),結(jié)構(gòu)上究竟如何調(diào)動(dòng)能夠保證效率最優(yōu),故障率最低。這時(shí)就需要假定數(shù)據(jù)集是無窮的,希爾伯特旅館也就用上了。
無窮很怪,這個(gè)概念還經(jīng)常被用在文學(xué)創(chuàng)作,尤其是科幻小說當(dāng)中。科幻是對(duì)未來的推演,但如果某件事可以增長到無窮,它往往會(huì)出現(xiàn)反常識(shí)的狀態(tài)。比如說永生不死的人,它可能首先就會(huì)失去對(duì)時(shí)間的概念,因?yàn)闊o窮的時(shí)間已經(jīng)沒有意義了,進(jìn)而表現(xiàn)出完全失去人類的一切特征,畢竟人類的所思所為,都是在時(shí)間有限這個(gè)前提下驅(qū)動(dòng)的。又比如瞬間移動(dòng),它會(huì)不會(huì)讓空間失去意義,進(jìn)而讓人失去辨別空間的需求和能力,進(jìn)而出現(xiàn)從來不想停留下來的人,而始終都在超高速移動(dòng)的人,究竟還是人嗎?
一件事如果逼近甚至抵達(dá)無窮,它就會(huì)超出控制,出現(xiàn)反常識(shí),反邏輯的一面。這個(gè)邏輯,對(duì)于AI似乎也適用。
用這個(gè)邏輯,解釋智能涌現(xiàn)
這幾年伴隨著預(yù)訓(xùn)練大模型的興起,越來越多的人開始談“智能涌現(xiàn)”。一般來說,所謂“智能涌現(xiàn)”現(xiàn)象,是指當(dāng)模型規(guī)模突破某個(gè)未知的界限后,就會(huì)突然涌現(xiàn)出驚人的智能。比如模型會(huì)表達(dá)出訓(xùn)練者預(yù)想不到的邏輯感、流暢性,甚至是人類稱之為情商的東西。
事實(shí)上,智能涌現(xiàn)作為一個(gè)目標(biāo),并不是今天才有。早在上世紀(jì)70年代,專家機(jī)器人的理論構(gòu)想就是在輸入足夠多的知識(shí)后,讓計(jì)算機(jī)展現(xiàn)出一種無所不知,無所不曉的效果,從而幫助人類解決各種問題。只是礙于當(dāng)時(shí)的算力與數(shù)據(jù)承載能力,最終這個(gè)設(shè)想無法落地。
而在今天云計(jì)算+大數(shù)據(jù)的組合下,更大規(guī)模的數(shù)據(jù)集可以應(yīng)用到AI訓(xùn)練中,加上深度學(xué)習(xí)在算法上實(shí)現(xiàn)了更好的數(shù)據(jù)吸納能力,才最終產(chǎn)出了ChatGPT為代表的智能涌現(xiàn)現(xiàn)象。
智能涌現(xiàn)到底是怎么實(shí)現(xiàn)的,這一點(diǎn)就像深度學(xué)習(xí)的黑箱性一樣,始終沒有特別合理的解釋。但“智能涌現(xiàn)”這個(gè)詞卻不是AI專有的,這個(gè)詞更早是一個(gè)生物學(xué)詞匯,是用來描述螞蟻、魚群表現(xiàn)出的集體智能行為。一只螞蟻挺傻的,一條魚也不聰明,但當(dāng)大量螞蟻聚集到一起,所表現(xiàn)出的那種分工明確、體系森嚴(yán)、結(jié)構(gòu)精巧的組織行動(dòng)方式,簡直讓人嘆為觀止。是螞蟻的大腦進(jìn)化了嗎?恐怕并不是,而是在螞蟻聚集到一定規(guī)模后,突破了某種希爾伯特旅館式的智能邊界。
從這個(gè)角度看,大模型這條AI之路,或許終極目標(biāo)并不是模仿人類。它不需要進(jìn)化出直覺、情感、自由意識(shí)這些人類獨(dú)有的東西。但它會(huì)積累無窮多的數(shù)據(jù)和知識(shí),當(dāng)我們無法觀測和預(yù)估大模型里擁有多少知識(shí),那么它就有無窮的知識(shí)。AI模型就變成了一座類希爾伯特旅館,它可以吞噬更多知識(shí),吞噬更多無窮,最終可以表現(xiàn)出人類想要的智能,也可能表現(xiàn)出更多人類不想要,或者沒準(zhǔn)備好想要的東西。
或許我們改換個(gè)思路,最終的通用人工智能AGI、強(qiáng)人工智能Strong AI,可能內(nèi)在機(jī)制并不類似于人類,而是更近乎螞蟻,近乎魚群,近乎希爾伯特旅館。
我們總是討論AI像不像人,能不能做人類所做的,人類有哪些獨(dú)有能力,巴拉巴拉巴拉。這是因?yàn)槲覀儾蛔≡谙柌芈灭^里,我們住在一個(gè)有限的世界,住在短暫的生命和易朽的軀殼里,住在一個(gè)絕大部分構(gòu)成物是水的大腦里。但AI不是,它相比人類更加貼近無窮。他能通過圖靈測試,他最終能做到一切。但我們并不知道為什么,因?yàn)锳I并不想成為人,他只是剛好住在希爾伯特旅館里。
“智能涌現(xiàn)”或許是個(gè)征兆,它告訴我們,AI的進(jìn)化目標(biāo)不是人類,而是《星際爭霸》里的蟲族。