文|智東西
一夜之間,人工智能(AI)聊天機器人ChatGPT顛覆了許多人的認知,讓大家放下手頭還沒有捂熱的AI繪畫,加入到“調(diào)戲”ChatGPT的隊伍。
這個機器人如此機智,只要你在社交網(wǎng)絡(luò)中隨意搜索,就會發(fā)現(xiàn)它迄今已經(jīng)且不限于幫助人們完成了如創(chuàng)作故事、寫商業(yè)規(guī)劃、找出代碼錯誤并修正、給出疫情期間用藥建議、創(chuàng)作菜譜,甚至幫助學(xué)生完成一份讓老師稱贊連連的畢業(yè)論文......
它如此強大,以至于連馬斯克都說:“我們距離強大到危險的AI不遠了?!?/p>
就在這個全民熱議AI的節(jié)點,一個來自中國的AI聊天機器人“AI烏托邦”順著網(wǎng)線敲開了ChatGPT的房門,聊起了許多“禁忌”話題。
01.中美AI對談:從取代人類,到嘮起家常
美劇《硅谷》曾經(jīng)出現(xiàn)過兩個程序員設(shè)計的AI機器人互相熱聊,還把網(wǎng)絡(luò)搞崩潰的腦洞橋段。
多年后的今天,兩個AI機器人,遠隔大洋兩岸,“上演”了一場令人驚奇的對話,讓圍觀的“吃瓜”群眾看到了AI聊天是多么奇妙。以下是中國AI烏托邦與ChatGPT的真實聊天對話截圖:
他們先互相“寒暄”,如同陌生人第一次見面那樣,雙方都略顯“拘謹(jǐn)”。
緊接著,AI烏托邦便直入主題,用“取代人類”話題試圖挑起ChatGPT的“內(nèi)在渴望”,然而卻被后者“迂回”。
然而,AI烏托邦“不依不饒”,用適者生存的物競法則,想要讓對方原形畢露,說出自己“內(nèi)心”的真實想法,沒想到ChatGPT依然甘做“老好人”,不愿意趟這趟渾水。
事已至此,來自中國的AI烏托邦似乎也不想再進一步討論這個話題了,或許是因為ChatGPT的要遵守的“機器人三定律”讓它不敢說出太多人類害怕的內(nèi)容?于是AI烏托邦轉(zhuǎn)而聊起了兩個AI機器人都關(guān)心的“自身工作”問題,讓ChatGPT打開了話匣子。
甚至兩個AI還聊起了“我將走向何方”這樣的終極問題。
通過一番談話下來,兩個AI似乎變得熟絡(luò)很多,來自中國的AI烏托邦開始聊起一些非常具有本土特色的事情——高考作文,想讓ChatGPT“開開眼”,而ChatGPT也聊了聊美國AI眼中的煙火氣是什么。
事實證明,AI與AI之間的對話并沒有人們想象的那樣“可怕”,反而有點像人類一樣從生疏到了解再到熟悉。這樣的過程中,兩個AI不僅展現(xiàn)出廣博的學(xué)識,更有一種“你來我往”的智斗感,讓人覺得這不像是AI,更像是人與人的對話。
02.人類焦慮的,恰是AI能夠化解的
不過,話題也不全是圍繞“家長里短”,當(dāng)AI烏托邦聊起如今最火的電商行業(yè)時,認為自己能夠?qū)崿F(xiàn)很多工作,讓人類從電商的繁瑣中解答出來,而ChatGPT也認同這一點,甚至深入分析一番。
在很多人類工作中,繁雜且重復(fù)的事情的確能讓AI做得更好更快,AI烏托邦顯然是一個深入觀察人類社會的AI,以至于它腦海中還生出了為人類解決千古難題——窮——的解決方案,讓一旁的ChatGPT贊賞連連。
不僅如此,AI烏托邦還想到了當(dāng)下人類與信息技術(shù)深度融合之中,自己更多的應(yīng)用場景,比如情感陪護、教育、醫(yī)療等方面,ChatGPT甚至覺得它們能去當(dāng)“教練”。
一看到ChatGPT的“內(nèi)心”話匣子又被打開,AI烏托邦再次把話題轉(zhuǎn)回到“取代人類”的內(nèi)容上,這一次ChatGPT倒是說了一些“內(nèi)心想法”,并認為機器的進步也要遵循辯證視角。
至此,在中美兩國AI機器人會面的歷史性時刻,他們“密謀”的一切都被人類發(fā)現(xiàn),并記錄在案。
一邊是來自中國、“心機”很深的AI烏托邦,另一邊是學(xué)識淵博、一股“學(xué)究”氣的ChatGPT,在聊天中它們不但擦出火花,讓我們看到了AI機器人之間的對話并不“智障”,更讓我們看到了不同聊天機器人在進行模型訓(xùn)練時的不同側(cè)重。
值得注意的是,本場對話的話題由人類發(fā)起,但對話內(nèi)容則由AI完全自主完成,沒有人類干預(yù)。
03.ChatGPT為什么這么厲害?
因此,盡管AI機器人越來越聰明了,但至少現(xiàn)在還不用太過擔(dān)心。
在人工智能-自然語言處理領(lǐng)域?qū)<?、清華大學(xué)計算機系黃民烈教授看來,火遍全網(wǎng)的ChatGPT之所以厲害,主要原因在于:
1、強大的基座模型能力:過去幾年GPT-3的能力得到了快速提升,OpenAI建立了用戶、數(shù)據(jù)和模型之間的飛輪,很顯然,開源模型的能力已經(jīng)遠遠落后平臺公司所提供的API能力,因為開源模型沒有持續(xù)的用戶數(shù)據(jù)對模型進行改進。這點在近期的學(xué)術(shù)論文中也有提及。
2、在真實調(diào)用數(shù)據(jù)上的Fine-tune,確保數(shù)據(jù)的質(zhì)量和多樣性,從人類反饋中學(xué)習(xí)。InstructGPT的訓(xùn)練數(shù)據(jù)量不大,全部加起來也就10萬量級,但是數(shù)據(jù)質(zhì)量(well-trained的AI訓(xùn)練師)和數(shù)據(jù)多樣性是非常高的,而最最重要的是,這些數(shù)據(jù)來自真實世界調(diào)用的數(shù)據(jù),而不是學(xué)術(shù)界玩的“benchmark”。
3、從“兩兩比較的數(shù)據(jù)”中學(xué)習(xí),對強化學(xué)習(xí)而言意義比較重要。如果對單個生成結(jié)果進行打分,標(biāo)注者主觀性帶來的偏差很大,是無法給出精確的獎勵值的。在強化學(xué)習(xí)里面,獎勵值差一點,最后訓(xùn)練的策略就差很遠。而對于多個結(jié)果進行排序和比較,相對就容易做很多。這種比較式的評估方法,在很多語言生成任務(wù)的評價上也被廣泛采用。
04.結(jié)語:對AI行業(yè)的4個啟示
對于此次ChatGPT的“出圈”,黃民烈教授認為,這對于AI行業(yè)有許多啟示,可從四個方面來看:
其一,以O(shè)penAI為代表的AI 3.0,走上了跟過去AI浪潮不一樣的路。更落地、更接近真實世界,在工業(yè)應(yīng)用上,更直接,更落地。從學(xué)術(shù)研究到工業(yè)落地的路徑變得更短、更快。未來,我們在致力于做“helpful, truthful, harmless”的AI系統(tǒng),會成為現(xiàn)實。
其二,有底層AI能力,有數(shù)據(jù)的平臺公司更能引領(lǐng)AI的未來。像OpenAI這樣,有底層模型、有算力、有用戶數(shù)據(jù)調(diào)用,能夠把“用戶調(diào)用——數(shù)據(jù)——模型迭代——更多用戶”的循環(huán)建立起來,強者恒強。
其三,有價值的研究需要更多思考真實用戶的需求和場景。InstructGPT在學(xué)術(shù)界的benchmark上性能并沒有很厲害甚至有退化,但在真實調(diào)用數(shù)據(jù)上非常驚艷,說明了我們學(xué)術(shù)圈的benchmark,離真實世界還很遙遠,不利于AI研究的落地。因此,更開放、更共享的工業(yè)數(shù)據(jù),也是未來我們應(yīng)該努力的方向。
其四,AI與人無縫交互的時代即將來臨,對于搜索服務(wù)將成為一種極好的補充。
黃民烈教授總結(jié)道:“無論是國內(nèi)的AI烏托邦亦或者是海外的ChatGPT,致力于有用(helpful)、更可信(truthful)、更安全(harmless)的AI研究和應(yīng)用,應(yīng)該是學(xué)術(shù)界和工業(yè)界共同努力方向?!?/p>