編譯 | 來咖智庫 豆豆
編輯 | 龔巖
科技不時(shí)會(huì)激發(fā)全世界的想象力,最新的例子就是ChatGPT。這可以從充斥于硅谷、華爾街、把角辦公室、新聞編輯室和教室里的閑言碎語來判斷。
自從去年11月由初創(chuàng)公司OpenAI發(fā)布后,ChatGPT人工智能聊天機(jī)器人(AI Chatbot)在前五天就吸引了100萬名用戶,成為有史以來被最快接受的消費(fèi)產(chǎn)品。微軟公司剛剛在OpenAI投資了100億美元,希望在其自身銷售的軟件中,植入ChatGPT這樣以假亂真模擬人類創(chuàng)作文本、圖像和視頻的能力。
1月26日,Google發(fā)布了論文,描述了一種類似的模型,能夠根據(jù)歌曲的文字描述創(chuàng)作音樂。Google母公司Alphabet的投資人在密切關(guān)注其如何應(yīng)對(duì)ChatGPT的挑戰(zhàn)。中國搜索巨頭百度據(jù)傳也計(jì)劃于3月在搜索引擎中加入聊天機(jī)器人的功能。
談?wù)撨@些早期熱潮是否合理還言之尚早。暫且不論ChatGPT及其競爭對(duì)手背后的這些“生成式”人工智能模型改變商業(yè)、文化和社會(huì)的程度,它們已經(jīng)在改變科技行業(yè)對(duì)于創(chuàng)新及其引擎的認(rèn)識(shí)了。像OpenAI和Google Research這樣的公司研發(fā)實(shí)驗(yàn)室,正在把大科技的處理能力與計(jì)算機(jī)科學(xué)中最明亮的一些腦力火花結(jié)合起來。這些競爭實(shí)驗(yàn)室——無論它們是深處大科技公司內(nèi)部,與其有關(guān)聯(lián),還是由獨(dú)立初創(chuàng)公司運(yùn)營——都在參與一場對(duì)于人工智能霸權(quán)史詩般的競賽。這場競賽的結(jié)果將決定全世界的計(jì)算機(jī)用戶多快能見到人工智能時(shí)代的曙光,以及將由誰來統(tǒng)治。
尤其是在美國,公司研發(fā)機(jī)構(gòu)長期以來都是科學(xué)進(jìn)步的來源。一個(gè)半世紀(jì)以前,托馬斯·愛迪生使用其留聲機(jī)、燈泡等發(fā)明帶來的資金,運(yùn)作其在新澤西Menlo Park的工作室。二戰(zhàn)后,美國公司在基礎(chǔ)科學(xué)方面投入巨大,希望能夠研發(fā)出實(shí)用的產(chǎn)品。杜邦(化工產(chǎn)品制造商)、IBM和施樂(均為硬件廠商)等均組建了大型研發(fā)實(shí)驗(yàn)室。AT&T的貝爾實(shí)驗(yàn)室生產(chǎn)出晶體管、激光和光伏電池等產(chǎn)品發(fā)明,其研發(fā)人員獲得過9項(xiàng)諾貝爾獎(jiǎng)。
然而,到了20世紀(jì)晚期,公司研發(fā)部門慢慢地更專注于“開發(fā)”,而非“研究”。2017年,經(jīng)濟(jì)學(xué)家Ashish Arora及其同事們研究了1980到2006年這段時(shí)期,發(fā)現(xiàn)公司們從基礎(chǔ)科學(xué)研究轉(zhuǎn)向了開發(fā)已有成果。他們認(rèn)為,其中的原因在于研究成本上漲,以及從研發(fā)成果中獲取收益的難度加大。施樂開發(fā)了現(xiàn)在計(jì)算機(jī)用戶們熟悉的圖標(biāo)和窗口等,但卻是蘋果和微軟從中收獲最多??茖W(xué)對(duì)于創(chuàng)新仍然很重要,但其主要已成為非營利大學(xué)的領(lǐng)地。
人工智能的興起使形勢(shì)再一次變化。大公司已不再是一枝獨(dú)秀。Anthropic和Character AI等初創(chuàng)公司已經(jīng)打造出自身的ChatGPT挑戰(zhàn)者。初創(chuàng)公司Stability AI作為一些小企業(yè)、大學(xué)和非盈利機(jī)構(gòu)組成的共同體,已打造出一種流行的能把文本轉(zhuǎn)成圖像的模型。中國政府資助的智源研究院(BAAI)等機(jī)構(gòu)也十分出色。
但最近全球幾乎所有人工智能方面的突破都來自于巨頭公司,一方面是由于它們有計(jì)算機(jī)算力,另一方面該領(lǐng)域的基礎(chǔ)研究成果難得地可以被迅速融入產(chǎn)品。亞馬遜將人工智能應(yīng)用于Alexa語音助手,Meta(Facebook母公司)的一個(gè)模型最近在Diplomacy桌面策略游戲中擊敗了人類選手引發(fā)關(guān)注。前述兩家公司比(計(jì)算機(jī)科學(xué)學(xué)霸集中營)斯坦福大學(xué)在人工智能方面的研發(fā)成果還分別要高三分之二和五分之四。Alphabet(Google母公司)和微軟的成果更豐富,這還不包括Google Research的兄弟實(shí)驗(yàn)室——Alphabet在2014年收購的DeepMind,以及微軟的關(guān)聯(lián)公司OpenAI。
至于哪家處于領(lǐng)先位置,專家們的觀點(diǎn)并不一致。例如,中國的實(shí)驗(yàn)室看來在計(jì)算機(jī)視覺子學(xué)科方面已取得大幅領(lǐng)先,它們?cè)趫D像分析方面的論文被引用得最多。根據(jù)微軟開展的排名,全世界前五名計(jì)算機(jī)視覺團(tuán)隊(duì)都是中國的。智源研究院也自稱打造了全球最大的自然語言模型——“悟道2.0”。Meta選手Cicero由于在Diplomacy游戲中開展策略推演和欺騙人類對(duì)手等廣受贊譽(yù)。DeepMind的模型已經(jīng)在對(duì)于計(jì)算機(jī)最難的圍棋游戲中戰(zhàn)勝了人類冠軍,還能解決長期以來的生命科學(xué)難題——預(yù)測蛋白質(zhì)的形狀。
這些成就都令人驚嘆。然而,在談到目前最火的ChatGPT這類人工智能時(shí),最大的戰(zhàn)役爆發(fā)于微軟和Alphabet之間。有人把基于OpenAI的GPT-3.5模型和Google尚未發(fā)布的基于LaMDA模型的聊天機(jī)器人進(jìn)行了比較,各問了它們一些問題。其中包括從美國數(shù)學(xué)競賽中選取的10個(gè)問題(“和為60的質(zhì)數(shù)對(duì)數(shù)量有多少個(gè)”),從美國SAT考試中選取的10個(gè)閱讀問題(“閱讀該段文字,選擇最能夠描述其中事件的選項(xiàng)”)。為了增加趣味,還分別向它們請(qǐng)教了約會(huì)建議(“根據(jù)下列約會(huì)應(yīng)用中的對(duì)話,提出首次約會(huì)的最佳方式是什么?”)。
兩個(gè)人工智能都沒能顯著領(lǐng)先對(duì)方。Google的數(shù)學(xué)較好,答對(duì)了5個(gè)問題,ChatGPT對(duì)了3個(gè)。它們給出的約會(huì)建議不太一致:輸入約會(huì)應(yīng)用中的一些真實(shí)對(duì)話后,兩者均就一個(gè)場景給出具體建議,對(duì)于另一個(gè)則只有“保持開放心態(tài)”、“進(jìn)行有效溝通”等陳詞濫調(diào)。在SAT問題方面,ChatGPT正確回答了9個(gè)問題(對(duì)手Google答對(duì)了7個(gè)),對(duì)于提問者反饋的響應(yīng)度更好,且再次嘗試時(shí)可以修正一些答案。1月30日,OpenAI宣布升級(jí)ChatGPT以改善其數(shù)學(xué)能力。當(dāng)對(duì)兩個(gè)人工智能提出10個(gè)新問題時(shí),LaMDA再次比對(duì)手多得了2分。但如果允許修正答案的話,ChatGPT能與對(duì)手打成平手。
至少在目前為止,沒有模型能夠取得無法撼動(dòng)的領(lǐng)先優(yōu)勢(shì),原因是人工智能知識(shí)傳播得很快。Stability AI的David Ha指出,相互競爭實(shí)驗(yàn)室的研究人員“經(jīng)?;煸谝黄稹?。與曾在Google工作的Ha先生一樣,很多人在機(jī)構(gòu)間攜帶著專業(yè)技術(shù)和經(jīng)驗(yàn)跳來跳去。此外,由于最好的人工智能專家在內(nèi)心深處都是科學(xué)家,他們經(jīng)常把能夠持續(xù)發(fā)布研究論文和在會(huì)議上展示研究成果作為屈就于私營部門的前提條件。這在一定程度上促使Google公布了一些重大進(jìn)展,包括人工智能模型的關(guān)鍵基礎(chǔ)要素“Transformer”,為對(duì)手提供了幫助(GPT里面的T指得就是“Transformer”)。由此,Meta的頂尖人工智能研究員Yann LeCun認(rèn)為,“沒有人能夠領(lǐng)先其他對(duì)手2-6個(gè)月以上”。
但這些只是早期的情況。這些實(shí)驗(yàn)室也許不會(huì)永遠(yuǎn)并駕齊驅(qū)下去。Google據(jù)傳已經(jīng)發(fā)布了“紅色警報(bào)”,擔(dān)心ChatGPT將能夠提升來自微軟的競爭對(duì)手搜索引擎Bing。DeepMind的研究人員說該公司以前聚焦于游戲和科學(xué),現(xiàn)在正把資源投入語言建模,可能于年內(nèi)發(fā)布其名為Sparrow的聊天機(jī)器人。
可能有助于判斷競賽最終勝者的一個(gè)變量是實(shí)驗(yàn)室的組織方式。OpenAI作為一家沒有什么收入流需要保護(hù)的小公司,也許會(huì)發(fā)現(xiàn)自己有更大空間向公眾發(fā)布產(chǎn)品。這會(huì)帶來大量的用戶數(shù)據(jù),使其模型變得更好(“基于人類反饋的強(qiáng)化學(xué)習(xí)”),并因此吸引更多用戶。
這種先發(fā)優(yōu)勢(shì)還可能在另一個(gè)方面自我強(qiáng)化。內(nèi)部人士指出,OpenAI近年的快速發(fā)展使其能夠從DeepMind等競爭對(duì)手處挖來專家。要想緊追不舍,Alphabet、亞馬遜和Meta也許要重拾其快速行動(dòng)、分解實(shí)施的能力,這在其經(jīng)受全球各地政府深入監(jiān)管審查的背景下很難實(shí)現(xiàn)。
另一個(gè)決定性因素也許是科技發(fā)展的路徑。到目前為止,對(duì)于生成式人工智能,越大就意味著越美,這給有錢的科技巨頭們帶來巨大優(yōu)勢(shì)。但在未來,規(guī)模也許不再意味著一切。例如,模型能夠變多大是有限度的。據(jù)非營利性研究所Epoch預(yù)計(jì),按照現(xiàn)在的速度,大語言模型將把高質(zhì)量網(wǎng)絡(luò)文本用完(盡管視頻等形態(tài)還將在一段時(shí)間內(nèi)有富余)。Stability AI的Ha先生指出,更重要的是,有辦法可以對(duì)具體任務(wù)的模型進(jìn)行微調(diào),“大幅降低擴(kuò)大模型的必要性”。人們也一直在探索以小博大的創(chuàng)新方法。
去年,共有27億美元資本流入生成式人工智能初創(chuàng)公司,達(dá)成110筆交易。這意味著風(fēng)險(xiǎn)投資家們?cè)谫€大科技公司們無法獲取該行業(yè)的全部價(jià)值。當(dāng)然,Alphabet、微軟和其他科技巨頭們將試圖證明這些投資者們是錯(cuò)的。人工智能的競賽才只是剛剛開始。