正在閱讀:

不必神化ChatGPT,它很牛卻不是唯一

掃一掃下載界面新聞APP

不必神化ChatGPT,它很牛卻不是唯一

ChatGPT確實(shí)具有革命性,但卻不是唯一。

界面新聞|范劍磊

文|光錐智能 周文斌

“ChatGPT的意義不亞于PC或互聯(lián)網(wǎng)的誕生”,比爾蓋茨對(duì)這個(gè)新風(fēng)口不吝贊譽(yù)。

裁員潮下一片慘淡的硅谷,因?yàn)镃hatGPT再次燃起了希望之光。

微軟斥資100億美元投資OpenAI,并計(jì)劃將ChatGPT融入旗下全線(xiàn)產(chǎn)品。2月4日,微軟融合ChatGPT-4的Bing已經(jīng)短暫上線(xiàn),速度之快讓人咂舌。

而為了應(yīng)對(duì)微軟激進(jìn)的布局,谷歌緊急地召回了佩奇和布林兩位創(chuàng)始人,并在上周也開(kāi)始內(nèi)測(cè)類(lèi)似的產(chǎn)品Apprentice Bard。同時(shí),谷歌還向OpenAI的競(jìng)爭(zhēng)對(duì)手Anthropic投資近4億美元,以完成微軟和OpenAI類(lèi)似的綁定。

中國(guó)科技公司也在紛紛跟進(jìn),一波類(lèi)似于2016年AlphaGo的熱潮又一次掀起。

2月7日,百度公布了自家類(lèi)ChatGPT產(chǎn)品的名字“文心一言”,并預(yù)計(jì)在3月推出相應(yīng)的產(chǎn)品。

2月8日,阿里巴巴也透露,聊天機(jī)器人ChatGPT目前處于內(nèi)測(cè)階段。

同日,網(wǎng)易有道CEO周楓也獨(dú)家向光錐智能確認(rèn),網(wǎng)易有道未來(lái)或?qū)⑼瞥鯟hatGPT同源技術(shù)產(chǎn)品,應(yīng)用場(chǎng)景圍繞在線(xiàn)教育。

2月9日,騰訊也表態(tài)正有序推進(jìn)ChatGPT和AIGC相關(guān)方向的專(zhuān)項(xiàng)研究。

一時(shí)間,不僅科技圈無(wú)人不談ChatGPT,甚至有不少人也開(kāi)始用其面向普通用戶(hù)賺錢(qián)。瑞銀預(yù)測(cè),ChatGPT的月活躍用戶(hù)在今年1月份達(dá)到了1億,它完成這個(gè)目標(biāo)只用了2個(gè)月,而在它之前,最快的TikTok大概花了9個(gè)月,這讓ChatGPT成為迄今為止增長(zhǎng)最快的消費(fèi)者應(yīng)用。

在此之前,AI產(chǎn)品更多是針對(duì)B端的產(chǎn)品,ChatGPT也打破了to B到to C的圈層壁壘。

當(dāng)然,ChatGPT的偉大,更重要的還是它讓通用型人工智能進(jìn)一步成為可能,并降低了這項(xiàng)技術(shù)的進(jìn)入門(mén)檻,讓更多開(kāi)發(fā)者能夠以低成本的方式在ChatGPT的基礎(chǔ)上開(kāi)發(fā)專(zhuān)屬應(yīng)用,讓AI改造世界的可能性進(jìn)一步提升。

可以說(shuō),就像25年前剛剛萌芽的互聯(lián)網(wǎng)正準(zhǔn)備對(duì)全球帶來(lái)翻天覆地的變革一樣,如今ChatGPT的出現(xiàn),讓AI成為新一輪技術(shù)爆發(fā)的奇點(diǎn)成為可能。

但是,光錐智能在和中國(guó)人工智能行業(yè)從業(yè)者交流后,發(fā)現(xiàn)不少技術(shù)從業(yè)者反而不如圈外如此狂熱。這是因?yàn)椋瑵u進(jìn)式技術(shù)進(jìn)步到今天,并非一蹴而就,技術(shù)從業(yè)者一直都在保持著密切的觀察和技術(shù)跟進(jìn)。

ChatGPT很牛,但不要神化它。

01 硅谷只剩AI了

談起ChatGPT,我們?nèi)匀灰獜墓韫乳_(kāi)始。和互聯(lián)網(wǎng)、Web3、元宇宙等之前大多數(shù)具有革命或非革命意義的技術(shù)突破一樣,ChatGPT仍然來(lái)自于硅谷。

但和之前硅谷各項(xiàng)技術(shù)方向百家爭(zhēng)鳴不同,這個(gè)時(shí)間點(diǎn)的ChatGPT更像是硅谷沒(méi)有選擇的選擇。

2022年,硅谷就經(jīng)歷了一波大裁員,并波及了幾乎所有的科技公司。到了2023年2月,雖然冬天的氣溫已經(jīng)有所回升,但硅谷的寒意卻還沒(méi)有褪去。

據(jù)trueup.io統(tǒng)計(jì)數(shù)據(jù),在2023年剛剛過(guò)去的這一個(gè)月,全球326家科技公司累計(jì)裁掉了106950萬(wàn)人,其中大頭都在硅谷,而且打擊面還非常廣泛,元宇宙、芯片、自動(dòng)駕駛和SaaS都是重災(zāi)區(qū)。

一直以來(lái),裁員都是一個(gè)行業(yè)不景氣的直接表現(xiàn)。

以Wbe3為例,Coinbase在2023年1月計(jì)劃裁掉公司20%的員工,這是美國(guó)第一家上市的合規(guī)加密交易平臺(tái),且這家公司已經(jīng)在去年6月裁掉了18%的員工。

研究公司PitchBook的數(shù)據(jù)顯示,在2022年第四季度,Wbe3行業(yè)的風(fēng)險(xiǎn)投資就已跌到了這兩年以來(lái)的最低水平,比2021年同期下降了75%。

在芯片領(lǐng)域,美光、格羅方德、英特爾等巨頭無(wú)一幸免,其中泛林集團(tuán)裁員1300人,因特爾下調(diào)包括CEO在內(nèi)的管理人員薪酬,并裁員數(shù)百人。SaaS領(lǐng)域,Salesforce在1月4日宣布裁員8000人,約占全體員工的10%。自動(dòng)駕駛方面,包括Waymo、Crusie、圖森未來(lái)、無(wú)人車(chē)配送公司Nuro都有裁員的消息傳出。

除此之外,曾經(jīng)被傾注下一代互聯(lián)網(wǎng)希望的元宇宙也終于走到了拐點(diǎn)。

去年11月,Meta確認(rèn)了成立18年來(lái)首次大規(guī)模裁員,扎克伯格向被裁員工道歉,“我錯(cuò)了,我要為此次裁員,以及我們是如何走到今天這個(gè)地步負(fù)責(zé)。”

投資人也不再看好Meta的元宇宙未來(lái),美國(guó)投資公司Altimeter Capital向Meta發(fā)表公開(kāi)信,呼吁公司削減20%的員工成本,并將「元宇宙」項(xiàng)目的支出限制在每年50億美元。

而相比于一頭扎入元宇宙之后又船大難掉頭的Meta,涉足稍淺的微軟則果斷選擇了棄舊從新。

首先,微軟對(duì)元宇宙相關(guān)業(yè)務(wù)進(jìn)行了大刀闊斧的裁剪,其宣布將在3月10日關(guān)閉2017年收購(gòu)的社交平臺(tái)AltspaceVR,并有可能擺脫混合現(xiàn)實(shí)工具包(MRTK)團(tuán)隊(duì)。

同時(shí),微軟又在AI方面大力投入。1月初,微軟就計(jì)劃向OpenAI投資100億美元,然后宣布要將包括Bing搜索、Office、Azure在內(nèi)的旗下全線(xiàn)產(chǎn)品整合ChatGPT。到2月7日,微軟已經(jīng)在Redmond召開(kāi)了整合ChatGPT的Bing發(fā)布會(huì)。

其實(shí)從ChatGPT面世第一天開(kāi)始,ChatGPT顛覆傳統(tǒng)搜索的觀點(diǎn)就已經(jīng)不脛而走。所以面對(duì)微軟激進(jìn)的布局,谷歌2月6日宣布推出一款聊天機(jī)器人Bard來(lái)與ChatGPT競(jìng)爭(zhēng),谷歌云計(jì)算部門(mén)也在開(kāi)展一個(gè)名為“Atlas”的項(xiàng)目。

2月7日,谷歌向ChatGPT的競(jìng)爭(zhēng)對(duì)手Anthropic投資了約3億美元,獲得了10%的股份,這讓谷歌和Anthropic形成了類(lèi)似微軟與OpenAI的綁定關(guān)系。

除了谷歌和微軟之外,在ChatGPT上線(xiàn)前三個(gè)月,Meta其實(shí)也曾發(fā)布過(guò)一款類(lèi)似的聊天機(jī)器人,只是并沒(méi)有獲得太多影響力。用Meta首席人工智能科學(xué)家雅恩?勒昆(Yann LeCun)的話(huà)說(shuō),“Meta的Blenderbot讓人覺(jué)得很無(wú)聊”。

相應(yīng)的,亞馬遜也已經(jīng)將ChatGPT應(yīng)用到了包括回答面試問(wèn)題、編寫(xiě)軟件代碼和創(chuàng)建培訓(xùn)文檔等工作職能中。一名亞馬遜員工在Slack上表示,亞馬遜云部門(mén)已經(jīng)成立了一個(gè)小型工作組,以更好地了解人工智能對(duì)其業(yè)務(wù)的影響。甚至,連蘋(píng)果都宣布要在下周召開(kāi)內(nèi)部AI峰會(huì)。

如今的硅谷,AI已經(jīng)成為了絕對(duì)C位。

這種轉(zhuǎn)向其實(shí)也表現(xiàn)在投資機(jī)構(gòu)的動(dòng)態(tài)上,2021年12月,紅杉資本將自己在Twitter上的簡(jiǎn)介從“幫助有冒險(xiǎn)精神的人創(chuàng)建偉大的公司”改成了“從想法到落地,我們幫助富有冒險(xiǎn)精神的人打造偉大的DAO?!?022年,Web3賽道火熱,紅杉在2022年1月1日-4月26日,以大概每周一家的速度投資了17家Web3公司。

但變化發(fā)生在去年9月,紅杉資本發(fā)布了一篇文章《生成式AI:一個(gè)創(chuàng)造性的新世界》。其中寫(xiě)道,生成式AI有可能創(chuàng)造數(shù)百萬(wàn)億美元的經(jīng)濟(jì)價(jià)值。

PitchBook的一項(xiàng)統(tǒng)計(jì)數(shù)據(jù)顯示,2022年投資圈向生成式AI公司共投入13.7億美元(折合人民幣約93.69億元),幾乎達(dá)到了過(guò)去5年的總和。這些投資中不僅包括OpenAI、Stability AI這樣的頭部企業(yè),也包如Jasper、Regie.ai、Replika等初創(chuàng)企業(yè)。

整體上,從投資人到大企業(yè),再到創(chuàng)業(yè)者,一場(chǎng)關(guān)于AI 2.0的大幕已經(jīng)拉開(kāi)。

02 差距沒(méi)那么大

從硅谷到中國(guó),ChatGPT的熱度有增無(wú)減。

畢竟一直以來(lái),關(guān)鍵的技術(shù)革新都發(fā)生在硅谷,這兩年中國(guó)尖端技術(shù)又一直面臨卡脖子的問(wèn)題。所以在ChatGPT出現(xiàn)之后,大家最關(guān)心的還是當(dāng)國(guó)外技術(shù)已經(jīng)開(kāi)始商業(yè)化落地的時(shí)候,國(guó)內(nèi)的進(jìn)度到底如何,差距又有多少?

2月7日,百度對(duì)外公布了自家類(lèi)ChatGPT產(chǎn)品的名稱(chēng)“文心一言”,英文名叫ERNIE BOT,目前,文心一言正在做上線(xiàn)前的沖刺。

“文心一言”一經(jīng)透露,便迅速登上各大平臺(tái)熱搜,百度股價(jià)一度漲超17%,市值增長(zhǎng)約700億港元。很明顯,市場(chǎng)對(duì)于一個(gè)中國(guó)版的ChatGPT已經(jīng)期待太久。

之前,有觀點(diǎn)認(rèn)為國(guó)內(nèi)外差距大概在兩年左右。但云知聲研發(fā)副總裁劉升平認(rèn)為,實(shí)際上的差距可能沒(méi)有這么遠(yuǎn)。兩年的說(shuō)法是因?yàn)镚PT-3是在兩年前公布的,但其實(shí)自GPT-3發(fā)布之后,國(guó)內(nèi)許多企業(yè)就已經(jīng)跟進(jìn)在做類(lèi)似的大模型了?!皩?shí)際差距并沒(méi)有那么大,大概在一年左右。”

小冰公司CEO李笛也向光錐智能提到:“國(guó)內(nèi)人工智能技術(shù)不像芯片、操作系統(tǒng)一樣落后于國(guó)外,相反它應(yīng)該是最接近國(guó)際的?!?/p>

“國(guó)內(nèi)外的差距主要是一種思維上的差距?!崩畹颜J(rèn)為,國(guó)內(nèi)對(duì)技術(shù)創(chuàng)新這件事鼓勵(lì)得不夠充分,如果一個(gè)公司耐得住寂寞,那它無(wú)論在哪個(gè)方向都是OK的。

事實(shí)上,國(guó)內(nèi)大廠基本都具備訓(xùn)練大模型的能力。比如百度這次發(fā)布的文心一言,就和百度文心大模型一脈相承。

百度在發(fā)布文心一言名字的時(shí)候還特意提到,在人工智能四層構(gòu)架中有全棧布局,包括底層芯片、深度學(xué)習(xí)框架,大模型以及最上層的搜索等應(yīng)用。擁有產(chǎn)業(yè)級(jí)知識(shí)增強(qiáng)文心大模型ERNIE,具備跨模態(tài)、跨語(yǔ)言的深度語(yǔ)言語(yǔ)義理解與生成能力。

同樣的,騰訊也有類(lèi)似混元AI大模型,在此基礎(chǔ)上,騰訊推出了HunYuan-NLP 1T大模型并一度登頂國(guó)內(nèi)最權(quán)威的自然語(yǔ)言理解任務(wù)榜單CLUE。此外,像阿里有“通義”大模型,華為有盤(pán)古大模型,國(guó)家隊(duì)中科院自動(dòng)化研究所有“紫東·太初”等等。

簡(jiǎn)單來(lái)說(shuō),國(guó)內(nèi)大廠基本都有做NLP預(yù)訓(xùn)練模型的能力,甚至許多專(zhuān)業(yè)能力還處在世界領(lǐng)先的水平。

比如騰訊的混元大模型在2022年11月公布了一項(xiàng)最新進(jìn)展,它們實(shí)現(xiàn)萬(wàn)億級(jí)NLP模型,可以用256張卡,最快1天內(nèi)完成訓(xùn)練,成本相比原來(lái)降低1/8。

作為對(duì)比,ChatGPT訓(xùn)練一次的成本高達(dá)1千萬(wàn)美元,這是一般企業(yè)無(wú)法承受的。小冰公司CEO李笛算過(guò)一筆賬:“如果按照ChatGPT成本來(lái)考量的話(huà),每天我要燒3億人民幣,一年要燒一千多億?!?/p>

而騰訊通過(guò)課程學(xué)習(xí)、MOE路由算法、模型結(jié)構(gòu)等方式優(yōu)化之后,讓更多企業(yè)能夠承擔(dān)得起訓(xùn)練自己的NLP模型的成本。

除此之外,像在專(zhuān)利儲(chǔ)備上,根據(jù)statista2021年的數(shù)據(jù),百度和騰訊都名列世界前列。

另一方面,就ChatGPT而言,它的技術(shù)原理并不新鮮。

Yann LeCun提到:“就底層技術(shù)而言,ChatGPT并不是特別創(chuàng)新的,它不是革命性的,盡管這是公眾對(duì)它的看法?!彼赋?,除了谷歌和Meta,還有6家初創(chuàng)公司基本上擁有與它非常相似的技術(shù)。ChatGPT是一項(xiàng)集體努力,因?yàn)樗鼌R集了多方多年來(lái)開(kāi)發(fā)的多項(xiàng)技術(shù)。

李笛也提到,大模型對(duì)應(yīng)的技術(shù)理念已經(jīng)誕生好幾年,無(wú)論是國(guó)內(nèi)還是國(guó)外,使用這種技術(shù)理念訓(xùn)練出來(lái)的大模型已經(jīng)很多,只是在具體fine tune(微調(diào))的過(guò)程中專(zhuān)注的領(lǐng)域有所不同。

做個(gè)不恰當(dāng)?shù)谋扔?,ChatGPT就像原子彈一樣,它的原理已經(jīng)被寫(xiě)在了教科書(shū)里,而大多數(shù)國(guó)家仍然無(wú)法實(shí)現(xiàn),更多是因?yàn)楣こ绦缘膯?wèn)題。比如千億規(guī)模的數(shù)據(jù)從哪里來(lái)?如何進(jìn)行數(shù)據(jù)標(biāo)注,具體標(biāo)注哪些數(shù)據(jù),標(biāo)注多少,這些數(shù)據(jù)又如何進(jìn)行組織訓(xùn)練等等。

而這些問(wèn)題也都沒(méi)有在OpenAI的論文中得到公布,需要企業(yè)在自己的模型訓(xùn)練中去嘗試和摸索,然后形成經(jīng)驗(yàn),積累成自己的know-how。

03 不要神化ChatGPT

雖然在底層技術(shù)上,國(guó)內(nèi)外其實(shí)并沒(méi)有想象中那么大的差距。但當(dāng)大家看到國(guó)外如火如荼的技術(shù)落地時(shí),也會(huì)擔(dān)心國(guó)內(nèi)在這方面掉隊(duì)。

對(duì)于ChatGPT這樣技術(shù)邏輯清晰的產(chǎn)品而言,慢一點(diǎn)并不影響結(jié)果。但如果產(chǎn)品差,則表現(xiàn)在具體工程問(wèn)題的解決能力上,這些部分要摸索,要踩坑,要形成經(jīng)驗(yàn)都需要漫長(zhǎng)的時(shí)間,這背后反映的是技術(shù)水平的問(wèn)題。

相比于歐美以英文為主的語(yǔ)言環(huán)境,中文是表意文字,在抽象概括和邏輯能力上天生不及英文。除此之外,國(guó)內(nèi)互聯(lián)網(wǎng)的語(yǔ)料也相對(duì)缺乏,沒(méi)有英文互聯(lián)網(wǎng)那么大的數(shù)據(jù)積累。

所以有業(yè)內(nèi)人士表示,對(duì)目前國(guó)內(nèi)的類(lèi)ChatGPT產(chǎn)品發(fā)展而言,重要的不是模型,而是數(shù)據(jù)。

“自然語(yǔ)言處理需要經(jīng)過(guò)一個(gè)非常嚴(yán)密的推理過(guò)程?!崩畹烟岬剑骸按竽P湍撤N意義上代表一種暴力,即把大量的數(shù)據(jù)壓縮到一個(gè)黑盒里面,然后提取出來(lái),這意味著大家在算力有一定保障的前提下,可以有機(jī)會(huì)用之前沒(méi)有用過(guò)的方法去完成?!?/p>

另一方面,ChatGPT確實(shí)是革命性的存在,但卻并不代表它就是今后NLP領(lǐng)域的唯一方向。

首先是ChatGPT的技術(shù)發(fā)展,今天最主要的技術(shù)在于,一個(gè)模型建壓好之后,如何從里面很好地提取數(shù)據(jù),目前還有很多新方法沒(méi)有嘗試,所以不排除未來(lái)用更小的模型達(dá)到很好效果的可能。

李笛提到,現(xiàn)在整個(gè)行業(yè)都在追求這種可能,因?yàn)槟P蛥?shù)太大,一定意味著成本非常高,以及各種各樣的其他問(wèn)題?!敖裉旒夹g(shù)差異還遠(yuǎn)遠(yuǎn)沒(méi)有達(dá)到成為不同技術(shù)流派的程度,也還遠(yuǎn)遠(yuǎn)沒(méi)有到說(shuō)就按應(yīng)用場(chǎng)景去劃分這樣一個(gè)程度。”

其次是從整個(gè)NLP的技術(shù)路線(xiàn)來(lái)看,目前主要有兩種主流技術(shù)路線(xiàn),分別是以谷歌BERT為代表的雙向預(yù)訓(xùn)練語(yǔ)言模型+fine-tuning(微調(diào)),和以O(shè)penAI的GPT為代表的自回歸預(yù)訓(xùn)練語(yǔ)言模型+Prompting(指示/提示)。

在ChatGPT發(fā)布之前,BERT一直是業(yè)內(nèi)主流的技術(shù)方案,它之所以被ChatGPT搶了風(fēng)頭,是因?yàn)樗鼰o(wú)法像GPT一樣用一個(gè)模型解決所有問(wèn)題,沒(méi)有表現(xiàn)出通用型人工智能的潛力。

但實(shí)際上,BERT在許多具體的場(chǎng)景下?lián)碛袃?yōu)勢(shì),比如在特定場(chǎng)景下,BERT可以用更小的數(shù)據(jù)量(ChatGPT是在3000億單詞的語(yǔ)料基礎(chǔ)上預(yù)訓(xùn)練出的擁有1750億參數(shù)的模型),更低的訓(xùn)練成本實(shí)現(xiàn)同樣的性能。

比如在醫(yī)院內(nèi)部這樣一個(gè)特定場(chǎng)景,一方面它用不起千億規(guī)模的模型,ChatGPT在醫(yī)院場(chǎng)景就屬于殺雞用牛刀,醫(yī)院也無(wú)法負(fù)擔(dān)部署ChatGPT的成本。另一方面,ChatGPT的模型是基于公開(kāi)數(shù)據(jù)訓(xùn)練的,但醫(yī)院的數(shù)據(jù)并不存在公共網(wǎng)絡(luò)上,所以面對(duì)醫(yī)院的問(wèn)題,ChatGPT可能無(wú)能為力。

但BERT卻能夠適應(yīng)這樣的場(chǎng)景,它可以以更小的數(shù)據(jù)量,更低的成本,針對(duì)醫(yī)院的數(shù)據(jù)和場(chǎng)景針對(duì)性地訓(xùn)練出的模型,在解決具體問(wèn)題上比ChatGPT更加得心應(yīng)手。

這其實(shí)就是一個(gè)所有領(lǐng)域都涉獵的全能型選手和深耕特定領(lǐng)域的專(zhuān)家之間的區(qū)別。即在數(shù)據(jù)確定的特定場(chǎng)景,BERT更有優(yōu)勢(shì)。而在沒(méi)有明確數(shù)據(jù)和目標(biāo),面向開(kāi)放式的應(yīng)用場(chǎng)景,ChatGPT則更合適。

當(dāng)然,具體到國(guó)內(nèi)企業(yè)的商業(yè)化來(lái)說(shuō),大模型需要大量的數(shù)據(jù),高昂的訓(xùn)練成本,這些都不是一般企業(yè)能夠承擔(dān)的,因此它注定了是巨頭的游戲。

在騰訊研究院近期發(fā)布的《AIGC發(fā)展趨勢(shì)2023》報(bào)告中就梳理了目前AIGC產(chǎn)業(yè)生態(tài)體系的三層構(gòu)架,包括以預(yù)訓(xùn)練模型為主的基礎(chǔ)層;以垂直化、場(chǎng)景化、個(gè)性化模型為主的中間層;和以圖像、語(yǔ)音、文字生成等具體AIGC應(yīng)用為主的應(yīng)用層。

其中,如百度、騰訊、OpenAI這樣的大公司將專(zhuān)注于做預(yù)訓(xùn)練模型,對(duì)這些企業(yè)來(lái)說(shuō),他們一方面能夠?qū)⒋竽P偷哪芰φ系阶约旱漠a(chǎn)品線(xiàn)中,直接面向廣大的用戶(hù);另一方面又能夠通過(guò)API為中小企業(yè)提供能力調(diào)用,在具體場(chǎng)景中落地。

面對(duì)這樣的生態(tài)架構(gòu),一位知名機(jī)構(gòu)投資人在考察過(guò)硅谷的ChatGPT項(xiàng)目后向光錐智能表示:“創(chuàng)業(yè)公司的機(jī)會(huì)在于,在開(kāi)源技術(shù)的基礎(chǔ)上,做具體的應(yīng)用場(chǎng)景。尤其是可以把幾種具體技術(shù)結(jié)合在一起,比如數(shù)字人和ChatGPT結(jié)合,自動(dòng)生成視頻,用于金融、客服等特定場(chǎng)景下的應(yīng)用?!?/p>

但這也會(huì)面臨一些問(wèn)題,即如果大家都調(diào)用同一個(gè)模型的能力,又落地在同一個(gè)細(xì)分場(chǎng)景,那必然會(huì)面臨同質(zhì)化的問(wèn)題。

所以劉升平認(rèn)為:“ChatGPT適合創(chuàng)業(yè)公司進(jìn)入市場(chǎng)初期的冷啟動(dòng),即通過(guò)ChatGPT提供服務(wù),然后逐步積累數(shù)據(jù),待有了一定數(shù)據(jù)積累之后再利用BERT訓(xùn)練專(zhuān)用模型,以此來(lái)建立自己的技術(shù)壁壘和護(hù)城河,同時(shí)也提供差異化的服務(wù),和同行拉開(kāi)差距?!?/p>

所以,無(wú)論是從技術(shù),還是從商業(yè)化的角度而言,ChatGPT和BERT從來(lái)不是一個(gè)非此即彼的問(wèn)題,而是一個(gè)術(shù)業(yè)有專(zhuān)攻的問(wèn)題。

此外,劉升平也提到,對(duì)于中小公司而言,如果沒(méi)有能力去研發(fā)類(lèi)似ChatGPT的通用大模型,那也可以考慮研發(fā)類(lèi)似ChatGPT的行業(yè)版模型,用更少的參數(shù)量,更多的行業(yè)數(shù)據(jù),在行業(yè)問(wèn)題上達(dá)到或超過(guò)ChatGPT的效果。

“我認(rèn)為到目前為止,人工智能在To C和To B上尚未出現(xiàn)一個(gè)放之四海而皆準(zhǔn)的商業(yè)模式?!?/p>

李笛提到,AI現(xiàn)在還出其實(shí)還處在一個(gè)相對(duì)比較早期,甚至可以稱(chēng)之為蠻荒時(shí)代,很多理念都還處在特別特別原始的狀態(tài),所以可能每年我們回顧過(guò)去,都會(huì)覺(jué)得在顛覆自己。

“就像前幾年NIIPS大會(huì)上有人開(kāi)玩笑說(shuō)過(guò)的大模型煉丹,現(xiàn)在的大模型就像大家拿到了一個(gè)好的玩具,但不知道這個(gè)玩具還能吐出什么令人驚訝的東西?!?/p>

在2016年,AlphaGo擊敗李世石時(shí),我們也曾以為AI時(shí)代已經(jīng)來(lái)臨,它會(huì)在許多領(lǐng)域?qū)⑷祟?lèi)替代掉,我們也曾為此恐慌和興奮,但實(shí)際上如今將近10年過(guò)去了,AlphaGo并沒(méi)有改變世界,甚至沒(méi)有改變?nèi)魏稳恕?/p>

所以,何妨讓子彈再飛一會(huì)兒呢?

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

微軟

4.9k
  • 納斯達(dá)克100指數(shù)跌幅擴(kuò)大至2%
  • 美股開(kāi)盤(pán):三大指數(shù)低開(kāi),科技股下跌,雅詩(shī)蘭黛跌逾24%

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

不必神化ChatGPT,它很牛卻不是唯一

ChatGPT確實(shí)具有革命性,但卻不是唯一。

界面新聞|范劍磊

文|光錐智能 周文斌

“ChatGPT的意義不亞于PC或互聯(lián)網(wǎng)的誕生”,比爾蓋茨對(duì)這個(gè)新風(fēng)口不吝贊譽(yù)。

裁員潮下一片慘淡的硅谷,因?yàn)镃hatGPT再次燃起了希望之光。

微軟斥資100億美元投資OpenAI,并計(jì)劃將ChatGPT融入旗下全線(xiàn)產(chǎn)品。2月4日,微軟融合ChatGPT-4的Bing已經(jīng)短暫上線(xiàn),速度之快讓人咂舌。

而為了應(yīng)對(duì)微軟激進(jìn)的布局,谷歌緊急地召回了佩奇和布林兩位創(chuàng)始人,并在上周也開(kāi)始內(nèi)測(cè)類(lèi)似的產(chǎn)品Apprentice Bard。同時(shí),谷歌還向OpenAI的競(jìng)爭(zhēng)對(duì)手Anthropic投資近4億美元,以完成微軟和OpenAI類(lèi)似的綁定。

中國(guó)科技公司也在紛紛跟進(jìn),一波類(lèi)似于2016年AlphaGo的熱潮又一次掀起。

2月7日,百度公布了自家類(lèi)ChatGPT產(chǎn)品的名字“文心一言”,并預(yù)計(jì)在3月推出相應(yīng)的產(chǎn)品。

2月8日,阿里巴巴也透露,聊天機(jī)器人ChatGPT目前處于內(nèi)測(cè)階段。

同日,網(wǎng)易有道CEO周楓也獨(dú)家向光錐智能確認(rèn),網(wǎng)易有道未來(lái)或?qū)⑼瞥鯟hatGPT同源技術(shù)產(chǎn)品,應(yīng)用場(chǎng)景圍繞在線(xiàn)教育。

2月9日,騰訊也表態(tài)正有序推進(jìn)ChatGPT和AIGC相關(guān)方向的專(zhuān)項(xiàng)研究。

一時(shí)間,不僅科技圈無(wú)人不談ChatGPT,甚至有不少人也開(kāi)始用其面向普通用戶(hù)賺錢(qián)。瑞銀預(yù)測(cè),ChatGPT的月活躍用戶(hù)在今年1月份達(dá)到了1億,它完成這個(gè)目標(biāo)只用了2個(gè)月,而在它之前,最快的TikTok大概花了9個(gè)月,這讓ChatGPT成為迄今為止增長(zhǎng)最快的消費(fèi)者應(yīng)用。

在此之前,AI產(chǎn)品更多是針對(duì)B端的產(chǎn)品,ChatGPT也打破了to B到to C的圈層壁壘。

當(dāng)然,ChatGPT的偉大,更重要的還是它讓通用型人工智能進(jìn)一步成為可能,并降低了這項(xiàng)技術(shù)的進(jìn)入門(mén)檻,讓更多開(kāi)發(fā)者能夠以低成本的方式在ChatGPT的基礎(chǔ)上開(kāi)發(fā)專(zhuān)屬應(yīng)用,讓AI改造世界的可能性進(jìn)一步提升。

可以說(shuō),就像25年前剛剛萌芽的互聯(lián)網(wǎng)正準(zhǔn)備對(duì)全球帶來(lái)翻天覆地的變革一樣,如今ChatGPT的出現(xiàn),讓AI成為新一輪技術(shù)爆發(fā)的奇點(diǎn)成為可能。

但是,光錐智能在和中國(guó)人工智能行業(yè)從業(yè)者交流后,發(fā)現(xiàn)不少技術(shù)從業(yè)者反而不如圈外如此狂熱。這是因?yàn)椋瑵u進(jìn)式技術(shù)進(jìn)步到今天,并非一蹴而就,技術(shù)從業(yè)者一直都在保持著密切的觀察和技術(shù)跟進(jìn)。

ChatGPT很牛,但不要神化它。

01 硅谷只剩AI了

談起ChatGPT,我們?nèi)匀灰獜墓韫乳_(kāi)始。和互聯(lián)網(wǎng)、Web3、元宇宙等之前大多數(shù)具有革命或非革命意義的技術(shù)突破一樣,ChatGPT仍然來(lái)自于硅谷。

但和之前硅谷各項(xiàng)技術(shù)方向百家爭(zhēng)鳴不同,這個(gè)時(shí)間點(diǎn)的ChatGPT更像是硅谷沒(méi)有選擇的選擇。

2022年,硅谷就經(jīng)歷了一波大裁員,并波及了幾乎所有的科技公司。到了2023年2月,雖然冬天的氣溫已經(jīng)有所回升,但硅谷的寒意卻還沒(méi)有褪去。

據(jù)trueup.io統(tǒng)計(jì)數(shù)據(jù),在2023年剛剛過(guò)去的這一個(gè)月,全球326家科技公司累計(jì)裁掉了106950萬(wàn)人,其中大頭都在硅谷,而且打擊面還非常廣泛,元宇宙、芯片、自動(dòng)駕駛和SaaS都是重災(zāi)區(qū)。

一直以來(lái),裁員都是一個(gè)行業(yè)不景氣的直接表現(xiàn)。

以Wbe3為例,Coinbase在2023年1月計(jì)劃裁掉公司20%的員工,這是美國(guó)第一家上市的合規(guī)加密交易平臺(tái),且這家公司已經(jīng)在去年6月裁掉了18%的員工。

研究公司PitchBook的數(shù)據(jù)顯示,在2022年第四季度,Wbe3行業(yè)的風(fēng)險(xiǎn)投資就已跌到了這兩年以來(lái)的最低水平,比2021年同期下降了75%。

在芯片領(lǐng)域,美光、格羅方德、英特爾等巨頭無(wú)一幸免,其中泛林集團(tuán)裁員1300人,因特爾下調(diào)包括CEO在內(nèi)的管理人員薪酬,并裁員數(shù)百人。SaaS領(lǐng)域,Salesforce在1月4日宣布裁員8000人,約占全體員工的10%。自動(dòng)駕駛方面,包括Waymo、Crusie、圖森未來(lái)、無(wú)人車(chē)配送公司Nuro都有裁員的消息傳出。

除此之外,曾經(jīng)被傾注下一代互聯(lián)網(wǎng)希望的元宇宙也終于走到了拐點(diǎn)。

去年11月,Meta確認(rèn)了成立18年來(lái)首次大規(guī)模裁員,扎克伯格向被裁員工道歉,“我錯(cuò)了,我要為此次裁員,以及我們是如何走到今天這個(gè)地步負(fù)責(zé)?!?/p>

投資人也不再看好Meta的元宇宙未來(lái),美國(guó)投資公司Altimeter Capital向Meta發(fā)表公開(kāi)信,呼吁公司削減20%的員工成本,并將「元宇宙」項(xiàng)目的支出限制在每年50億美元。

而相比于一頭扎入元宇宙之后又船大難掉頭的Meta,涉足稍淺的微軟則果斷選擇了棄舊從新。

首先,微軟對(duì)元宇宙相關(guān)業(yè)務(wù)進(jìn)行了大刀闊斧的裁剪,其宣布將在3月10日關(guān)閉2017年收購(gòu)的社交平臺(tái)AltspaceVR,并有可能擺脫混合現(xiàn)實(shí)工具包(MRTK)團(tuán)隊(duì)。

同時(shí),微軟又在AI方面大力投入。1月初,微軟就計(jì)劃向OpenAI投資100億美元,然后宣布要將包括Bing搜索、Office、Azure在內(nèi)的旗下全線(xiàn)產(chǎn)品整合ChatGPT。到2月7日,微軟已經(jīng)在Redmond召開(kāi)了整合ChatGPT的Bing發(fā)布會(huì)。

其實(shí)從ChatGPT面世第一天開(kāi)始,ChatGPT顛覆傳統(tǒng)搜索的觀點(diǎn)就已經(jīng)不脛而走。所以面對(duì)微軟激進(jìn)的布局,谷歌2月6日宣布推出一款聊天機(jī)器人Bard來(lái)與ChatGPT競(jìng)爭(zhēng),谷歌云計(jì)算部門(mén)也在開(kāi)展一個(gè)名為“Atlas”的項(xiàng)目。

2月7日,谷歌向ChatGPT的競(jìng)爭(zhēng)對(duì)手Anthropic投資了約3億美元,獲得了10%的股份,這讓谷歌和Anthropic形成了類(lèi)似微軟與OpenAI的綁定關(guān)系。

除了谷歌和微軟之外,在ChatGPT上線(xiàn)前三個(gè)月,Meta其實(shí)也曾發(fā)布過(guò)一款類(lèi)似的聊天機(jī)器人,只是并沒(méi)有獲得太多影響力。用Meta首席人工智能科學(xué)家雅恩?勒昆(Yann LeCun)的話(huà)說(shuō),“Meta的Blenderbot讓人覺(jué)得很無(wú)聊”。

相應(yīng)的,亞馬遜也已經(jīng)將ChatGPT應(yīng)用到了包括回答面試問(wèn)題、編寫(xiě)軟件代碼和創(chuàng)建培訓(xùn)文檔等工作職能中。一名亞馬遜員工在Slack上表示,亞馬遜云部門(mén)已經(jīng)成立了一個(gè)小型工作組,以更好地了解人工智能對(duì)其業(yè)務(wù)的影響。甚至,連蘋(píng)果都宣布要在下周召開(kāi)內(nèi)部AI峰會(huì)。

如今的硅谷,AI已經(jīng)成為了絕對(duì)C位。

這種轉(zhuǎn)向其實(shí)也表現(xiàn)在投資機(jī)構(gòu)的動(dòng)態(tài)上,2021年12月,紅杉資本將自己在Twitter上的簡(jiǎn)介從“幫助有冒險(xiǎn)精神的人創(chuàng)建偉大的公司”改成了“從想法到落地,我們幫助富有冒險(xiǎn)精神的人打造偉大的DAO。”2022年,Web3賽道火熱,紅杉在2022年1月1日-4月26日,以大概每周一家的速度投資了17家Web3公司。

但變化發(fā)生在去年9月,紅杉資本發(fā)布了一篇文章《生成式AI:一個(gè)創(chuàng)造性的新世界》。其中寫(xiě)道,生成式AI有可能創(chuàng)造數(shù)百萬(wàn)億美元的經(jīng)濟(jì)價(jià)值。

PitchBook的一項(xiàng)統(tǒng)計(jì)數(shù)據(jù)顯示,2022年投資圈向生成式AI公司共投入13.7億美元(折合人民幣約93.69億元),幾乎達(dá)到了過(guò)去5年的總和。這些投資中不僅包括OpenAI、Stability AI這樣的頭部企業(yè),也包如Jasper、Regie.ai、Replika等初創(chuàng)企業(yè)。

整體上,從投資人到大企業(yè),再到創(chuàng)業(yè)者,一場(chǎng)關(guān)于AI 2.0的大幕已經(jīng)拉開(kāi)。

02 差距沒(méi)那么大

從硅谷到中國(guó),ChatGPT的熱度有增無(wú)減。

畢竟一直以來(lái),關(guān)鍵的技術(shù)革新都發(fā)生在硅谷,這兩年中國(guó)尖端技術(shù)又一直面臨卡脖子的問(wèn)題。所以在ChatGPT出現(xiàn)之后,大家最關(guān)心的還是當(dāng)國(guó)外技術(shù)已經(jīng)開(kāi)始商業(yè)化落地的時(shí)候,國(guó)內(nèi)的進(jìn)度到底如何,差距又有多少?

2月7日,百度對(duì)外公布了自家類(lèi)ChatGPT產(chǎn)品的名稱(chēng)“文心一言”,英文名叫ERNIE BOT,目前,文心一言正在做上線(xiàn)前的沖刺。

“文心一言”一經(jīng)透露,便迅速登上各大平臺(tái)熱搜,百度股價(jià)一度漲超17%,市值增長(zhǎng)約700億港元。很明顯,市場(chǎng)對(duì)于一個(gè)中國(guó)版的ChatGPT已經(jīng)期待太久。

之前,有觀點(diǎn)認(rèn)為國(guó)內(nèi)外差距大概在兩年左右。但云知聲研發(fā)副總裁劉升平認(rèn)為,實(shí)際上的差距可能沒(méi)有這么遠(yuǎn)。兩年的說(shuō)法是因?yàn)镚PT-3是在兩年前公布的,但其實(shí)自GPT-3發(fā)布之后,國(guó)內(nèi)許多企業(yè)就已經(jīng)跟進(jìn)在做類(lèi)似的大模型了?!皩?shí)際差距并沒(méi)有那么大,大概在一年左右?!?/p>

小冰公司CEO李笛也向光錐智能提到:“國(guó)內(nèi)人工智能技術(shù)不像芯片、操作系統(tǒng)一樣落后于國(guó)外,相反它應(yīng)該是最接近國(guó)際的?!?/p>

“國(guó)內(nèi)外的差距主要是一種思維上的差距?!崩畹颜J(rèn)為,國(guó)內(nèi)對(duì)技術(shù)創(chuàng)新這件事鼓勵(lì)得不夠充分,如果一個(gè)公司耐得住寂寞,那它無(wú)論在哪個(gè)方向都是OK的。

事實(shí)上,國(guó)內(nèi)大廠基本都具備訓(xùn)練大模型的能力。比如百度這次發(fā)布的文心一言,就和百度文心大模型一脈相承。

百度在發(fā)布文心一言名字的時(shí)候還特意提到,在人工智能四層構(gòu)架中有全棧布局,包括底層芯片、深度學(xué)習(xí)框架,大模型以及最上層的搜索等應(yīng)用。擁有產(chǎn)業(yè)級(jí)知識(shí)增強(qiáng)文心大模型ERNIE,具備跨模態(tài)、跨語(yǔ)言的深度語(yǔ)言語(yǔ)義理解與生成能力。

同樣的,騰訊也有類(lèi)似混元AI大模型,在此基礎(chǔ)上,騰訊推出了HunYuan-NLP 1T大模型并一度登頂國(guó)內(nèi)最權(quán)威的自然語(yǔ)言理解任務(wù)榜單CLUE。此外,像阿里有“通義”大模型,華為有盤(pán)古大模型,國(guó)家隊(duì)中科院自動(dòng)化研究所有“紫東·太初”等等。

簡(jiǎn)單來(lái)說(shuō),國(guó)內(nèi)大廠基本都有做NLP預(yù)訓(xùn)練模型的能力,甚至許多專(zhuān)業(yè)能力還處在世界領(lǐng)先的水平。

比如騰訊的混元大模型在2022年11月公布了一項(xiàng)最新進(jìn)展,它們實(shí)現(xiàn)萬(wàn)億級(jí)NLP模型,可以用256張卡,最快1天內(nèi)完成訓(xùn)練,成本相比原來(lái)降低1/8。

作為對(duì)比,ChatGPT訓(xùn)練一次的成本高達(dá)1千萬(wàn)美元,這是一般企業(yè)無(wú)法承受的。小冰公司CEO李笛算過(guò)一筆賬:“如果按照ChatGPT成本來(lái)考量的話(huà),每天我要燒3億人民幣,一年要燒一千多億?!?/p>

而騰訊通過(guò)課程學(xué)習(xí)、MOE路由算法、模型結(jié)構(gòu)等方式優(yōu)化之后,讓更多企業(yè)能夠承擔(dān)得起訓(xùn)練自己的NLP模型的成本。

除此之外,像在專(zhuān)利儲(chǔ)備上,根據(jù)statista2021年的數(shù)據(jù),百度和騰訊都名列世界前列。

另一方面,就ChatGPT而言,它的技術(shù)原理并不新鮮。

Yann LeCun提到:“就底層技術(shù)而言,ChatGPT并不是特別創(chuàng)新的,它不是革命性的,盡管這是公眾對(duì)它的看法。”他指出,除了谷歌和Meta,還有6家初創(chuàng)公司基本上擁有與它非常相似的技術(shù)。ChatGPT是一項(xiàng)集體努力,因?yàn)樗鼌R集了多方多年來(lái)開(kāi)發(fā)的多項(xiàng)技術(shù)。

李笛也提到,大模型對(duì)應(yīng)的技術(shù)理念已經(jīng)誕生好幾年,無(wú)論是國(guó)內(nèi)還是國(guó)外,使用這種技術(shù)理念訓(xùn)練出來(lái)的大模型已經(jīng)很多,只是在具體fine tune(微調(diào))的過(guò)程中專(zhuān)注的領(lǐng)域有所不同。

做個(gè)不恰當(dāng)?shù)谋扔?,ChatGPT就像原子彈一樣,它的原理已經(jīng)被寫(xiě)在了教科書(shū)里,而大多數(shù)國(guó)家仍然無(wú)法實(shí)現(xiàn),更多是因?yàn)楣こ绦缘膯?wèn)題。比如千億規(guī)模的數(shù)據(jù)從哪里來(lái)?如何進(jìn)行數(shù)據(jù)標(biāo)注,具體標(biāo)注哪些數(shù)據(jù),標(biāo)注多少,這些數(shù)據(jù)又如何進(jìn)行組織訓(xùn)練等等。

而這些問(wèn)題也都沒(méi)有在OpenAI的論文中得到公布,需要企業(yè)在自己的模型訓(xùn)練中去嘗試和摸索,然后形成經(jīng)驗(yàn),積累成自己的know-how。

03 不要神化ChatGPT

雖然在底層技術(shù)上,國(guó)內(nèi)外其實(shí)并沒(méi)有想象中那么大的差距。但當(dāng)大家看到國(guó)外如火如荼的技術(shù)落地時(shí),也會(huì)擔(dān)心國(guó)內(nèi)在這方面掉隊(duì)。

對(duì)于ChatGPT這樣技術(shù)邏輯清晰的產(chǎn)品而言,慢一點(diǎn)并不影響結(jié)果。但如果產(chǎn)品差,則表現(xiàn)在具體工程問(wèn)題的解決能力上,這些部分要摸索,要踩坑,要形成經(jīng)驗(yàn)都需要漫長(zhǎng)的時(shí)間,這背后反映的是技術(shù)水平的問(wèn)題。

相比于歐美以英文為主的語(yǔ)言環(huán)境,中文是表意文字,在抽象概括和邏輯能力上天生不及英文。除此之外,國(guó)內(nèi)互聯(lián)網(wǎng)的語(yǔ)料也相對(duì)缺乏,沒(méi)有英文互聯(lián)網(wǎng)那么大的數(shù)據(jù)積累。

所以有業(yè)內(nèi)人士表示,對(duì)目前國(guó)內(nèi)的類(lèi)ChatGPT產(chǎn)品發(fā)展而言,重要的不是模型,而是數(shù)據(jù)。

“自然語(yǔ)言處理需要經(jīng)過(guò)一個(gè)非常嚴(yán)密的推理過(guò)程?!崩畹烟岬剑骸按竽P湍撤N意義上代表一種暴力,即把大量的數(shù)據(jù)壓縮到一個(gè)黑盒里面,然后提取出來(lái),這意味著大家在算力有一定保障的前提下,可以有機(jī)會(huì)用之前沒(méi)有用過(guò)的方法去完成?!?/p>

另一方面,ChatGPT確實(shí)是革命性的存在,但卻并不代表它就是今后NLP領(lǐng)域的唯一方向。

首先是ChatGPT的技術(shù)發(fā)展,今天最主要的技術(shù)在于,一個(gè)模型建壓好之后,如何從里面很好地提取數(shù)據(jù),目前還有很多新方法沒(méi)有嘗試,所以不排除未來(lái)用更小的模型達(dá)到很好效果的可能。

李笛提到,現(xiàn)在整個(gè)行業(yè)都在追求這種可能,因?yàn)槟P蛥?shù)太大,一定意味著成本非常高,以及各種各樣的其他問(wèn)題?!敖裉旒夹g(shù)差異還遠(yuǎn)遠(yuǎn)沒(méi)有達(dá)到成為不同技術(shù)流派的程度,也還遠(yuǎn)遠(yuǎn)沒(méi)有到說(shuō)就按應(yīng)用場(chǎng)景去劃分這樣一個(gè)程度?!?/p>

其次是從整個(gè)NLP的技術(shù)路線(xiàn)來(lái)看,目前主要有兩種主流技術(shù)路線(xiàn),分別是以谷歌BERT為代表的雙向預(yù)訓(xùn)練語(yǔ)言模型+fine-tuning(微調(diào)),和以O(shè)penAI的GPT為代表的自回歸預(yù)訓(xùn)練語(yǔ)言模型+Prompting(指示/提示)。

在ChatGPT發(fā)布之前,BERT一直是業(yè)內(nèi)主流的技術(shù)方案,它之所以被ChatGPT搶了風(fēng)頭,是因?yàn)樗鼰o(wú)法像GPT一樣用一個(gè)模型解決所有問(wèn)題,沒(méi)有表現(xiàn)出通用型人工智能的潛力。

但實(shí)際上,BERT在許多具體的場(chǎng)景下?lián)碛袃?yōu)勢(shì),比如在特定場(chǎng)景下,BERT可以用更小的數(shù)據(jù)量(ChatGPT是在3000億單詞的語(yǔ)料基礎(chǔ)上預(yù)訓(xùn)練出的擁有1750億參數(shù)的模型),更低的訓(xùn)練成本實(shí)現(xiàn)同樣的性能。

比如在醫(yī)院內(nèi)部這樣一個(gè)特定場(chǎng)景,一方面它用不起千億規(guī)模的模型,ChatGPT在醫(yī)院場(chǎng)景就屬于殺雞用牛刀,醫(yī)院也無(wú)法負(fù)擔(dān)部署ChatGPT的成本。另一方面,ChatGPT的模型是基于公開(kāi)數(shù)據(jù)訓(xùn)練的,但醫(yī)院的數(shù)據(jù)并不存在公共網(wǎng)絡(luò)上,所以面對(duì)醫(yī)院的問(wèn)題,ChatGPT可能無(wú)能為力。

但BERT卻能夠適應(yīng)這樣的場(chǎng)景,它可以以更小的數(shù)據(jù)量,更低的成本,針對(duì)醫(yī)院的數(shù)據(jù)和場(chǎng)景針對(duì)性地訓(xùn)練出的模型,在解決具體問(wèn)題上比ChatGPT更加得心應(yīng)手。

這其實(shí)就是一個(gè)所有領(lǐng)域都涉獵的全能型選手和深耕特定領(lǐng)域的專(zhuān)家之間的區(qū)別。即在數(shù)據(jù)確定的特定場(chǎng)景,BERT更有優(yōu)勢(shì)。而在沒(méi)有明確數(shù)據(jù)和目標(biāo),面向開(kāi)放式的應(yīng)用場(chǎng)景,ChatGPT則更合適。

當(dāng)然,具體到國(guó)內(nèi)企業(yè)的商業(yè)化來(lái)說(shuō),大模型需要大量的數(shù)據(jù),高昂的訓(xùn)練成本,這些都不是一般企業(yè)能夠承擔(dān)的,因此它注定了是巨頭的游戲。

在騰訊研究院近期發(fā)布的《AIGC發(fā)展趨勢(shì)2023》報(bào)告中就梳理了目前AIGC產(chǎn)業(yè)生態(tài)體系的三層構(gòu)架,包括以預(yù)訓(xùn)練模型為主的基礎(chǔ)層;以垂直化、場(chǎng)景化、個(gè)性化模型為主的中間層;和以圖像、語(yǔ)音、文字生成等具體AIGC應(yīng)用為主的應(yīng)用層。

其中,如百度、騰訊、OpenAI這樣的大公司將專(zhuān)注于做預(yù)訓(xùn)練模型,對(duì)這些企業(yè)來(lái)說(shuō),他們一方面能夠?qū)⒋竽P偷哪芰φ系阶约旱漠a(chǎn)品線(xiàn)中,直接面向廣大的用戶(hù);另一方面又能夠通過(guò)API為中小企業(yè)提供能力調(diào)用,在具體場(chǎng)景中落地。

面對(duì)這樣的生態(tài)架構(gòu),一位知名機(jī)構(gòu)投資人在考察過(guò)硅谷的ChatGPT項(xiàng)目后向光錐智能表示:“創(chuàng)業(yè)公司的機(jī)會(huì)在于,在開(kāi)源技術(shù)的基礎(chǔ)上,做具體的應(yīng)用場(chǎng)景。尤其是可以把幾種具體技術(shù)結(jié)合在一起,比如數(shù)字人和ChatGPT結(jié)合,自動(dòng)生成視頻,用于金融、客服等特定場(chǎng)景下的應(yīng)用?!?/p>

但這也會(huì)面臨一些問(wèn)題,即如果大家都調(diào)用同一個(gè)模型的能力,又落地在同一個(gè)細(xì)分場(chǎng)景,那必然會(huì)面臨同質(zhì)化的問(wèn)題。

所以劉升平認(rèn)為:“ChatGPT適合創(chuàng)業(yè)公司進(jìn)入市場(chǎng)初期的冷啟動(dòng),即通過(guò)ChatGPT提供服務(wù),然后逐步積累數(shù)據(jù),待有了一定數(shù)據(jù)積累之后再利用BERT訓(xùn)練專(zhuān)用模型,以此來(lái)建立自己的技術(shù)壁壘和護(hù)城河,同時(shí)也提供差異化的服務(wù),和同行拉開(kāi)差距?!?/p>

所以,無(wú)論是從技術(shù),還是從商業(yè)化的角度而言,ChatGPT和BERT從來(lái)不是一個(gè)非此即彼的問(wèn)題,而是一個(gè)術(shù)業(yè)有專(zhuān)攻的問(wèn)題。

此外,劉升平也提到,對(duì)于中小公司而言,如果沒(méi)有能力去研發(fā)類(lèi)似ChatGPT的通用大模型,那也可以考慮研發(fā)類(lèi)似ChatGPT的行業(yè)版模型,用更少的參數(shù)量,更多的行業(yè)數(shù)據(jù),在行業(yè)問(wèn)題上達(dá)到或超過(guò)ChatGPT的效果。

“我認(rèn)為到目前為止,人工智能在To C和To B上尚未出現(xiàn)一個(gè)放之四海而皆準(zhǔn)的商業(yè)模式。”

李笛提到,AI現(xiàn)在還出其實(shí)還處在一個(gè)相對(duì)比較早期,甚至可以稱(chēng)之為蠻荒時(shí)代,很多理念都還處在特別特別原始的狀態(tài),所以可能每年我們回顧過(guò)去,都會(huì)覺(jué)得在顛覆自己。

“就像前幾年NIIPS大會(huì)上有人開(kāi)玩笑說(shuō)過(guò)的大模型煉丹,現(xiàn)在的大模型就像大家拿到了一個(gè)好的玩具,但不知道這個(gè)玩具還能吐出什么令人驚訝的東西?!?/p>

在2016年,AlphaGo擊敗李世石時(shí),我們也曾以為AI時(shí)代已經(jīng)來(lái)臨,它會(huì)在許多領(lǐng)域?qū)⑷祟?lèi)替代掉,我們也曾為此恐慌和興奮,但實(shí)際上如今將近10年過(guò)去了,AlphaGo并沒(méi)有改變世界,甚至沒(méi)有改變?nèi)魏稳恕?/p>

所以,何妨讓子彈再飛一會(huì)兒呢?

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。