正在閱讀:

為什么今天出現(xiàn)了ChatGPT?往后還會(huì)發(fā)生什么?

掃一掃下載界面新聞APP

為什么今天出現(xiàn)了ChatGPT?往后還會(huì)發(fā)生什么?

還有機(jī)會(huì)做中國(guó)版的OpneAI嗎?

界面新聞|范劍磊

編輯|峰瑞資本

這篇專欄出自李翔和豐叔在「高能量」播客的一次深度對(duì)話。李翔是《詳談》叢書(shū)主理人,得到App總編輯。

對(duì)話發(fā)生在4月中旬,負(fù)責(zé)數(shù)據(jù)基礎(chǔ)制度建設(shè)的國(guó)家數(shù)據(jù)局成立一月有余,科技巨頭間的AI競(jìng)賽日趨白熱化。

在此背景下,李翔和豐叔暢談一個(gè)多小時(shí),從文本信息數(shù)據(jù)化說(shuō)起,以數(shù)據(jù)化為線串起了互聯(lián)網(wǎng)的過(guò)去三十年,并試圖解答關(guān)于ChatGPT的一些熱點(diǎn)問(wèn)題:

為什么現(xiàn)在出現(xiàn)了ChatGPT?往后還會(huì)發(fā)生什么?

在ChatGPT這個(gè)鏈條上會(huì)有哪些重要公司?創(chuàng)業(yè)公司還有機(jī)會(huì)嗎?

還有機(jī)會(huì)做出中國(guó)的OpenAI嗎?

第一波人工智能浪潮興起后,有留下什么好的“遺產(chǎn)”嗎?

醫(yī)療、自動(dòng)駕駛領(lǐng)域如何實(shí)現(xiàn)數(shù)據(jù)化?未來(lái)會(huì)變成什么樣?

Web3和區(qū)塊鏈熱潮之后,沉淀了什么?

對(duì)話過(guò)去已逾半月,據(jù)第一財(cái)經(jīng)5月6日消息,包括百度、阿里、華為、商湯以及科大訊飛等在內(nèi),中國(guó)目前有40多家企業(yè)布局了大模型。膠著競(jìng)爭(zhēng)下,誰(shuí)能成為這一鏈條的關(guān)鍵公司?

/ 01 /在ChatGPT這個(gè)鏈條上,會(huì)“長(zhǎng)”出哪些重要的公司?

李翔:從你的視角來(lái)看 ,在ChatGPT這個(gè)鏈條上,會(huì)有哪些重要的公司?只從新聞來(lái)看,它可能有OpenAI這樣的開(kāi)發(fā)模型公司,也可能有英偉達(dá)這樣提供芯片跟算力的公司。李豐:今天來(lái)看肯定還是這三類:數(shù)據(jù)、算法和算力。但是最終,他們?cè)趹?yīng)用層會(huì)演化成不同的東西,應(yīng)用層的東西通常比提供基礎(chǔ)設(shè)施的要更大一些,壟斷效應(yīng)更強(qiáng)一些。

大模型做好做大不容易,如果有的話肯定會(huì)是好的應(yīng)用,但它們其實(shí)作為生產(chǎn)力工具,更容易在垂直領(lǐng)域被結(jié)合出來(lái),尤其是需要用對(duì)話流加上博覽群書(shū)的專業(yè)抽象內(nèi)容來(lái)提供服務(wù)的公司。

比如說(shuō),我們投資了專注做在線心理咨詢服務(wù)的Glowe閣樓,線上的心理咨詢師通過(guò)和用戶聊天,為用戶提供基礎(chǔ)的心理咨詢服務(wù)。這大概就是通過(guò)博覽群書(shū)的對(duì)話流專業(yè)服務(wù)來(lái)解決問(wèn)題。

又比如說(shuō)可以做金融服務(wù),因?yàn)檫@里需要非常專業(yè)的理財(cái)師,跟用戶進(jìn)行無(wú)微不至的談話,一段時(shí)間之后才把用戶隱藏需求比較具象地挖掘出來(lái)。

它會(huì)不會(huì)出現(xiàn)像搜索引擎,但又不是搜索引擎,并且提供廣義文本信息、供需匹配更高效率的商業(yè)模式?也許會(huì)有,如果有了,就具有絕對(duì)優(yōu)勢(shì)。李翔:微軟必應(yīng)也在做這樣的嘗試。李豐:對(duì)。有個(gè)有意思的話題,從搜索引擎到頭條到抖音,本質(zhì)上都是文本數(shù)據(jù)的供需匹配。

但是頭條能做成的最大原因,是交互形態(tài)的改變和新設(shè)備的大規(guī)模普及,使輸入和使用場(chǎng)景都跟上一代(如PC、筆記本電腦)有極大的差別。上一代的人沒(méi)轉(zhuǎn)過(guò)來(lái),百度當(dāng)時(shí)轉(zhuǎn)慢了,才給了頭條這個(gè)機(jī)會(huì)。

這個(gè)“新”是指用戶交互方式的變化、屏幕的變化、物理鍵盤的消失、移動(dòng)場(chǎng)景下多窗口切換以及輸入不方便等。所有這些因素造成了用戶使用拖拉或點(diǎn)選的方式,而不是用鍵盤輸入關(guān)鍵詞,來(lái)進(jìn)行了信息篩選。

在此基礎(chǔ)上,一個(gè)新的文本信息供需匹配的商業(yè)模式出現(xiàn)了(我們會(huì)在下文詳細(xì)展開(kāi)在互聯(lián)網(wǎng)發(fā)展的過(guò)程中,由新變化帶來(lái)的新的商業(yè)模式)。如果要再做一個(gè),下一個(gè)應(yīng)該不會(huì)以相同的搜索形態(tài)出現(xiàn)。

/ 02 /還有機(jī)會(huì)做出中國(guó)的OpenAI嗎?

李翔:現(xiàn)在越來(lái)越多的大公司入局,也會(huì)有一些比較成功的創(chuàng)業(yè)者想要做中國(guó)的OpenAI,這些創(chuàng)業(yè)公司還會(huì)有機(jī)會(huì)嗎?李豐:這其中存在幾個(gè)關(guān)鍵要素是變量。

第一個(gè)變量是,會(huì)不會(huì)有好版本的開(kāi)源?

硬幣有兩面。在巨頭激烈競(jìng)爭(zhēng)的時(shí)候,反而會(huì)有更多更好版本的開(kāi)源模型出現(xiàn),這個(gè)時(shí)候,應(yīng)用就會(huì)變得更突出一些。

不做激烈的模型競(jìng)爭(zhēng),把開(kāi)源的模型拿過(guò)來(lái),站在巨人肩膀上,在自己專業(yè)領(lǐng)域范圍經(jīng)過(guò)適當(dāng)調(diào)整、訓(xùn)練和加工,把它變成專業(yè)服務(wù)勞動(dòng)力中的一個(gè)生產(chǎn)力工具,并不能完全把人替代掉。

我們還需要考慮的是,在非算法邏輯的認(rèn)知邏輯上,有沒(méi)有加新的“一小跳”的東西?

這一小跳通常是一層窗戶紙?;剡^(guò)頭來(lái)看,搜索框就是當(dāng)時(shí)的一小跳,它將當(dāng)時(shí)已經(jīng)成熟的用戶習(xí)慣和設(shè)備,結(jié)合當(dāng)時(shí)的算力和算法,相對(duì)準(zhǔn)確地匹配用戶和需求。

比如Alphafold,能夠根據(jù)人們“投喂”的數(shù)據(jù),智能預(yù)測(cè)蛋白質(zhì)的結(jié)構(gòu)。對(duì)于Alphafold來(lái)說(shuō),除了要考慮分子熱力學(xué)模型之外,還要基于生物、化學(xué)、物理等層面的內(nèi)容,來(lái)理解分子的結(jié)構(gòu)。

在算法層面之外,Alphafold這個(gè)模型在認(rèn)知層面有了迭代,能夠更好地近似和模擬分子結(jié)構(gòu)?,F(xiàn)在大家對(duì)Alphafold提供的預(yù)測(cè)結(jié)果瞠目結(jié)舌,因?yàn)樗咏诎l(fā)現(xiàn)了人們未曾發(fā)現(xiàn)過(guò)的蛋白質(zhì)結(jié)構(gòu)。李翔:打個(gè)比方,你說(shuō)電動(dòng)車到底難不難,你說(shuō)它不難,很難解釋說(shuō)特斯拉之前就一直沒(méi)有人把這個(gè)事情證明是可行的、靠譜的。你說(shuō)它很難,你也解釋不了特斯拉之后,中國(guó)出現(xiàn)了“蔚小理”。李豐:這個(gè)例子也合適,雖然它更像是物理科技。這里邊需要有非常多的非算法知識(shí)和某些抽象層面的認(rèn)知邏輯進(jìn)到了算法里并且融合成算法,使它進(jìn)步。這些事情非??珙I(lǐng)域、跨知識(shí),需要靈感,要求非常高。

/ 03 /人工智能的浪潮后,有留下什么好的“遺產(chǎn)”嗎?

李翔:2016年前后有一波人工智能浪潮,很多資金投入到這個(gè)行業(yè),也出現(xiàn)了很多優(yōu)秀的人工智能創(chuàng)業(yè)公司。今天來(lái)看,大量資金投入后,有留下什么好的遺產(chǎn)嗎?李豐:在技術(shù)出現(xiàn)新的投資浪潮時(shí),我們簡(jiǎn)單把它總結(jié)為兩波,第一波叫“值錢的時(shí)候不賺錢”,第二波叫“賺錢的時(shí)候不值錢”。

我們以大數(shù)據(jù)行業(yè)為例。2012-2013年,不管是在美國(guó)還是在中國(guó),大數(shù)據(jù)都是超級(jí)熱的投資概念。今天大數(shù)據(jù)已經(jīng)不時(shí)髦了,但經(jīng)過(guò)這10年的發(fā)展,大數(shù)據(jù)行業(yè)具有了一定規(guī)模,并且有些公司比較賺錢,存活下來(lái)了。

一個(gè)新技術(shù)發(fā)生并且變成投資熱潮的時(shí)候,往往是它不賺錢的時(shí)候。等它嵌到應(yīng)用場(chǎng)景里,這個(gè)技術(shù)的普及性就提高了,變成了某種意義上的生產(chǎn)力工具,就值錢了。比如最早發(fā)明電的時(shí)候,大家可以無(wú)限想象,但當(dāng)時(shí)很難落地。愛(ài)迪生發(fā)明出電燈泡后,當(dāng)它賺很多錢且普及開(kāi)來(lái)的時(shí)候,電燈泡已不是令人激動(dòng)的技術(shù)創(chuàng)新了。李翔:?jiǎn)渭兙虶PT和大模型而言,投資界對(duì)它的態(tài)度是什么樣的?李豐:一部分投資人對(duì)之賦予了巨大的熱情和信任,還付諸了行動(dòng);一部分投資人對(duì)之持整體偏保守和冷靜的態(tài)度;還有一部分比較積極且縝密地在看,但是還沒(méi)有到說(shuō)服自己過(guò)投資門檻的程度。不同態(tài)度的投資人可能差不多各占1/ 3。

/ 04 /從數(shù)據(jù)化這個(gè)維度來(lái)看,為什么今天出現(xiàn)了ChatGPT?

往后還會(huì)發(fā)生什么?

李豐:我們?cè)谕顿Y時(shí),經(jīng)常會(huì)關(guān)注“為什么是今天”、“為什么發(fā)生了”以及“往后還會(huì)發(fā)生什么”。那么GPT是如何一路走到今天的?

從谷歌開(kāi)始用搜索關(guān)鍵詞為用戶尋找對(duì)應(yīng)的內(nèi)容,到ChatGPT通過(guò)對(duì)話為人們梳理內(nèi)容,人工智能在理解和認(rèn)知文本上已經(jīng)獲得了巨大進(jìn)步。

我們可以從信息數(shù)據(jù)化這個(gè)維度,來(lái)理解近幾十年,與互聯(lián)網(wǎng)相關(guān)的各種商業(yè)模式和以后可能會(huì)出現(xiàn)的變化。

過(guò)去30年,互聯(lián)網(wǎng)最大貢獻(xiàn)之一,是把大量的文本信息變成了文本數(shù)據(jù)。

文本數(shù)據(jù)化過(guò)程中,最大的贏家和貢獻(xiàn)者是微軟。微軟借助鼠標(biāo)加鍵盤加圖形化操作系統(tǒng),讓足夠多的人把文本變成數(shù)據(jù)。

下一步,怎么滿足人們對(duì)于信息的需求?這方面的贏家就是門戶網(wǎng)站,國(guó)外最成功的公司之一就是雅虎。雅虎將已經(jīng)被數(shù)據(jù)化的文本信息,用人工的方法進(jìn)行編輯、分類。

上網(wǎng)的人越來(lái)越多,貢獻(xiàn)文本數(shù)據(jù)的人也越來(lái)越多,在這個(gè)基礎(chǔ)上就出現(xiàn)了BBS。論壇在中國(guó)尤為典型,大家在更小的版面內(nèi)進(jìn)行內(nèi)容生產(chǎn)和內(nèi)容消費(fèi)。

當(dāng)互聯(lián)網(wǎng)上文本數(shù)據(jù)太多了之后,搜索排序排得不好時(shí),甚至要在十幾頁(yè)后,用戶才能找到想要的信息。

這種情況下,從文本數(shù)據(jù)化供需關(guān)系上來(lái)看,社交網(wǎng)絡(luò)的出現(xiàn),提供了另外一個(gè)解決方案,就是提供了用戶想要的某類信息。比如海外的Facebook、Twitter,本土的人人網(wǎng)、新浪微博等平臺(tái),為用戶提供了海量、個(gè)性化的信息。

再后來(lái),文本數(shù)據(jù)化的程度、總量和規(guī)模到非常大時(shí),人工分類越來(lái)越難、越來(lái)越低效。這時(shí)就要機(jī)器介入,給有需求的人匹配最合適的內(nèi)容。

迭代的過(guò)程無(wú)非是這三件事,上層是數(shù)據(jù),中間是算法,底下是算力。被算法學(xué)習(xí)調(diào)教的主要對(duì)象——數(shù)據(jù)開(kāi)始大量增長(zhǎng),于是就給算法提升的訓(xùn)練空間越來(lái)越大。

在算法層面,典型的比較成功的應(yīng)用就是Google。Google 作為搜索引擎,有兩個(gè)非常有意思和重要的貢獻(xiàn)。

第一個(gè)貢獻(xiàn)是搜索框,它讓你把想要的東西抽象成一個(gè)詞或幾個(gè)詞,計(jì)算機(jī)得到了需求,再尋找所有現(xiàn)存的文本數(shù)據(jù)來(lái)匹配。

第二個(gè)貢獻(xiàn)是排序。在算法層面,可以找到各種各樣的詞,但哪個(gè)是跟你相關(guān)的、重要性高的?它引入了一個(gè)合理的認(rèn)知邏輯就是相關(guān)性排序。它這個(gè)相關(guān)性最早的時(shí)候跟科學(xué)論文一樣。李翔:是論文的引用次數(shù)。李豐:對(duì),相當(dāng)于網(wǎng)頁(yè)的鏈接次數(shù)。這種排序其實(shí)是有意思的進(jìn)步,和應(yīng)用貼合得很緊。

我們從最早的那個(gè)邏輯線開(kāi)始,是先完成了數(shù)據(jù)化,在某種意義上開(kāi)始進(jìn)入自動(dòng)化加部分的智能化。跳到今天的GPT,現(xiàn)在文本信息已經(jīng)有超高的比例和量被做成了文本數(shù)據(jù),跟 20 年前相比是巨大的量級(jí)飛躍,所以它訓(xùn)練出來(lái)的模型非常智能。

這件事還會(huì)再進(jìn)化嗎?

會(huì)的。這個(gè)過(guò)程中還有一個(gè)跟 Google 類似的變遷節(jié)點(diǎn)——注意力模型的引入。簡(jiǎn)單來(lái)講,可以把注意力模型理解為關(guān)注到特定部分,而不是整體,給予它不同的優(yōu)先級(jí)或者資源支持。

在先解決數(shù)字化,再解決部分意義上機(jī)器的自動(dòng)化、智能化的過(guò)程當(dāng)中,除了算法本身的數(shù)理邏輯演進(jìn)外,如果在這個(gè)過(guò)程中還有新的認(rèn)知邏輯被引入,加上底層算力的持續(xù)進(jìn)步,再加上更海量數(shù)據(jù)的不停訓(xùn)練,它就會(huì)產(chǎn)生出跳躍的小臺(tái)階。比如我們之前提到的Alphafold,不僅有算法層面的革新,還引入了生物、物理、化學(xué)等多領(lǐng)域知識(shí)。李翔:我想提供另外一種視角,來(lái)理解文本數(shù)字化的演進(jìn)過(guò)程。無(wú)論是從內(nèi)容生產(chǎn),還是內(nèi)容分發(fā)而言,我整個(gè)職業(yè)生涯都受到了文本數(shù)字化的沖擊。

從內(nèi)容生產(chǎn)角度,與紙媒相比,最開(kāi)始門戶時(shí)代的內(nèi)容生產(chǎn)者仍然是人,網(wǎng)站編輯把已經(jīng)生產(chǎn)出來(lái)的文本內(nèi)容數(shù)字化后,搬到網(wǎng)頁(yè)上。

往后演進(jìn),生產(chǎn)這一端就出現(xiàn)了大的變化?;ヂ?lián)網(wǎng)把內(nèi)容生產(chǎn)門檻降低了,用戶開(kāi)始生產(chǎn)內(nèi)容。這個(gè)時(shí)候也對(duì)應(yīng)出現(xiàn)了博客等新形態(tài)的內(nèi)容形式,門戶網(wǎng)站也開(kāi)始把博客內(nèi)容整合起來(lái)。AIGC出現(xiàn)之前,內(nèi)容生產(chǎn)仍然是機(jī)構(gòu)和個(gè)人。

分發(fā)方面,搜索把內(nèi)容重新組織,然后分發(fā)。又出現(xiàn)了通過(guò)社交關(guān)系分發(fā),也就是分發(fā)邏輯變成社交網(wǎng)絡(luò),然后出現(xiàn)了社交媒體的說(shuō)法,如微博、 Twitter。之后,變成了機(jī)器分發(fā),出現(xiàn)了今日頭條、抖音等。

如今內(nèi)容生產(chǎn)端又出現(xiàn)了一個(gè)特別大的躍遷,就是ChatGPT。它讓AI生產(chǎn)的內(nèi)容不再“小兒科”,不少人說(shuō)它在很多方面輸出的內(nèi)容已經(jīng)不輸本科生了。這種先進(jìn)的內(nèi)容生產(chǎn)方式,再跟先進(jìn)的內(nèi)容分發(fā)方式結(jié)合起來(lái),可能會(huì)出現(xiàn)非常先進(jìn)的商業(yè)模式。

/ 05 /數(shù)據(jù)化如何成就了蘋果、微信、抖音?

李豐:我們剛才講的底層全都是基于文本,某種意義上來(lái)看,比較重要和厲害的算法和模型還是要到視覺(jué)信息上。

剛才舉了注意力模型的例子。我們?cè)谔幚硪曈X(jué)信息的時(shí)候,顯然很好地運(yùn)用了注意力模型。一眼看過(guò)去,雖有無(wú)數(shù)東西,但我有焦點(diǎn),知道此刻最重要的事情、需要觀察的對(duì)象到底在哪里。這些“無(wú)意識(shí)”的行為,已經(jīng)需要比較復(fù)雜、高級(jí)的認(rèn)知。

沒(méi)有任何人天生就會(huì)打字,但在今天,小朋友直接用智能手機(jī)上的交互手段就能找到、做到他想要的事情,這和打字是完全不一樣的。拖拽、上下滑等手勢(shì)操控,相對(duì)于文本數(shù)據(jù)化過(guò)程中的打字。

最直接的變化就是,用戶依靠視覺(jué)可以理解的部分、用直覺(jué)控制就可以完成這個(gè)過(guò)程。

某種意義上,所有的算法、算力和數(shù)據(jù)的迭代,最難的部分還是要解決各種各樣跟視覺(jué)化有關(guān)的信息。

李翔:這也是當(dāng)時(shí)虛擬現(xiàn)實(shí),包括元宇宙概念出現(xiàn)后,那么多人非常興奮的一個(gè)重要原因。因?yàn)樗_實(shí)不是單純的一維文字互聯(lián)網(wǎng),也不是單純的二維視頻或圖片的互聯(lián)網(wǎng)。李豐:對(duì)。為什么當(dāng)我們把文本信息變成了數(shù)據(jù)之后,會(huì)產(chǎn)生這么多巨大無(wú)比的公司?因?yàn)樾畔⒌钠ヅ?,相?duì)于數(shù)據(jù)的匹配難很多。信息一旦被數(shù)據(jù)化之后,獲取信息的成本變得極其低或者幾乎為0,而信息的流動(dòng)性近乎無(wú)窮。

在這個(gè)基礎(chǔ)上,誰(shuí)能正向促進(jìn)或利用了流動(dòng)成本為0,而流動(dòng)性無(wú)窮大,并且在這里完成某種類型的普及或兩種中的任何一種撮合,都會(huì)成為超級(jí)厲害的公司。

再往下,到了熱鬧的移動(dòng)互聯(lián)網(wǎng)階段。智能手機(jī)增加了很多“諾基亞時(shí)代”沒(méi)有的東西,比如麥克風(fēng)陣列、跟聲音有關(guān)的芯片、背向光學(xué)可變焦高清攝像頭、GPS芯片……

這些東西是誰(shuí)先把它集成起來(lái)的?

蘋果。蘋果把原來(lái)沒(méi)有被數(shù)據(jù)化過(guò)的新信息——位置、較高質(zhì)量的音頻、較好的視覺(jué)信息變成數(shù)據(jù)。這個(gè)過(guò)程普及后,蘋果就和當(dāng)年微軟一樣,成為極其重要的節(jié)點(diǎn)。這是第一步。

第二步,我們知道的所有移動(dòng)互聯(lián)網(wǎng)上的超級(jí)應(yīng)用,沒(méi)有例外,大概率在發(fā)展中都借助了數(shù)據(jù)化的基礎(chǔ)設(shè)施。

今天的美團(tuán)來(lái)自于兩個(gè)公司,一個(gè)是大眾點(diǎn)評(píng),它讓中小商戶愿意把自己的信息變成數(shù)據(jù)放在互聯(lián)網(wǎng)上,另一個(gè)是美團(tuán),它讓消費(fèi)者把需求數(shù)據(jù)化。

微信則利用了超高質(zhì)量的通信數(shù)據(jù),或者叫語(yǔ)音數(shù)據(jù),進(jìn)行了語(yǔ)音數(shù)據(jù)在人和人之間的傳遞和匹配。

抖音通過(guò)高清光學(xué)攝像頭,把視覺(jué)信息變成了視覺(jué)數(shù)據(jù)。消費(fèi)者得到了完全不同的體驗(yàn),并且得到了高效的內(nèi)容供給與匹配。

我在10年前投過(guò)B站。我們?cè)诜治鯞站時(shí),有個(gè)有意思的現(xiàn)象,中國(guó)沒(méi)有自己的YouTube。當(dāng)時(shí),中國(guó)的視頻行業(yè)在人才供給和數(shù)據(jù)供給兩端都不成熟。而B(niǎo)站干回了文本數(shù)據(jù)化的事,除了底層影像之外,大家主要在當(dāng)時(shí)消費(fèi)的是彈幕,也就是文本數(shù)據(jù)。

/ 06 /醫(yī)療、自動(dòng)駕駛領(lǐng)域如何實(shí)現(xiàn)數(shù)據(jù)化?

未來(lái)會(huì)變成什么樣?

李豐:在醫(yī)療、自動(dòng)駕駛領(lǐng)域,也有典型的數(shù)據(jù)化的例子。

過(guò)去15年,我們可以簡(jiǎn)單總結(jié)為,新藥研發(fā)的主要進(jìn)展大多發(fā)生在腫瘤致病基因的發(fā)現(xiàn),以及腫瘤治療上。

這個(gè)過(guò)程是怎么發(fā)生的?它是由于第二代基因測(cè)序儀的發(fā)明與普及。

基因測(cè)序儀可以把基因信息變成基因數(shù)據(jù),完成對(duì)基因信息的數(shù)據(jù)化??茖W(xué)家們可以利用大量新出現(xiàn)的基因數(shù)據(jù),進(jìn)行科學(xué)發(fā)現(xiàn)。相當(dāng)于門戶網(wǎng)站把文本數(shù)據(jù)分門別類,供足夠多的消費(fèi)者來(lái)消費(fèi)和瀏覽。

醫(yī)療行業(yè)如果繼續(xù)在數(shù)據(jù)化這條線上演進(jìn),會(huì)出現(xiàn)哪幾種可能的趨勢(shì)?對(duì)于投資有什么樣的啟示?

我只想到了其中一部分。

第一,由于儀器設(shè)備的進(jìn)步,數(shù)據(jù)化能力的提升,人們會(huì)收集到更高通量、更快速度和更全面的信息。細(xì)胞中呈現(xiàn)出的細(xì)微差異,可能就是致病的決定因素。

峰瑞已投企業(yè)新格元Singleron所切入的單細(xì)胞測(cè)序,從單個(gè)細(xì)胞層面,發(fā)現(xiàn)基因的輕微變化。就像電腦,當(dāng)CPU變得越來(lái)越好之后,就能處理更精細(xì)、更復(fù)雜的信息。

第二,隨著醫(yī)療行業(yè)數(shù)據(jù)化程度提高,致力于發(fā)現(xiàn)數(shù)據(jù)之間關(guān)系的科學(xué)家可能就逐漸“不夠用了”。未來(lái),醫(yī)療行業(yè)會(huì)不會(huì)演進(jìn)到,計(jì)算機(jī)通過(guò)數(shù)據(jù)和算法,直接預(yù)測(cè)出基因組信息所揭示出的,和治療疾病有關(guān)的分子以及治療藥物的形態(tài)?

峰瑞已投企業(yè)晶泰科技、劑泰科技目前在制藥的部分環(huán)節(jié)利用了數(shù)據(jù)化,理想情況下是發(fā)展到全流程智能化的程度。

智能化意味著自覺(jué)地把所有數(shù)據(jù)都發(fā)現(xiàn)出來(lái)。就像互聯(lián)網(wǎng)的信息增多之后,出現(xiàn)了Google搜索平臺(tái),人們想找什么信息,平臺(tái)就提供什么。

第三,當(dāng)收集生命體征的數(shù)據(jù)設(shè)備越來(lái)越強(qiáng)之后,變得小型化、家用化、輕量化甚至隨身化。設(shè)備變化背后,會(huì)不會(huì)又能幫助我們收集新的數(shù)據(jù)類型?

隨著光電、微流控等技術(shù)的發(fā)展,智能手表已經(jīng)能測(cè)脈搏和血氧了。峰瑞已投企業(yè)心永科技,通過(guò)可穿戴設(shè)備,實(shí)現(xiàn)連續(xù)血壓檢測(cè)。彭博社記者爆料稱,蘋果可能將為Apple Watch配備無(wú)創(chuàng)血糖監(jiān)測(cè)功能。

當(dāng)信息設(shè)備從電腦轉(zhuǎn)向手機(jī),衍生出了很多新的模式。那么在醫(yī)療領(lǐng)域,生物體征信息的數(shù)據(jù)化,也會(huì)帶來(lái)商業(yè)模式的改變,就像基因測(cè)序儀給新藥研發(fā)行業(yè)帶來(lái)變革一樣。

生命體征數(shù)據(jù)化,還能助力解決中國(guó)的養(yǎng)老問(wèn)題。當(dāng)設(shè)備能夠及時(shí)監(jiān)測(cè)居家老人的健康狀態(tài),子女以及醫(yī)護(hù)人員就能按需而動(dòng),而不是全天要有人守著老人。

另一個(gè)有意思的例子,也是當(dāng)下熱門的領(lǐng)域——自動(dòng)駕駛。

從2015年開(kāi)始到今天,自動(dòng)駕駛?cè)匀幻媾R一定挑戰(zhàn),尤其是到L4以上級(jí)別的(L1到L3可以理解為“人機(jī)共駕”,L4則意味著無(wú)人駕駛)。其中有一部分原因是車上的智能化程度和傳感器都還不夠多,汽車系統(tǒng)無(wú)法充分掌握此刻的車、周圍的環(huán)境、其他的車輛是個(gè)什么狀況。

想象一下,如果今天我們把新車都裝上了很多傳感器,激光雷達(dá)的、視覺(jué)的、定位的……我們就把車狀態(tài)、路況、環(huán)境等大量信息進(jìn)行了數(shù)據(jù)化,算法和算力就可以在數(shù)據(jù)輸入、反饋、評(píng)價(jià)的基礎(chǔ)上,進(jìn)行迭代,從而實(shí)現(xiàn)自動(dòng)駕駛。

總結(jié)來(lái)看,無(wú)論是移動(dòng)互聯(lián)網(wǎng)里的美團(tuán)點(diǎn)評(píng)、微信、抖音,還是AI制藥、自動(dòng)駕駛,這些都是信息數(shù)據(jù)化的積累過(guò)程當(dāng)中出現(xiàn)的商業(yè)模式。我們可以用數(shù)據(jù)化這條線,來(lái)理解如今的超級(jí)應(yīng)用、超級(jí)公司。李翔:AIGC、ChatGPT,相當(dāng)于在內(nèi)容供給側(cè)發(fā)生了特別大的變化。幾乎每一次豐富供給、創(chuàng)造新供給、提高匹配效率,都會(huì)創(chuàng)造新的商業(yè)模式。李豐:回到剛才我們總結(jié)那個(gè)基礎(chǔ)邏輯上,要不然是在中早期的時(shí)候大規(guī)模地普及了某種信息的數(shù)據(jù)化,要不然就是在數(shù)據(jù)化的基礎(chǔ)完成之后,如何提高匹配效率。當(dāng)技術(shù)上的進(jìn)展不足以提高數(shù)據(jù)匹配效率時(shí),就用其他方法來(lái)提升效率。

微軟是普及文本數(shù)據(jù)化的最核心公司,如果回看當(dāng)初,除了瀏覽器,微軟應(yīng)該早些布局搜索。在這個(gè)基礎(chǔ)上,微軟加入跟谷歌的戰(zhàn)爭(zhēng),從勝率上來(lái)看,它有一定的基礎(chǔ)。

微軟也是這條發(fā)展軸上的關(guān)鍵玩家,不管是在雅虎的時(shí)代,還是在瀏覽器時(shí)代、搜索引擎時(shí)代,它都花了非常大力氣追趕。

但這些商業(yè)模式具有明顯的馬太效應(yīng),后來(lái)者往往很難超越。今天假定供需撮合模式在文本信息上有新的變化,微軟從數(shù)據(jù)總量以及其對(duì)這個(gè)軸上的事情的理解和積累來(lái)看,也許有機(jī)會(huì)重新做成文本數(shù)據(jù)撮合效率這條主軸上的關(guān)鍵公司。李翔:微軟的厲害之處在于始終在這條軸線上,即使不是那個(gè)領(lǐng)先者,也始終跟在后面。

/ 07 /Web3和區(qū)塊鏈熱潮之后,沉淀了什么?

李豐:談到Web3和區(qū)塊鏈,我比較關(guān)注的是,在這一輪熱潮之后,到底沉淀了什么?

10多年前,投資Coinbase和Ripple天使輪時(shí),我在IDG內(nèi)部做了兩次PPT,來(lái)講一個(gè)邏輯——為什么要投數(shù)字貨幣?

答案比較明確,我們往后無(wú)窮遠(yuǎn)地想,越來(lái)越多的東西被數(shù)據(jù)化之后,在某一個(gè)行業(yè)或者在某一個(gè)鏈條上幾乎都高度數(shù)據(jù)化之后,數(shù)據(jù)化就不僅僅只是解決信息匹配,它很有可能要解決權(quán)益的流動(dòng)、交易的問(wèn)題。

在這種情況下,以往分配利益或者進(jìn)行交易、結(jié)算的機(jī)制,就會(huì)出現(xiàn)效率上的問(wèn)題。

直到這一輪之前,數(shù)字貨幣領(lǐng)域,在今天被認(rèn)為還比較成功的公司,大多都存在于數(shù)字貨幣交易的閉環(huán)里。不管你做的是錢包、交易還是提供交易撮合的工具或金融產(chǎn)品,數(shù)字貨幣以及交易本身就是全數(shù)字化的閉環(huán),最容易用到數(shù)字化和新結(jié)算方法。

2013年,硅谷涌起了第一波數(shù)字貨幣浪潮,無(wú)數(shù)創(chuàng)業(yè)公司在嘗試把各種各樣的事情,有的甚至想把比特幣提款機(jī)做成商業(yè)模式。

但后來(lái)一些公司沒(méi)能得到發(fā)展,主要因?yàn)樗鼈兪亲觥鞍腴_(kāi)環(huán)”的應(yīng)用。某些環(huán)節(jié)需要人為強(qiáng)行地,把線下的某些東西轉(zhuǎn)換到線上來(lái)。在半開(kāi)環(huán)的商業(yè)模式中,除了效率、成本等問(wèn)題,還有誠(chéng)信等問(wèn)題。

今天看Web3,我們往最遠(yuǎn)處想,如果最終有足夠多的行業(yè)、鏈條數(shù)字化程度足夠高,交易之外,組織管理、溝通形態(tài)這些,從效率和成本上看,也會(huì)跟當(dāng)下不一樣。所有這些高度數(shù)字化的行業(yè)中,就會(huì)用新的公司形態(tài)、新的管理方法、新的溝通工具,也會(huì)用新的交易和交換以及權(quán)益方法。

10多年前,我非常難解釋虛擬貨幣到底是怎么回事時(shí),用的一個(gè)例子是P2P下載。P2P下載就是借別人的計(jì)算機(jī)暫時(shí)不用的算力,當(dāng)成一個(gè)并行下載的節(jié)點(diǎn),來(lái)加速下載,極度地節(jié)省了網(wǎng)絡(luò)資源、提高了下載速度,迅雷就是其中的典型公司。

但P2P下載沒(méi)有誕生出成功的大公司,部分原因是它沒(méi)法確立經(jīng)濟(jì)利益模式:貢獻(xiàn)的算力、得到的東西很難被正確和完整地衡量經(jīng)濟(jì)價(jià)值。所以最后很多這類應(yīng)用最終變成了盜版下載工具,因?yàn)椴缓米匪荨?/p>

如果數(shù)字貨幣早發(fā)生10年,那當(dāng)時(shí)的P2P下載就可以完美使用數(shù)字貨幣,利用去中心化結(jié)算方法來(lái)進(jìn)行的新交易、新商業(yè)模式。它能夠瞬間完成大量的計(jì)量結(jié)算,并且在貢獻(xiàn)發(fā)生時(shí),就把錢給了貢獻(xiàn)者。這種事在任何一個(gè)現(xiàn)實(shí)世界里,都很難出現(xiàn),所以這是個(gè)小閉環(huán)。李翔:我有時(shí)候也在想,有了數(shù)字貨幣和區(qū)塊鏈技術(shù)之后,我們就可以給那些以往沒(méi)辦法去激勵(lì)貢獻(xiàn)值的一方給予激勵(lì)。但有時(shí)候也會(huì)想,如果維基百科已經(jīng)應(yīng)用了數(shù)字貨幣和區(qū)塊鏈技術(shù),給它的內(nèi)容貢獻(xiàn)者以激勵(lì),很有可能是不是就不會(huì)再有維基百科了?李豐:第一,很多行業(yè)、模式一旦進(jìn)入了閉環(huán)數(shù)字化或者全鏈條數(shù)字化之后,它確實(shí)有壟斷性,變成了越大越好,越好越大。

第二,一旦進(jìn)入數(shù)據(jù)化之后,它權(quán)益的分配、交易的確認(rèn)、組織管理和溝通協(xié)調(diào)等所有的機(jī)制都可能發(fā)生變化,來(lái)匹配這個(gè)難以想象的效率提升。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

為什么今天出現(xiàn)了ChatGPT?往后還會(huì)發(fā)生什么?

還有機(jī)會(huì)做中國(guó)版的OpneAI嗎?

界面新聞|范劍磊

編輯|峰瑞資本

這篇專欄出自李翔和豐叔在「高能量」播客的一次深度對(duì)話。李翔是《詳談》叢書(shū)主理人,得到App總編輯。

對(duì)話發(fā)生在4月中旬,負(fù)責(zé)數(shù)據(jù)基礎(chǔ)制度建設(shè)的國(guó)家數(shù)據(jù)局成立一月有余,科技巨頭間的AI競(jìng)賽日趨白熱化。

在此背景下,李翔和豐叔暢談一個(gè)多小時(shí),從文本信息數(shù)據(jù)化說(shuō)起,以數(shù)據(jù)化為線串起了互聯(lián)網(wǎng)的過(guò)去三十年,并試圖解答關(guān)于ChatGPT的一些熱點(diǎn)問(wèn)題:

為什么現(xiàn)在出現(xiàn)了ChatGPT?往后還會(huì)發(fā)生什么?

在ChatGPT這個(gè)鏈條上會(huì)有哪些重要公司?創(chuàng)業(yè)公司還有機(jī)會(huì)嗎?

還有機(jī)會(huì)做出中國(guó)的OpenAI嗎?

第一波人工智能浪潮興起后,有留下什么好的“遺產(chǎn)”嗎?

醫(yī)療、自動(dòng)駕駛領(lǐng)域如何實(shí)現(xiàn)數(shù)據(jù)化?未來(lái)會(huì)變成什么樣?

Web3和區(qū)塊鏈熱潮之后,沉淀了什么?

對(duì)話過(guò)去已逾半月,據(jù)第一財(cái)經(jīng)5月6日消息,包括百度、阿里、華為、商湯以及科大訊飛等在內(nèi),中國(guó)目前有40多家企業(yè)布局了大模型。膠著競(jìng)爭(zhēng)下,誰(shuí)能成為這一鏈條的關(guān)鍵公司?

/ 01 /在ChatGPT這個(gè)鏈條上,會(huì)“長(zhǎng)”出哪些重要的公司?

李翔:從你的視角來(lái)看 ,在ChatGPT這個(gè)鏈條上,會(huì)有哪些重要的公司?只從新聞來(lái)看,它可能有OpenAI這樣的開(kāi)發(fā)模型公司,也可能有英偉達(dá)這樣提供芯片跟算力的公司。李豐:今天來(lái)看肯定還是這三類:數(shù)據(jù)、算法和算力。但是最終,他們?cè)趹?yīng)用層會(huì)演化成不同的東西,應(yīng)用層的東西通常比提供基礎(chǔ)設(shè)施的要更大一些,壟斷效應(yīng)更強(qiáng)一些。

大模型做好做大不容易,如果有的話肯定會(huì)是好的應(yīng)用,但它們其實(shí)作為生產(chǎn)力工具,更容易在垂直領(lǐng)域被結(jié)合出來(lái),尤其是需要用對(duì)話流加上博覽群書(shū)的專業(yè)抽象內(nèi)容來(lái)提供服務(wù)的公司。

比如說(shuō),我們投資了專注做在線心理咨詢服務(wù)的Glowe閣樓,線上的心理咨詢師通過(guò)和用戶聊天,為用戶提供基礎(chǔ)的心理咨詢服務(wù)。這大概就是通過(guò)博覽群書(shū)的對(duì)話流專業(yè)服務(wù)來(lái)解決問(wèn)題。

又比如說(shuō)可以做金融服務(wù),因?yàn)檫@里需要非常專業(yè)的理財(cái)師,跟用戶進(jìn)行無(wú)微不至的談話,一段時(shí)間之后才把用戶隱藏需求比較具象地挖掘出來(lái)。

它會(huì)不會(huì)出現(xiàn)像搜索引擎,但又不是搜索引擎,并且提供廣義文本信息、供需匹配更高效率的商業(yè)模式?也許會(huì)有,如果有了,就具有絕對(duì)優(yōu)勢(shì)。李翔:微軟必應(yīng)也在做這樣的嘗試。李豐:對(duì)。有個(gè)有意思的話題,從搜索引擎到頭條到抖音,本質(zhì)上都是文本數(shù)據(jù)的供需匹配。

但是頭條能做成的最大原因,是交互形態(tài)的改變和新設(shè)備的大規(guī)模普及,使輸入和使用場(chǎng)景都跟上一代(如PC、筆記本電腦)有極大的差別。上一代的人沒(méi)轉(zhuǎn)過(guò)來(lái),百度當(dāng)時(shí)轉(zhuǎn)慢了,才給了頭條這個(gè)機(jī)會(huì)。

這個(gè)“新”是指用戶交互方式的變化、屏幕的變化、物理鍵盤的消失、移動(dòng)場(chǎng)景下多窗口切換以及輸入不方便等。所有這些因素造成了用戶使用拖拉或點(diǎn)選的方式,而不是用鍵盤輸入關(guān)鍵詞,來(lái)進(jìn)行了信息篩選。

在此基礎(chǔ)上,一個(gè)新的文本信息供需匹配的商業(yè)模式出現(xiàn)了(我們會(huì)在下文詳細(xì)展開(kāi)在互聯(lián)網(wǎng)發(fā)展的過(guò)程中,由新變化帶來(lái)的新的商業(yè)模式)。如果要再做一個(gè),下一個(gè)應(yīng)該不會(huì)以相同的搜索形態(tài)出現(xiàn)。

/ 02 /還有機(jī)會(huì)做出中國(guó)的OpenAI嗎?

李翔:現(xiàn)在越來(lái)越多的大公司入局,也會(huì)有一些比較成功的創(chuàng)業(yè)者想要做中國(guó)的OpenAI,這些創(chuàng)業(yè)公司還會(huì)有機(jī)會(huì)嗎?李豐:這其中存在幾個(gè)關(guān)鍵要素是變量。

第一個(gè)變量是,會(huì)不會(huì)有好版本的開(kāi)源?

硬幣有兩面。在巨頭激烈競(jìng)爭(zhēng)的時(shí)候,反而會(huì)有更多更好版本的開(kāi)源模型出現(xiàn),這個(gè)時(shí)候,應(yīng)用就會(huì)變得更突出一些。

不做激烈的模型競(jìng)爭(zhēng),把開(kāi)源的模型拿過(guò)來(lái),站在巨人肩膀上,在自己專業(yè)領(lǐng)域范圍經(jīng)過(guò)適當(dāng)調(diào)整、訓(xùn)練和加工,把它變成專業(yè)服務(wù)勞動(dòng)力中的一個(gè)生產(chǎn)力工具,并不能完全把人替代掉。

我們還需要考慮的是,在非算法邏輯的認(rèn)知邏輯上,有沒(méi)有加新的“一小跳”的東西?

這一小跳通常是一層窗戶紙?;剡^(guò)頭來(lái)看,搜索框就是當(dāng)時(shí)的一小跳,它將當(dāng)時(shí)已經(jīng)成熟的用戶習(xí)慣和設(shè)備,結(jié)合當(dāng)時(shí)的算力和算法,相對(duì)準(zhǔn)確地匹配用戶和需求。

比如Alphafold,能夠根據(jù)人們“投喂”的數(shù)據(jù),智能預(yù)測(cè)蛋白質(zhì)的結(jié)構(gòu)。對(duì)于Alphafold來(lái)說(shuō),除了要考慮分子熱力學(xué)模型之外,還要基于生物、化學(xué)、物理等層面的內(nèi)容,來(lái)理解分子的結(jié)構(gòu)。

在算法層面之外,Alphafold這個(gè)模型在認(rèn)知層面有了迭代,能夠更好地近似和模擬分子結(jié)構(gòu)?,F(xiàn)在大家對(duì)Alphafold提供的預(yù)測(cè)結(jié)果瞠目結(jié)舌,因?yàn)樗咏诎l(fā)現(xiàn)了人們未曾發(fā)現(xiàn)過(guò)的蛋白質(zhì)結(jié)構(gòu)。李翔:打個(gè)比方,你說(shuō)電動(dòng)車到底難不難,你說(shuō)它不難,很難解釋說(shuō)特斯拉之前就一直沒(méi)有人把這個(gè)事情證明是可行的、靠譜的。你說(shuō)它很難,你也解釋不了特斯拉之后,中國(guó)出現(xiàn)了“蔚小理”。李豐:這個(gè)例子也合適,雖然它更像是物理科技。這里邊需要有非常多的非算法知識(shí)和某些抽象層面的認(rèn)知邏輯進(jìn)到了算法里并且融合成算法,使它進(jìn)步。這些事情非??珙I(lǐng)域、跨知識(shí),需要靈感,要求非常高。

/ 03 /人工智能的浪潮后,有留下什么好的“遺產(chǎn)”嗎?

李翔:2016年前后有一波人工智能浪潮,很多資金投入到這個(gè)行業(yè),也出現(xiàn)了很多優(yōu)秀的人工智能創(chuàng)業(yè)公司。今天來(lái)看,大量資金投入后,有留下什么好的遺產(chǎn)嗎?李豐:在技術(shù)出現(xiàn)新的投資浪潮時(shí),我們簡(jiǎn)單把它總結(jié)為兩波,第一波叫“值錢的時(shí)候不賺錢”,第二波叫“賺錢的時(shí)候不值錢”。

我們以大數(shù)據(jù)行業(yè)為例。2012-2013年,不管是在美國(guó)還是在中國(guó),大數(shù)據(jù)都是超級(jí)熱的投資概念。今天大數(shù)據(jù)已經(jīng)不時(shí)髦了,但經(jīng)過(guò)這10年的發(fā)展,大數(shù)據(jù)行業(yè)具有了一定規(guī)模,并且有些公司比較賺錢,存活下來(lái)了。

一個(gè)新技術(shù)發(fā)生并且變成投資熱潮的時(shí)候,往往是它不賺錢的時(shí)候。等它嵌到應(yīng)用場(chǎng)景里,這個(gè)技術(shù)的普及性就提高了,變成了某種意義上的生產(chǎn)力工具,就值錢了。比如最早發(fā)明電的時(shí)候,大家可以無(wú)限想象,但當(dāng)時(shí)很難落地。愛(ài)迪生發(fā)明出電燈泡后,當(dāng)它賺很多錢且普及開(kāi)來(lái)的時(shí)候,電燈泡已不是令人激動(dòng)的技術(shù)創(chuàng)新了。李翔:?jiǎn)渭兙虶PT和大模型而言,投資界對(duì)它的態(tài)度是什么樣的?李豐:一部分投資人對(duì)之賦予了巨大的熱情和信任,還付諸了行動(dòng);一部分投資人對(duì)之持整體偏保守和冷靜的態(tài)度;還有一部分比較積極且縝密地在看,但是還沒(méi)有到說(shuō)服自己過(guò)投資門檻的程度。不同態(tài)度的投資人可能差不多各占1/ 3。

/ 04 /從數(shù)據(jù)化這個(gè)維度來(lái)看,為什么今天出現(xiàn)了ChatGPT?

往后還會(huì)發(fā)生什么?

李豐:我們?cè)谕顿Y時(shí),經(jīng)常會(huì)關(guān)注“為什么是今天”、“為什么發(fā)生了”以及“往后還會(huì)發(fā)生什么”。那么GPT是如何一路走到今天的?

從谷歌開(kāi)始用搜索關(guān)鍵詞為用戶尋找對(duì)應(yīng)的內(nèi)容,到ChatGPT通過(guò)對(duì)話為人們梳理內(nèi)容,人工智能在理解和認(rèn)知文本上已經(jīng)獲得了巨大進(jìn)步。

我們可以從信息數(shù)據(jù)化這個(gè)維度,來(lái)理解近幾十年,與互聯(lián)網(wǎng)相關(guān)的各種商業(yè)模式和以后可能會(huì)出現(xiàn)的變化。

過(guò)去30年,互聯(lián)網(wǎng)最大貢獻(xiàn)之一,是把大量的文本信息變成了文本數(shù)據(jù)。

文本數(shù)據(jù)化過(guò)程中,最大的贏家和貢獻(xiàn)者是微軟。微軟借助鼠標(biāo)加鍵盤加圖形化操作系統(tǒng),讓足夠多的人把文本變成數(shù)據(jù)。

下一步,怎么滿足人們對(duì)于信息的需求?這方面的贏家就是門戶網(wǎng)站,國(guó)外最成功的公司之一就是雅虎。雅虎將已經(jīng)被數(shù)據(jù)化的文本信息,用人工的方法進(jìn)行編輯、分類。

上網(wǎng)的人越來(lái)越多,貢獻(xiàn)文本數(shù)據(jù)的人也越來(lái)越多,在這個(gè)基礎(chǔ)上就出現(xiàn)了BBS。論壇在中國(guó)尤為典型,大家在更小的版面內(nèi)進(jìn)行內(nèi)容生產(chǎn)和內(nèi)容消費(fèi)。

當(dāng)互聯(lián)網(wǎng)上文本數(shù)據(jù)太多了之后,搜索排序排得不好時(shí),甚至要在十幾頁(yè)后,用戶才能找到想要的信息。

這種情況下,從文本數(shù)據(jù)化供需關(guān)系上來(lái)看,社交網(wǎng)絡(luò)的出現(xiàn),提供了另外一個(gè)解決方案,就是提供了用戶想要的某類信息。比如海外的Facebook、Twitter,本土的人人網(wǎng)、新浪微博等平臺(tái),為用戶提供了海量、個(gè)性化的信息。

再后來(lái),文本數(shù)據(jù)化的程度、總量和規(guī)模到非常大時(shí),人工分類越來(lái)越難、越來(lái)越低效。這時(shí)就要機(jī)器介入,給有需求的人匹配最合適的內(nèi)容。

迭代的過(guò)程無(wú)非是這三件事,上層是數(shù)據(jù),中間是算法,底下是算力。被算法學(xué)習(xí)調(diào)教的主要對(duì)象——數(shù)據(jù)開(kāi)始大量增長(zhǎng),于是就給算法提升的訓(xùn)練空間越來(lái)越大。

在算法層面,典型的比較成功的應(yīng)用就是Google。Google 作為搜索引擎,有兩個(gè)非常有意思和重要的貢獻(xiàn)。

第一個(gè)貢獻(xiàn)是搜索框,它讓你把想要的東西抽象成一個(gè)詞或幾個(gè)詞,計(jì)算機(jī)得到了需求,再尋找所有現(xiàn)存的文本數(shù)據(jù)來(lái)匹配。

第二個(gè)貢獻(xiàn)是排序。在算法層面,可以找到各種各樣的詞,但哪個(gè)是跟你相關(guān)的、重要性高的?它引入了一個(gè)合理的認(rèn)知邏輯就是相關(guān)性排序。它這個(gè)相關(guān)性最早的時(shí)候跟科學(xué)論文一樣。李翔:是論文的引用次數(shù)。李豐:對(duì),相當(dāng)于網(wǎng)頁(yè)的鏈接次數(shù)。這種排序其實(shí)是有意思的進(jìn)步,和應(yīng)用貼合得很緊。

我們從最早的那個(gè)邏輯線開(kāi)始,是先完成了數(shù)據(jù)化,在某種意義上開(kāi)始進(jìn)入自動(dòng)化加部分的智能化。跳到今天的GPT,現(xiàn)在文本信息已經(jīng)有超高的比例和量被做成了文本數(shù)據(jù),跟 20 年前相比是巨大的量級(jí)飛躍,所以它訓(xùn)練出來(lái)的模型非常智能。

這件事還會(huì)再進(jìn)化嗎?

會(huì)的。這個(gè)過(guò)程中還有一個(gè)跟 Google 類似的變遷節(jié)點(diǎn)——注意力模型的引入。簡(jiǎn)單來(lái)講,可以把注意力模型理解為關(guān)注到特定部分,而不是整體,給予它不同的優(yōu)先級(jí)或者資源支持。

在先解決數(shù)字化,再解決部分意義上機(jī)器的自動(dòng)化、智能化的過(guò)程當(dāng)中,除了算法本身的數(shù)理邏輯演進(jìn)外,如果在這個(gè)過(guò)程中還有新的認(rèn)知邏輯被引入,加上底層算力的持續(xù)進(jìn)步,再加上更海量數(shù)據(jù)的不停訓(xùn)練,它就會(huì)產(chǎn)生出跳躍的小臺(tái)階。比如我們之前提到的Alphafold,不僅有算法層面的革新,還引入了生物、物理、化學(xué)等多領(lǐng)域知識(shí)。李翔:我想提供另外一種視角,來(lái)理解文本數(shù)字化的演進(jìn)過(guò)程。無(wú)論是從內(nèi)容生產(chǎn),還是內(nèi)容分發(fā)而言,我整個(gè)職業(yè)生涯都受到了文本數(shù)字化的沖擊。

從內(nèi)容生產(chǎn)角度,與紙媒相比,最開(kāi)始門戶時(shí)代的內(nèi)容生產(chǎn)者仍然是人,網(wǎng)站編輯把已經(jīng)生產(chǎn)出來(lái)的文本內(nèi)容數(shù)字化后,搬到網(wǎng)頁(yè)上。

往后演進(jìn),生產(chǎn)這一端就出現(xiàn)了大的變化?;ヂ?lián)網(wǎng)把內(nèi)容生產(chǎn)門檻降低了,用戶開(kāi)始生產(chǎn)內(nèi)容。這個(gè)時(shí)候也對(duì)應(yīng)出現(xiàn)了博客等新形態(tài)的內(nèi)容形式,門戶網(wǎng)站也開(kāi)始把博客內(nèi)容整合起來(lái)。AIGC出現(xiàn)之前,內(nèi)容生產(chǎn)仍然是機(jī)構(gòu)和個(gè)人。

分發(fā)方面,搜索把內(nèi)容重新組織,然后分發(fā)。又出現(xiàn)了通過(guò)社交關(guān)系分發(fā),也就是分發(fā)邏輯變成社交網(wǎng)絡(luò),然后出現(xiàn)了社交媒體的說(shuō)法,如微博、 Twitter。之后,變成了機(jī)器分發(fā),出現(xiàn)了今日頭條、抖音等。

如今內(nèi)容生產(chǎn)端又出現(xiàn)了一個(gè)特別大的躍遷,就是ChatGPT。它讓AI生產(chǎn)的內(nèi)容不再“小兒科”,不少人說(shuō)它在很多方面輸出的內(nèi)容已經(jīng)不輸本科生了。這種先進(jìn)的內(nèi)容生產(chǎn)方式,再跟先進(jìn)的內(nèi)容分發(fā)方式結(jié)合起來(lái),可能會(huì)出現(xiàn)非常先進(jìn)的商業(yè)模式。

/ 05 /數(shù)據(jù)化如何成就了蘋果、微信、抖音?

李豐:我們剛才講的底層全都是基于文本,某種意義上來(lái)看,比較重要和厲害的算法和模型還是要到視覺(jué)信息上。

剛才舉了注意力模型的例子。我們?cè)谔幚硪曈X(jué)信息的時(shí)候,顯然很好地運(yùn)用了注意力模型。一眼看過(guò)去,雖有無(wú)數(shù)東西,但我有焦點(diǎn),知道此刻最重要的事情、需要觀察的對(duì)象到底在哪里。這些“無(wú)意識(shí)”的行為,已經(jīng)需要比較復(fù)雜、高級(jí)的認(rèn)知。

沒(méi)有任何人天生就會(huì)打字,但在今天,小朋友直接用智能手機(jī)上的交互手段就能找到、做到他想要的事情,這和打字是完全不一樣的。拖拽、上下滑等手勢(shì)操控,相對(duì)于文本數(shù)據(jù)化過(guò)程中的打字。

最直接的變化就是,用戶依靠視覺(jué)可以理解的部分、用直覺(jué)控制就可以完成這個(gè)過(guò)程。

某種意義上,所有的算法、算力和數(shù)據(jù)的迭代,最難的部分還是要解決各種各樣跟視覺(jué)化有關(guān)的信息。

李翔:這也是當(dāng)時(shí)虛擬現(xiàn)實(shí),包括元宇宙概念出現(xiàn)后,那么多人非常興奮的一個(gè)重要原因。因?yàn)樗_實(shí)不是單純的一維文字互聯(lián)網(wǎng),也不是單純的二維視頻或圖片的互聯(lián)網(wǎng)。李豐:對(duì)。為什么當(dāng)我們把文本信息變成了數(shù)據(jù)之后,會(huì)產(chǎn)生這么多巨大無(wú)比的公司?因?yàn)樾畔⒌钠ヅ洌鄬?duì)于數(shù)據(jù)的匹配難很多。信息一旦被數(shù)據(jù)化之后,獲取信息的成本變得極其低或者幾乎為0,而信息的流動(dòng)性近乎無(wú)窮。

在這個(gè)基礎(chǔ)上,誰(shuí)能正向促進(jìn)或利用了流動(dòng)成本為0,而流動(dòng)性無(wú)窮大,并且在這里完成某種類型的普及或兩種中的任何一種撮合,都會(huì)成為超級(jí)厲害的公司。

再往下,到了熱鬧的移動(dòng)互聯(lián)網(wǎng)階段。智能手機(jī)增加了很多“諾基亞時(shí)代”沒(méi)有的東西,比如麥克風(fēng)陣列、跟聲音有關(guān)的芯片、背向光學(xué)可變焦高清攝像頭、GPS芯片……

這些東西是誰(shuí)先把它集成起來(lái)的?

蘋果。蘋果把原來(lái)沒(méi)有被數(shù)據(jù)化過(guò)的新信息——位置、較高質(zhì)量的音頻、較好的視覺(jué)信息變成數(shù)據(jù)。這個(gè)過(guò)程普及后,蘋果就和當(dāng)年微軟一樣,成為極其重要的節(jié)點(diǎn)。這是第一步。

第二步,我們知道的所有移動(dòng)互聯(lián)網(wǎng)上的超級(jí)應(yīng)用,沒(méi)有例外,大概率在發(fā)展中都借助了數(shù)據(jù)化的基礎(chǔ)設(shè)施。

今天的美團(tuán)來(lái)自于兩個(gè)公司,一個(gè)是大眾點(diǎn)評(píng),它讓中小商戶愿意把自己的信息變成數(shù)據(jù)放在互聯(lián)網(wǎng)上,另一個(gè)是美團(tuán),它讓消費(fèi)者把需求數(shù)據(jù)化。

微信則利用了超高質(zhì)量的通信數(shù)據(jù),或者叫語(yǔ)音數(shù)據(jù),進(jìn)行了語(yǔ)音數(shù)據(jù)在人和人之間的傳遞和匹配。

抖音通過(guò)高清光學(xué)攝像頭,把視覺(jué)信息變成了視覺(jué)數(shù)據(jù)。消費(fèi)者得到了完全不同的體驗(yàn),并且得到了高效的內(nèi)容供給與匹配。

我在10年前投過(guò)B站。我們?cè)诜治鯞站時(shí),有個(gè)有意思的現(xiàn)象,中國(guó)沒(méi)有自己的YouTube。當(dāng)時(shí),中國(guó)的視頻行業(yè)在人才供給和數(shù)據(jù)供給兩端都不成熟。而B(niǎo)站干回了文本數(shù)據(jù)化的事,除了底層影像之外,大家主要在當(dāng)時(shí)消費(fèi)的是彈幕,也就是文本數(shù)據(jù)。

/ 06 /醫(yī)療、自動(dòng)駕駛領(lǐng)域如何實(shí)現(xiàn)數(shù)據(jù)化?

未來(lái)會(huì)變成什么樣?

李豐:在醫(yī)療、自動(dòng)駕駛領(lǐng)域,也有典型的數(shù)據(jù)化的例子。

過(guò)去15年,我們可以簡(jiǎn)單總結(jié)為,新藥研發(fā)的主要進(jìn)展大多發(fā)生在腫瘤致病基因的發(fā)現(xiàn),以及腫瘤治療上。

這個(gè)過(guò)程是怎么發(fā)生的?它是由于第二代基因測(cè)序儀的發(fā)明與普及。

基因測(cè)序儀可以把基因信息變成基因數(shù)據(jù),完成對(duì)基因信息的數(shù)據(jù)化??茖W(xué)家們可以利用大量新出現(xiàn)的基因數(shù)據(jù),進(jìn)行科學(xué)發(fā)現(xiàn)。相當(dāng)于門戶網(wǎng)站把文本數(shù)據(jù)分門別類,供足夠多的消費(fèi)者來(lái)消費(fèi)和瀏覽。

醫(yī)療行業(yè)如果繼續(xù)在數(shù)據(jù)化這條線上演進(jìn),會(huì)出現(xiàn)哪幾種可能的趨勢(shì)?對(duì)于投資有什么樣的啟示?

我只想到了其中一部分。

第一,由于儀器設(shè)備的進(jìn)步,數(shù)據(jù)化能力的提升,人們會(huì)收集到更高通量、更快速度和更全面的信息。細(xì)胞中呈現(xiàn)出的細(xì)微差異,可能就是致病的決定因素。

峰瑞已投企業(yè)新格元Singleron所切入的單細(xì)胞測(cè)序,從單個(gè)細(xì)胞層面,發(fā)現(xiàn)基因的輕微變化。就像電腦,當(dāng)CPU變得越來(lái)越好之后,就能處理更精細(xì)、更復(fù)雜的信息。

第二,隨著醫(yī)療行業(yè)數(shù)據(jù)化程度提高,致力于發(fā)現(xiàn)數(shù)據(jù)之間關(guān)系的科學(xué)家可能就逐漸“不夠用了”。未來(lái),醫(yī)療行業(yè)會(huì)不會(huì)演進(jìn)到,計(jì)算機(jī)通過(guò)數(shù)據(jù)和算法,直接預(yù)測(cè)出基因組信息所揭示出的,和治療疾病有關(guān)的分子以及治療藥物的形態(tài)?

峰瑞已投企業(yè)晶泰科技、劑泰科技目前在制藥的部分環(huán)節(jié)利用了數(shù)據(jù)化,理想情況下是發(fā)展到全流程智能化的程度。

智能化意味著自覺(jué)地把所有數(shù)據(jù)都發(fā)現(xiàn)出來(lái)。就像互聯(lián)網(wǎng)的信息增多之后,出現(xiàn)了Google搜索平臺(tái),人們想找什么信息,平臺(tái)就提供什么。

第三,當(dāng)收集生命體征的數(shù)據(jù)設(shè)備越來(lái)越強(qiáng)之后,變得小型化、家用化、輕量化甚至隨身化。設(shè)備變化背后,會(huì)不會(huì)又能幫助我們收集新的數(shù)據(jù)類型?

隨著光電、微流控等技術(shù)的發(fā)展,智能手表已經(jīng)能測(cè)脈搏和血氧了。峰瑞已投企業(yè)心永科技,通過(guò)可穿戴設(shè)備,實(shí)現(xiàn)連續(xù)血壓檢測(cè)。彭博社記者爆料稱,蘋果可能將為Apple Watch配備無(wú)創(chuàng)血糖監(jiān)測(cè)功能。

當(dāng)信息設(shè)備從電腦轉(zhuǎn)向手機(jī),衍生出了很多新的模式。那么在醫(yī)療領(lǐng)域,生物體征信息的數(shù)據(jù)化,也會(huì)帶來(lái)商業(yè)模式的改變,就像基因測(cè)序儀給新藥研發(fā)行業(yè)帶來(lái)變革一樣。

生命體征數(shù)據(jù)化,還能助力解決中國(guó)的養(yǎng)老問(wèn)題。當(dāng)設(shè)備能夠及時(shí)監(jiān)測(cè)居家老人的健康狀態(tài),子女以及醫(yī)護(hù)人員就能按需而動(dòng),而不是全天要有人守著老人。

另一個(gè)有意思的例子,也是當(dāng)下熱門的領(lǐng)域——自動(dòng)駕駛。

從2015年開(kāi)始到今天,自動(dòng)駕駛?cè)匀幻媾R一定挑戰(zhàn),尤其是到L4以上級(jí)別的(L1到L3可以理解為“人機(jī)共駕”,L4則意味著無(wú)人駕駛)。其中有一部分原因是車上的智能化程度和傳感器都還不夠多,汽車系統(tǒng)無(wú)法充分掌握此刻的車、周圍的環(huán)境、其他的車輛是個(gè)什么狀況。

想象一下,如果今天我們把新車都裝上了很多傳感器,激光雷達(dá)的、視覺(jué)的、定位的……我們就把車狀態(tài)、路況、環(huán)境等大量信息進(jìn)行了數(shù)據(jù)化,算法和算力就可以在數(shù)據(jù)輸入、反饋、評(píng)價(jià)的基礎(chǔ)上,進(jìn)行迭代,從而實(shí)現(xiàn)自動(dòng)駕駛。

總結(jié)來(lái)看,無(wú)論是移動(dòng)互聯(lián)網(wǎng)里的美團(tuán)點(diǎn)評(píng)、微信、抖音,還是AI制藥、自動(dòng)駕駛,這些都是信息數(shù)據(jù)化的積累過(guò)程當(dāng)中出現(xiàn)的商業(yè)模式。我們可以用數(shù)據(jù)化這條線,來(lái)理解如今的超級(jí)應(yīng)用、超級(jí)公司。李翔:AIGC、ChatGPT,相當(dāng)于在內(nèi)容供給側(cè)發(fā)生了特別大的變化。幾乎每一次豐富供給、創(chuàng)造新供給、提高匹配效率,都會(huì)創(chuàng)造新的商業(yè)模式。李豐:回到剛才我們總結(jié)那個(gè)基礎(chǔ)邏輯上,要不然是在中早期的時(shí)候大規(guī)模地普及了某種信息的數(shù)據(jù)化,要不然就是在數(shù)據(jù)化的基礎(chǔ)完成之后,如何提高匹配效率。當(dāng)技術(shù)上的進(jìn)展不足以提高數(shù)據(jù)匹配效率時(shí),就用其他方法來(lái)提升效率。

微軟是普及文本數(shù)據(jù)化的最核心公司,如果回看當(dāng)初,除了瀏覽器,微軟應(yīng)該早些布局搜索。在這個(gè)基礎(chǔ)上,微軟加入跟谷歌的戰(zhàn)爭(zhēng),從勝率上來(lái)看,它有一定的基礎(chǔ)。

微軟也是這條發(fā)展軸上的關(guān)鍵玩家,不管是在雅虎的時(shí)代,還是在瀏覽器時(shí)代、搜索引擎時(shí)代,它都花了非常大力氣追趕。

但這些商業(yè)模式具有明顯的馬太效應(yīng),后來(lái)者往往很難超越。今天假定供需撮合模式在文本信息上有新的變化,微軟從數(shù)據(jù)總量以及其對(duì)這個(gè)軸上的事情的理解和積累來(lái)看,也許有機(jī)會(huì)重新做成文本數(shù)據(jù)撮合效率這條主軸上的關(guān)鍵公司。李翔:微軟的厲害之處在于始終在這條軸線上,即使不是那個(gè)領(lǐng)先者,也始終跟在后面。

/ 07 /Web3和區(qū)塊鏈熱潮之后,沉淀了什么?

李豐:談到Web3和區(qū)塊鏈,我比較關(guān)注的是,在這一輪熱潮之后,到底沉淀了什么?

10多年前,投資Coinbase和Ripple天使輪時(shí),我在IDG內(nèi)部做了兩次PPT,來(lái)講一個(gè)邏輯——為什么要投數(shù)字貨幣?

答案比較明確,我們往后無(wú)窮遠(yuǎn)地想,越來(lái)越多的東西被數(shù)據(jù)化之后,在某一個(gè)行業(yè)或者在某一個(gè)鏈條上幾乎都高度數(shù)據(jù)化之后,數(shù)據(jù)化就不僅僅只是解決信息匹配,它很有可能要解決權(quán)益的流動(dòng)、交易的問(wèn)題。

在這種情況下,以往分配利益或者進(jìn)行交易、結(jié)算的機(jī)制,就會(huì)出現(xiàn)效率上的問(wèn)題。

直到這一輪之前,數(shù)字貨幣領(lǐng)域,在今天被認(rèn)為還比較成功的公司,大多都存在于數(shù)字貨幣交易的閉環(huán)里。不管你做的是錢包、交易還是提供交易撮合的工具或金融產(chǎn)品,數(shù)字貨幣以及交易本身就是全數(shù)字化的閉環(huán),最容易用到數(shù)字化和新結(jié)算方法。

2013年,硅谷涌起了第一波數(shù)字貨幣浪潮,無(wú)數(shù)創(chuàng)業(yè)公司在嘗試把各種各樣的事情,有的甚至想把比特幣提款機(jī)做成商業(yè)模式。

但后來(lái)一些公司沒(méi)能得到發(fā)展,主要因?yàn)樗鼈兪亲觥鞍腴_(kāi)環(huán)”的應(yīng)用。某些環(huán)節(jié)需要人為強(qiáng)行地,把線下的某些東西轉(zhuǎn)換到線上來(lái)。在半開(kāi)環(huán)的商業(yè)模式中,除了效率、成本等問(wèn)題,還有誠(chéng)信等問(wèn)題。

今天看Web3,我們往最遠(yuǎn)處想,如果最終有足夠多的行業(yè)、鏈條數(shù)字化程度足夠高,交易之外,組織管理、溝通形態(tài)這些,從效率和成本上看,也會(huì)跟當(dāng)下不一樣。所有這些高度數(shù)字化的行業(yè)中,就會(huì)用新的公司形態(tài)、新的管理方法、新的溝通工具,也會(huì)用新的交易和交換以及權(quán)益方法。

10多年前,我非常難解釋虛擬貨幣到底是怎么回事時(shí),用的一個(gè)例子是P2P下載。P2P下載就是借別人的計(jì)算機(jī)暫時(shí)不用的算力,當(dāng)成一個(gè)并行下載的節(jié)點(diǎn),來(lái)加速下載,極度地節(jié)省了網(wǎng)絡(luò)資源、提高了下載速度,迅雷就是其中的典型公司。

但P2P下載沒(méi)有誕生出成功的大公司,部分原因是它沒(méi)法確立經(jīng)濟(jì)利益模式:貢獻(xiàn)的算力、得到的東西很難被正確和完整地衡量經(jīng)濟(jì)價(jià)值。所以最后很多這類應(yīng)用最終變成了盜版下載工具,因?yàn)椴缓米匪荨?/p>

如果數(shù)字貨幣早發(fā)生10年,那當(dāng)時(shí)的P2P下載就可以完美使用數(shù)字貨幣,利用去中心化結(jié)算方法來(lái)進(jìn)行的新交易、新商業(yè)模式。它能夠瞬間完成大量的計(jì)量結(jié)算,并且在貢獻(xiàn)發(fā)生時(shí),就把錢給了貢獻(xiàn)者。這種事在任何一個(gè)現(xiàn)實(shí)世界里,都很難出現(xiàn),所以這是個(gè)小閉環(huán)。李翔:我有時(shí)候也在想,有了數(shù)字貨幣和區(qū)塊鏈技術(shù)之后,我們就可以給那些以往沒(méi)辦法去激勵(lì)貢獻(xiàn)值的一方給予激勵(lì)。但有時(shí)候也會(huì)想,如果維基百科已經(jīng)應(yīng)用了數(shù)字貨幣和區(qū)塊鏈技術(shù),給它的內(nèi)容貢獻(xiàn)者以激勵(lì),很有可能是不是就不會(huì)再有維基百科了?李豐:第一,很多行業(yè)、模式一旦進(jìn)入了閉環(huán)數(shù)字化或者全鏈條數(shù)字化之后,它確實(shí)有壟斷性,變成了越大越好,越好越大。

第二,一旦進(jìn)入數(shù)據(jù)化之后,它權(quán)益的分配、交易的確認(rèn)、組織管理和溝通協(xié)調(diào)等所有的機(jī)制都可能發(fā)生變化,來(lái)匹配這個(gè)難以想象的效率提升。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。