正在閱讀:

阿里接連“痛失”兩員大將,都去搞大模型了

掃一掃下載界面新聞APP

阿里接連“痛失”兩員大將,都去搞大模型了

每一個AI科學(xué)家都有一個做大模型的夢想。

文|融中財經(jīng) 風(fēng)信子

編輯|吾人

要問2023年的創(chuàng)投圈什么最熱鬧,那非ChatGPT莫屬。

除了谷歌、微軟、Meta、百度等這些互聯(lián)網(wǎng)大廠積極加碼AI的投資,不少這些大廠走出來的高管也紛紛加入到創(chuàng)業(yè)的隊伍中去,大有重現(xiàn)移動互聯(lián)網(wǎng)時代的創(chuàng)業(yè)熱潮,這不又有幾個互聯(lián)網(wǎng)大廠的高管出來創(chuàng)業(yè)了。

近日,亞馬遜首席科學(xué)家李沐,被曝已離職創(chuàng)業(yè),其創(chuàng)業(yè)項目,名為Boson.ai,從官網(wǎng)信息來看,創(chuàng)業(yè)內(nèi)容與大模型應(yīng)用有關(guān)。目前李沐尚未官宣,但在Boson.ai的GitHub項目主頁中,已經(jīng)能看見他的身影。

就好像王興找上老同學(xué)王慧文開啟大模型創(chuàng)業(yè)一樣,這次李沐是與其導(dǎo)師Alex Smola一起創(chuàng)業(yè)的,Alex Smola曾任亞馬遜副總裁,是位杰出的AI科學(xué)家,目前任Boson.ai的CEO。

有傳聞稱阿里VP賈揚清將離職創(chuàng)業(yè),計劃創(chuàng)業(yè)的方向是AIInfra(AI架構(gòu)),屬于是AI基礎(chǔ)設(shè)施提供商,關(guān)注包括大模型在內(nèi)的AI應(yīng)用。具體而言是要打造一個統(tǒng)一、多云和可觀察的人工智能平臺。目標(biāo)是提升人工智能產(chǎn)品化的效率,包括開發(fā)者效率和系統(tǒng)效率兩個方面。通過端到端的解決方案,來幫助企業(yè)和開發(fā)者高效部署人工智能。

僅隔一天,阿里再失一員AI大將。據(jù)悉,阿里M6大模型的前帶頭人楊紅霞已加入字節(jié)AILab(人工智能實驗室),參與語言生成大模型的研發(fā)。

除此之外,據(jù)不完全統(tǒng)計,AI大模型領(lǐng)域已經(jīng)集結(jié)了前美團(tuán)聯(lián)合創(chuàng)始人王慧文,原京東集團(tuán)技術(shù)委員會主席、云與 AI 總裁,京東人工智能研究院院長周伯文,前搜狗CEO王小川,快手前AI核心人物李巖等。

3月20日,創(chuàng)新工場董事長兼首席執(zhí)行官李開復(fù),轉(zhuǎn)型投資人多年的他,宣布將籌組名為“AI2.0”的項目。創(chuàng)新工場也將“Project AI 2.0”(AI2.0項目)掛到了官網(wǎng)首頁,并表示將在全球范圍尋找具有 AI 大模型、NLP(語言生成模型)、Multi-modality(多模態(tài))等領(lǐng)域能力的優(yōu)秀技術(shù)人和研究員。這意味著,李開復(fù)要親自帶隊投入大模型創(chuàng)業(yè)中去了。

看到曾經(jīng)最優(yōu)秀的一批創(chuàng)業(yè)者投身AI大模型創(chuàng)業(yè),無疑是振奮人心的,然而我們要思考的是為什么ChatGPT沒有誕生在中國,開發(fā)我們自己的ChatGPT到底需要什么?

01 為什么ChatGPT沒有誕生在中國?

ChatGPT的誕生讓世界為之震驚,也讓創(chuàng)投圈為之瘋狂,不少國人也為ChatGPT沒有誕生在中國而感到失落。

近幾個月,關(guān)于老外在用ChatGPT寫論文,寫工作總結(jié),寫各種報告等新聞不絕于耳,國人垂涎已久,盡管百度以最快的速度推出了號稱中國版的ChatGPT文心一言,然而無論是來自用戶還是投資者的反饋都不是滿意,甚至有人調(diào)侃,百度的文心一言發(fā)布會硬生生搞成了招商大會。發(fā)布會期間,百度股價一度閃崩,這不禁讓國內(nèi)再度發(fā)出疑問,百度做AI也有10年了,為什么它沒有率先做出ChatGPT,為什么ChatGPT沒有誕生在中國?

有不少專家從技術(shù)、法律等角度分析原因,他們認(rèn)為中國之所以沒有誕生ChatGPT主要是因為以下幾個原因:

華東政法大學(xué)政治學(xué)研究院院長、人工智能與大數(shù)據(jù)指數(shù)研究院院長高奇琦教授認(rèn)為,通用大模型是一個系統(tǒng)工程,算法、數(shù)據(jù)和算力這三個因素至關(guān)重要。目前,我們的差距主要集中在數(shù)據(jù)和算力。數(shù)據(jù)方面,英文互聯(lián)網(wǎng)上的數(shù)據(jù)質(zhì)量相對比較高,也更易于清洗。ChatGPT之所以問題回答得好,很重要的原因就在于英文互聯(lián)網(wǎng)上有大量比較準(zhǔn)確的知識類信息,可以用于模型訓(xùn)練。中文互聯(lián)網(wǎng)產(chǎn)生的數(shù)據(jù)也很多,但質(zhì)量還有差距,加之國內(nèi)的數(shù)據(jù)大量儲存于移動端APP中,數(shù)據(jù)比較難抓取,而互聯(lián)網(wǎng)巨頭之間的數(shù)據(jù)又是相互封閉的,數(shù)據(jù)孤島化的情況也比較嚴(yán)重。算力是另一個巨大的挑戰(zhàn),ChatGPT需要至少3萬張英偉達(dá)A100卡的算力,這是巨大的一筆投入。

除此之外,還有人從政策法規(guī)的角度進(jìn)行了分析,他們認(rèn)為,為了避免人工智能技術(shù)可能帶來的潛在風(fēng)險和威脅,中國國家和市級政府都出臺了一系列的人工智能技術(shù)規(guī)范和管理條例。這些規(guī)定對于ChatGPT這樣依賴深度學(xué)習(xí)技術(shù),可能涉及到數(shù)據(jù)保護(hù)和隱私保護(hù)等方面的技術(shù)提出了嚴(yán)格要求,需要滿足一系列的審批和認(rèn)證流程。

筆者從創(chuàng)投的角度分析,認(rèn)為中國之所以沒率先落地ChatGPT,一方面是國內(nèi)許多企業(yè)家對新技術(shù)缺乏敏感性,另一方面是國內(nèi)的投資人對底層技術(shù)的長期不重視。

雖然不少國人紛紛舉手要進(jìn)行大模型創(chuàng)業(yè),立志要做出中國版的ChatGPT,然而俞敏洪卻指出了一個扎心的事實。近日,他在第23屆亞布力中國企業(yè)家論壇上說道,“ChatGPT已討論兩個月了,有多少企業(yè)家玩過ChatGPT?”在他看來,沒玩過ChatGPT的企業(yè)家,沒資格談?wù)摳呖萍己臀磥砥髽I(yè)的走向,對于企業(yè)家來說,年齡不是問題,思想的僵化和行動的僵化才是問題,不接受新鮮事物才是問題。

知名互聯(lián)網(wǎng)學(xué)者劉興亮在一檔節(jié)目中被主持人問到,為什么ChatGPT沒有誕生在中國,他用一句話回答了這個問題,即美國人在創(chuàng)新、中國人在應(yīng)用、歐洲人在立法。

俞敏洪與劉興亮分別揭示了國內(nèi)面對新技術(shù)不同層面的態(tài)度,俞敏洪指出了,中國企業(yè)家對于新興技術(shù)缺乏足夠的熱情,對于新事物缺乏思想上的接受能力以及相應(yīng)的行動力,這也引發(fā)了中國的ChatGPT到底會在互聯(lián)網(wǎng)大廠誕生還是在創(chuàng)業(yè)企業(yè)誕生的討論。

劉興亮的回答也反映出一個問題,即我國的創(chuàng)業(yè)項目有著太強的功利性,凡是不能快速變現(xiàn)或者暫時落地場景不明朗的項目很難得到投資人的青睞,這也讓我們忽略了許多底層技術(shù)的創(chuàng)業(yè)機(jī)會,而恰恰是底層技術(shù)才是能夠“卡脖子”的地方。

所以,中國缺的不是能做出ChatGPT的技術(shù)人才,而是能夠孵化ChatGPT的環(huán)境土壤。

02 中國不缺技術(shù)人才,缺的是優(yōu)秀的企業(yè)家

每一個AI科學(xué)家都有一個做大模型的夢想,比如李沐、賈揚清等,我們要做的是給他們一個實現(xiàn)夢想的溫床。

李沐,江湖人稱“沐神”,又被稱為深度學(xué)習(xí)界的“米其林”,是硅谷華人技術(shù)大神,深度學(xué)習(xí)框架MXNet創(chuàng)始人之一。

公開資料顯示,李沐2008年畢業(yè)于上海交通大學(xué)計算機(jī)系,大學(xué)期間,曾在微軟亞洲研究院擔(dān)任實習(xí)生。2011年4月-2012年8月,李沐在百度擔(dān)任高級研究員,后進(jìn)入卡耐基梅隆大學(xué)(CMU)讀博,師從Alex Smola和Dave Andersen。2017年CMU博士畢業(yè)后,李沐加入亞馬遜成為資深首席科學(xué)家。

李沐的主要研究興趣集中在大規(guī)模機(jī)器學(xué)習(xí),尤其是大規(guī)模分布式系統(tǒng)和機(jī)器學(xué)習(xí)算法的協(xié)同設(shè)計。李沐曾以第一作者的身份在計算機(jī)科學(xué)領(lǐng)域的大會以及期刊上發(fā)表了多篇論文,包括跨度理論(FOCS)、機(jī)器學(xué)習(xí)(NIPS、ICML)、應(yīng)用層面(CVPR、KDD)、操作系統(tǒng)(OSDI)等方向。

此外,李沐還是B站的一位UP主,注冊了“跟著李沐學(xué)AI”這一賬號,通過視頻向大家介紹各種AI知識,制作了幾十篇論文的精讀課程。不少同學(xué)跟著他養(yǎng)成了精讀論文的習(xí)慣。

李沐不僅是一位學(xué)霸,一位不錯的老師,他在創(chuàng)業(yè)上也有這一定的經(jīng)驗和心得。

李沐在CMU讀博期間,恰逢國內(nèi)創(chuàng)業(yè)熱潮,他在國內(nèi)的好友戴文淵、余凱等人紛紛加入創(chuàng)業(yè)大軍,受此影響,大洋彼岸的李沐與導(dǎo)師Alex Smola、同學(xué)等5人也體驗了一把創(chuàng)業(yè)。他們創(chuàng)辦了數(shù)據(jù)分析算法公司 Marianas Labs,Alex Smol 教授擔(dān)任 CEO,李沐擔(dān)任 CTO。后來這家公司被收購了。

“在學(xué)術(shù)界,當(dāng)你有一個想法,馬上就可以開始操作,并且只需要把想法實現(xiàn),大概完成 90% 的工作就好;而在工業(yè)界,想法不是最重要的,重要的是要把想法落地,剩下的那10% 的工作才是最重要的,甚至可能會花費你 90% 的精力?!薄岸鴦?chuàng)業(yè),需要考慮的事情就更復(fù)雜了,除了要思考如何把想法落地,還需要考慮團(tuán)隊的合作、人員的調(diào)配,要決定團(tuán)隊的發(fā)展方向,分析整個工業(yè)環(huán)境的發(fā)展趨勢等”,李沐曾談到。

2016年7月,Alex Smola重返工業(yè)界,加入亞馬遜,后來在AWS 擔(dān)任副總裁級別的科學(xué)家,李沐也追隨導(dǎo)師,加入亞馬遜,離職前做到了AWS資深高級科學(xué)家。

還有最新加入大模型的阿里的兩位AI科學(xué)家。賈揚清,本科和研究生階段就讀于清華大學(xué)自動化專業(yè),后赴加州大學(xué)伯克利分校攻讀計算機(jī)科學(xué)博士。他在博士期間創(chuàng)立并開源了如今業(yè)內(nèi)目熟能詳?shù)纳疃葘W(xué)習(xí)框架Caffe,被微軟、雅虎英偉達(dá)、Adobe等公司采用。2019年3月,賈揚清正式加入阿里巴巴,擔(dān)任技術(shù)副總裁崗位,領(lǐng)導(dǎo)大數(shù)據(jù)計算平臺的研發(fā)工作。

楊紅霞畢業(yè)于南開大學(xué)、杜克大學(xué)統(tǒng)計科學(xué)系,師從著名統(tǒng)計學(xué)家David Dunson。她在人工智能領(lǐng)域國際會議、頂級期刊有近百篇頁級論文。

楊紅霞曾是阿里達(dá)摩院超大規(guī)模多模態(tài)預(yù)訓(xùn)練模型M6的技術(shù)負(fù)責(zé)人,M6是阿里巴巴達(dá)摩院研發(fā)的超大規(guī)模多模態(tài)預(yù)訓(xùn)練模型。

楊紅霞曾帶領(lǐng)M6大模型從百億級進(jìn)化到千億、再到萬億的參數(shù)量,并且主導(dǎo)認(rèn)知智能技術(shù)的發(fā)展和場景落地。2021年3月,M6大模型首次發(fā)布到2021年底,阿里云發(fā)布M6最新進(jìn)展時,其參數(shù)已至10萬億,成為當(dāng)時全球最大的AI預(yù)訓(xùn)練模型。

隨著越來越多的人加入大模型創(chuàng)業(yè),可以發(fā)現(xiàn),無論在國內(nèi)還是在國外,我們AI技術(shù)方面的人才并不在少數(shù),然而實際的結(jié)果卻是,我們并沒有率先做出自己的大模型出來,這再次將我們一直以來的短板暴露出來,我們是個很好的追隨者,但是做不了領(lǐng)先者。

如何改變這一局面呢?

03 ChatGPT會誕生在哪里?巨頭還是創(chuàng)業(yè)公司

想做領(lǐng)先者,不可忽視創(chuàng)業(yè)公司的作用。

在ChatGPT出來之前,很多國內(nèi)的投資人都認(rèn)為,這種沒有落地場景的底層技術(shù)只有巨頭才能玩,創(chuàng)業(yè)公司參與就是自尋死路,在他們看來,巨頭在技術(shù)研發(fā)上的積累遠(yuǎn)超創(chuàng)業(yè)公司,在數(shù)據(jù)和算法資源也是遙遙領(lǐng)先,在資金和人才的儲備上也占盡優(yōu)勢,甚至在管理能力方面都是成熟的,然而現(xiàn)實卻打臉了。

谷歌作為全球AI領(lǐng)域的領(lǐng)路人,一直被寄予厚望,然而突然殺出一個OpenAI,這著實讓它有點措手不及,同時在美國的其他巨頭中也沒有誕生出ChatGPT。

同樣在中國,百度主攻AI多年,據(jù)稱,許多百度內(nèi)部的員工都不信百度能做好文心一言。

這一方面說明,一個龐大的企業(yè)機(jī)器,雖然有著投資人所以為的諸多優(yōu)勢,但由于內(nèi)部人際關(guān)系復(fù)雜,問題盤根錯節(jié),這造成了人浮于事,效率低下等問題;另一方面,相比創(chuàng)業(yè)公司的孤注一擲,巨頭有著穩(wěn)定的現(xiàn)金流業(yè)務(wù),這也會讓企業(yè)家對新業(yè)務(wù)的重視程度不夠。此外,巨頭最缺的是創(chuàng)業(yè)團(tuán)隊對項目的熱情和成功的渴望,而這也是能否成為領(lǐng)先最關(guān)鍵的因素。

不少人覺得,高調(diào)進(jìn)入AI大模型創(chuàng)業(yè)就是為了蹭熱點、圈錢,真正踏踏實實做事的少之又少,誠然,正如清華大學(xué)新聞學(xué)院教授、博士生導(dǎo)師沈陽預(yù)測,未來AI大模型的市場格局是ChatGPT一家,開源一家,中國一家,三分天下,這個行業(yè)必然是九死一生的,但是最后誰是留下來的幸運兒,誰又能知道呢?

從個人投資者來說,不投九死一生的行業(yè)可以理解,但是從全國整體來說,我們需要敢于做夢的投資家、企業(yè)家,畢竟OpenAI也是美國數(shù)位富豪喂出來的。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

阿里接連“痛失”兩員大將,都去搞大模型了

每一個AI科學(xué)家都有一個做大模型的夢想。

文|融中財經(jīng) 風(fēng)信子

編輯|吾人

要問2023年的創(chuàng)投圈什么最熱鬧,那非ChatGPT莫屬。

除了谷歌、微軟、Meta、百度等這些互聯(lián)網(wǎng)大廠積極加碼AI的投資,不少這些大廠走出來的高管也紛紛加入到創(chuàng)業(yè)的隊伍中去,大有重現(xiàn)移動互聯(lián)網(wǎng)時代的創(chuàng)業(yè)熱潮,這不又有幾個互聯(lián)網(wǎng)大廠的高管出來創(chuàng)業(yè)了。

近日,亞馬遜首席科學(xué)家李沐,被曝已離職創(chuàng)業(yè),其創(chuàng)業(yè)項目,名為Boson.ai,從官網(wǎng)信息來看,創(chuàng)業(yè)內(nèi)容與大模型應(yīng)用有關(guān)。目前李沐尚未官宣,但在Boson.ai的GitHub項目主頁中,已經(jīng)能看見他的身影。

就好像王興找上老同學(xué)王慧文開啟大模型創(chuàng)業(yè)一樣,這次李沐是與其導(dǎo)師Alex Smola一起創(chuàng)業(yè)的,Alex Smola曾任亞馬遜副總裁,是位杰出的AI科學(xué)家,目前任Boson.ai的CEO。

有傳聞稱阿里VP賈揚清將離職創(chuàng)業(yè),計劃創(chuàng)業(yè)的方向是AIInfra(AI架構(gòu)),屬于是AI基礎(chǔ)設(shè)施提供商,關(guān)注包括大模型在內(nèi)的AI應(yīng)用。具體而言是要打造一個統(tǒng)一、多云和可觀察的人工智能平臺。目標(biāo)是提升人工智能產(chǎn)品化的效率,包括開發(fā)者效率和系統(tǒng)效率兩個方面。通過端到端的解決方案,來幫助企業(yè)和開發(fā)者高效部署人工智能。

僅隔一天,阿里再失一員AI大將。據(jù)悉,阿里M6大模型的前帶頭人楊紅霞已加入字節(jié)AILab(人工智能實驗室),參與語言生成大模型的研發(fā)。

除此之外,據(jù)不完全統(tǒng)計,AI大模型領(lǐng)域已經(jīng)集結(jié)了前美團(tuán)聯(lián)合創(chuàng)始人王慧文,原京東集團(tuán)技術(shù)委員會主席、云與 AI 總裁,京東人工智能研究院院長周伯文,前搜狗CEO王小川,快手前AI核心人物李巖等。

3月20日,創(chuàng)新工場董事長兼首席執(zhí)行官李開復(fù),轉(zhuǎn)型投資人多年的他,宣布將籌組名為“AI2.0”的項目。創(chuàng)新工場也將“Project AI 2.0”(AI2.0項目)掛到了官網(wǎng)首頁,并表示將在全球范圍尋找具有 AI 大模型、NLP(語言生成模型)、Multi-modality(多模態(tài))等領(lǐng)域能力的優(yōu)秀技術(shù)人和研究員。這意味著,李開復(fù)要親自帶隊投入大模型創(chuàng)業(yè)中去了。

看到曾經(jīng)最優(yōu)秀的一批創(chuàng)業(yè)者投身AI大模型創(chuàng)業(yè),無疑是振奮人心的,然而我們要思考的是為什么ChatGPT沒有誕生在中國,開發(fā)我們自己的ChatGPT到底需要什么?

01 為什么ChatGPT沒有誕生在中國?

ChatGPT的誕生讓世界為之震驚,也讓創(chuàng)投圈為之瘋狂,不少國人也為ChatGPT沒有誕生在中國而感到失落。

近幾個月,關(guān)于老外在用ChatGPT寫論文,寫工作總結(jié),寫各種報告等新聞不絕于耳,國人垂涎已久,盡管百度以最快的速度推出了號稱中國版的ChatGPT文心一言,然而無論是來自用戶還是投資者的反饋都不是滿意,甚至有人調(diào)侃,百度的文心一言發(fā)布會硬生生搞成了招商大會。發(fā)布會期間,百度股價一度閃崩,這不禁讓國內(nèi)再度發(fā)出疑問,百度做AI也有10年了,為什么它沒有率先做出ChatGPT,為什么ChatGPT沒有誕生在中國?

有不少專家從技術(shù)、法律等角度分析原因,他們認(rèn)為中國之所以沒有誕生ChatGPT主要是因為以下幾個原因:

華東政法大學(xué)政治學(xué)研究院院長、人工智能與大數(shù)據(jù)指數(shù)研究院院長高奇琦教授認(rèn)為,通用大模型是一個系統(tǒng)工程,算法、數(shù)據(jù)和算力這三個因素至關(guān)重要。目前,我們的差距主要集中在數(shù)據(jù)和算力。數(shù)據(jù)方面,英文互聯(lián)網(wǎng)上的數(shù)據(jù)質(zhì)量相對比較高,也更易于清洗。ChatGPT之所以問題回答得好,很重要的原因就在于英文互聯(lián)網(wǎng)上有大量比較準(zhǔn)確的知識類信息,可以用于模型訓(xùn)練。中文互聯(lián)網(wǎng)產(chǎn)生的數(shù)據(jù)也很多,但質(zhì)量還有差距,加之國內(nèi)的數(shù)據(jù)大量儲存于移動端APP中,數(shù)據(jù)比較難抓取,而互聯(lián)網(wǎng)巨頭之間的數(shù)據(jù)又是相互封閉的,數(shù)據(jù)孤島化的情況也比較嚴(yán)重。算力是另一個巨大的挑戰(zhàn),ChatGPT需要至少3萬張英偉達(dá)A100卡的算力,這是巨大的一筆投入。

除此之外,還有人從政策法規(guī)的角度進(jìn)行了分析,他們認(rèn)為,為了避免人工智能技術(shù)可能帶來的潛在風(fēng)險和威脅,中國國家和市級政府都出臺了一系列的人工智能技術(shù)規(guī)范和管理條例。這些規(guī)定對于ChatGPT這樣依賴深度學(xué)習(xí)技術(shù),可能涉及到數(shù)據(jù)保護(hù)和隱私保護(hù)等方面的技術(shù)提出了嚴(yán)格要求,需要滿足一系列的審批和認(rèn)證流程。

筆者從創(chuàng)投的角度分析,認(rèn)為中國之所以沒率先落地ChatGPT,一方面是國內(nèi)許多企業(yè)家對新技術(shù)缺乏敏感性,另一方面是國內(nèi)的投資人對底層技術(shù)的長期不重視。

雖然不少國人紛紛舉手要進(jìn)行大模型創(chuàng)業(yè),立志要做出中國版的ChatGPT,然而俞敏洪卻指出了一個扎心的事實。近日,他在第23屆亞布力中國企業(yè)家論壇上說道,“ChatGPT已討論兩個月了,有多少企業(yè)家玩過ChatGPT?”在他看來,沒玩過ChatGPT的企業(yè)家,沒資格談?wù)摳呖萍己臀磥砥髽I(yè)的走向,對于企業(yè)家來說,年齡不是問題,思想的僵化和行動的僵化才是問題,不接受新鮮事物才是問題。

知名互聯(lián)網(wǎng)學(xué)者劉興亮在一檔節(jié)目中被主持人問到,為什么ChatGPT沒有誕生在中國,他用一句話回答了這個問題,即美國人在創(chuàng)新、中國人在應(yīng)用、歐洲人在立法。

俞敏洪與劉興亮分別揭示了國內(nèi)面對新技術(shù)不同層面的態(tài)度,俞敏洪指出了,中國企業(yè)家對于新興技術(shù)缺乏足夠的熱情,對于新事物缺乏思想上的接受能力以及相應(yīng)的行動力,這也引發(fā)了中國的ChatGPT到底會在互聯(lián)網(wǎng)大廠誕生還是在創(chuàng)業(yè)企業(yè)誕生的討論。

劉興亮的回答也反映出一個問題,即我國的創(chuàng)業(yè)項目有著太強的功利性,凡是不能快速變現(xiàn)或者暫時落地場景不明朗的項目很難得到投資人的青睞,這也讓我們忽略了許多底層技術(shù)的創(chuàng)業(yè)機(jī)會,而恰恰是底層技術(shù)才是能夠“卡脖子”的地方。

所以,中國缺的不是能做出ChatGPT的技術(shù)人才,而是能夠孵化ChatGPT的環(huán)境土壤。

02 中國不缺技術(shù)人才,缺的是優(yōu)秀的企業(yè)家

每一個AI科學(xué)家都有一個做大模型的夢想,比如李沐、賈揚清等,我們要做的是給他們一個實現(xiàn)夢想的溫床。

李沐,江湖人稱“沐神”,又被稱為深度學(xué)習(xí)界的“米其林”,是硅谷華人技術(shù)大神,深度學(xué)習(xí)框架MXNet創(chuàng)始人之一。

公開資料顯示,李沐2008年畢業(yè)于上海交通大學(xué)計算機(jī)系,大學(xué)期間,曾在微軟亞洲研究院擔(dān)任實習(xí)生。2011年4月-2012年8月,李沐在百度擔(dān)任高級研究員,后進(jìn)入卡耐基梅隆大學(xué)(CMU)讀博,師從Alex Smola和Dave Andersen。2017年CMU博士畢業(yè)后,李沐加入亞馬遜成為資深首席科學(xué)家。

李沐的主要研究興趣集中在大規(guī)模機(jī)器學(xué)習(xí),尤其是大規(guī)模分布式系統(tǒng)和機(jī)器學(xué)習(xí)算法的協(xié)同設(shè)計。李沐曾以第一作者的身份在計算機(jī)科學(xué)領(lǐng)域的大會以及期刊上發(fā)表了多篇論文,包括跨度理論(FOCS)、機(jī)器學(xué)習(xí)(NIPS、ICML)、應(yīng)用層面(CVPR、KDD)、操作系統(tǒng)(OSDI)等方向。

此外,李沐還是B站的一位UP主,注冊了“跟著李沐學(xué)AI”這一賬號,通過視頻向大家介紹各種AI知識,制作了幾十篇論文的精讀課程。不少同學(xué)跟著他養(yǎng)成了精讀論文的習(xí)慣。

李沐不僅是一位學(xué)霸,一位不錯的老師,他在創(chuàng)業(yè)上也有這一定的經(jīng)驗和心得。

李沐在CMU讀博期間,恰逢國內(nèi)創(chuàng)業(yè)熱潮,他在國內(nèi)的好友戴文淵、余凱等人紛紛加入創(chuàng)業(yè)大軍,受此影響,大洋彼岸的李沐與導(dǎo)師Alex Smola、同學(xué)等5人也體驗了一把創(chuàng)業(yè)。他們創(chuàng)辦了數(shù)據(jù)分析算法公司 Marianas Labs,Alex Smol 教授擔(dān)任 CEO,李沐擔(dān)任 CTO。后來這家公司被收購了。

“在學(xué)術(shù)界,當(dāng)你有一個想法,馬上就可以開始操作,并且只需要把想法實現(xiàn),大概完成 90% 的工作就好;而在工業(yè)界,想法不是最重要的,重要的是要把想法落地,剩下的那10% 的工作才是最重要的,甚至可能會花費你 90% 的精力?!薄岸鴦?chuàng)業(yè),需要考慮的事情就更復(fù)雜了,除了要思考如何把想法落地,還需要考慮團(tuán)隊的合作、人員的調(diào)配,要決定團(tuán)隊的發(fā)展方向,分析整個工業(yè)環(huán)境的發(fā)展趨勢等”,李沐曾談到。

2016年7月,Alex Smola重返工業(yè)界,加入亞馬遜,后來在AWS 擔(dān)任副總裁級別的科學(xué)家,李沐也追隨導(dǎo)師,加入亞馬遜,離職前做到了AWS資深高級科學(xué)家。

還有最新加入大模型的阿里的兩位AI科學(xué)家。賈揚清,本科和研究生階段就讀于清華大學(xué)自動化專業(yè),后赴加州大學(xué)伯克利分校攻讀計算機(jī)科學(xué)博士。他在博士期間創(chuàng)立并開源了如今業(yè)內(nèi)目熟能詳?shù)纳疃葘W(xué)習(xí)框架Caffe,被微軟、雅虎英偉達(dá)、Adobe等公司采用。2019年3月,賈揚清正式加入阿里巴巴,擔(dān)任技術(shù)副總裁崗位,領(lǐng)導(dǎo)大數(shù)據(jù)計算平臺的研發(fā)工作。

楊紅霞畢業(yè)于南開大學(xué)、杜克大學(xué)統(tǒng)計科學(xué)系,師從著名統(tǒng)計學(xué)家David Dunson。她在人工智能領(lǐng)域國際會議、頂級期刊有近百篇頁級論文。

楊紅霞曾是阿里達(dá)摩院超大規(guī)模多模態(tài)預(yù)訓(xùn)練模型M6的技術(shù)負(fù)責(zé)人,M6是阿里巴巴達(dá)摩院研發(fā)的超大規(guī)模多模態(tài)預(yù)訓(xùn)練模型。

楊紅霞曾帶領(lǐng)M6大模型從百億級進(jìn)化到千億、再到萬億的參數(shù)量,并且主導(dǎo)認(rèn)知智能技術(shù)的發(fā)展和場景落地。2021年3月,M6大模型首次發(fā)布到2021年底,阿里云發(fā)布M6最新進(jìn)展時,其參數(shù)已至10萬億,成為當(dāng)時全球最大的AI預(yù)訓(xùn)練模型。

隨著越來越多的人加入大模型創(chuàng)業(yè),可以發(fā)現(xiàn),無論在國內(nèi)還是在國外,我們AI技術(shù)方面的人才并不在少數(shù),然而實際的結(jié)果卻是,我們并沒有率先做出自己的大模型出來,這再次將我們一直以來的短板暴露出來,我們是個很好的追隨者,但是做不了領(lǐng)先者。

如何改變這一局面呢?

03 ChatGPT會誕生在哪里?巨頭還是創(chuàng)業(yè)公司

想做領(lǐng)先者,不可忽視創(chuàng)業(yè)公司的作用。

在ChatGPT出來之前,很多國內(nèi)的投資人都認(rèn)為,這種沒有落地場景的底層技術(shù)只有巨頭才能玩,創(chuàng)業(yè)公司參與就是自尋死路,在他們看來,巨頭在技術(shù)研發(fā)上的積累遠(yuǎn)超創(chuàng)業(yè)公司,在數(shù)據(jù)和算法資源也是遙遙領(lǐng)先,在資金和人才的儲備上也占盡優(yōu)勢,甚至在管理能力方面都是成熟的,然而現(xiàn)實卻打臉了。

谷歌作為全球AI領(lǐng)域的領(lǐng)路人,一直被寄予厚望,然而突然殺出一個OpenAI,這著實讓它有點措手不及,同時在美國的其他巨頭中也沒有誕生出ChatGPT。

同樣在中國,百度主攻AI多年,據(jù)稱,許多百度內(nèi)部的員工都不信百度能做好文心一言。

這一方面說明,一個龐大的企業(yè)機(jī)器,雖然有著投資人所以為的諸多優(yōu)勢,但由于內(nèi)部人際關(guān)系復(fù)雜,問題盤根錯節(jié),這造成了人浮于事,效率低下等問題;另一方面,相比創(chuàng)業(yè)公司的孤注一擲,巨頭有著穩(wěn)定的現(xiàn)金流業(yè)務(wù),這也會讓企業(yè)家對新業(yè)務(wù)的重視程度不夠。此外,巨頭最缺的是創(chuàng)業(yè)團(tuán)隊對項目的熱情和成功的渴望,而這也是能否成為領(lǐng)先最關(guān)鍵的因素。

不少人覺得,高調(diào)進(jìn)入AI大模型創(chuàng)業(yè)就是為了蹭熱點、圈錢,真正踏踏實實做事的少之又少,誠然,正如清華大學(xué)新聞學(xué)院教授、博士生導(dǎo)師沈陽預(yù)測,未來AI大模型的市場格局是ChatGPT一家,開源一家,中國一家,三分天下,這個行業(yè)必然是九死一生的,但是最后誰是留下來的幸運兒,誰又能知道呢?

從個人投資者來說,不投九死一生的行業(yè)可以理解,但是從全國整體來說,我們需要敢于做夢的投資家、企業(yè)家,畢竟OpenAI也是美國數(shù)位富豪喂出來的。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。