文|獵云網(wǎng) 王非
大模型領(lǐng)域,一家“隱形獨角獸”,正在悄然成長。
緊隨紅杉、金沙江、徐匯資本之后,百度、騰訊、智譜AI、經(jīng)緯、真格等近日入股了一家大模型算力公司——無問芯穹(Infinigence-AI),投資陣容堪稱豪華。
這家成立于今年5月的新公司,由清華大學(xué)電子工程系系主任汪玉教授坐鎮(zhèn),也是他繼深鑒科技創(chuàng)業(yè)成功后的再次出發(fā),自然引發(fā)了外界的廣泛關(guān)注。
與汪玉攜手創(chuàng)業(yè)的依然是他的學(xué)生曾書霖、戴國浩等人,而這也意味著,清華系在大模型領(lǐng)域占據(jù)半壁江山后,“再下一城”。
針對融資細(xì)節(jié)、公司架構(gòu)等相關(guān)問題,獵云網(wǎng)向公司法人曾書霖求證,無問芯穹方面表示:“當(dāng)前無穹融資具體信息不方便透露,一切以官方對外發(fā)布過的信息為準(zhǔn);組織架構(gòu)信息同樣,也暫不方便透露?!?/p>
值得一提的是,作為上?!巴辽灵L”的創(chuàng)業(yè)公司,無問芯穹已經(jīng)與徐匯區(qū)完成了相關(guān)項目的簽約。
而在技術(shù)積累上,無問芯穹參與完成的新研究,也已經(jīng)助力其刷新了大模型優(yōu)化紀(jì)錄。
紅杉打頭陣,騰訊百度經(jīng)緯真格等攜手入局
目前,無問芯穹并未官宣過融資。但此前有市場消息稱,該公司已經(jīng)完成兩輪融資,領(lǐng)投方為紅杉,跟投方有經(jīng)緯、徐匯資本等。
工商變更記錄顯示,早在今年6月,即無問芯穹創(chuàng)立的第二個月,紅杉就通過旗下紅創(chuàng)科興(寧波)科技有限公司(下稱:紅創(chuàng)科興),出現(xiàn)在了北京無問芯穹的投資人列表,此次變更為“退出”,或為后續(xù)轉(zhuǎn)向上海無問芯穹做準(zhǔn)備。
隨后在今年9月,在目前無問芯穹的主體——上海無問芯穹中,紅創(chuàng)科興初次現(xiàn)身,并已是該公司的投資人。
也正是在此時,無問芯穹正式完成了真正意義上的的第一輪融資。
來源:天眼查
在這一輪投資人(股權(quán))變更中,紅杉又通過廈門紅杉雅恒股權(quán)投資合伙企業(yè)(有限合伙),加入了無問芯穹投資行列。
與紅杉同時入股的還包括金沙江、徐匯資本、無限基金。
值得一提的是,金沙江早在深鑒科技創(chuàng)業(yè)時,就曾連續(xù)參與過后者的天使輪和A輪融資。此次早早入股無問芯穹,也是金沙江再次押注汪玉。
而徐匯資本的入股,或許早在7月份上海徐匯區(qū)與無問芯穹完成相關(guān)項目的簽約時,就已埋下了伏筆。
最新持股情況顯示,上海無問長庚企業(yè)管理合伙企業(yè)(有限合伙)為無問芯穹的大股東,直接持股約15.220%。
而紅杉共持有無問芯穹約10.722%股份,系最大外部機構(gòu)股東;此外,徐匯資本持股約2.315%,金沙江與無限基金均持股約1.286%。
短短兩個多月后,無問芯穹于11月30日進(jìn)行了第二次投資人(股權(quán))變更,股東新增騰訊、百度、經(jīng)緯、真格、啟明創(chuàng)投、智譜AI等,投資陣容更加強大。
來源:天眼查
最新持股情況顯示,騰訊、百度、經(jīng)緯、真格的持股比例及最終受益股份均為1.952%;智譜AI持股比例及最終受益股份則均為0.651%。
今年以來,BAT三家在大模型領(lǐng)域的投資時有交叉,生數(shù)科技吸引了阿里和百度的入股,智譜AI則獲得了阿里和騰訊的支持。此次投資無問芯穹,或為騰訊和百度在大模型領(lǐng)域的首次聯(lián)手。
值得一提的是,智譜AI今年以來已經(jīng)投資了7家公司,包括聆心智能、面壁智能、冪律智能、集異璧等大模型相關(guān)公司。此次入股無問芯穹,或許與該公司10月份發(fā)布的Z計劃有關(guān)系,該計劃旨在為大模型創(chuàng)業(yè)者提供投資+技術(shù)支持,而無問芯穹也正是智譜AI發(fā)布Z計劃后投資的首家大模型相關(guān)公司。
投資人變更的同時,無問芯穹還新增了多位主要人員。董事備案一欄顯示,在公元、曾書霖、戴國浩的基礎(chǔ)上,無問芯穹新增周志峰、熊喬喬、曹曦、顏深根為董事。
其中,熊喬喬最早作為監(jiān)事出現(xiàn),目前已變更為李伯勛。
值得一提的是,熊喬喬也是無問芯穹的最大受益所有人,最終受益股份約27.487%。
來源:天眼查
此外,戴國浩與顏深根,分別持有無問芯穹8.528%股份。前者的最終受益股份更是高達(dá)22.404%,僅次于熊喬喬,后者的最終受益股份則為8.528%。
清華系主任坐鎮(zhèn),“產(chǎn)學(xué)結(jié)合,師生聯(lián)手”2.0
紅杉早早入局,金沙江繼續(xù)押注,騰訊百度經(jīng)緯真格等一眾互聯(lián)網(wǎng)大廠和頭部VC云集而至,與汪玉有著莫大關(guān)系。
天眼查App顯示,在核心成員一欄中,無問芯穹創(chuàng)始人為汪玉。
汪玉于1998年入學(xué)清華,本碩博均在清華,自2007年開始留校任教。他是清華電子工程系首位80后系主任,也是該系創(chuàng)辦以來第二年輕系主任。
來源:清華大學(xué)電子工程系
汪玉長期從事智能芯片、高能效電路與系統(tǒng)研究,曾多次在頂會拿下最佳論文獎,共發(fā)表IEEE/ACM雜志文章50余篇,谷歌學(xué)術(shù)引用17000余次。
2016年1月,以汪玉為負(fù)責(zé)人的深度學(xué)習(xí)處理器項目,通過清華大學(xué)電子信息學(xué)院論證并獲得支持。之后,項目團隊以研究成果“卷積神經(jīng)網(wǎng)絡(luò)的逐層變精度定點化方法及裝置”作價入股AI芯片公司深鑒科技,進(jìn)行產(chǎn)業(yè)化運營。
汪玉的學(xué)生,姚頌、單羿正是深鑒科技的創(chuàng)始成員,這也是他首次與學(xué)生攜手創(chuàng)業(yè)。
2018年,深鑒科技被FPGA廠商賽靈思收購。汪玉與合伙人旋即,共同向母校清華大學(xué)捐贈了500萬美元。
此次創(chuàng)辦無問芯穹,也是汪玉繼深鑒科技后,又一次“產(chǎn)學(xué)結(jié)合,師生聯(lián)手”。目前公開的兩名學(xué)生,分別為曾書霖和戴國浩。
首先,曾書霖是北京無問芯穹(成立于5月8日)、上海無問芯穹(成立于5月31日)這兩家公司的法定代表人。在無問芯穹核心成員一欄中,他僅作為執(zhí)行董事&總經(jīng)理出現(xiàn)。但在主要人員列表中,他的職位是董事長、總經(jīng)理、財務(wù)負(fù)責(zé)人。
公開資料顯示,2014年,來自廣西南寧的“數(shù)學(xué)學(xué)霸”曾書霖順利進(jìn)入清華大學(xué)電子工程系。2018年,他開啟了博士學(xué)位學(xué)習(xí)生涯,導(dǎo)師就是汪玉,主要研究方向是基于FPGA的神經(jīng)網(wǎng)絡(luò)加速器設(shè)計、軟硬件協(xié)同優(yōu)化、云端硬件虛擬化、大規(guī)模異構(gòu)計算等。
2017-2019年,曾書霖曾在深鑒FPGA硬件組當(dāng)過兩年實習(xí)生,于是此次共同創(chuàng)辦無問芯穹,也是他和導(dǎo)師的再次攜手。
其次,戴國浩雖未出現(xiàn)在核心成員,但卻是無問芯穹受益股份達(dá)22.404%的大股東之一,僅次于熊喬喬的27.487%。
2014年和2019年,戴國浩先后獲得清華大學(xué)電子工程系工學(xué)學(xué)士和博士學(xué)位。博士期間,汪玉正是戴國浩博士畢業(yè)論文指導(dǎo)老師。
目前,戴國浩是上海交通大學(xué)長聘教軌副教授,還是清源研究院定制計算中心共同負(fù)責(zé)人、人工智能設(shè)計自動化創(chuàng)新實驗室負(fù)責(zé)人。
來源:上海交通大學(xué)
據(jù)悉,此次創(chuàng)辦無問芯穹,汪玉的合作伙伴還包括北京大學(xué)科研副教授、商湯原數(shù)據(jù)與計算平臺部執(zhí)行總監(jiān)、小紅書原AI平臺部負(fù)責(zé)人顏深根等。
需要注意的是,12月18日,在以“讓算力更自由”為主題的首屆AI Tech Day(AI 嘉年華)上,夏立雪將以無問芯穹創(chuàng)始人的身份出席,并發(fā)表《模型推理加速,釋放算力潛力》主題演講。
目前,網(wǎng)絡(luò)上關(guān)于夏立雪的消息并不多。在今年4月的《清華112周年校慶電子系校友返校論壇》上,他作為電子系2009級畢業(yè)10周年校友代表作了相關(guān)發(fā)言。而在今年8月常德全媒公眾號的一篇文章中,他曾以無問芯穹CEO身份出現(xiàn),但在后續(xù)推文修改后,已無此描述。
同樣是在“AI 嘉年華”上,汪玉也將現(xiàn)身以《自主可控的AGI產(chǎn)業(yè)發(fā)展與布局,讓算力更自由》為主題的圓桌論壇環(huán)節(jié)。但他的介紹里并未提及無問芯穹,僅顯示為“清華大學(xué)電子系主任”。
做大模型基礎(chǔ)設(shè)施,加速大模型落地最后一公里
與市場上大多數(shù)通用或?qū)S么竽P凸静煌?,無問芯穹另辟蹊徑,走得是一條服務(wù)大模型公司的“大路”。
據(jù)介紹,無問芯穹以無穹大模型能效優(yōu)化工具包為基礎(chǔ),整合國產(chǎn)芯片算力, 構(gòu)建統(tǒng)一算力底座。在AI大模型多樣、算力多樣的分散行業(yè)格局下,構(gòu)建連接模型和算力的M*N中間層。通過模型層、系統(tǒng)層、硬件層的跨層協(xié)同優(yōu)化,發(fā)揮各類算力硬件的效率,助力大模型應(yīng)用落地。
具體而言,無問芯穹主要提供智算云服務(wù)、智算一體機、大模型能效優(yōu)化工具包等解決方案。同時,公司還自研了行業(yè)大模型,包括政務(wù)大模型、法律大模型、證券大模型等。
解決什么痛點?無問芯穹商業(yè)化副總裁李楓在9月及11月份的相關(guān)活動中做過詳細(xì)分享——《加速大模型落地最后一公里》。
據(jù)李楓介紹,為了解決模型和算力之間的瓶頸,無問芯穹致力于提供大模型軟硬一體化自動化優(yōu)化方案。向上,我們服務(wù)多家大模型算法企業(yè);向下,我們聯(lián)動多家國產(chǎn)芯片公司。產(chǎn)品上,我們實現(xiàn)了大模型在多種硬件上的M×N一鍵部署平臺,降低大模型的使用門檻,讓模型部署越快越好,真正成為AI 2.0時代大模型的基礎(chǔ)設(shè)施。
為了助力 AI 2.0 時代大模型落地,無問芯穹著力于解決四個痛點需求。
1.支持長文本或大輸入:比如之前支持 2K token 的模型,我們可以用快速推理和訓(xùn)練,使它支持 32K token,我們就可以做好例如專業(yè)長文本的信息檢索、生成、會議聊天助手等應(yīng)用;
2.提升性價比:我們把語言和多模態(tài)生成模型部署到消費級顯卡,甚至手機等終端設(shè)備上,讓廣大客戶用得起;
3.垂直領(lǐng)域適配:用大模型通用能力幫助各行各業(yè)的人們提升體驗和效率;
4.一鍵式部署:讓大模型能低人力成本被部署到各種場景,讓每個工廠、學(xué)校、家庭甚至個人都能用到它的能力。
無問芯穹希望實現(xiàn)“大模型用得好、用得起、用得廣、愿意用”的目標(biāo),加速大模型落地最后一公里。
來源:青云科技
作為上?!巴辽灵L”的創(chuàng)業(yè)公司,創(chuàng)立僅兩月,無問芯穹就在今年7月的2023世界人工智能大會上,正式首次亮相。
據(jù)上海徐匯公眾號文章,徐匯區(qū)委常委、副區(qū)長俞林偉代表徐匯,與無問芯穹進(jìn)行了簽約。雙方簽約項目為無問芯穹大模型軟硬件協(xié)同優(yōu)化平臺,旨在解決大模型算法向大算力芯片的高效統(tǒng)一部署問題,建設(shè)面向大模型的M×N算法-芯片聯(lián)合優(yōu)化平臺,其中M層支撐多種大模型算法、N層連接多種大算力芯片,提升大模型到國產(chǎn)芯片平臺的部署效率,實現(xiàn)在不同國產(chǎn)芯片上的“高效”“統(tǒng)一”部署。
在無問芯穹11月份發(fā)布的公眾號文章中,也提到了公司的最新進(jìn)展。
據(jù)介紹,來自無問芯穹、清華大學(xué)和上海交通大學(xué)的聯(lián)合團隊提出了一種新方法FlashDecoding++,可以將GPU推理提速2-4倍,同時支持英偉達(dá)和AMD的GPU。
目前,F(xiàn)lashDecoding++已被集成于無問芯穹的大模型計算引擎Infini-ACC中。在Infini-ACC的支持下,無問芯穹正在開發(fā)一系列大模型軟硬件一體化的解決方案,其中包含大模型無穹天權(quán)(Infini-Megrez)、軟硬件一體機等。
據(jù)了解,Infini-Megrez在處理長文本方面表現(xiàn)非常出色,將可處理的文本長度破紀(jì)錄地提升到了256k token,也是當(dāng)前大模型所能處理的最長文本長度。
來源:無問芯穹
此外,Infini-Megrez大模型在 CEval(中)、MMLU(英)、CMMLU(中)、AGIEval等數(shù)據(jù)集上均取得了第一梯隊算法性能,并依托Infini-ACC計算引擎持續(xù)進(jìn)化中。