正在閱讀:

商湯們等待ChatGPT的日子

掃一掃下載界面新聞APP

商湯們等待ChatGPT的日子

夢想從AI先驅轉換到“英偉達平替”。

界面新聞|范劍磊

文|略大參考 秦安娜

編輯 | 原野

01

2010 年,喬布斯將 iPhone 4發(fā)布會的「One more thing」留給了Facetime。他故技重施,在現(xiàn)場撥通好友John Ive的電話——曾經接到初代iPhone首個通話的幸運朋友。兩秒等待后,喬布斯按下通話頁面上形似攝像機的圖標,他留著銀灰色短胡須的削痩臉龐出現(xiàn)在屏幕上。隨即,現(xiàn)場響起了“woo”的驚嘆和起伏的掌聲。

這是蘋果首次在 iPhone 上引入前置攝像頭,雖然只有 30 萬像素,卻讓一部分技術愛好者,看到了前置攝像頭的應用前景。清華學生印奇和唐文斌是其中的代表。他們制作了一款名叫《烏鴉來了》的游戲,功能很簡單,立在田地里的稻草人,驅趕四處飛來的烏鴉,防止看守的南瓜被偷走。

但區(qū)別于同時代需要觸屏操作的游戲,《烏鴉來了》是通過攝像頭操作,用戶對著鏡頭左右晃動頭部,控制稻草人擺動,達到驅趕烏鴉的效果。游戲2011年上線,屬于很早期、形式簡單的AR游戲。但由于玩法新奇,很快就上升到蘋果App Store中國區(qū)免費榜前三名。

聯(lián)想之星的投資人王明耀注意到這款游戲,找到印奇團隊,投了幾百萬人民幣的天使輪。不久后,《烏鴉來了》在 App Store上推出付費版,售價為0.99美元,但是用戶的付費意愿不高。就這樣,印奇團隊的第一個創(chuàng)業(yè)項目,在沒有走通商業(yè)化的情況下,擱淺。

此后,印奇、唐文斌帶著團隊又開發(fā)了幾款游戲,均未能成為爆款。他們開始反思,游戲并不是他們最擅長的,他們的長項是機器視覺。在清華姚班讀本科時,印奇和唐文斌就已經在人工智能領域嶄露頭角,印奇在微軟亞洲研究院實習期間,師從孫劍,研究人臉識別。

李開復曾想把印奇挖到谷歌,未果。不過,兩人也因此相識。后來,李開復離開谷歌,創(chuàng)辦創(chuàng)新工場,轉型創(chuàng)業(yè)導師,印奇曾經找他商討創(chuàng)業(yè)做圖像處理器GPU的想法,他想打造中國的皮克斯——被喬布斯收購的那家電腦動畫企業(yè)。李開復聽了當即反對,他當時想不清楚GPU能用來做什么。這款后來在人工智能時代廣泛獲得增長的產品,在當時并沒被看出應用潛力。

早期風投的重要投資邏輯是投人,李開復投了印奇,但當時還叫Face++的曠視團隊,拿得出手的作品只有創(chuàng)始人參加各類人臉識別競賽獲取的冠軍,驗證過的商業(yè)模式是游戲場景并不能讓機器視覺技術發(fā)揮出最大價值。至于它應該用來做什么,無論是李開復還是印奇,都沒想清楚。

在一片混沌中依稀中飄出來的概念:智能手機應該會提供使用場景,這是當時廣聚共識的投資方向。彼時,古早互聯(lián)網時代的創(chuàng)業(yè)者奔走在擁抱新時代的道路上。財富自由的雷軍想做智能手機,他想過投資魅族,但初中出來打拼的黃章對股份極其看中,跟雷軍詳談過好幾次,最終無法接受雷軍提出的投資入股并出任董事長的方案。后來雷軍扯旗,自建團隊,喝下了那碗小米粥。

硬件是當時的主旋律,新的產品終端產生,代表著會催生出新的軟件服務機會。小米造手機也是從軟件系統(tǒng)MIUI開始的。周鴻祎看懂了雷軍用硬件賣軟件的思路,也要做手機。但他不如雷軍幸運,找到類似周光平的人物搞定供應鏈。于是,他退而求其次,想做特供機,聯(lián)合手機廠商一起對抗小米。

可惜,行業(yè)里很多人看不到周鴻祎的視野,還沒有長大的小米,也不足以令他們畏懼,繼而集中在紅衣教主的麾下發(fā)起進攻。聯(lián)想高管的一段表態(tài),大致能代表當時主流手機廠商的看法:小米幾百萬臺的銷量,只不過是聯(lián)想的幾分之一。

無論持有何種視角,中國智能手機的“造機”浪潮,在小米的推動下開始了,手機出貨量以指數(shù)級攀升。而智能手機上搭載的那顆前置攝像頭,讓機器視覺從各大比賽以算法創(chuàng)造出正確率提升的競爭中,以及各大研究室的故紙堆里爬出來,找到了技術可以落地的應用前景。印奇團隊搭建Face++平臺,通過API的方式,為企業(yè)提供服務。種子用戶是美圖秀秀,李開復幫忙找來好友蔡文勝,達成合作。后續(xù)又找到螞蟻金服,為支付寶提供人臉識別技術。

回頭來看,這一切要感謝iPhone將前置攝像頭裝進手機,催生出美顏、人臉識別的需求。隨后,人工智能開始具體應用于很多單向領域。2015年,馬云在德國漢諾威博覽會,親自演示“刷臉”支付,引發(fā)廣泛討論,作為技術提供方的曠視也隨之沾光。

02

中國不算悠久的人工智能商業(yè)史中,絕大多數(shù)的時間,都是在尋找技術的落地場景。在人工智能1.0時代,以曠視、商湯為代表的企業(yè),搭上移動互聯(lián)網時代帶動的視覺需求,OPPO、vivo等手機廠商,美圖、百合網、快手等企業(yè),成為它們在四顧茫然的商業(yè)化道路上,可以暫時歇腳的石凳。用曠視科技副總裁吳文昊的話來說,世界上60%攝像頭用在手機上面,AI一定要進入這個市場。

但這些業(yè)務無法支撐起一家獨角獸企業(yè)的估值,以及與之相匹配的營收。隨著手機鏡頭像素的持續(xù)性迭代,依靠算法帶來的視覺優(yōu)勢被一點點吞噬。當手機廠商陸續(xù)喊出1億像素的宣傳賣點,CMOS圖像傳感器的芯片,成為真正決定一部手機拍照功能好壞的決定性因素。

加入果鏈,為iPhone提供CMOS圖像傳感器的索尼,拿走了手機攝像頭的絕大多數(shù)市場份額。它常年占據(jù)著CMOS圖像傳感器一半的市場。跟硬件進化產生的優(yōu)勢相比,算法帶來的視覺優(yōu)化方案,變得不那么激動人心。

顯然,第一波人工智能企業(yè),還沒有摸到商業(yè)化的入門磚,找到連通人工智能從實驗室算法到應用場景落地之間的橋梁。

探索仍將繼續(xù),隨后人工智能企業(yè)開始在不同“地圖”刷金幣的商業(yè)化之旅。好在,移動互聯(lián)網時代提供了不少講述新商業(yè)故事的場景。上半場,AI與互聯(lián)網金融的結合,成為重要的人臉識別場景?!盎ヂ?lián)網+”浪潮的高峰期,曠視服務近七成的互金客戶。

進入移動互聯(lián)網下半場后,在向線下要流量的使用場景中,無人零售為AI企業(yè)創(chuàng)造了另一波需求。2016年末,亞馬遜推出了無人便利店 Amazon Go,以“不用排隊,拿了就走”的購物體驗出圈,消費者進入商店,在開放貨架上選購商品,然后走出商店,整個購物結算環(huán)節(jié)就完成了。

硅谷的風潮吹向中國,中國零售企業(yè)的創(chuàng)新熱情被點燃了,無人零售成為撐起“新零售”業(yè)態(tài)的全村的希望。外界討論它會是第四次零售變革嗎?行業(yè)會產生下一個滴滴嗎?

不知前路,但行動者已經在路上。阿里巴巴在第二屆淘寶造物節(jié)上,推出無人超市“淘咖啡”’、大潤發(fā)推出繽果盒子,蘇寧、京東同樣上新無人零售業(yè)態(tài)。曠視、商湯再次成為站在大廠背后的企業(yè),為這些應用場景提供技術支持。

創(chuàng)投圈最愛擁抱新變化。當時正值共享經濟的創(chuàng)業(yè)風口式微,無人零售迅速崛起。IT 桔子的數(shù)據(jù)顯示,2017 年共有 93 起無人零售事件獲得融資,占新零售領域投融資事件一半以上,行業(yè)出現(xiàn)了「果小美」,「小麥鋪」、「猩便利」等明星公司。在資本的熱情驅動之下,街頭巷尾涌現(xiàn)出無數(shù)無人零售項目——但現(xiàn)實是,很多人進去不是為了購物,而是乘涼,那里有空調。

正如創(chuàng)投圈涌動的各類風口一樣,風起時資本和創(chuàng)業(yè)項目入場很快,而在資本發(fā)現(xiàn)投錢也無法改變戰(zhàn)局后,熱情就會迅速消退。同之前的情況不同的是,此前資本的意志可以迫使行業(yè)第一名和第二名合并,達到近乎壟斷行業(yè)的作用,但無人零售做不到,一位創(chuàng)業(yè)者說,行業(yè)第二名和最后一名沒有區(qū)別。

風口此起彼伏,商湯、曠視等活躍在大廠背后的技術提供方,也無非是帶著相近的技術,從一個風口過渡到另一個風口。

2017年,蘋果 iPhone X 的發(fā)布,帶動了「AI+3D」的人臉識別方案。商湯和曠視迅速加入到手機行業(yè)的新一輪軍備競賽之中。競爭激烈之時,兩家企業(yè)分別派遣十多人的團隊,進駐各品牌手機廠商的辦公場地。兩家企業(yè)的房間緊挨著,中間是透明的玻璃,能看見彼此。兩個團隊每天發(fā)布一個版本PK。手機廠商不看別的,就看誰的算法更好,擇優(yōu)選擇。

在會議室睡了四個月之后,在人臉識別解鎖上,曠視拿下了vivo部分機型、小米、榮耀、錘子、美圖等,商湯拿下了OPPO和vivo部分機型,以及一些機內應用。

對于自己打“輔助”的身份,兩家企業(yè)的創(chuàng)業(yè)人有過類似的表述。曠視創(chuàng)始人印奇說,“創(chuàng)業(yè)之初對人臉識別、圖像識別、機器大腦這些技術能有什么用,在哪里落地,是很模糊的?!鄙虦珓?chuàng)始人湯曉鷗對人工智能的商業(yè)前景,抱有理性的說道:人工智能也不過是一個輔助性的工具,并不是事情的全部。這個工具本身并不能產生獨立的價值,而一定是在跟各個行業(yè)相結合以后,為各個行業(yè)生產效率的提升來服務的。

這些先進入行業(yè)的創(chuàng)業(yè)者,看起來都不相信,中國可以產生通用大模型的故事。

03

盡管沒有一直站在風口,中國的人工智能創(chuàng)業(yè)熱情卻多年保持在高位,融資金額在2017年首次超越美國,位居世界第一。根據(jù)深圳人工智能行業(yè)協(xié)會統(tǒng)計,自2012年至2020年上半年,北京、上海、深圳、杭州四地的AI產業(yè)融資達4260億元,融資規(guī)模在2018年達到頂點,當年融資近1500億元。

類似商湯、曠視這項的明星企業(yè),更是資本的寵兒。它們吸引外界廣泛關注的時刻,通常也是跟融資新聞聯(lián)系在一起。2017年10月,曠視獲得4.6億美元C輪融資,刷新人工智能領域的融資記錄。然而,不到一年,記錄被孫正義的軟銀愿景基金以10億美元投資商湯的單筆融資再次刷新。孫正義以一己之力,將商湯科技估值抬至60億美元。

孫正義的投資方法是下重注,別人投幾百萬的,他投幾千萬,別人投幾億,他投幾千億。他喜歡問創(chuàng)業(yè)者的問題是“如果錢不是問題,你會怎么做?”,“我們怎么才能幫助你擴張100倍?”

但是,初代人工智能企業(yè)的業(yè)務擴張是人工+智能的模板。也就是說,業(yè)務擴張總要跟人力成本的支出增長聯(lián)系在一起,基本成正比。

人類憑借肉眼可以辨別出不同物體之間的差別, 但是機器視覺記住不同物體之間的特征,需要通過大量的訓練。訓練人類認識什么是小狗很容易,但是訓練機器認識小狗很費錢,它需要通過無數(shù)張圖片,才可以讓機器認識什么是“小狗”。換到另外的場景,比如說讓機器認識什么是貓,就需要將算法重新訓練一遍。

而且,它所需要的成本也很高昂,不僅僅是算法、數(shù)據(jù)、還包括算力支持。還在谷歌大腦供職時,吳恩達(Andrew Ng)曾經跟好友,擔任英偉達首席科學家的比爾·戴利(Bill Dally)抱怨,他的課題組要用數(shù)千萬條YouTube視頻來訓練神經網絡AI分辨貓與人的不同。結果訓練神經網絡AI的算力不夠。如果用CPU來執(zhí)行此類任務,完成課題大概需要1.6萬塊CPU。對任何一家存在于商業(yè)公司的研究項目組而言,申報1.6萬塊CPU的預算,也是十分困難的,即便是在不差錢的谷歌。

對中國人工智能企業(yè)而言亦是如此。商湯投入巨資建立了自己的超算中心,很燒錢。按一下“run”字按鈕,進行一次數(shù)據(jù)訓練迭代,整體花費至少50萬元。CEO徐立稱,“我們有150多個博士天天在算法平臺上按‘run’,這還不算每年追加的數(shù)億元GPU集群采購預算?!?/p>

商湯、曠視為代表的AI四小龍,收入高,虧損也高。導致虧損的核心是巨量的人力資本投入。它們總收入的75%花在人力成本,加上硬件成本及其他成本,最終總是難逃虧損。這讓它們在安防領域的競爭優(yōu)勢,遠遠比不上老牌安防巨頭??低?,后者每掙一元錢,在人力成本上只花不到0.2元,硬件及其他成本約0.6元,最終還能掙0.2元。

更扎心的是,AI四小龍用虧損換來的,也不過是落地場景分散、產品標準化程度低,算法模型沒有深度突破的局面。

風口來來去去,兜兜轉轉不停歇。曠視、商湯這樣的企業(yè),始終作為技術服務方的形式存在。

在人工智能概念火爆后,一輪輪融資和上市,為初代AI企業(yè)帶來充沛的現(xiàn)金流。比如商湯,上市后,大手一揮花費33.28億元,買入上海西岸國際人工智能中心西樓4樓至26樓。近日陷入現(xiàn)金流短缺危機的寶寶樹,看到商湯的現(xiàn)金流,是要留下羨慕眼淚的,這樣企業(yè)的CFO,大約是不會上演手持寶劍闖門的劇情。

商湯在現(xiàn)有費用的基礎上,擁有能支撐企業(yè)5年運轉的現(xiàn)金流,但僅憑借這些資本卻無法讓它們成為消費級的企業(yè)。

人工智能從2017年就開始成為國家戰(zhàn)略,作為21世紀三大尖端技術——基因工程、納米科學、AI——之一,曾被給予中國科技彎道超車的眾望,但這些希望被分散在做自然語言、做語音識別、做機器視覺等細分領域大大小小的各類創(chuàng)業(yè)項目上,被錯付在找尋可以支持商業(yè)化變現(xiàn)的落地場景上。

通用大模型,沒有成為一種具備產業(yè)共識的選項。產業(yè)端沒有出現(xiàn)過哪個創(chuàng)業(yè)項目,想要做可以語音識別、機器視覺、機器翻譯、能溝通,可以回答問題的通用人工智能。

但是,創(chuàng)造出ChatGPT的OpenAI不是這樣,它成立之初,就是要做通用大模型。

出門問問的創(chuàng)始人李志飛說,OpenAI成立就一直目標是做AGI,做通用模型,而不是完成具體任務的系統(tǒng)。在GPT-3后,OpenAI是產品驅動的AI研究。這跟Google或別的組織不一樣。別的要么是偏學術的研究——一幫人做出一個系統(tǒng),寫一篇論文,弄個PR,又去干別的了;要么是像DeepMind是項目制,AlphaGo做一做,又做AlphaZero,又做AlphaFord。OpenAI與它們最大的不同在于,它是以產品為導向的迭代。

當 OpenAI 推出“ChatGPT+插件”的新結構時,它實際上已經完成了身份轉化,變成一家消費級技術平臺公司。全球的創(chuàng)業(yè)公司都可以通過它,推出自己的服務。目前已有的插件包括旅游、餐廳預定等,今后還會有更多。

04

至少在現(xiàn)在,“商湯”們還沒準備好自己當主角。受限于野心、技術、資本等資源或者創(chuàng)新壓力,被推上風口的中國AI公司們,研究的還是生意,如何讓原本的生意與ChatGPT帶來的機遇更好地結合——這確實也是它們等待多年的時機。

人工智能領域可以稱之為以產品為導向的研究,無人駕駛算一個。正如周鴻祎當年對雷軍辦小米的預測——新終端會產生新的軟件,電動汽車也帶動了軟件系統(tǒng)創(chuàng)新,比如無人駕駛輔助系統(tǒng)成為電動汽車智能化的重要支撐,就像理想汽車將自己定義為人工智能企業(yè),而非造車企業(yè)。

蔚來、理想、小鵬三家造車新勢力的軟硬件一體的方案,留給其他人工智能企業(yè)的空間,是跟傳統(tǒng)廠商合作??上В瑐鹘y(tǒng)車企還在完成電動化的上半場,絕大多數(shù)沒有進入到智能化的下半場。即便是電動車銷量一騎絕塵的比亞迪,其創(chuàng)始人王傳福也將自己拋進“無人駕駛是騙局”的爭議里。

既沒有硬件優(yōu)勢,又缺少軟件算法和數(shù)據(jù)的初代人工智能企業(yè),提供的智能駕駛解決方案——比如商湯的絕影,可以為車企提供駕駛員疲勞狀態(tài)實時提醒、兒童遺忘檢測系統(tǒng)等乘員感知技術,也不過是為人臉識別方案尋找新的落地場景而已,跟智能駕駛可以說是毫不沾邊。曠視的智能汽車系統(tǒng)解決方案,跟商湯幾乎是復制、粘貼形式的相似,都是提供車主身份驗證、司機駕駛狀態(tài)分析,本質當然也是一樣,找個新瓶子裝舊的湯藥。

至于日前商湯發(fā)布的“日日新SenseNova”大模型體系,推出自然語言處理、內容生成、自動化數(shù)據(jù)標注、自定義模型訓練等多種大模型及能力,也不過是在宣傳話術層面向大模型的靠攏?!绑w系”二字已經說明它不是一個模型,而是將人臉識別應用在不同場景的平臺集合。

以上種種擁抱新能源汽車的方案和產品,都是功能單一的單獨模型,只能語音識別,只能語義理解,只能畫圖。而且,商湯在發(fā)布會上的演示環(huán)節(jié),出現(xiàn)AI模型站civitai的圖片,引發(fā)網絡質疑。商湯方面的解釋是:秒畫SenseMirage包含商湯自研AIGC大模型,也提供第三方社區(qū)開源模型。

圖:被質疑來自AI模型站civitai的圖片

商湯的大模型是應用場景層面的大模型。它被行業(yè)人士所知曉,但又沒聽聞有博主測試過。畢竟它只面向政企開放API接口。即便是開源模型,商湯對用戶群體的選擇也有要求,參照一下,2023年 2月,meta AI開源了LLaMa模型,有650億的參數(shù),它開源就是想讓多人拿到更多的參數(shù),此外,它還寫了一篇介紹LLaMA模型的論文,介紹模型參數(shù),并謹慎的稱自己是“小模型"。而商湯從開源模型中拿到參數(shù),卻打包組合進“日日新”體系,變成給政企客戶測試用的服務。

商湯在商業(yè)化上的更近一步,是從賣技術服務方案的企業(yè),變成想要賣算力的企業(yè)。商湯在上海臨港的AIDC算力中心,完成2.7萬塊GPU的部署并實現(xiàn)了5.0 exaFLOPS的算力輸出能力。

賣算力是人工智能領域穩(wěn)賺不賠的生意。當年面對吳恩達對算力不足的困惑,好友戴利的回答是:何必整1.6萬塊CPU,用英偉達公司的顯卡產品,幾十塊就搞定。對于研究領域,算力太重要了。李彥宏講過,吳恩達在谷歌的時候,據(jù)說很不爽,因為谷歌不相信GPU的方向,(吳恩達)到了百度隨便買GPU,所以百度有了最大的GPU集群。

商湯的聯(lián)合創(chuàng)始人徐立曾介紹,一位投資人跟他聊完之后,獲得了靈感,買入英偉達的股票,獲得了7倍回報。但是商湯給不了資本市場如此高的回報,它趕在2021年最后一個交易日上市,以3.99元的發(fā)行價上市——搶在跟投資人對賭協(xié)議到期之前。上市之初,商湯股價翻過一倍。目前,則是已經呈現(xiàn)腰斬的狀態(tài)。

而英偉達成為人工智能行業(yè)的“水電煤”。2020年,全世界跑AI的云計算與數(shù)據(jù)中心,80.6%都在用英偉達的GPU驅動。2021年,英偉達宣稱:全球前五百個超算中,七成由它家的芯片驅動。在最新的超算系統(tǒng)中,此比例是九成。

如今,人工智能卷向動輒幾百幾千億參數(shù)的大模型領域,作為支撐模型運算的最基礎的力量,算力更顯重要。沒有充足算力就帶不動大模型。英偉達創(chuàng)始人黃仁勛說“AI進入iPhone時刻”的預測無論是否成真,這邊卷向大模型的方向,英偉達都穩(wěn)賺不賠。比如,百度的文心一言在畫圖理解上還需要進化,畫的驢肉火燒、松鼠桂魚等菜譜,讓人啼笑皆非,卻并不妨礙,其背后的算力提供方百度云,以此宣傳自身服務。根據(jù)百度副總裁沈抖的說法:百度云是國內第一個訓練出大模型的云。

對于商湯而言,情節(jié)相似。雖然只是大模型體系,且特供測試名額,但是它在發(fā)布會優(yōu)先講的是大裝置,也就是臨港AIDC出售算力的商業(yè)故事。創(chuàng)業(yè)近10年,商湯的夢想也不過從中國AI先驅轉換為成為“英偉達平替”而已。它提供算力支持的絕大多數(shù)芯片,還是購于英偉達。

要求一家中國AI公司直接去奔赴宏遠高大的夢想,在眼下還是個奢望。但至少,對于商湯們而言,在迷霧中摸索前行的商業(yè)化之路,因為大模型的進化而變得更加清晰。

印奇已經在最近的訪談中喊出了曠視要在5年內實現(xiàn)盈利的小目標。畢竟,先活下來,才有后續(xù)趕超的其他可能。在更令人激動的故事出現(xiàn)之前,或許能祈禱的只是:所有的等待和嘗試都值得。

本文為轉載內容,授權事宜請聯(lián)系原著作權人。

商湯科技

2.6k
  • 商湯星云發(fā)布新一代面向智慧園區(qū)場景的智能服務器,新增視覺多模態(tài)大模型算法
  • 商湯科技在上海成立智能科技公司

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

商湯們等待ChatGPT的日子

夢想從AI先驅轉換到“英偉達平替”。

界面新聞|范劍磊

文|略大參考 秦安娜

編輯 | 原野

01

2010 年,喬布斯將 iPhone 4發(fā)布會的「One more thing」留給了Facetime。他故技重施,在現(xiàn)場撥通好友John Ive的電話——曾經接到初代iPhone首個通話的幸運朋友。兩秒等待后,喬布斯按下通話頁面上形似攝像機的圖標,他留著銀灰色短胡須的削痩臉龐出現(xiàn)在屏幕上。隨即,現(xiàn)場響起了“woo”的驚嘆和起伏的掌聲。

這是蘋果首次在 iPhone 上引入前置攝像頭,雖然只有 30 萬像素,卻讓一部分技術愛好者,看到了前置攝像頭的應用前景。清華學生印奇和唐文斌是其中的代表。他們制作了一款名叫《烏鴉來了》的游戲,功能很簡單,立在田地里的稻草人,驅趕四處飛來的烏鴉,防止看守的南瓜被偷走。

但區(qū)別于同時代需要觸屏操作的游戲,《烏鴉來了》是通過攝像頭操作,用戶對著鏡頭左右晃動頭部,控制稻草人擺動,達到驅趕烏鴉的效果。游戲2011年上線,屬于很早期、形式簡單的AR游戲。但由于玩法新奇,很快就上升到蘋果App Store中國區(qū)免費榜前三名。

聯(lián)想之星的投資人王明耀注意到這款游戲,找到印奇團隊,投了幾百萬人民幣的天使輪。不久后,《烏鴉來了》在 App Store上推出付費版,售價為0.99美元,但是用戶的付費意愿不高。就這樣,印奇團隊的第一個創(chuàng)業(yè)項目,在沒有走通商業(yè)化的情況下,擱淺。

此后,印奇、唐文斌帶著團隊又開發(fā)了幾款游戲,均未能成為爆款。他們開始反思,游戲并不是他們最擅長的,他們的長項是機器視覺。在清華姚班讀本科時,印奇和唐文斌就已經在人工智能領域嶄露頭角,印奇在微軟亞洲研究院實習期間,師從孫劍,研究人臉識別。

李開復曾想把印奇挖到谷歌,未果。不過,兩人也因此相識。后來,李開復離開谷歌,創(chuàng)辦創(chuàng)新工場,轉型創(chuàng)業(yè)導師,印奇曾經找他商討創(chuàng)業(yè)做圖像處理器GPU的想法,他想打造中國的皮克斯——被喬布斯收購的那家電腦動畫企業(yè)。李開復聽了當即反對,他當時想不清楚GPU能用來做什么。這款后來在人工智能時代廣泛獲得增長的產品,在當時并沒被看出應用潛力。

早期風投的重要投資邏輯是投人,李開復投了印奇,但當時還叫Face++的曠視團隊,拿得出手的作品只有創(chuàng)始人參加各類人臉識別競賽獲取的冠軍,驗證過的商業(yè)模式是游戲場景并不能讓機器視覺技術發(fā)揮出最大價值。至于它應該用來做什么,無論是李開復還是印奇,都沒想清楚。

在一片混沌中依稀中飄出來的概念:智能手機應該會提供使用場景,這是當時廣聚共識的投資方向。彼時,古早互聯(lián)網時代的創(chuàng)業(yè)者奔走在擁抱新時代的道路上。財富自由的雷軍想做智能手機,他想過投資魅族,但初中出來打拼的黃章對股份極其看中,跟雷軍詳談過好幾次,最終無法接受雷軍提出的投資入股并出任董事長的方案。后來雷軍扯旗,自建團隊,喝下了那碗小米粥。

硬件是當時的主旋律,新的產品終端產生,代表著會催生出新的軟件服務機會。小米造手機也是從軟件系統(tǒng)MIUI開始的。周鴻祎看懂了雷軍用硬件賣軟件的思路,也要做手機。但他不如雷軍幸運,找到類似周光平的人物搞定供應鏈。于是,他退而求其次,想做特供機,聯(lián)合手機廠商一起對抗小米。

可惜,行業(yè)里很多人看不到周鴻祎的視野,還沒有長大的小米,也不足以令他們畏懼,繼而集中在紅衣教主的麾下發(fā)起進攻。聯(lián)想高管的一段表態(tài),大致能代表當時主流手機廠商的看法:小米幾百萬臺的銷量,只不過是聯(lián)想的幾分之一。

無論持有何種視角,中國智能手機的“造機”浪潮,在小米的推動下開始了,手機出貨量以指數(shù)級攀升。而智能手機上搭載的那顆前置攝像頭,讓機器視覺從各大比賽以算法創(chuàng)造出正確率提升的競爭中,以及各大研究室的故紙堆里爬出來,找到了技術可以落地的應用前景。印奇團隊搭建Face++平臺,通過API的方式,為企業(yè)提供服務。種子用戶是美圖秀秀,李開復幫忙找來好友蔡文勝,達成合作。后續(xù)又找到螞蟻金服,為支付寶提供人臉識別技術。

回頭來看,這一切要感謝iPhone將前置攝像頭裝進手機,催生出美顏、人臉識別的需求。隨后,人工智能開始具體應用于很多單向領域。2015年,馬云在德國漢諾威博覽會,親自演示“刷臉”支付,引發(fā)廣泛討論,作為技術提供方的曠視也隨之沾光。

02

中國不算悠久的人工智能商業(yè)史中,絕大多數(shù)的時間,都是在尋找技術的落地場景。在人工智能1.0時代,以曠視、商湯為代表的企業(yè),搭上移動互聯(lián)網時代帶動的視覺需求,OPPO、vivo等手機廠商,美圖、百合網、快手等企業(yè),成為它們在四顧茫然的商業(yè)化道路上,可以暫時歇腳的石凳。用曠視科技副總裁吳文昊的話來說,世界上60%攝像頭用在手機上面,AI一定要進入這個市場。

但這些業(yè)務無法支撐起一家獨角獸企業(yè)的估值,以及與之相匹配的營收。隨著手機鏡頭像素的持續(xù)性迭代,依靠算法帶來的視覺優(yōu)勢被一點點吞噬。當手機廠商陸續(xù)喊出1億像素的宣傳賣點,CMOS圖像傳感器的芯片,成為真正決定一部手機拍照功能好壞的決定性因素。

加入果鏈,為iPhone提供CMOS圖像傳感器的索尼,拿走了手機攝像頭的絕大多數(shù)市場份額。它常年占據(jù)著CMOS圖像傳感器一半的市場。跟硬件進化產生的優(yōu)勢相比,算法帶來的視覺優(yōu)化方案,變得不那么激動人心。

顯然,第一波人工智能企業(yè),還沒有摸到商業(yè)化的入門磚,找到連通人工智能從實驗室算法到應用場景落地之間的橋梁。

探索仍將繼續(xù),隨后人工智能企業(yè)開始在不同“地圖”刷金幣的商業(yè)化之旅。好在,移動互聯(lián)網時代提供了不少講述新商業(yè)故事的場景。上半場,AI與互聯(lián)網金融的結合,成為重要的人臉識別場景。“互聯(lián)網+”浪潮的高峰期,曠視服務近七成的互金客戶。

進入移動互聯(lián)網下半場后,在向線下要流量的使用場景中,無人零售為AI企業(yè)創(chuàng)造了另一波需求。2016年末,亞馬遜推出了無人便利店 Amazon Go,以“不用排隊,拿了就走”的購物體驗出圈,消費者進入商店,在開放貨架上選購商品,然后走出商店,整個購物結算環(huán)節(jié)就完成了。

硅谷的風潮吹向中國,中國零售企業(yè)的創(chuàng)新熱情被點燃了,無人零售成為撐起“新零售”業(yè)態(tài)的全村的希望。外界討論它會是第四次零售變革嗎?行業(yè)會產生下一個滴滴嗎?

不知前路,但行動者已經在路上。阿里巴巴在第二屆淘寶造物節(jié)上,推出無人超市“淘咖啡”’、大潤發(fā)推出繽果盒子,蘇寧、京東同樣上新無人零售業(yè)態(tài)。曠視、商湯再次成為站在大廠背后的企業(yè),為這些應用場景提供技術支持。

創(chuàng)投圈最愛擁抱新變化。當時正值共享經濟的創(chuàng)業(yè)風口式微,無人零售迅速崛起。IT 桔子的數(shù)據(jù)顯示,2017 年共有 93 起無人零售事件獲得融資,占新零售領域投融資事件一半以上,行業(yè)出現(xiàn)了「果小美」,「小麥鋪」、「猩便利」等明星公司。在資本的熱情驅動之下,街頭巷尾涌現(xiàn)出無數(shù)無人零售項目——但現(xiàn)實是,很多人進去不是為了購物,而是乘涼,那里有空調。

正如創(chuàng)投圈涌動的各類風口一樣,風起時資本和創(chuàng)業(yè)項目入場很快,而在資本發(fā)現(xiàn)投錢也無法改變戰(zhàn)局后,熱情就會迅速消退。同之前的情況不同的是,此前資本的意志可以迫使行業(yè)第一名和第二名合并,達到近乎壟斷行業(yè)的作用,但無人零售做不到,一位創(chuàng)業(yè)者說,行業(yè)第二名和最后一名沒有區(qū)別。

風口此起彼伏,商湯、曠視等活躍在大廠背后的技術提供方,也無非是帶著相近的技術,從一個風口過渡到另一個風口。

2017年,蘋果 iPhone X 的發(fā)布,帶動了「AI+3D」的人臉識別方案。商湯和曠視迅速加入到手機行業(yè)的新一輪軍備競賽之中。競爭激烈之時,兩家企業(yè)分別派遣十多人的團隊,進駐各品牌手機廠商的辦公場地。兩家企業(yè)的房間緊挨著,中間是透明的玻璃,能看見彼此。兩個團隊每天發(fā)布一個版本PK。手機廠商不看別的,就看誰的算法更好,擇優(yōu)選擇。

在會議室睡了四個月之后,在人臉識別解鎖上,曠視拿下了vivo部分機型、小米、榮耀、錘子、美圖等,商湯拿下了OPPO和vivo部分機型,以及一些機內應用。

對于自己打“輔助”的身份,兩家企業(yè)的創(chuàng)業(yè)人有過類似的表述。曠視創(chuàng)始人印奇說,“創(chuàng)業(yè)之初對人臉識別、圖像識別、機器大腦這些技術能有什么用,在哪里落地,是很模糊的。”商湯創(chuàng)始人湯曉鷗對人工智能的商業(yè)前景,抱有理性的說道:人工智能也不過是一個輔助性的工具,并不是事情的全部。這個工具本身并不能產生獨立的價值,而一定是在跟各個行業(yè)相結合以后,為各個行業(yè)生產效率的提升來服務的。

這些先進入行業(yè)的創(chuàng)業(yè)者,看起來都不相信,中國可以產生通用大模型的故事。

03

盡管沒有一直站在風口,中國的人工智能創(chuàng)業(yè)熱情卻多年保持在高位,融資金額在2017年首次超越美國,位居世界第一。根據(jù)深圳人工智能行業(yè)協(xié)會統(tǒng)計,自2012年至2020年上半年,北京、上海、深圳、杭州四地的AI產業(yè)融資達4260億元,融資規(guī)模在2018年達到頂點,當年融資近1500億元。

類似商湯、曠視這項的明星企業(yè),更是資本的寵兒。它們吸引外界廣泛關注的時刻,通常也是跟融資新聞聯(lián)系在一起。2017年10月,曠視獲得4.6億美元C輪融資,刷新人工智能領域的融資記錄。然而,不到一年,記錄被孫正義的軟銀愿景基金以10億美元投資商湯的單筆融資再次刷新。孫正義以一己之力,將商湯科技估值抬至60億美元。

孫正義的投資方法是下重注,別人投幾百萬的,他投幾千萬,別人投幾億,他投幾千億。他喜歡問創(chuàng)業(yè)者的問題是“如果錢不是問題,你會怎么做?”,“我們怎么才能幫助你擴張100倍?”

但是,初代人工智能企業(yè)的業(yè)務擴張是人工+智能的模板。也就是說,業(yè)務擴張總要跟人力成本的支出增長聯(lián)系在一起,基本成正比。

人類憑借肉眼可以辨別出不同物體之間的差別, 但是機器視覺記住不同物體之間的特征,需要通過大量的訓練。訓練人類認識什么是小狗很容易,但是訓練機器認識小狗很費錢,它需要通過無數(shù)張圖片,才可以讓機器認識什么是“小狗”。換到另外的場景,比如說讓機器認識什么是貓,就需要將算法重新訓練一遍。

而且,它所需要的成本也很高昂,不僅僅是算法、數(shù)據(jù)、還包括算力支持。還在谷歌大腦供職時,吳恩達(Andrew Ng)曾經跟好友,擔任英偉達首席科學家的比爾·戴利(Bill Dally)抱怨,他的課題組要用數(shù)千萬條YouTube視頻來訓練神經網絡AI分辨貓與人的不同。結果訓練神經網絡AI的算力不夠。如果用CPU來執(zhí)行此類任務,完成課題大概需要1.6萬塊CPU。對任何一家存在于商業(yè)公司的研究項目組而言,申報1.6萬塊CPU的預算,也是十分困難的,即便是在不差錢的谷歌。

對中國人工智能企業(yè)而言亦是如此。商湯投入巨資建立了自己的超算中心,很燒錢。按一下“run”字按鈕,進行一次數(shù)據(jù)訓練迭代,整體花費至少50萬元。CEO徐立稱,“我們有150多個博士天天在算法平臺上按‘run’,這還不算每年追加的數(shù)億元GPU集群采購預算?!?/p>

商湯、曠視為代表的AI四小龍,收入高,虧損也高。導致虧損的核心是巨量的人力資本投入。它們總收入的75%花在人力成本,加上硬件成本及其他成本,最終總是難逃虧損。這讓它們在安防領域的競爭優(yōu)勢,遠遠比不上老牌安防巨頭海康威視,后者每掙一元錢,在人力成本上只花不到0.2元,硬件及其他成本約0.6元,最終還能掙0.2元。

更扎心的是,AI四小龍用虧損換來的,也不過是落地場景分散、產品標準化程度低,算法模型沒有深度突破的局面。

風口來來去去,兜兜轉轉不停歇。曠視、商湯這樣的企業(yè),始終作為技術服務方的形式存在。

在人工智能概念火爆后,一輪輪融資和上市,為初代AI企業(yè)帶來充沛的現(xiàn)金流。比如商湯,上市后,大手一揮花費33.28億元,買入上海西岸國際人工智能中心西樓4樓至26樓。近日陷入現(xiàn)金流短缺危機的寶寶樹,看到商湯的現(xiàn)金流,是要留下羨慕眼淚的,這樣企業(yè)的CFO,大約是不會上演手持寶劍闖門的劇情。

商湯在現(xiàn)有費用的基礎上,擁有能支撐企業(yè)5年運轉的現(xiàn)金流,但僅憑借這些資本卻無法讓它們成為消費級的企業(yè)。

人工智能從2017年就開始成為國家戰(zhàn)略,作為21世紀三大尖端技術——基因工程、納米科學、AI——之一,曾被給予中國科技彎道超車的眾望,但這些希望被分散在做自然語言、做語音識別、做機器視覺等細分領域大大小小的各類創(chuàng)業(yè)項目上,被錯付在找尋可以支持商業(yè)化變現(xiàn)的落地場景上。

通用大模型,沒有成為一種具備產業(yè)共識的選項。產業(yè)端沒有出現(xiàn)過哪個創(chuàng)業(yè)項目,想要做可以語音識別、機器視覺、機器翻譯、能溝通,可以回答問題的通用人工智能。

但是,創(chuàng)造出ChatGPT的OpenAI不是這樣,它成立之初,就是要做通用大模型。

出門問問的創(chuàng)始人李志飛說,OpenAI成立就一直目標是做AGI,做通用模型,而不是完成具體任務的系統(tǒng)。在GPT-3后,OpenAI是產品驅動的AI研究。這跟Google或別的組織不一樣。別的要么是偏學術的研究——一幫人做出一個系統(tǒng),寫一篇論文,弄個PR,又去干別的了;要么是像DeepMind是項目制,AlphaGo做一做,又做AlphaZero,又做AlphaFord。OpenAI與它們最大的不同在于,它是以產品為導向的迭代。

當 OpenAI 推出“ChatGPT+插件”的新結構時,它實際上已經完成了身份轉化,變成一家消費級技術平臺公司。全球的創(chuàng)業(yè)公司都可以通過它,推出自己的服務。目前已有的插件包括旅游、餐廳預定等,今后還會有更多。

04

至少在現(xiàn)在,“商湯”們還沒準備好自己當主角。受限于野心、技術、資本等資源或者創(chuàng)新壓力,被推上風口的中國AI公司們,研究的還是生意,如何讓原本的生意與ChatGPT帶來的機遇更好地結合——這確實也是它們等待多年的時機。

人工智能領域可以稱之為以產品為導向的研究,無人駕駛算一個。正如周鴻祎當年對雷軍辦小米的預測——新終端會產生新的軟件,電動汽車也帶動了軟件系統(tǒng)創(chuàng)新,比如無人駕駛輔助系統(tǒng)成為電動汽車智能化的重要支撐,就像理想汽車將自己定義為人工智能企業(yè),而非造車企業(yè)。

蔚來、理想、小鵬三家造車新勢力的軟硬件一體的方案,留給其他人工智能企業(yè)的空間,是跟傳統(tǒng)廠商合作??上В瑐鹘y(tǒng)車企還在完成電動化的上半場,絕大多數(shù)沒有進入到智能化的下半場。即便是電動車銷量一騎絕塵的比亞迪,其創(chuàng)始人王傳福也將自己拋進“無人駕駛是騙局”的爭議里。

既沒有硬件優(yōu)勢,又缺少軟件算法和數(shù)據(jù)的初代人工智能企業(yè),提供的智能駕駛解決方案——比如商湯的絕影,可以為車企提供駕駛員疲勞狀態(tài)實時提醒、兒童遺忘檢測系統(tǒng)等乘員感知技術,也不過是為人臉識別方案尋找新的落地場景而已,跟智能駕駛可以說是毫不沾邊。曠視的智能汽車系統(tǒng)解決方案,跟商湯幾乎是復制、粘貼形式的相似,都是提供車主身份驗證、司機駕駛狀態(tài)分析,本質當然也是一樣,找個新瓶子裝舊的湯藥。

至于日前商湯發(fā)布的“日日新SenseNova”大模型體系,推出自然語言處理、內容生成、自動化數(shù)據(jù)標注、自定義模型訓練等多種大模型及能力,也不過是在宣傳話術層面向大模型的靠攏。“體系”二字已經說明它不是一個模型,而是將人臉識別應用在不同場景的平臺集合。

以上種種擁抱新能源汽車的方案和產品,都是功能單一的單獨模型,只能語音識別,只能語義理解,只能畫圖。而且,商湯在發(fā)布會上的演示環(huán)節(jié),出現(xiàn)AI模型站civitai的圖片,引發(fā)網絡質疑。商湯方面的解釋是:秒畫SenseMirage包含商湯自研AIGC大模型,也提供第三方社區(qū)開源模型。

圖:被質疑來自AI模型站civitai的圖片

商湯的大模型是應用場景層面的大模型。它被行業(yè)人士所知曉,但又沒聽聞有博主測試過。畢竟它只面向政企開放API接口。即便是開源模型,商湯對用戶群體的選擇也有要求,參照一下,2023年 2月,meta AI開源了LLaMa模型,有650億的參數(shù),它開源就是想讓多人拿到更多的參數(shù),此外,它還寫了一篇介紹LLaMA模型的論文,介紹模型參數(shù),并謹慎的稱自己是“小模型"。而商湯從開源模型中拿到參數(shù),卻打包組合進“日日新”體系,變成給政企客戶測試用的服務。

商湯在商業(yè)化上的更近一步,是從賣技術服務方案的企業(yè),變成想要賣算力的企業(yè)。商湯在上海臨港的AIDC算力中心,完成2.7萬塊GPU的部署并實現(xiàn)了5.0 exaFLOPS的算力輸出能力。

賣算力是人工智能領域穩(wěn)賺不賠的生意。當年面對吳恩達對算力不足的困惑,好友戴利的回答是:何必整1.6萬塊CPU,用英偉達公司的顯卡產品,幾十塊就搞定。對于研究領域,算力太重要了。李彥宏講過,吳恩達在谷歌的時候,據(jù)說很不爽,因為谷歌不相信GPU的方向,(吳恩達)到了百度隨便買GPU,所以百度有了最大的GPU集群。

商湯的聯(lián)合創(chuàng)始人徐立曾介紹,一位投資人跟他聊完之后,獲得了靈感,買入英偉達的股票,獲得了7倍回報。但是商湯給不了資本市場如此高的回報,它趕在2021年最后一個交易日上市,以3.99元的發(fā)行價上市——搶在跟投資人對賭協(xié)議到期之前。上市之初,商湯股價翻過一倍。目前,則是已經呈現(xiàn)腰斬的狀態(tài)。

而英偉達成為人工智能行業(yè)的“水電煤”。2020年,全世界跑AI的云計算與數(shù)據(jù)中心,80.6%都在用英偉達的GPU驅動。2021年,英偉達宣稱:全球前五百個超算中,七成由它家的芯片驅動。在最新的超算系統(tǒng)中,此比例是九成。

如今,人工智能卷向動輒幾百幾千億參數(shù)的大模型領域,作為支撐模型運算的最基礎的力量,算力更顯重要。沒有充足算力就帶不動大模型。英偉達創(chuàng)始人黃仁勛說“AI進入iPhone時刻”的預測無論是否成真,這邊卷向大模型的方向,英偉達都穩(wěn)賺不賠。比如,百度的文心一言在畫圖理解上還需要進化,畫的驢肉火燒、松鼠桂魚等菜譜,讓人啼笑皆非,卻并不妨礙,其背后的算力提供方百度云,以此宣傳自身服務。根據(jù)百度副總裁沈抖的說法:百度云是國內第一個訓練出大模型的云。

對于商湯而言,情節(jié)相似。雖然只是大模型體系,且特供測試名額,但是它在發(fā)布會優(yōu)先講的是大裝置,也就是臨港AIDC出售算力的商業(yè)故事。創(chuàng)業(yè)近10年,商湯的夢想也不過從中國AI先驅轉換為成為“英偉達平替”而已。它提供算力支持的絕大多數(shù)芯片,還是購于英偉達。

要求一家中國AI公司直接去奔赴宏遠高大的夢想,在眼下還是個奢望。但至少,對于商湯們而言,在迷霧中摸索前行的商業(yè)化之路,因為大模型的進化而變得更加清晰。

印奇已經在最近的訪談中喊出了曠視要在5年內實現(xiàn)盈利的小目標。畢竟,先活下來,才有后續(xù)趕超的其他可能。在更令人激動的故事出現(xiàn)之前,或許能祈禱的只是:所有的等待和嘗試都值得。

本文為轉載內容,授權事宜請聯(lián)系原著作權人。