文|融中財經(jīng)
ChatGPT一夜爆火,掀起了產(chǎn)業(yè)界對于AI大模型的追逐,也吹響了“百模大戰(zhàn)”的號角。為了與OpenAI的ChatGPT抗衡,各方紛紛下注。電商巨頭亞馬遜近期也開始在AI領(lǐng)域頻頻發(fā)力,并向 OpenAI的頭號對手Anthropic豪擲了40億美元(約合292.34億元人民幣)。而這項投資被認為是迄今為止亞馬遜在生成式AI領(lǐng)域中最大的一項投資。
不過就在亞馬遜宣布上述投資幾天后,Anthropic再次傳出了融資動向。10月4日,有消息稱Anthropic嘗試找谷歌以及其他投資人談判,計劃再募集20億美元(約合146.17億元人民幣)的新資金,投后估值或預(yù)計達200-300億美元之間。該公司的新估值將是今年3月40億美元的5倍以上。讓這家成立不到兩年的AI初創(chuàng)公司風(fēng)頭一時無兩。
01 Anthropic什么來頭
受到谷歌、亞馬遜青睞的Anthropic究竟有何背景?先來參考一下中文通用大模型綜合性評測基準(zhǔn)SuperCLUE發(fā)布的9月榜單。測試結(jié)果顯示,Anthropic推出的Claude 2總分僅次于OpenAI的GPT-4和GPT-3.5,位列第三。
9月SuperCLUE總排行榜上Claude 2位列第三(圖片來自于cluebenchmarks.com)
除了在社區(qū)榜單上的優(yōu)勢排名外,Anthropic的創(chuàng)始團隊也不一般。創(chuàng)始人Dario Amodei和Daniela Amodei兄妹倆,在創(chuàng)業(yè)前均來自O(shè)penAI,并在其中擔(dān)任重要職位:Dario是研究副總裁,Daniela是安全政策副總裁。其中,Dario早在OpenAI創(chuàng)立之初便加入了,堪稱其元老級人物之一。另外幾位如Jared Kaplan、Sam McCandlish、Tom Brown等核心研究員也都來自O(shè)penAI,并且均參與過GPT-2與GPT-3 的開發(fā)。這些GPT系列產(chǎn)品的早期開發(fā)者在2021年成立了Anthropic。
隨著ChatGPT的發(fā)布,Anthropic也不甘示弱,僅用兩個月時間便推出了可與之對標(biāo)的類ChatGPT產(chǎn)品——Claude,又在7月初完成了Claude 2的升級,速度驚人。有業(yè)內(nèi)測評顯示,在綜合性能上,Claude 2與GPT-3.5相當(dāng),但與GPT-4仍存在差距。在文件上傳、長文本處理上,Claude 2優(yōu)勢明顯,可將上下文處理的token數(shù)量擴展到10萬個,相當(dāng)于7.5萬個英文單詞。Claude是GPT-4容納token量的3倍,Claude 2更可處理數(shù)百頁技術(shù)文檔,甚至是一本書。在邏輯與計算上,Claude 2與GPT-4性能已不相上下,但代碼生成和問題推理方面較弱。憑借著文本處理數(shù)量上的巨大優(yōu)勢,Claude可與現(xiàn)階段商用的大模型進行差異化競爭。
Anthropic在技術(shù)圈認可度也很高,被認為是OpenAI的強勁對手,其致力于解決大語言模型現(xiàn)有的難點,并在AI安全技術(shù)、大模型的潛在危害性、大模型的可解釋性等方面進行了大量研究。對此,Anthropic提出了憲法式AI方法,為AI系統(tǒng)設(shè)定憲法原則,以區(qū)別于人類反饋強化學(xué)習(xí)RLHF方法,利于實現(xiàn)更精確、更自動化的AI行為監(jiān)督和控制。憲法式AI方法將避免未來AI過于智能,危及人類的情況,為人類監(jiān)督和管理AI提供了方案。
基于上述在AI合規(guī)領(lǐng)域的獨特優(yōu)勢,Anthropic將AI安全技術(shù)視作其產(chǎn)品和解決方案的核心賣點之一。而這一商業(yè)定位與OpenAI等競爭對手有著顯著區(qū)別,有可能在AI安全市場上搶到先機。
大模型是個吞金獸。為了持續(xù)迭代升級,Anthropic希望未來兩年能夠再籌集50億美元以訓(xùn)練更為復(fù)雜的模型,而此次亞馬遜提供的40億美元則將用于訓(xùn)練Claude-Next——Anthropic的新一代大模型。新的大模型生成能力預(yù)計是當(dāng)前最強AI的10倍。在應(yīng)用上,Claude-Next將以行業(yè)落地為主,目標(biāo)是切入到十幾個主要行業(yè)里。
此前Anthropic的年營收大約為1億美元,隨著與亞馬遜的合作展開與深入,預(yù)計2023年的全年營收有望翻倍,增長至2億美元,月營收約至1700萬美元。到2024年底,Anthropic年營收將有望達到5億美元,是其估值的1/200倍,遠遠超出OpenAI的營收能力。
縱觀業(yè)內(nèi),Anthropic已成為當(dāng)前硅谷最受資本歡迎的AI公司之一,整體估值接近50億美元,僅次于OpenAI,位列第二。
02 科技巨頭間的AI角力
AI大模型生成能力的每一次躍遷,對于算力的需求來說,都會呈現(xiàn)指數(shù)級增長。這勢必引發(fā)對底層算力基礎(chǔ)設(shè)施以及大量資金的追逐,也注定了這是一場科技巨頭之間的慘烈大戰(zhàn)。在這波AI浪潮下,美國科技巨頭各逞其能,早已從單純比拼大模型產(chǎn)品,延展至大模型結(jié)合算力的核心基礎(chǔ)能力較量。對于亞馬遜、微軟、谷歌作為全球云服務(wù)的三大巨頭而言,則是對云端計算與服務(wù)的實力新考驗。另外,以特斯拉為代表的產(chǎn)業(yè)新勢力,同樣躍躍欲試,正在快速殺入戰(zhàn)局。此時的競爭焦點逐步變?yōu)閾屓耍ㄩ_發(fā)者和使用者)、搶資本和搶生態(tài)上。
從AI大模型迭代,到算力消耗,再到資本投入,吸引更多的開發(fā)者和使用者,形成AI云服務(wù)生態(tài),最終收獲商業(yè)回報。這是科技巨頭們期待看到的良性循環(huán)?;ヂ?lián)網(wǎng)時代,亞馬遜在云服務(wù)領(lǐng)域處于領(lǐng)先地位,但在AI時代,由于在AI大模型和算力方面的滯后,其云服務(wù)市場份額面臨著微軟、谷歌的蠶食。微軟與OpenAI、谷歌與DeepMind的結(jié)合,使微軟云Azure、谷歌云GCP相比亞馬遜AWS,不只有了AI附加值,還有固定的業(yè)務(wù)出口,具備明顯的競爭優(yōu)勢。這也成為亞馬遜砸錢Anthropic的重要原因。
微軟:2019年投資了OpenAI,2023年初加碼投資100億美元,對OpenAI持股比重49%,藉由ChatGPT熱潮,微軟完成了從最初的軟件提供商到云服務(wù)商再到AI領(lǐng)導(dǎo)者的角色轉(zhuǎn)換。同時,微軟也試圖將投資OpenAI的成功復(fù)制到其他AI初創(chuàng)企業(yè),遂又戰(zhàn)略性投了Inflection AI、人工智能獨角獸Adep。同時與開源AI大模型Meta/Facebook LlaMA 2合作,在開源與閉源AI大模型兩邊下注,以提升微軟云Azure競爭力。
谷歌:盡管有DeepMind與谷歌大腦合并,但仍然不影響谷歌對Anthropic持續(xù)下注。OpenAI的強勢崛起,令谷歌“鴨梨山大”,今年2月便投了Anthropic 4億美元,獲得其10%股份;10月初,傳Anthropic與谷歌等投資方溝通,準(zhǔn)備新一輪至少20億美元融資。另外,谷歌繼推出LLM聊天機器人Bard后,又宣布推出新版AI模型Gemini,曾被認為是當(dāng)前GPT-4最強勁的挑戰(zhàn)者,但具體表現(xiàn)仍有待驗證。
亞馬遜:屬于AI后發(fā)跟進者,5年前錯失了與OpenAI的合作機會,讓微軟成為這輪AI時代“嘗鮮人”;在對Anthropic投資中,又比谷歌晚了半年左右時間,今年9月下旬才向Anthropic初步投資12.5億美元,之后最多可增投至40億美元。目前,亞馬遜持有Anthropic少數(shù)股權(quán),Anthropic估值尚未確定。如果亞馬遜這筆投資順利完成,將是其在AI相關(guān)領(lǐng)域里的最大一筆投資。
Meta:同樣是AI后發(fā)者。Meta從最初的投入元宇宙,轉(zhuǎn)而布局AI,宣布推出大型語言模型LLM的第一個版本LLaMA。為扭轉(zhuǎn)后發(fā)局勢,Meta拋出了“開源免費”的大招。與微軟、谷歌先通過大模型優(yōu)化現(xiàn)有產(chǎn)品(例如,微軟將OpenAI接入BING、Office和Azure,谷歌將AI技術(shù)應(yīng)用在搜索、Workspace、地圖等)不同,Meta期待通過AI構(gòu)建出更具前瞻性的元宇宙,野心不容小覷。
特斯拉/xAI:馬斯克曾是OpenAI創(chuàng)辦人之一,但現(xiàn)在已退出并成立了新的AI公司xAI,目標(biāo)是了解宇宙真正的本質(zhì),試圖要打造一個“好的通用型人工智能(AGI)”。2023年8月28日,已上線1萬塊英偉達H100 GPU組成的超級計算機集群,將用于訓(xùn)練特斯拉自動駕駛系統(tǒng)FSD與其他各種AI應(yīng)用。另外,特斯拉Dojo超級計算機將于2023年7月正式開始量產(chǎn),進一步強化算力基礎(chǔ)設(shè)施。特斯拉自研芯片D1作為Dojo核心,基于臺積電7nm制程與先進封裝技術(shù)打造,2023年特斯拉在臺積電投片量約5000片12寸晶圓,預(yù)計2024年將翻倍至1萬片;未來,特斯拉有可能像亞馬遜AWS云服務(wù)一樣,將Dojo對外開放。
蘋果:憑借著龐大的Siri群體,似乎對此次ChatGPT風(fēng)潮較為不屑,在公開發(fā)言場合也比較不愛用“AI”一詞,而是較常用機器學(xué)習(xí)(Machine Learning)。整體來看,蘋果的AI技術(shù)傾向用來優(yōu)化現(xiàn)有產(chǎn)品的基本功能。不過,庫克近日也表示:“AI 在我們產(chǎn)品中幾乎無處不在,公司正在進行的生成式 AI 研究,我們有很多工作要做。”
03 亞馬遜的必然選擇
具體再來看看亞馬遜,其業(yè)務(wù)重點原本來自AWS的云計算業(yè)務(wù),今年第二季度的收入增長了12.16%,達到了221.4億美元,但利潤卻下降了6.12%,為53.65億美元,經(jīng)營利潤率也下降了4.72個百分點,至24.23%。盡管AWS的收入貢獻不算太高,但利潤貢獻仍占到整體的大頭。顯然,亞馬遜憑借著全球知名云計算服務(wù)供應(yīng)商的身份,其云計算貢獻的利潤勉強彌補了其零售業(yè)務(wù)的微薄利潤甚至虧損情況。
不過,隨著OpenAI與微軟的深度捆綁,帶動了微軟云計算業(yè)務(wù)Azure的市場占有率,對亞馬遜形成了極大地威脅。在近期亞馬遜業(yè)績發(fā)布會上,CEO Andy Jassy強調(diào)云計算業(yè)務(wù)在近幾個季度的利潤率大幅下滑,其規(guī)模效益似乎正逐漸減弱。但AWS仍是無可置疑的云基建領(lǐng)導(dǎo)者,且在客戶數(shù)量、合作伙伴生態(tài)規(guī)模以及功能廣度方面均處于領(lǐng)先位置,同時實現(xiàn)了最為強勁的經(jīng)營表現(xiàn)。人們已經(jīng)對生成式AI產(chǎn)生了極大的興趣,但大多數(shù)人討論最多的是應(yīng)用層,特別是OpenAI通過ChatGPT所做的事情。而亞馬遜在底層基座上的能力優(yōu)勢,顯然可以成為新的發(fā)力點。
一般來說,對于希望應(yīng)用大模型的企業(yè),自研大模型需要數(shù)十億美元以及多年的訓(xùn)練,這就需要大量資金和設(shè)備的支持才行。更為實惠的解決方案是,對一些已經(jīng)非常強大的開源基礎(chǔ)模型進行定制化的微調(diào),以滿足自身的多樣化業(yè)務(wù)需求。據(jù)預(yù)測,到2026年,僅在企業(yè)技術(shù)方面,這種希望與AI結(jié)合的市場規(guī)模就將從2023年的近430億美元上升到980億美元(約合7168.5億元人民幣),市場空間巨大。
對此,今年4月亞馬遜AWS發(fā)布了全托管基礎(chǔ)模型服務(wù)“Amazon Bedrock”,以“關(guān)鍵基礎(chǔ)設(shè)施提供商”的角色加入了大模型之戰(zhàn),希望從與微軟云、谷歌云手中搶回更多市場份額。另外,亞馬遜投資Anthropic的更深層次戰(zhàn)略目標(biāo),包括Anthropic承諾使用AWS自研的AI專用芯片Trainium和AI加速器芯片Inferentia來構(gòu)建平臺,訓(xùn)練和部署未來的AI基礎(chǔ)模型。事實上,AWS和Anthropic均表示,他們將在未來的Trainium和Inferentia技術(shù)上進行合作。
Anthropic還做出了長期承諾,計劃通過Bedrock為AWS客戶提供其未來幾代AI基礎(chǔ)模型的訪問權(quán)限。相比于其他的一站式的大模型服務(wù)平臺,Amazon Bedrock的優(yōu)勢在于,用戶可將其與亞馬遜AWS平臺的其余部分集成在一起,更輕松地訪問存儲在Amazon S3對象存儲服務(wù)中的數(shù)據(jù),并能夠從亞馬遜AWS訪問控制和治理策略中受益。而Amazon Bedrock的重要價值就在于此。這項服務(wù)可以讓所有人都可以基于已有的大模型、專用的AI算力和工具,再結(jié)合自己的數(shù)據(jù)開始構(gòu)建生成式AI應(yīng)用。
可以說,生成式AI改變了云計算服務(wù)的競爭格局,使得模型、框架和應(yīng)用層面的能力提供變得更加重要,同時也促進了“模型即服務(wù)”新商業(yè)模式的出現(xiàn)。如Amazon Bedrock平臺就將大模型變成了一項可直接使用的服務(wù),利于推動各行各業(yè)用戶方便地接入和應(yīng)用生成式AI。而商湯科技副總裁唐臻怡也曾向融中財經(jīng)表示,未來企業(yè)可能無需自研大模型和訓(xùn)練,基于通用大模型的基模型底座,再結(jié)合自身行業(yè)數(shù)據(jù),就能生出不同的參天大樹。
目前,我國的AI大模型也再加速發(fā)展,百度的“文心一言”、騰訊的“混元”、科大訊飛的“星火”……數(shù)據(jù)顯示,國內(nèi)已至少130家公司研究大模型產(chǎn)品,其中通用大模型有78家。
隨著大模型之戰(zhàn)愈演愈烈,對亞馬遜來說,投資Anthropic的錢已不可再省,甚至必須花出去,才能用來以小博大。而像谷歌、微軟、亞馬遜、英偉達這樣的大廠投資者來說,為當(dāng)紅的AI企業(yè)支付高溢價,除了看重這些初創(chuàng)公司的技術(shù)前景和潛在市場外,如能順便拓展下自身業(yè)務(wù),增加云端服務(wù)器或自家芯片的使用,似乎就會達成一個雙贏的局面。