正在閱讀:

我在硅谷看AI:Deepseek狂飆背后,2025年15條AI關(guān)鍵投資啟示

掃一掃下載界面新聞APP

我在硅谷看AI:Deepseek狂飆背后,2025年15條AI關(guān)鍵投資啟示

展望2025年,大語(yǔ)言模型將會(huì)走向何方?在這份報(bào)告中,我們將從行業(yè)變化、技術(shù)進(jìn)展和應(yīng)用趨勢(shì)三方面,對(duì)大模型的未來(lái)發(fā)展進(jìn)行深入前瞻。

圖片來(lái)源|界面圖庫(kù)

文|硅兔賽跑 王子 顧程來(lái) Evan 李海丹

編輯|李海丹

開篇

生成式AI,作為當(dāng)今最具顛覆性的技術(shù)之一,正在引領(lǐng)各行業(yè)進(jìn)入全新的發(fā)展階段。

1月14日,OpenAI推出了名為Tasks的測(cè)試版功能,標(biāo)志著ChatGPT正式邁入AI智能體(AI Agent)階段。春節(jié)期間,中國(guó)大模型DeepSeek憑借其推理模型DeepSeek-R1引起了廣泛關(guān)注,該模型以O(shè)penAI十分之一的成本達(dá)到了GPT-o1的同級(jí)別表現(xiàn)。同時(shí),DeepSeek在1月26日登頂蘋果App Store和谷歌Play Store全球下載榜首,上線18天內(nèi)下載量突破1600萬(wàn)。

緊接著,OpenAI繼續(xù)推動(dòng)創(chuàng)新,發(fā)布動(dòng)作不斷:1月24日發(fā)布了一款代號(hào)為“Operator”的全新AI Agent產(chǎn)品;隨后2月1日推出o3-mini,專注于STEM領(lǐng)域,支持函數(shù)調(diào)用、流式傳輸、結(jié)構(gòu)化輸出和搜索結(jié)合等功能;2月3日又推出面向深度研究領(lǐng)域的智能體產(chǎn)品,進(jìn)一步拓展了其在專業(yè)領(lǐng)域的應(yīng)用。谷歌也不甘示弱,在2月6日凌晨發(fā)布了性能更強(qiáng)的Gemini 2.0系列模型,包括Pro、Flash和Flash-Lite三個(gè)版本。

如今,生成式AI正迎來(lái)類似的歷史時(shí)刻,這不僅是科技革命,更是商業(yè)重塑的契機(jī),我們正站在這一變革的起點(diǎn)。每一次平臺(tái)級(jí)機(jī)會(huì)的背后,都會(huì)催生出一批市值百億、千億美金的公司。從互聯(lián)網(wǎng)到移動(dòng)互聯(lián)網(wǎng),再到云計(jì)算和區(qū)塊鏈,每一次基礎(chǔ)設(shè)施的創(chuàng)新都激發(fā)了無(wú)數(shù)新的應(yīng)用場(chǎng)景,推動(dòng)科技巨頭的崛起。

回顧這些歷史周期,我們發(fā)現(xiàn),基礎(chǔ)設(shè)施的完善往往會(huì)催生應(yīng)用公司的黃金發(fā)展期。生成式AI作為新型基礎(chǔ)設(shè)施,正處于這一發(fā)展軌道的起點(diǎn)。未來(lái),這些公司將通過(guò)創(chuàng)新的商業(yè)模式和智能化產(chǎn)品,重新定義我們的工作和生活方式,迎來(lái)屬于自己的千億市值時(shí)代。展望2025年,大語(yǔ)言模型將會(huì)走向何方?在這份報(bào)告中,我們將從行業(yè)變化、技術(shù)進(jìn)展和應(yīng)用趨勢(shì)三方面,對(duì)大模型的未來(lái)發(fā)展進(jìn)行深入前瞻。

AI瘋狂吸金,千億獨(dú)角獸冉冉升起

2024年,最為人們印象深刻的,便是生成式AI公司——OpenAI高達(dá)65億美元的融資。這筆融資讓這位生成式AI的弄潮兒估值達(dá)到約1500億美元——一只大型千億獨(dú)角獸正在硅谷茁壯成長(zhǎng),而這只是2024年中最具代表性的一個(gè)。生成式AI所創(chuàng)造出的“造富神話”,多次讓人們情緒高漲,AI就像一個(gè)龐大的“吸金獸”,以颶風(fēng)般的速度吸走了大部分的風(fēng)投資金。

涌入AI賽道的大量資金和頂尖創(chuàng)業(yè)者,正在催生出了一批新晉獨(dú)角獸公司。根據(jù)硅兔君復(fù)盤,在過(guò)去18個(gè)月新增的73家獨(dú)角獸中,有28家是AI公司,占到了新增獨(dú)角獸的大約三分之一。例如特斯拉創(chuàng)始人埃隆·馬斯克在2023年7月創(chuàng)立的xAI,2024年3月發(fā)布了首款A(yù)I聊天機(jī)器人Grok-1,隨后發(fā)布了Grok-1.5V大模型,其在最新一輪融資中,估值達(dá)到240億美元;Xaira Therapeutics,作為AI+生物技術(shù)領(lǐng)域的公司,其聯(lián)合創(chuàng)始人David Baker在“AI+蛋白質(zhì)”領(lǐng)域頗有造詣,其團(tuán)隊(duì)研發(fā)出AI大模型RFdiffusion,用擴(kuò)散模型構(gòu)建的創(chuàng)新型生成式AI系統(tǒng),并且可以按需構(gòu)建AI分子,估值為27億美元;Cognition AI是一家由三位華人創(chuàng)業(yè)者創(chuàng)立的公司,2024年3月,其推出了世界上第一位完全自主的AI軟件工程師,在最新一輪融資后估值達(dá)到20億美元。

制圖:硅兔賽跑,數(shù)據(jù)來(lái)源pitchbook

制圖:硅兔賽跑,數(shù)據(jù)來(lái)源pitchbook

這些AI獨(dú)角獸的成長(zhǎng)速度遠(yuǎn)快于非AI獨(dú)角獸,前25%的AI公司在不到2.5年內(nèi)就已經(jīng)達(dá)到獨(dú)角獸估值。同時(shí),最大規(guī)模的交易也流向了AI的初創(chuàng)企業(yè)。

另一個(gè)趨勢(shì)是——融資額正在變大,頭部效應(yīng)更加明顯。根據(jù)第三方數(shù)據(jù)分析機(jī)構(gòu)Pitchbook的數(shù)據(jù),2024年,光是北美的風(fēng)險(xiǎn)投資總金額達(dá)到了2164億美金,較2023年增長(zhǎng)了28%。其中2024年四季度,北美地區(qū)的融資額達(dá)到了771億美金,創(chuàng)下了2年以來(lái)的新高,光是人工智能相關(guān)項(xiàng)目的投融資額達(dá)到了991億美金,占到了總額的45.8%,達(dá)到了歷史最高水平。過(guò)去美國(guó)最大的10筆風(fēng)險(xiǎn)投資交易每年通常占總?cè)谫Y額的9%左右,而自2023年以來(lái),這一比例升至20%。

過(guò)去一年,我們?cè)诠韫?,這個(gè)北美將近50%投融資發(fā)生的地區(qū)以及最能夠代表北美創(chuàng)投發(fā)展的地方,捕捉到最新的一些變化并試圖梳理出最前沿的趨勢(shì):

首先,針對(duì)人工智能創(chuàng)投領(lǐng)域,有四大行業(yè)趨勢(shì)值得關(guān)注:

1、如果說(shuō)2023年的AI Agent,只是停留在諸如斯坦福小鎮(zhèn)這樣的虛擬世界;2024年,AI Agent的商業(yè)化條件逐漸成熟;2025年則是Agent AI商業(yè)化的元年,資本的關(guān)注和注入加速,會(huì)加劇各大科技公司和初創(chuàng)企業(yè)在Agent AI 領(lǐng)域的競(jìng)爭(zhēng),推動(dòng)技術(shù)創(chuàng)新和產(chǎn)業(yè)應(yīng)用的落地。

2、一方面圍繞生成式AI基礎(chǔ)設(shè)施的投資規(guī)??涨?,帶動(dòng)了一系列產(chǎn)業(yè)鏈公司;另一方面,業(yè)界正在嘗試一些低成本、性價(jià)比高的做法,減少訓(xùn)練的投入?yún)s能達(dá)到與GPT-4/4o等同的效果;

3、專有AI模型正在釋放AI潛力,他們正在解決通用大模型不能解決的問(wèn)題,逐步具備較高的商業(yè)化潛力。

4、生成式界面將迎重大發(fā)展,用戶能夠有更好的互動(dòng)體驗(yàn),將帶來(lái)新的商業(yè)模式和市場(chǎng)機(jī)會(huì)。

其次,在人工智能的技術(shù)方面,我們總結(jié)了八大趨勢(shì):

1、2025年,大模型將更加關(guān)注多模態(tài)的融合與交互,其訓(xùn)練方法正在不斷優(yōu)化;

2、一直以來(lái),盡管大模型能力在不斷增強(qiáng),但仍無(wú)法解決人工智能的“黑箱”問(wèn)題。2024年,許多公司陸續(xù)推出了更透明的模型架構(gòu)和解釋工具以緩解“黑箱”帶來(lái)的麻煩。2025年,可解釋性工具將進(jìn)一步普及;

3、2024年,大模型的長(zhǎng)期記憶能力迎來(lái)了一系列技術(shù)突破。2025年,隨著多模態(tài)技術(shù)的進(jìn)步,跨模態(tài)記憶融合將在視頻、文本、觸覺(jué)和嗅覺(jué)數(shù)據(jù)的編碼上取得突破,進(jìn)一步提升模型的記憶能力。

4、合成數(shù)據(jù)作為加速大模型訓(xùn)練的方法,將在2025年進(jìn)一步發(fā)揮潛能。

5、2025年,隨著更強(qiáng)大的計(jì)算資源的普及和優(yōu)化,規(guī)模定律將繼續(xù)提升,這使得更多的中小型企業(yè)可以進(jìn)入AI領(lǐng)域,加速了大模型的普及,效率躍遷曲線下,大模型的成本更低了。

6、2025年,強(qiáng)化學(xué)習(xí)(RL)與大語(yǔ)言模型的結(jié)合有望進(jìn)一步提升模型的泛化能力,并使得從預(yù)訓(xùn)練到后訓(xùn)練和推理遷移的轉(zhuǎn)變成為可能。

7、隨著AI應(yīng)用場(chǎng)景的多樣化,簡(jiǎn)化算法架構(gòu)將成為AI發(fā)展的重要方向。2025年,更多優(yōu)化算法將被用于強(qiáng)化學(xué)習(xí)等領(lǐng)域,以減少計(jì)算資源的消耗。

8、隨著AI蒸餾技術(shù)的普及,相關(guān)的法律和監(jiān)管框架也需要不斷加強(qiáng),以確保在模型開發(fā)和應(yīng)用過(guò)程中不會(huì)侵犯知識(shí)產(chǎn)權(quán)或數(shù)據(jù)隱私。

另外,在人工智能的應(yīng)用方面,2025年也有了一些新的變化:

1、2025年,企業(yè)級(jí)AI應(yīng)用迎來(lái)深入發(fā)展,越來(lái)越多企業(yè)將從人工智能中獲利。AI Agent成為行業(yè)顛覆性力量,生成式AI推動(dòng)傳統(tǒng)行業(yè)進(jìn)入智能化時(shí)代。隨著企業(yè)在生成式AI上盈利,商業(yè)模式轉(zhuǎn)變?yōu)榘垂ぷ鞒晒召M(fèi),取代傳統(tǒng)的SaaS席位收費(fèi)。

2、2025年對(duì)于AI應(yīng)用來(lái)說(shuō),下一個(gè)重大事件將屬于消費(fèi)。我們期待一個(gè)“殺手級(jí)”AI消費(fèi)應(yīng)用的誕生。

3、在AI應(yīng)用端,企業(yè)不再依賴單一模型,而是會(huì)根據(jù)不同的應(yīng)用需求和場(chǎng)景,將不同模型模塊進(jìn)行組合,定制出符合自己業(yè)務(wù)需求的模型。

趨勢(shì)一 :2025年,AI Agent元年拉開序幕

人工智能未來(lái)學(xué)家雷·庫(kù)茲韋爾 (Ray Kurzweil)表示,2025年,我們將開始看到從聊天機(jī)器人和圖像生成器向“代理”系統(tǒng)的轉(zhuǎn)變,這些系統(tǒng)可以自主完成任務(wù),而不僅僅是回答問(wèn)題。人工智能系統(tǒng)正在從單一的交互模式,走向?qū)iT且相互關(guān)聯(lián)的代理。

AI Agent,也稱為人工智能代理,通常是指能夠感知環(huán)境、進(jìn)行自主理解、決策和執(zhí)行動(dòng)作的智能體。根據(jù)咨詢公司來(lái)覓PEVC的統(tǒng)計(jì),自2024年以來(lái),全球AI Agent賽道的融資金額已突破665億元人民幣。從整體來(lái)看,這些資金主要流向了在技術(shù)與市場(chǎng)潛力方面處于領(lǐng)先地位的頭部企業(yè)。

科技巨頭紛紛布局AI Agent,以搶占未來(lái)智能交互的制高點(diǎn)。2024年,OpenAI憑借其強(qiáng)大的技術(shù)實(shí)力和廣泛的市場(chǎng)應(yīng)用,官宣65億美元新融資,成為萬(wàn)億獨(dú)角獸,也成為全球AI Agent領(lǐng)域的主要資金流之一。埃隆·馬斯克創(chuàng)立的xAI,希望將AI Agent與人類深度整合,創(chuàng)建全球首個(gè)AI Agent與人類共存的社交平臺(tái),xAI在2024年12月完成60億美元融資,估值達(dá)到了近500億美元。谷歌也全力推廣商用AI Agent,發(fā)布了全球?yàn)閿?shù)不多的商用AI Agent市場(chǎng),為企業(yè)提供一站式開發(fā)、部署和應(yīng)用生態(tài)。微軟在2024年11月的Ignite大會(huì)上宣布已建立全球規(guī)模最大的企業(yè)級(jí)AI Agent生態(tài)系統(tǒng),企業(yè)用戶可通過(guò)Azure AI目錄訪問(wèn)超過(guò)1800個(gè)AI模型。此外,微軟的Copilot Studio平臺(tái)已支持用戶創(chuàng)建自主Agent,并正式進(jìn)入預(yù)覽階段。蘋果也在開發(fā)者大會(huì)上展示了其最新的AI成果Apple Intelligence。

2025年,OpenAI推出的智能體功能(AI Agent)以及一系列基于生成式AI的智能系統(tǒng),它們開始具備真正的自主學(xué)習(xí)和推理能力,從單一任務(wù)的執(zhí)行者,轉(zhuǎn)變?yōu)槟軌蜻M(jìn)行多任務(wù)處理、復(fù)雜決策和交互的智能體——1月24日,OpenAI發(fā)布了一款代號(hào)為“Operator”的全新AI Agent產(chǎn)品,與其他各家Agent相比,它會(huì)通過(guò)自有的CUA(電腦控制Agent)系統(tǒng)進(jìn)行復(fù)雜的思維鏈反思和步驟規(guī)劃,這可以大大提高其完成任務(wù)的精度和復(fù)雜性。Operator的創(chuàng)新之處在于其成功實(shí)現(xiàn)了從認(rèn)知到執(zhí)行的完整閉環(huán)。這一能力的拓展不僅是技術(shù)上的突破,更是AI技術(shù)邁向更高層次發(fā)展的關(guān)鍵一步。

AI Agent不再是單一的輔助工具,而是可以獨(dú)立進(jìn)行深度學(xué)習(xí)、理解和推理的智能系統(tǒng),賦能企業(yè)和個(gè)人高效完成復(fù)雜任務(wù),推動(dòng)生產(chǎn)力的大幅提升。2025年,AI智能體的全面普及將不僅改變技術(shù)產(chǎn)業(yè)的格局,還將在各個(gè)領(lǐng)域深刻影響人類的生活方式,從而使這一年成為AI Agent真正嶄露頭角的元年。

趨勢(shì)二:基礎(chǔ)設(shè)施軍備競(jìng)賽:投資空前,低成本做法漸成趨勢(shì)

一年多以前,基礎(chǔ)大模型制造商OpenAI,在芯片制造商英偉達(dá)生產(chǎn)的25000個(gè)最新進(jìn)GPU集群上訓(xùn)練了GPT-4。隨后,馬斯克表示他在一個(gè)數(shù)據(jù)中心有100000個(gè)GPU,并計(jì)劃購(gòu)買200000個(gè)。

頭部公司通過(guò)大規(guī)模資金投入,搶占人工智能基礎(chǔ)設(shè)施的制高點(diǎn),而以英偉達(dá)為代表的硬件廠商也在以前所未有的速度上不斷突破技術(shù)極限。例如,英偉達(dá)的頂級(jí)芯片性能相當(dāng)于300部高端iPhone的處理能力。

在這場(chǎng)基礎(chǔ)設(shè)施競(jìng)爭(zhēng)中,埃隆·馬斯克的X平臺(tái)部分業(yè)務(wù)——xAI的“Colossus”訓(xùn)練集群,成為世界上最強(qiáng)大的人工智能訓(xùn)練集群之一。這個(gè)集群僅用122天便建成,預(yù)算高達(dá)30億至40億美元,成為人工智能基礎(chǔ)設(shè)施建設(shè)的里程碑。目前,xAI計(jì)劃將集群容量翻倍,進(jìn)一步增強(qiáng)處理能力。Meta也在大規(guī)模投資硬件,近期公布了其24000個(gè)GPU數(shù)據(jù)中心規(guī)模集群的兩個(gè)版本,旨在支持其下一代人工智能模型。

雖然目前GPU集群比傳統(tǒng)數(shù)據(jù)中心小,但對(duì)人工智能計(jì)算不斷增長(zhǎng)的需求將需要大規(guī)模的基礎(chǔ)設(shè)施擴(kuò)展。包括Meta、亞馬遜、Alphabet和微軟在內(nèi)的主要科技公司正在推動(dòng)對(duì)人工智能基礎(chǔ)設(shè)施的空前投資。超大規(guī)模數(shù)據(jù)中心運(yùn)營(yíng)商預(yù)計(jì)2024年資本支出(CapEx)將超過(guò) 2000 億美元,到2025年這一數(shù)字預(yù)計(jì)將接近2500億美元。盡管并非所有支出都直接與人工智能相關(guān),但很大一部分都分配給了人工智能,并且這個(gè)份額在不斷增加。微軟和OpenAI已討論推出一個(gè)專門用于人工智能工作負(fù)載的5千兆瓦數(shù)據(jù)中心,可能耗資超過(guò)1000億美元,甚至可以買得下一艘最新型核動(dòng)力航空母艦。

在這場(chǎng)人工智能基礎(chǔ)建設(shè)中受益的,是這個(gè)產(chǎn)業(yè)鏈中的組成部分。

第一類就是數(shù)據(jù)中心的托管服務(wù)提供商——也就是向大公司提供數(shù)據(jù)中心租賃容量的公司,他們是數(shù)據(jù)中心市場(chǎng)的重要組成部分。這批數(shù)據(jù)中心的托管服務(wù)提供商如今也在拓展其以人工智能為重點(diǎn)的基礎(chǔ)設(shè)施服務(wù)。例如,超大規(guī)模托管領(lǐng)域的領(lǐng)導(dǎo)者 Equinix 已獲得近 150 億美元的資金用于在美國(guó)建設(shè)人工智能數(shù)據(jù)中心,主要為客戶提供基礎(chǔ)設(shè)施,以訓(xùn)練和部署大規(guī)模私有人工智能模型,這些客戶往往是科技行業(yè)以外的財(cái)富 500 強(qiáng)公司。

另一類受益者則是人工智能數(shù)據(jù)中心建設(shè)中的輔助產(chǎn)品,例如低功耗CPU、內(nèi)存、存儲(chǔ)系統(tǒng)、網(wǎng)絡(luò)組件以及冷卻和電源管理設(shè)備。冷卻產(chǎn)品供應(yīng)商 Vertiv在2024年7月至9月的三個(gè)月內(nèi)實(shí)現(xiàn)了19%的同比收入增長(zhǎng),并提高了未來(lái)12個(gè)月的業(yè)績(jī)指引。

第三類則是圍繞數(shù)據(jù)中心能源生產(chǎn)、熱管理和電源管理解決方案的公司。Alphabet董事長(zhǎng)在2023年2月表示,與LLM互動(dòng)可能比標(biāo)準(zhǔn)關(guān)鍵字搜索的花費(fèi)高出10倍。另外,根據(jù)谷歌研究員Urs H lzle的文章提及,標(biāo)準(zhǔn)Google搜索使用的電力為0.3Wh,這意味著每次LLM互動(dòng)的耗電量約為3Wh。這個(gè)數(shù)字與SemiAnalysis在2023年初對(duì)ChatGPT運(yùn)營(yíng)成本的評(píng)估一致,該評(píng)估估計(jì)ChatGPT每次請(qǐng)求耗電量為2.9Wh,如果每天響應(yīng)1.95億個(gè)請(qǐng)求,估計(jì)平均每天耗電量為564MWh。

《紐約客》報(bào)道稱,ChatGPT每天用電量相當(dāng)于1.7萬(wàn)個(gè)美國(guó)家庭的用電量。如果基于當(dāng)前模型和技術(shù),讓每個(gè)標(biāo)準(zhǔn)Google搜索都變成 LLM 交互,對(duì) Google總用電量的潛在影響巨大。第三方分析機(jī)構(gòu)SemiAnalysis估計(jì),帶有大模型交互功能的谷歌搜索單次請(qǐng)求的用電量達(dá)到將近9Wh,谷歌每天搜索大約需要90億次,則需要81000MWh。

這一趨勢(shì)促使人們對(duì)位于數(shù)據(jù)中心設(shè)施附近的核能和能源生產(chǎn)等技術(shù)以及熱管理和電源管理解決方案進(jìn)行投資。

不過(guò),如今科學(xué)家和業(yè)界正在尋找更聰明并且資源密集度更低的方法來(lái)解決訓(xùn)練人工智能模型所需要的算力和能源問(wèn)題。例如通過(guò)蒸餾技術(shù),這項(xiàng)技術(shù)的踐行者——DeepSeek,這家國(guó)產(chǎn)大模型也給美國(guó)硅谷提供了更多低成本的訓(xùn)練參考。DeepSeek大模型性能在多個(gè)方面比肩OpenAI,其中DeepSeek V3,整個(gè)訓(xùn)練過(guò)程僅用了約2000張二流芯片進(jìn)行訓(xùn)練,官方稱成本僅占用約550萬(wàn)美元,而Meta的模型則使用了16000個(gè)性能最強(qiáng)的一流芯片。并且,DeepSeek-R1通過(guò)重新設(shè)計(jì)訓(xùn)練流程、以“少量SFT數(shù)據(jù)+多輪強(qiáng)化學(xué)習(xí)”的辦法,在提高了模型準(zhǔn)確性的同時(shí),也顯著降低內(nèi)存占用和計(jì)算開銷,每百萬(wàn)輸出tokens16元,大約是OpenAI o1運(yùn)行成本的三十分之一。

在這樣的競(jìng)爭(zhēng)壓力下,0penAI推出了其成本更低的o3-mini,比o1-mini便宜63%,比完整的o1模型便宜93%,每百萬(wàn)tokens的進(jìn)出費(fèi)用分別為1.10美元/4.40美元(享有50%的緩存折扣)。谷歌發(fā)布的Gemini 2.0 Flash-Lite是Gemini 2.0系列的新變體,每百萬(wàn)tokens0.3美元,是谷歌目前最便宜的模型。

可以窺見,在AI產(chǎn)業(yè)的競(jìng)爭(zhēng)中,降低訓(xùn)練成本、提高計(jì)算效率和優(yōu)化模型性能已成為企業(yè)的主要競(jìng)爭(zhēng)策略。尤其是訓(xùn)練流程的優(yōu)化,成為了公司在大模型市場(chǎng)中占據(jù)競(jìng)爭(zhēng)優(yōu)勢(shì)的關(guān)鍵能力之一。2025年,低成本做法也將成為行業(yè)的主流趨勢(shì)。

此外,一些大公司也在開發(fā)專用人工智能芯片,例如谷歌、蘋果、微軟和OpenAI,這些專業(yè)芯片可以比英偉達(dá)這樣通用處理器運(yùn)行更高效;或是采用一些方法提高芯片的使用效率,例如用多種模型,每種模型針對(duì)不同問(wèn)題,以此來(lái)縮短芯片的處理時(shí)間等。AI推理芯片制造商Groq2024年估值達(dá)到28億美元,在Blackrock領(lǐng)投的新一輪中融資6.4億美元,其專為AI推理任務(wù)設(shè)計(jì)的芯片“語(yǔ)言計(jì)算單元”(LPU, language processing unit)能以現(xiàn)有解決方案1/10的價(jià)格、10倍的速度運(yùn)行與ChatGPT、GPT-4o相似的模型。目前,在Groq開發(fā)的、對(duì)標(biāo)英偉達(dá)CUDA的軟件開發(fā)平臺(tái)GroqCloud平臺(tái)上,約有40萬(wàn)開發(fā)者。

趨勢(shì)三:專有模型有望釋放AI的應(yīng)用潛力

大模型就像個(gè)通才,然而,在一些專業(yè)領(lǐng)域,大模型往往缺乏針對(duì)性和操作性。為了突破這一瓶頸,越來(lái)越多的公司開始專注于開發(fā)專有模型,通過(guò)在特定領(lǐng)域數(shù)據(jù)上微調(diào)模型,實(shí)現(xiàn)更高效的工作流程自動(dòng)化,提供更具操作性和任務(wù)導(dǎo)向的工具。這一趨勢(shì)正在逐步升溫,并在多個(gè)行業(yè)展現(xiàn)出巨大的應(yīng)用潛力。以下為一些具體的案例:

金融服務(wù)領(lǐng)域,提升決策效率與洞察力:摩根大通和彭博社等機(jī)構(gòu)正在利用其龐大的內(nèi)部數(shù)據(jù)集開發(fā)大語(yǔ)言模型,以提升運(yùn)營(yíng)效率和決策能力。這些模型能夠提供獨(dú)特的市場(chǎng)洞察、風(fēng)險(xiǎn)分析和報(bào)告生成。例如,彭博社于2023年開發(fā)了BloombergGPT,專注于金融領(lǐng)域的數(shù)據(jù)分析和預(yù)測(cè),通過(guò)微調(diào)金融數(shù)據(jù),能夠更高效地處理復(fù)雜的金融任務(wù),如市場(chǎng)趨勢(shì)分析和投資策略制定。

網(wǎng)絡(luò)安全領(lǐng)域,精準(zhǔn)檢測(cè)與應(yīng)對(duì)威脅:美國(guó)網(wǎng)絡(luò)安全解決方案提供商Palo Alto Networks正在訓(xùn)練自有的大語(yǔ)言模型,這些模型能夠幫助安全專家更好地檢測(cè)和應(yīng)對(duì)網(wǎng)絡(luò)威脅。該公司在2024財(cái)年四季度披露了超過(guò)2億美元的AI相關(guān)經(jīng)常性收入,同比增幅近四倍。AI大模型通過(guò)模擬復(fù)雜攻擊場(chǎng)景,幫助安全團(tuán)隊(duì)快速發(fā)現(xiàn)系統(tǒng)漏洞并提供修復(fù)建議,顯著提升了網(wǎng)絡(luò)安全的實(shí)時(shí)預(yù)警和用戶行為分析能力。

國(guó)防領(lǐng)域,用于軍事與情報(bào)分析:美國(guó)數(shù)據(jù)分析和軟件公司Palantir近期獲得了一系列合同,用于支持AI的服務(wù),包括加速部署適用于國(guó)防和軍事領(lǐng)域的AI模型。這些模型能夠提升情報(bào)分析、目標(biāo)識(shí)別和決策支持能力。例如,AI訓(xùn)練平臺(tái)可以創(chuàng)建逼真的戰(zhàn)斗場(chǎng)景,幫助士兵在安全環(huán)境下進(jìn)行戰(zhàn)術(shù)訓(xùn)練。此外,AI技術(shù)在軍事領(lǐng)域的應(yīng)用還包括無(wú)人化作戰(zhàn)系統(tǒng)和沉浸式訓(xùn)練模擬。

生命科學(xué)領(lǐng)域:2024年,科研人員使用AI的比例快速增加,AI對(duì)科學(xué)研究方法和流程的變革效應(yīng)也開始顯現(xiàn)。比如,AlphaFold 3.0在2024年發(fā)布,不僅提高了蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的準(zhǔn)確率,還擴(kuò)展到了DNA和RNA等生物分子的研究,這項(xiàng)技術(shù)幫助科學(xué)家快速預(yù)測(cè)藥物分子與目標(biāo)蛋白質(zhì)的結(jié)合情況,大大提高了藥物研發(fā)的效率。2025年,多模態(tài)大模型將進(jìn)一步融入科學(xué)研究,賦能多維數(shù)據(jù)的復(fù)雜結(jié)構(gòu)挖掘,輔助科研問(wèn)題的綜合理解與全局分析,為生物醫(yī)學(xué)、氣象、材料發(fā)現(xiàn)、生命模擬、能源等基礎(chǔ)與應(yīng)用科學(xué)的研究開辟新方向。

除了上述領(lǐng)域,專有模型還在其他行業(yè)展現(xiàn)出廣泛的應(yīng)用前景。例如,Two Sigma在量化投資中使用AI Agent進(jìn)行選股策略,通過(guò)分析財(cái)務(wù)數(shù)據(jù)和宏觀經(jīng)濟(jì)指標(biāo),識(shí)別潛在的投資機(jī)會(huì)。Shopify Sidekick則利用LLama 2生成產(chǎn)品描述、回應(yīng)客戶查詢和創(chuàng)建營(yíng)銷內(nèi)容,幫助小企業(yè)主提升運(yùn)營(yíng)效率。

專有模型通過(guò)在特定領(lǐng)域的數(shù)據(jù)上進(jìn)行微調(diào),能夠提供更具針對(duì)性和操作性的解決方案。這種趨勢(shì)不僅提升了各行業(yè)的自動(dòng)化水平,還為企業(yè)帶來(lái)了顯著的運(yùn)營(yíng)效率提升和成本降低。隨著AI技術(shù)的不斷發(fā)展,未來(lái)專有模型將在更多領(lǐng)域得到廣泛應(yīng)用,成為推動(dòng)行業(yè)創(chuàng)新的重要力量。

趨勢(shì)四:推動(dòng)動(dòng)態(tài)自適應(yīng)界面,實(shí)現(xiàn)高度個(gè)性化的交互體驗(yàn)

生成式界面(Generative Interface)是指利用生成式模型,如生成對(duì)抗網(wǎng)絡(luò)(GANs)或變分自編碼器(VAEs),自動(dòng)創(chuàng)建用戶界面元素或交互流程。這種界面不是通過(guò)傳統(tǒng)設(shè)計(jì)方法人工制作,而是通過(guò)機(jī)器學(xué)習(xí)算法根據(jù)輸入的數(shù)據(jù)、需求或上下文生成。

在2024年,生成式用戶界面(Generative UI)在動(dòng)態(tài)和自適應(yīng)界面、AI與算法融合、個(gè)性化體驗(yàn)等方面取得了顯著進(jìn)展。大規(guī)模生成式預(yù)訓(xùn)練模型(如GPT系列、DALL·E等)已被廣泛應(yīng)用于自動(dòng)化界面設(shè)計(jì)。開發(fā)者借助這些模型,可以快速生成和調(diào)整界面元素,如按鈕、布局、色彩搭配等,甚至可以根據(jù)用戶反饋實(shí)時(shí)調(diào)整界面的外觀和功能。

此外,生成式界面逐步在增強(qiáng)現(xiàn)實(shí)(AR)和虛擬現(xiàn)實(shí)(VR)環(huán)境中得到應(yīng)用,尤其是在需要復(fù)雜交互的沉浸式體驗(yàn)中,AI幫助生成自適應(yīng)、動(dòng)態(tài)變化的虛擬界面。例如,英偉達(dá)在2024年SIGGRAPH大會(huì)上展示了利用實(shí)時(shí)生成式AI創(chuàng)建沉浸式沙漠世界的研究成果。此外,英偉達(dá)還通過(guò)Holoscan技術(shù)賦能手術(shù)機(jī)器人,加速AI技術(shù)在醫(yī)療實(shí)踐中的應(yīng)用。這些應(yīng)用展示了生成式AI在動(dòng)態(tài)生成虛擬界面方面的潛力,尤其是在需要高度沉浸感的場(chǎng)景中。

可以說(shuō),隨著用戶需求變得更加多樣化和復(fù)雜,傳統(tǒng)的固定界面無(wú)法滿足個(gè)性化的交互需求。動(dòng)態(tài)自適應(yīng)界面能夠根據(jù)用戶的行為、偏好和環(huán)境變化實(shí)時(shí)調(diào)整顯示內(nèi)容和功能,提供更加定制化的體驗(yàn)。

展望2025年,生成式界面將迎來(lái)重大發(fā)展,成為推動(dòng)用戶體驗(yàn)變革的關(guān)鍵力量。越來(lái)越多的應(yīng)用將采用基于用戶交互和邏輯工作流程自適應(yīng)的動(dòng)態(tài)用戶界面。生成式UI將使應(yīng)用能夠自動(dòng)生成表單、儀表板或可視化等界面元素,這些元素將根據(jù)用戶的具體需求和操作量身定制。例如,Web開發(fā)平臺(tái)Vercel和Bolt.new等公司正在開發(fā)能夠創(chuàng)建高度適應(yīng)性和個(gè)性化用戶體驗(yàn)的平臺(tái),提供實(shí)時(shí)演進(jìn)的界面,以滿足不斷變化的需求,從而簡(jiǎn)化工作流程。

03 八大技術(shù)趨勢(shì),推動(dòng)AI泛化能力

趨勢(shì)一:多模態(tài)能力的增強(qiáng)和集成

2024年,多模態(tài)AI取得了顯著進(jìn)展。OpenAI、Google DeepMind等機(jī)構(gòu)推出了更強(qiáng)大的多模態(tài)模型,如視頻生成模型Sora的誕生、OpenAI多模態(tài)AI大模型GPT-4o的到來(lái)、CLIP模型通過(guò)跨模態(tài)表示實(shí)現(xiàn)圖文搜索,用戶可以通過(guò)輸入文本搜索相關(guān)圖像或視頻。此外,文本到圖像生成(如DALL·E、Stable Diffusion)和視頻生成模型也取得了顯著進(jìn)展,進(jìn)一步拓展了AI的交互體驗(yàn)。

大模型逐步增加了能夠處理圖像、音頻或視頻等多種輸入形式。這些模型不僅提升了AI對(duì)復(fù)雜信息的處理能力,還拓展了其應(yīng)用領(lǐng)域。在谷歌云發(fā)布的《2025年AI商業(yè)趨勢(shì)》報(bào)告中,多模態(tài)AI被放在首位。谷歌云預(yù)測(cè),2025年將成為企業(yè)采用AI技術(shù)的關(guān)鍵一年,這一趨勢(shì)主要由多模態(tài)學(xué)習(xí)及其實(shí)現(xiàn)的情境感知所驅(qū)動(dòng)的,并預(yù)計(jì)2025年全球多模態(tài)AI市場(chǎng)規(guī)模將達(dá)到24億美元。

2025年,大模型將更加關(guān)注多模態(tài)融合與交互。AI不僅能夠生成文本,還能理解圖像、視頻中的上下文,甚至在多模態(tài)環(huán)境中進(jìn)行決策。比如,結(jié)合視覺(jué)與語(yǔ)音的能力,模型能夠更好地理解復(fù)雜的場(chǎng)景,并做出合適的反應(yīng)。

此外,多模態(tài)模型的訓(xùn)練方法也在不斷優(yōu)化,例如采用分階段訓(xùn)練策略,先固定大語(yǔ)言模型的權(quán)重參數(shù),對(duì)圖像編碼器和橋接組件進(jìn)行初步訓(xùn)練,再進(jìn)行整體訓(xùn)練,從而提升模型性能。

趨勢(shì)二:大模型的可解釋性表現(xiàn)更強(qiáng)

可解釋人工智能 (xAI) 是人工智能領(lǐng)域的一個(gè)新興領(lǐng)域,致力于使人工智能系統(tǒng)對(duì)人類更加透明、可解釋和可理解。xAI的興起源于人們對(duì)人工智能決策過(guò)程透明度和問(wèn)責(zé)制的需求日益增長(zhǎng),尤其是隨著人工智能系統(tǒng)變得越來(lái)越復(fù)雜并部署在金融、法律或醫(yī)療保健等高風(fēng)險(xiǎn)領(lǐng)域。例如,考慮醫(yī)院用于篩查患者X光片的腫瘤檢測(cè) CNN(卷積神經(jīng)網(wǎng)絡(luò)) 模型的情況。但是,當(dāng)技術(shù)人員或患者不知道其工作原理時(shí),他們?nèi)绾文芟嘈牌浣Y(jié)果?這正是我們需要方法來(lái)了解影響任何深度學(xué)習(xí)模型決策的因素的原因。

另外,AI的安全性問(wèn)題是一個(gè)不可忽視的關(guān)鍵挑戰(zhàn)。尤其是大模型在做出決策時(shí)的“思考過(guò)程”對(duì)于用戶和開發(fā)者來(lái)說(shuō)變得不透明,就像一個(gè)“黑箱”,其決策過(guò)程難以解釋和追蹤。若這些模型未經(jīng)過(guò)嚴(yán)格的審查和驗(yàn)證,它們可能會(huì)做出無(wú)法被察覺(jué)的有害決策,甚至加劇社會(huì)偏見和不公。因此,加強(qiáng)對(duì)大模型的監(jiān)控、審查和可解釋性要求是提升AI系統(tǒng)安全性的重要一步。

2024年,大模型的可解釋性取得了重要進(jìn)展。OpenAI、Google DeepMind等機(jī)構(gòu)推出了更透明的模型架構(gòu)和解釋工具,如GPT-4的可解釋性增強(qiáng)版本和Gemini的跨模態(tài)解釋功能。LIME、SHAP等后驗(yàn)解釋方法被廣泛應(yīng)用于醫(yī)療、金融等領(lǐng)域,幫助用戶理解模型決策依據(jù)。同時(shí),自監(jiān)督學(xué)習(xí)和符號(hào)AI的結(jié)合提升了模型的內(nèi)在可解釋性,減少了“黑箱”問(wèn)題。行業(yè)也開始重視可解釋性的標(biāo)準(zhǔn)化,例如歐盟《人工智能法案》要求高風(fēng)險(xiǎn)AI系統(tǒng)提供清晰的決策解釋。

2025年,可解釋性工具將進(jìn)一步普及,將模型將內(nèi)置更強(qiáng)大的解釋能力,實(shí)時(shí)生成決策依據(jù),并支持多模態(tài)數(shù)據(jù)的跨模態(tài)解釋,幫助用戶理解復(fù)雜AI模型的決策過(guò)程。通過(guò)一些自主進(jìn)化模式或可解釋性工具,將模型將內(nèi)置更強(qiáng)大的解釋能力,實(shí)時(shí)生成決策依據(jù),并支持多模態(tài)數(shù)據(jù)的跨模態(tài)解釋。可解釋性與性能的平衡將得到優(yōu)化,知識(shí)蒸餾和模型壓縮技術(shù)將幫助簡(jiǎn)化復(fù)雜模型的同時(shí)保持高精度。行業(yè)專用可解釋性工具將普及,滿足醫(yī)療、金融等領(lǐng)域的合規(guī)需求。

以DeepSeek為例,通過(guò)純算法自主進(jìn)化的Zero模式與僅需數(shù)千條人工標(biāo)注數(shù)據(jù)的R1模式組合,既保留模型自主進(jìn)化能力又保障人類可解釋性————Zero模式使得模型能夠自我進(jìn)化和發(fā)現(xiàn)數(shù)據(jù)中的規(guī)律,而R1模式通過(guò)引入人工標(biāo)注數(shù)據(jù)為模型提供了一個(gè)監(jiān)督和解釋的框架。這種結(jié)合確保了模型在保持自主學(xué)習(xí)能力的同時(shí),也能夠被人類理解和控制,從而提升了可解釋性。

此外,倫理和隱私保護(hù)將深度融入可解釋性設(shè)計(jì),確保AI系統(tǒng)既透明又安全,推動(dòng)大模型在高風(fēng)險(xiǎn)場(chǎng)景中的廣泛應(yīng)用。以下是一些提升的方向和工具:

○ 自監(jiān)督學(xué)習(xí)與模型可解釋性:通過(guò)自監(jiān)督學(xué)習(xí),AI系統(tǒng)可以在缺乏大量標(biāo)注數(shù)據(jù)的情況下,通過(guò)理解數(shù)據(jù)的內(nèi)在結(jié)構(gòu)來(lái)進(jìn)行學(xué)習(xí),這種方法有助于提升模型的透明度,使得我們能夠更好地理解其學(xué)習(xí)過(guò)程。

○ 生成對(duì)抗網(wǎng)絡(luò)(GANs)和模型蒸餾:通過(guò)生成對(duì)抗網(wǎng)絡(luò)和蒸餾技術(shù),開發(fā)者能夠簡(jiǎn)化復(fù)雜模型,同時(shí)保持高效性和準(zhǔn)確性,這種方法使得大規(guī)模深度學(xué)習(xí)模型更加易于解釋。

○ 增強(qiáng)推理框架和可視化工具:新一代的AI推理框架將更注重可視化,幫助用戶以更直觀的方式理解模型決策的依據(jù)。例如,基于圖像或文本的AI系統(tǒng),新的可視化工具可以清晰展示模型如何關(guān)注不同的輸入特征,從而提升其可解釋性。

需要一提的是,未來(lái)AI的安全不光需要提升可解釋性,還需要著重于法律合規(guī)性、安全審計(jì)和濫用防范等方面,推動(dòng)AI技術(shù)的負(fù)責(zé)任應(yīng)用。隨著技術(shù)的不斷發(fā)展,AI如何在不斷的創(chuàng)新中確保安全,將成為AI領(lǐng)域面臨的重大挑戰(zhàn)之一。

趨勢(shì)三:大模型長(zhǎng)期記憶能力迎來(lái)深層次變革

目前的許多大模型(如基于Transformer架構(gòu)的模型)在處理長(zhǎng)文本或復(fù)雜上下文時(shí),常常會(huì)面臨信息丟失等問(wèn)題。傳統(tǒng)模型一般有固定的“記憶窗口”,當(dāng)文本或輸入信息過(guò)長(zhǎng)時(shí),模型往往會(huì)忘記最初的信息,或者在處理過(guò)程中只關(guān)注較近的上下文。長(zhǎng)期記憶的核心需求是讓模型能跨越多個(gè)時(shí)刻、任務(wù)和場(chǎng)景記住信息,并能在合適的時(shí)機(jī)提取和利用這些信息。

大模型的長(zhǎng)期記憶能力迎來(lái)了一系列技術(shù)突破。首先,在上下文窗口的擴(kuò)展上,比如2024年,Google Gemini 1.5 Pro突破性地實(shí)現(xiàn)了最高可達(dá)1000萬(wàn)token的處理能力。到2025年2月發(fā)布的Gemini 2.0全家桶,最強(qiáng)Pro版本可支持到2M上下文。

其次,外部記憶系統(tǒng)的引入推動(dòng)了大模型記憶能力的發(fā)展。如IBM WatsonX的實(shí)時(shí)知識(shí)圖譜更新功能使得在醫(yī)學(xué)診斷等特定領(lǐng)域的記憶準(zhǔn)確率提高了35%。持續(xù)學(xué)習(xí)機(jī)制方面,Meta的LoRA-X架構(gòu)通過(guò)參數(shù)隔離技術(shù)降低了多任務(wù)干擾,OpenAI則部署了分布式記憶訓(xùn)練系統(tǒng),使百萬(wàn)設(shè)備協(xié)同進(jìn)化,提升了記憶系統(tǒng)表現(xiàn)。在記憶檢索方面,Anthropic的ContextRouter模塊和微軟的MAVEx系統(tǒng)分別通過(guò)動(dòng)態(tài)記憶權(quán)重分配和跨模態(tài)聯(lián)合檢索,優(yōu)化了記憶檢索的準(zhǔn)確性與效率。

第三,隱私與安全問(wèn)題也得到了關(guān)注,Google推出的Memory Provenance框架增強(qiáng)了記憶的透明度和可控性,而HuggingFace的SafeMemory工具包通過(guò)差分隱私技術(shù)將隱私泄露的風(fēng)險(xiǎn)大幅度降低。這些技術(shù)突破使大模型的長(zhǎng)期記憶能力得到了顯著提升,推動(dòng)了多個(gè)領(lǐng)域的應(yīng)用發(fā)展。

2025年,大模型的長(zhǎng)期記憶技術(shù)將迎來(lái)新的發(fā)展趨勢(shì)。如混合窗口架構(gòu)或?qū)⒊蔀樯舷挛奶幚淼男路妒?,能夠根?jù)任務(wù)需求動(dòng)態(tài)調(diào)整局部和全局注意力的范圍,大幅度提升處理效率。隨著多模態(tài)技術(shù)的進(jìn)步,跨模態(tài)記憶融合將在視頻、文本、觸覺(jué)和嗅覺(jué)數(shù)據(jù)的編碼上取得突破,進(jìn)一步提升模型的記憶能力。記憶權(quán)限管理和記憶遺忘機(jī)制將更加成熟,為隱私和安全提供更強(qiáng)保障。

此外,隨著用戶對(duì)個(gè)性化和定制化的需求不斷提升。個(gè)性化記憶系統(tǒng)能夠根據(jù)用戶的特定需求、偏好和行為習(xí)慣構(gòu)建專屬的記憶圖譜。例如,AI助手可以記住用戶的興趣、常用的命令、偏好的回答風(fēng)格等,從而提供更加精準(zhǔn)和符合需求的回復(fù)。2025年,個(gè)性化記憶系統(tǒng)也將成為大模型發(fā)展的重點(diǎn)方向,大模型能夠根據(jù)用戶需求構(gòu)建專屬記憶圖譜,提高個(gè)性化回復(fù)的準(zhǔn)確性,并通過(guò)跨設(shè)備記憶同步實(shí)現(xiàn)實(shí)時(shí)更新。

不過(guò),盡管大模型在長(zhǎng)期記憶方面取得顯著進(jìn)展,但仍面臨技術(shù)挑戰(zhàn),包括記憶沖突解決、多來(lái)源記憶的置信度評(píng)估體系、能耗瓶頸和認(rèn)知偏差防控問(wèn)題。商業(yè)應(yīng)用方面,醫(yī)療、教育和金融等行業(yè)將受益于大模型長(zhǎng)期記憶能力的提升,預(yù)計(jì)能夠降低誤診率、提升知識(shí)留存率并加速風(fēng)控響應(yīng)速度。

趨勢(shì)四:合成數(shù)據(jù)或加速大模型訓(xùn)練

隨著人工智能技術(shù)的飛速發(fā)展,數(shù)據(jù)成為推動(dòng)AI進(jìn)步的核心資源。2025年,合成數(shù)據(jù)作為加速大模型訓(xùn)練的一種重要方法,正在成為AI發(fā)展的關(guān)鍵趨勢(shì)。馬斯克在2025年CES(消費(fèi)電子展會(huì))的訪談中提到,隨著人類累積的知識(shí)幾乎被AI訓(xùn)練完畢,未來(lái)的AI系統(tǒng)將不得不依賴合成數(shù)據(jù)進(jìn)行自我生成和學(xué)習(xí)。這一觀點(diǎn)突顯了合成數(shù)據(jù)在未來(lái)AI技術(shù)發(fā)展中的潛力。

目前,多個(gè)科技巨頭已經(jīng)開始在AI模型訓(xùn)練中廣泛應(yīng)用合成數(shù)據(jù)。微軟、Meta、OpenAI和Anthropic等公司紛紛將合成數(shù)據(jù)作為增強(qiáng)模型訓(xùn)練效率和拓寬訓(xùn)練數(shù)據(jù)源的有效手段。例如,2024年下半年發(fā)布的Llama 3.1、o1、DeepSeekV3和Phi-4等模型均報(bào)告了使用合成數(shù)據(jù)進(jìn)行訓(xùn)練。根據(jù)科技市場(chǎng)研究機(jī)構(gòu)Gartner的預(yù)測(cè),到2024年,AI及分析項(xiàng)目中使用的數(shù)據(jù)中,60%以上將來(lái)自合成數(shù)據(jù)。合成數(shù)據(jù)能夠幫助AI系統(tǒng)在真實(shí)數(shù)據(jù)難以獲得或標(biāo)注成本過(guò)高的情況下,生成具有代表性且符合特定任務(wù)需求的數(shù)據(jù),大幅降低了對(duì)實(shí)際數(shù)據(jù)的依賴。

然而,合成數(shù)據(jù)的使用仍然面臨諸多挑戰(zhàn)與爭(zhēng)議。2024年7月,《Nature》期刊刊登的論文指出,LLM生成的合成數(shù)據(jù)可能會(huì)污染下一代模型的訓(xùn)練集,導(dǎo)致模型性能下降,甚至發(fā)生“崩潰”。這一風(fēng)險(xiǎn)類似于“數(shù)據(jù)中毒”問(wèn)題,嚴(yán)重時(shí)可能讓模型無(wú)法做出有效的推理和判斷。英偉達(dá)也發(fā)布了其Nemotron-4 340B開源模型,聲稱使用了98%的合成數(shù)據(jù),但同時(shí)也強(qiáng)調(diào)需要加強(qiáng)合成數(shù)據(jù)的質(zhì)量控制,以避免潛在的負(fù)面影響。

盡管面臨風(fēng)險(xiǎn),但合成數(shù)據(jù)在加速大模型訓(xùn)練方面的潛力仍然巨大。尤其在高性能計(jì)算和多模態(tài)數(shù)據(jù)融合等領(lǐng)域,合成數(shù)據(jù)可以快速擴(kuò)展訓(xùn)練集的規(guī)模,并提供更多樣化的訓(xùn)練情境。為了應(yīng)對(duì)合成數(shù)據(jù)帶來(lái)的挑戰(zhàn),AI研究者正在不斷優(yōu)化生成數(shù)據(jù)的質(zhì)量和多樣性,例如通過(guò)強(qiáng)化學(xué)習(xí)算法對(duì)合成數(shù)據(jù)進(jìn)行校正,或者結(jié)合人類監(jiān)督和自動(dòng)化評(píng)估機(jī)制來(lái)減少“數(shù)據(jù)污染”風(fēng)險(xiǎn)。

展望未來(lái),隨著技術(shù)的不斷進(jìn)步,合成數(shù)據(jù)有望成為AI訓(xùn)練中的重要組成部分。它不僅能加速模型的訓(xùn)練過(guò)程,還能在數(shù)據(jù)匱乏或難以獲取的領(lǐng)域,為AI發(fā)展提供新的動(dòng)力。

趨勢(shì)五:大模型普及加速,效率躍遷曲線下成本更低了

在2025年1月,Anthropic的CEO-Dario Amodei 發(fā)表了一篇長(zhǎng)達(dá)萬(wàn)字的深度分析報(bào)告??隙薉eepSeek的技術(shù)突破:其最新模型在特定基準(zhǔn)測(cè)試中已逼近美國(guó)頂尖水平,并嘗試從三個(gè)維度將中國(guó)的AI進(jìn)步納入全球技術(shù)演進(jìn)坐標(biāo)系進(jìn)行定位:算力規(guī)模定律、效率躍遷曲線、范式革新動(dòng)能。

這些維度的選擇反映了他對(duì)國(guó)產(chǎn)AI評(píng)估方面的理解:關(guān)注硬件和計(jì)算能力的提升(算力規(guī)模定律),技術(shù)的效率提升(效率躍遷曲線),以及新技術(shù)范式的創(chuàng)新和推動(dòng)力(范式革新動(dòng)能)。這種全方位的定位方式,能夠精準(zhǔn)捕捉到AI大模型在全球技術(shù)演進(jìn)中的角色及潛力。具體我們解釋下這三方面的重要性和趨勢(shì):

首先,規(guī)模定律是推動(dòng)大模型發(fā)展的基礎(chǔ)。隨著硬件技術(shù)不斷進(jìn)步(如更強(qiáng)大的GPU、TPU和專用AI芯片),訓(xùn)練超大規(guī)模模型已變得越來(lái)越可行,同時(shí)也驅(qū)動(dòng)了云計(jì)算和分布式計(jì)算的發(fā)展,進(jìn)一步降低了成本。隨著更強(qiáng)大的計(jì)算資源的普及和優(yōu)化,規(guī)模定律將繼續(xù)提升,這是2025年AI大模型的關(guān)鍵能力趨勢(shì)之一。

其次,關(guān)于效率躍遷曲線,曲線偏移指的是技術(shù)創(chuàng)新帶來(lái)成本曲線的變化,使得原本高昂的訓(xùn)練成本能夠通過(guò)硬件優(yōu)化、模型架構(gòu)改進(jìn)等手段大幅降低。這不僅能夠降低AI研發(fā)的門檻,還能加速技術(shù)迭代。比如2024年,硬件創(chuàng)新如量子計(jì)算、專用AI加速芯片推動(dòng)AI訓(xùn)練成本的快速降低。同時(shí),AI框架的優(yōu)化(如更高效的深度學(xué)習(xí)框架)和算法改進(jìn)幫助實(shí)現(xiàn)了更少計(jì)算資源的更高效訓(xùn)練。

在前文中我們也提到了,目前對(duì)于AI基礎(chǔ)設(shè)施方面軍備競(jìng)賽激烈,低成本做法漸成趨勢(shì),尤其是DeepSeek通過(guò)采用OpenAI等先進(jìn)模型,利用蒸餾技術(shù)將其知識(shí)轉(zhuǎn)移。這一過(guò)程使得DeepSeek能夠在保持較高性能的同時(shí),顯著減少訓(xùn)練所需的計(jì)算資源和時(shí)間。通過(guò)模仿OpenAI模型的輸出,“學(xué)生模型”能夠快速學(xué)習(xí)復(fù)雜的模式和推理能力,加速模型的優(yōu)化過(guò)程。2025年,隨著硬件和算法的進(jìn)一步突破,AI開發(fā)成本將大幅下降,這也使得更多的中小型企業(yè)可以進(jìn)入AI領(lǐng)域。

此外,新的訓(xùn)練范式(如強(qiáng)化學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)等)正在改變AI的學(xué)習(xí)方式。2020到2023年,AI主要依賴預(yù)訓(xùn)練模型,使用大量互聯(lián)網(wǎng)文本進(jìn)行訓(xùn)練,并通過(guò)少量額外訓(xùn)練進(jìn)行微調(diào)。然而,到了2024年,強(qiáng)化學(xué)習(xí)(RL)成為新的重點(diǎn),通過(guò)強(qiáng)化學(xué)習(xí)生成思維鏈,AI在數(shù)學(xué)、編程和推理等任務(wù)上的表現(xiàn)顯著提升。初期階段投入較少,但效果顯著。

強(qiáng)化學(xué)習(xí)和自監(jiān)督學(xué)習(xí)等新興范式逐漸在機(jī)器人、自動(dòng)化和多模態(tài)學(xué)習(xí)領(lǐng)域得到應(yīng)用,尤其提升了機(jī)器人在動(dòng)態(tài)環(huán)境中的自主學(xué)習(xí)和決策能力。到2025年,這些新訓(xùn)練范式預(yù)計(jì)將成為AI發(fā)展的主流,尤其在復(fù)雜任務(wù)處理上(接下來(lái)趨勢(shì)六我們會(huì)進(jìn)一步解釋)。

趨勢(shì)六:預(yù)訓(xùn)練到后期訓(xùn)練和推理遷移轉(zhuǎn)變

2024年是AI技術(shù)飛速發(fā)展的一年,尤其是在大語(yǔ)言模型(LLM)和多模態(tài)技術(shù)方面取得了顯著突破。這一年,AI從單一模態(tài)向多模態(tài)融合邁進(jìn),大語(yǔ)言模型通過(guò)擴(kuò)展上下文窗口和采用混合專家架構(gòu)(MoE)等技術(shù),顯著提升了推理和生成能力。同時(shí),強(qiáng)化學(xué)習(xí)(RL)開始與大語(yǔ)言模型結(jié)合,為模型的泛化能力提升提供了新的方向。此外,AI在醫(yī)療、金融、自動(dòng)駕駛等領(lǐng)域的應(yīng)用不斷深化,推動(dòng)了行業(yè)變革。然而,隨著模型規(guī)模的擴(kuò)大,預(yù)訓(xùn)練階段的性能提升逐漸放緩,行業(yè)開始探索后訓(xùn)練和推理遷移的新模式。

2025年,AI技術(shù)將進(jìn)入一個(gè)新的發(fā)展階段,Scaling Law的擴(kuò)展將成為關(guān)鍵趨勢(shì)之一。強(qiáng)化學(xué)習(xí)與大語(yǔ)言模型的結(jié)合(RL+LLMs)將進(jìn)一步推動(dòng)模型泛化能力,從預(yù)訓(xùn)練向后訓(xùn)練和推理遷移轉(zhuǎn)變。

這種模式將使AI在特定場(chǎng)景下的表現(xiàn)得到顯著提升,同時(shí)降低訓(xùn)練成本,提高模型的適應(yīng)性和靈活性。此外,AI將在更多領(lǐng)域?qū)崿F(xiàn)落地應(yīng)用,如智能駕駛、具身智能等,這些領(lǐng)域?qū)⒂瓉?lái)技術(shù)突破和商業(yè)化的加速,但也與此同時(shí)會(huì)帶來(lái)更多的安全和風(fēng)險(xiǎn)管理挑戰(zhàn)。因此,AI安全和治理將成為行業(yè)關(guān)注的重點(diǎn)。

需要強(qiáng)調(diào)的是,大規(guī)模語(yǔ)言模型(LLM)的預(yù)訓(xùn)練階段已經(jīng)接近瓶頸,主要受到數(shù)據(jù)、計(jì)算資源和模型規(guī)模增長(zhǎng)的限制,且在通用性提升上邊際效益遞減。部分研究人員和行業(yè)專家擔(dān)心,對(duì)于大規(guī)模語(yǔ)言模型而言,傳統(tǒng)擴(kuò)展方式已接近極限。生成式AI已遇瓶頸。據(jù)外媒報(bào)道,像OpenAI這樣的公司在擴(kuò)大技術(shù)應(yīng)用時(shí)也發(fā)現(xiàn)困難重重,其他前沿實(shí)驗(yàn)室也面臨更嚴(yán)重的挑戰(zhàn)。知名數(shù)據(jù)科學(xué)家Yam Peleg透露,一些實(shí)驗(yàn)室試圖通過(guò)延長(zhǎng)訓(xùn)練時(shí)間和增加數(shù)據(jù)量來(lái)提升模型表現(xiàn),但結(jié)果卻遭遇了“收益遞減墻”,且情況比公開報(bào)道的更為嚴(yán)重。

不過(guò),盡管如此,預(yù)訓(xùn)練依然為模型奠定了基礎(chǔ),后續(xù)的優(yōu)化潛力巨大。因此,在后訓(xùn)練階段(如微調(diào)、強(qiáng)化學(xué)習(xí)、多模態(tài)對(duì)齊等)依然存在許多優(yōu)化機(jī)會(huì)。通過(guò)領(lǐng)域特化、任務(wù)指令優(yōu)化、模型壓縮等技術(shù),可以提升模型在特定任務(wù)上的表現(xiàn),同時(shí)提高其在資源受限環(huán)境中的部署效率和安全性。

趨勢(shì)七:更多優(yōu)化算法將被用于強(qiáng)化學(xué)習(xí)等領(lǐng)域

目前,深度強(qiáng)化學(xué)習(xí)(DRL)的優(yōu)化算法在多個(gè)行業(yè)取得了應(yīng)用突破。為了解決傳統(tǒng)強(qiáng)化學(xué)習(xí)在高維度問(wèn)題上訓(xùn)練困難的問(wèn)題,研究者采用了更加高效的算法,如模仿學(xué)習(xí)和分層強(qiáng)化學(xué)習(xí),顯著提升了模型的學(xué)習(xí)效率和訓(xùn)練速度。比如Google DeepMind 推出的AlphaDev系統(tǒng)由兩個(gè)核心組成部分構(gòu)成:學(xué)習(xí)算法和表示函數(shù)。學(xué)習(xí)算法是在先進(jìn)的 AlphaZero 算法基礎(chǔ)上進(jìn)行擴(kuò)展,結(jié)合了深度強(qiáng)化學(xué)習(xí) (DRL) 和隨機(jī)搜索優(yōu)化算法,以執(zhí)行大規(guī)模的指令搜索任務(wù)。

此外,RLHF(強(qiáng)化學(xué)習(xí)與人類反饋結(jié)合)的應(yīng)用開始更加深入和精細(xì)。AI大模型開始通過(guò)更精確的人類反饋進(jìn)行訓(xùn)練,從而能夠更好地理解復(fù)雜任務(wù),并且在人機(jī)交互中表現(xiàn)出更高的自適應(yīng)能力。例如,OpenAI的ChatGPT通過(guò)用戶的實(shí)時(shí)反饋不斷優(yōu)化對(duì)話能力,以提供個(gè)性化和上下文相關(guān)的回答。由于RLHF能顯著減少對(duì)大規(guī)模標(biāo)注數(shù)據(jù)的依賴,更多AI系統(tǒng)開始通過(guò)少量高質(zhì)量的人工反饋來(lái)進(jìn)行高效訓(xùn)練,從而降低了模型開發(fā)和訓(xùn)練的成本。

還有近期處于話題焦點(diǎn)的DeepSeek,R1模型通過(guò)強(qiáng)化學(xué)習(xí)(RL)和基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)進(jìn)行訓(xùn)練,并針對(duì)核心算法模塊做了大量的優(yōu)化處理:比如改造 Attention 模塊,通過(guò)低秩壓縮,讓KV Cache的效率達(dá)到最優(yōu)。以及通過(guò)訓(xùn)練架構(gòu)瘦身—例如GRPO算法通過(guò)省去傳統(tǒng)強(qiáng)化學(xué)習(xí)中必須的Critic模型(即"雙引擎"設(shè)計(jì)),將復(fù)雜算法簡(jiǎn)化為可落地執(zhí)行的工程方案。一般傳統(tǒng)的強(qiáng)化學(xué)習(xí)模型通常采用這雙引擎”設(shè)計(jì)——Actor和Critic,Actor負(fù)責(zé)執(zhí)行決策,Critic評(píng)估Actor的決策效果,二者需要同時(shí)進(jìn)行訓(xùn)練,這增加了計(jì)算量和訓(xùn)練復(fù)雜度。通過(guò)去除Critic模型,GRPO算法能夠簡(jiǎn)化模型結(jié)構(gòu),降低計(jì)算資源的消耗。

隨著AI應(yīng)用場(chǎng)景的多樣化,簡(jiǎn)化算法架構(gòu)將成為AI發(fā)展的重要方向。2025年,更多優(yōu)化算法(如GRPO等)將被用于強(qiáng)化學(xué)習(xí)等領(lǐng)域,以減少計(jì)算資源的消耗,同時(shí)提高模型的執(zhí)行效率和實(shí)時(shí)響應(yīng)能力。

隨著硬件資源的不斷提升和算法的進(jìn)一步優(yōu)化,像GRPO這樣的輕量級(jí)強(qiáng)化學(xué)習(xí)算法將被廣泛應(yīng)用于邊緣計(jì)算和低資源設(shè)備上。例如,智能設(shè)備、物聯(lián)網(wǎng)設(shè)備和機(jī)器人等領(lǐng)域,都會(huì)受益于這種簡(jiǎn)化的算法,實(shí)現(xiàn)在硬件條件有限的環(huán)境中高效運(yùn)行。

趨勢(shì)八:低成本訓(xùn)練與AI倫理,知識(shí)產(chǎn)權(quán)成為核心議題

春節(jié)期間,DeepSeek的DeepSeek-R1震撼了全球科技圈和資本市場(chǎng),其基于知識(shí)蒸餾技術(shù),成功將大型復(fù)雜模型的知識(shí)遷移到較小模型,實(shí)現(xiàn)高效部署。2月6日,斯坦福大學(xué)李飛飛團(tuán)隊(duì)和華盛頓大學(xué)研究人員以不到50美元云計(jì)算費(fèi)用,成功蒸餾出一個(gè)名為s1的新推理模型,表現(xiàn)與OpenAI的o1和DeepSeek的R1相似,展示了蒸餾技術(shù)的強(qiáng)大潛力。基于競(jìng)爭(zhēng)壓力,2月7日,OpenAI公開了o3-mini的推理思維鏈,但該推理思維鏈并非原始數(shù)據(jù),OpenAI產(chǎn)品官Kevin Weil表示會(huì)找到平衡方式以避免被競(jìng)爭(zhēng)對(duì)手蒸餾。

Kevin Weil的考慮出發(fā)點(diǎn)在于,蒸餾通常依賴于將一個(gè)較大模型的知識(shí)提取出來(lái),并將其遷移到一個(gè)更小的模型。如果目標(biāo)模型能夠有效地從源模型中獲取有用的知識(shí),且沒(méi)有太大的性能損失,那么理論上,很多模型都可以通過(guò)蒸餾技術(shù)進(jìn)行簡(jiǎn)化和優(yōu)化。因此,隨著AI蒸餾技術(shù)的普及,相關(guān)的法律和監(jiān)管框架也需要不斷加強(qiáng),以確保在模型開發(fā)和應(yīng)用過(guò)程中不會(huì)侵犯知識(shí)產(chǎn)權(quán)或數(shù)據(jù)隱私。

這種低成本訓(xùn)練的模式也引發(fā)了業(yè)界關(guān)于AI模型知識(shí)產(chǎn)權(quán)和倫理問(wèn)題的討論。隨著越來(lái)越多的研究依賴于現(xiàn)有基座模型進(jìn)行微調(diào),是否應(yīng)當(dāng)給予這些基座模型開發(fā)者相應(yīng)的回報(bào)成為一個(gè)重要議題。同時(shí),如何確保AI技術(shù)的公平使用和共享,也亟待業(yè)界深入探討和解決。

下一個(gè)殺手級(jí)應(yīng)用,可能在消費(fèi)領(lǐng)域

趨勢(shì)一:越來(lái)越多企業(yè)從人工智能上掙到錢

過(guò)去的2024年,是生成式AI的落地之年。而2025年,則是這些企業(yè)級(jí)AI應(yīng)用在已有的落地場(chǎng)景中深入發(fā)展的一年。

美國(guó)風(fēng)險(xiǎn)投資機(jī)構(gòu)Menlo Ventures在統(tǒng)計(jì)了600家美國(guó)企業(yè)的IT支出(包括模型支出、訓(xùn)練&部署支出、AI應(yīng)用支出,不包括芯片、云計(jì)算等支出)情況后發(fā)現(xiàn),2024年企業(yè)的AI相關(guān)支出達(dá)到了138億美元,相比2023年的23億美元增長(zhǎng)了超過(guò)6倍。在這其中,應(yīng)用支出的增速最快,6億美元增長(zhǎng)到了2024年的46億美元。

數(shù)據(jù)來(lái)源:Menlo Ventures

企業(yè)AI相關(guān)支出的提高,讓不同的行業(yè)間接獲益。第一個(gè)受益的是咨詢公司。2024年,埃森哲和IBM等咨詢公司正在實(shí)現(xiàn)大幅的收入增長(zhǎng),其中,與人工智能相關(guān)的服務(wù)對(duì)其營(yíng)收增長(zhǎng)貢獻(xiàn)顯著,客戶希望通過(guò)咨詢,了解實(shí)施人工智能能夠獲得的競(jìng)爭(zhēng)優(yōu)勢(shì)。根據(jù)埃森哲披露,截至 2024 年 9 月,其生成式人工智能咨詢預(yù)訂額近 30 億美元。

第二個(gè)從人工智能中獲益的行業(yè)是云計(jì)算和軟件公司。軟件公司ServiceNow自推出 “Now Assist” 以來(lái),報(bào)告了強(qiáng)勁的生成式人工智能預(yù)訂量,其首席財(cái)務(wù)官表示,在新產(chǎn)品系列中,最大新增年度合同價(jià)值貢獻(xiàn),來(lái)自于人工智能的采用。另外,軟件巨頭甲骨文的基礎(chǔ)設(shè)施即服務(wù)(IaaS)部門實(shí)現(xiàn)了強(qiáng)勁增長(zhǎng),這在很大程度上歸因于人工智能工作負(fù)載的增加。數(shù)據(jù)中心的領(lǐng)導(dǎo)者Equinix也因?yàn)槿斯ぶ悄芑A(chǔ)設(shè)施需求獲得了大量新合同。

另外,廣告行業(yè)也從人工智能使用中獲益。根據(jù)Meta Platforms最近報(bào)告,在人工智能的加持下,其廣告展示量增長(zhǎng)了7% ,每廣告的平均價(jià)格增長(zhǎng)了 11%,季度收入同比增張了19%。

亞馬遜集成了基于生成式人工智能的產(chǎn)品圖像生成工具,導(dǎo)致某些廣告活動(dòng)的廣告展示量顯著增加。我們預(yù)計(jì),隨著人工智能服務(wù)需求的擴(kuò)大,具有獨(dú)特市場(chǎng)定位、強(qiáng)大分銷渠道和特權(quán)數(shù)據(jù)訪問(wèn)權(quán)限的云計(jì)算、軟件應(yīng)用和基礎(chǔ)設(shè)施公司將成為主要受益者。隨著人工智能市場(chǎng)的成熟,這些科技巨頭可能在 2025 年實(shí)現(xiàn)加速增長(zhǎng)。

我們嘗試總結(jié)了生成式AI滲透率最高的幾個(gè)應(yīng)用場(chǎng)景:AI代碼、AI客服支持和企業(yè)級(jí)搜索。

● 最高的是AI代碼應(yīng)用,企業(yè)對(duì)AI代碼應(yīng)用的采用率達(dá)到了51%,比如,頭部產(chǎn)品 Github Copilot 的ARR(年度經(jīng)常性收入,是指企業(yè)每年從客戶那里獲得的或期望從客戶那里獲得的服務(wù)或產(chǎn)品回報(bào)的收入計(jì)算)達(dá)到了3億美金也真實(shí)的反應(yīng)了用戶的需求。Cursor、Cognition 等新興工具在迎來(lái)用戶快速增長(zhǎng)的同時(shí),也獲得了資本市場(chǎng)的火熱追捧。

● 其次是AI客戶支持,其采用率達(dá)到了31%,產(chǎn)品為內(nèi)部員工或外部用戶提供基于產(chǎn)品知識(shí)的客戶支持。Sierra、Decagon 等初創(chuàng)借力生成式AI的智能,為用戶提供符合品牌調(diào)性和消費(fèi)者畫像的定制化客服體驗(yàn),挑戰(zhàn)低效、無(wú)趣的傳統(tǒng)客服。

● 第三是AI數(shù)據(jù)檢索,其采用率達(dá)到了28%,這類應(yīng)用幫助企業(yè)解鎖和利用分散在各組織中的數(shù)據(jù),將數(shù)據(jù)孤島中的寶貴知識(shí)管理利用。例如一家初創(chuàng)企業(yè)Glean,其業(yè)務(wù)是企業(yè)級(jí)搜索,旨在為企業(yè)打造內(nèi)部的Google,核心產(chǎn)品 Glean Assistant 的用戶每天平均查詢 14 次,遠(yuǎn)超Google的日均查詢次數(shù)。在過(guò)去一年ARR(年經(jīng)常性收入,Annual Recurring Revenue)達(dá)到了5500萬(wàn)美金。

數(shù)據(jù)來(lái)源:Menlo Ventures

2024年,企業(yè)60%的AI應(yīng)用支出來(lái)自企業(yè)創(chuàng)新業(yè)務(wù)的預(yù)算,說(shuō)明企業(yè)使用這些應(yīng)用的態(tài)度以嘗試和探索為主,生成式AI在企業(yè)應(yīng)用場(chǎng)景中的落地尚處于早期階段。接下來(lái),隨著企業(yè)未來(lái)各個(gè)部門對(duì)于生成式AI應(yīng)用的預(yù)算持續(xù)增長(zhǎng),哪些生成式AI應(yīng)用能為企業(yè)帶來(lái)實(shí)實(shí)在在的回報(bào)率,哪些或?qū)⒎值贸掷m(xù)性更長(zhǎng)、規(guī)模更大的預(yù)算,從而支持生成式AI應(yīng)用生根發(fā)芽、斬獲1億美金甚至更多ARR。

①AI Agent正在給企業(yè)帶來(lái)效益

2025年,生成式AI應(yīng)用正在生根、發(fā)芽,給企業(yè)帶來(lái)實(shí)實(shí)在在的現(xiàn)金回報(bào),基于這樣的趨勢(shì),AI Agent將是這個(gè)商業(yè)環(huán)節(jié)閉環(huán)的關(guān)鍵。

AI Agent從學(xué)術(shù)走向商業(yè)落地,僅花了三年時(shí)間。

AI Agent的第一波高潮來(lái)自2023年年初,AutoGPT的火爆,所謂AutoGPT,其實(shí)是把學(xué)術(shù)圈很多的Agent idea簡(jiǎn)單呈現(xiàn)出來(lái),盡管其讓開發(fā)者感受到大模型的強(qiáng)大,但很快大家便發(fā)現(xiàn),AutoGPT的實(shí)驗(yàn)性強(qiáng)于實(shí)用性,難以解決大部分的實(shí)際問(wèn)題。第二波高潮來(lái)自2023年9月,AgentGen,通過(guò)構(gòu)建不同職能的Agent,分工協(xié)作。

到了2024年,AI Agent開始從實(shí)驗(yàn)走向現(xiàn)實(shí)。

2024年末,OpenAI首席執(zhí)行官Sam Altman提出了AGI(通用人工智能)的五層框架:

Lv1 - Chatbot,具備基礎(chǔ)的對(duì)話能力,能夠理解和回應(yīng)簡(jiǎn)單的文本輸入

Lv2 - Reasoner,具備基本的邏輯推理能力,能夠分析復(fù)雜信息并進(jìn)行推斷

Lv3 - Agent,具備理解復(fù)雜指令的能力

Lv4 - Innovator,具備創(chuàng)新和創(chuàng)造的能力

Lv5 - Organizer,具備協(xié)調(diào)和管理龐大系統(tǒng)、資源和團(tuán)隊(duì)的能力

他提出,如今我們正處于第二個(gè)階段并非常接近第三個(gè)階段的狀態(tài)。

Lv3的Agent智能體能夠自主與環(huán)境交互、收集信息,具備持續(xù)規(guī)劃并執(zhí)行多步驟、長(zhǎng)時(shí)間任務(wù)的能力。要達(dá)成這個(gè)階段,需要一個(gè)推理能力、邏輯能力更強(qiáng)的模型(可能是o1的下一個(gè)版本、也可能是對(duì)標(biāo)o1的開源模型)。同時(shí),服務(wù)AI Agent應(yīng)用的基礎(chǔ)設(shè)施也必不可少。

當(dāng)下,企業(yè)出于安全性、準(zhǔn)確性、穩(wěn)定性等因素的考量,更傾向于使用 AI Copilot (人在回路中參與)增加人在工作流中的效率,而不是直接采用端到端自動(dòng)化 AI Agent。隨著底層模型能力和Agent框架開發(fā)的持續(xù)升級(jí),Agent應(yīng)用將為企業(yè)提供更智能高效的數(shù)字員工。人與AI的協(xié)作關(guān)系將從AI賦能人工作,逐漸轉(zhuǎn)變到人監(jiān)督指導(dǎo)AI完成工作,最終達(dá)到AI自主完成工作。這個(gè)轉(zhuǎn)變會(huì)在未來(lái)幾年迅速發(fā)生。

至于適合AI Agent最先產(chǎn)生價(jià)值的應(yīng)用場(chǎng)景,2025年大概將延續(xù)現(xiàn)階段生成式AI滲透率高的場(chǎng)景,例如代碼編程、客服、銷售、營(yíng)銷等。

根據(jù)第三方機(jī)構(gòu)Menlo Ventures的調(diào)查數(shù)據(jù)顯示,企業(yè)內(nèi)各部門的生成式AI預(yù)算劃分中,IT部分獨(dú)占鰲頭(22%)、產(chǎn)品和工程開發(fā)次之(19%),客服(9%)、銷售(8%)和營(yíng)銷(7%)緊隨其后。

數(shù)據(jù)來(lái)源:Menlo Ventures, UpHonest Capital

根據(jù)硅兔賽跑的觀察,一些企業(yè)的確正在從這幾個(gè)場(chǎng)景中賺錢:

IT部門選擇之一的初創(chuàng)公司Glean,在2024年9月份完成新一輪融資,估值達(dá)到46億美元,其旨在優(yōu)化企業(yè)內(nèi)部數(shù)據(jù)檢索和問(wèn)題答復(fù)。

在產(chǎn)品和工程開發(fā)部門依賴的AI編程應(yīng)用中,初創(chuàng)公司Cognition在2024年3月推出了首個(gè)AI程序員Devin,成立僅6個(gè)月就達(dá)到了20億美金估值。同年12月其Agent產(chǎn)品Devin正式上線,區(qū)別于普通的代碼補(bǔ)全應(yīng)用,Devin能夠無(wú)需人類參與進(jìn)行自主編碼,完成需要人類工程師參與的項(xiàng)目開發(fā)。目前 Devin擁有諸多頭部客戶:例如Ramp 使用Devin 編寫測(cè)試代碼并清理死亡代碼,MongoDB使用 Devin 更新過(guò)時(shí)的代碼架構(gòu)。

硅谷投資機(jī)構(gòu)UpHonest Capital早期投資的Cosine,正在打造全自動(dòng)的AI軟件開發(fā)助理Genie,曾在SWE-Bench測(cè)試中獲得全球最高分?jǐn)?shù)。Cosine 研發(fā)了獨(dú)有的數(shù)據(jù)管道,能夠生成具有人類工程師開發(fā)邏輯、增量知識(shí)、支持搜索的高質(zhì)量數(shù)據(jù)集。同時(shí),Cosine是OpenAI最大的模型微調(diào)合作伙伴,擁有其前沿模型的早期使用權(quán)限。結(jié)合數(shù)據(jù)和模型優(yōu)勢(shì),Cosine已經(jīng)與多家世界500強(qiáng)公司和明星初創(chuàng)公司達(dá)成合作。

客服作為人力密集型工作,也將成為AI Agent最先顛覆的環(huán)節(jié)。比如UpHonest Capital早期投資的Proactive AI 正在為零售品牌打造具有高情感智能語(yǔ)言能力的客服助理,主要幫助企業(yè)向其用戶提供契合品牌調(diào)性和個(gè)性化需求的客服服務(wù),目前已與餐飲、健身、沙龍等行業(yè)多家頭部企業(yè)達(dá)成深度合作。

銷售和營(yíng)銷作為企業(yè)開源的重要入口,企業(yè)利用最新技術(shù)提高獲客效率的意愿也非常高。美國(guó)的人工智能初創(chuàng)公司11x,打造AI驅(qū)動(dòng)的“數(shù)字工作者”以取代傳統(tǒng)的銷售團(tuán)隊(duì),其Agent能夠自主執(zhí)行GTM工作流程。11x不通過(guò)軟件幫助企業(yè)降本增效,而是直接提供實(shí)在的工作成果,數(shù)字員工能夠自主實(shí)現(xiàn)完成的收入閉環(huán)。11x成立6個(gè)月就達(dá)到了200萬(wàn)美金的ARR,目前ARR已經(jīng)達(dá)到了1,000萬(wàn)美金。FlashIntel正在打造AI驅(qū)動(dòng)的GTM平臺(tái)并向企業(yè)提供AI驅(qū)動(dòng)的銷售助理(SDR)。FlashIntel在G2 2024冬季報(bào)告中總計(jì)獲得了189枚徽章,其中FlashRev被評(píng)為最佳銷售產(chǎn)品,最佳營(yíng)銷和數(shù)字廣告產(chǎn)品,以及最高滿意度產(chǎn)品。

② 在數(shù)字化滲透率低的傳統(tǒng)行業(yè)有隱藏的“金礦”

曾經(jīng),傳統(tǒng)行業(yè)的玩家對(duì)AI嗤之以鼻,過(guò)高的投入成本和微不足道的效果,讓他們難以對(duì)AI押注過(guò)多。

不過(guò)這一次,傳統(tǒng)行業(yè)的生成式AI之路,有可能跳過(guò)軟件階段,直接進(jìn)入AI階段,類似新興市場(chǎng)從使用現(xiàn)金直接轉(zhuǎn)向移動(dòng)支付。

這些行業(yè)本身對(duì)于科技的采用速度較慢,生成式AI的出現(xiàn)帶來(lái)了直接交付結(jié)果而非交付軟件的模式,減少了前期投入成本、肉眼可見的提升了投資回報(bào)率,使得恐懼新技術(shù)的決策者更容易被說(shuō)服。比如醫(yī)療領(lǐng)域的病例記錄、法律領(lǐng)域的案件報(bào)告生成、金融行業(yè)的合規(guī)風(fēng)險(xiǎn)篩查等等。

2024年12月,美國(guó)家政垂直軟件巨頭ServiceTitan上市,上市當(dāng)天股價(jià)漲幅超過(guò)40%,在2024年上市公司中,該漲幅僅次于社交平臺(tái)Reddit和芯片公司Astera Labs兩家。

要知道,ServiceTitan 2012年成立,歷經(jīng)12年發(fā)展,在僅拿下家政行業(yè)1%市場(chǎng)份額的情況下,其市值一度達(dá)到90億美元。由此可見,美國(guó)垂直行業(yè),數(shù)字化滲透速率之低,垂直行業(yè)AI化的價(jià)值之高。ServiceTitan之成功,自然使我們關(guān)注到美國(guó)傳統(tǒng)行業(yè)的機(jī)會(huì),數(shù)字化滲透率低的傳統(tǒng)行業(yè)。

美國(guó)初創(chuàng)公司Sameday為美國(guó)家庭服務(wù)行業(yè)(除蟲、HVAC、家庭維修等)提供AI銷售代理,通過(guò)自動(dòng)化的語(yǔ)音客服接聽來(lái)電并安排服務(wù)預(yù)約,提高電話接聽率,從而提高轉(zhuǎn)換率,現(xiàn)在已經(jīng)與ServiceTitan集成。Sameday的創(chuàng)始人曾在美國(guó)增長(zhǎng)最快的家庭服務(wù)行頭部公司擔(dān)任CMO,擁有極深的行業(yè)認(rèn)知和豐富的行業(yè)資源。2024年,Sameday的ARR預(yù)計(jì)將增長(zhǎng)5倍以上,月度客戶留存率達(dá)98.5%。

建筑行業(yè)的AI解決方案提供商Pantheon,能夠生成高精度且可編輯的 3D 建筑模型,通過(guò)AI實(shí)現(xiàn)更快的設(shè)計(jì)迭代周期可以顯著降低項(xiàng)目成本。Pantheon AI不向建筑師出售軟件許可證,而是直接向房地產(chǎn)開發(fā)商和業(yè)主出售其設(shè)計(jì)服務(wù)。2024年10月,Pantheon AI完成了由a16z領(lǐng)投的2500萬(wàn)美金種子輪融資。

傳統(tǒng)行業(yè)以外,法律、金融、醫(yī)療行業(yè)積累了大量數(shù)據(jù),為行業(yè)垂直基石模型訓(xùn)練提供了豐富的燃料,且法律、金融、醫(yī)療行業(yè)價(jià)值高,但普遍在傳統(tǒng)軟件巨頭的壟斷下變化緩慢。即便垂直SaaS一定程度上取代了過(guò)時(shí)繁瑣的老系統(tǒng),但總體的滲透率依然有限。以醫(yī)療行業(yè)為例,其行業(yè)規(guī)模高達(dá)4.3萬(wàn)億美元,貢獻(xiàn)了約1/5的美國(guó)GDP。但在美國(guó)市值前100的上市軟件公司中,只有一家是服務(wù)醫(yī)療行業(yè)的軟件公司。

2024年,Evenup ARR預(yù)計(jì)將達(dá)到5000萬(wàn)美金,最新一輪的投后估值達(dá)到了10億美金。Evenup 利用生成式AI幫助律師進(jìn)行人身?yè)p害賠償(Personal Injury Claims)案件的索賠工作。雖然目前只服務(wù)于人身?yè)p害賠償這一個(gè)領(lǐng)域,但這已經(jīng)是一個(gè)非常大的市場(chǎng)了。美國(guó)每年約有30萬(wàn)參與處理人身?yè)p害賠償?shù)穆蓭?,每年支付給受害者的索賠金額高達(dá)1000億美金。

有備而來(lái)者,率先享受紅利,那些垂直行業(yè)專家、對(duì)行業(yè)的工作流有深入認(rèn)知的創(chuàng)業(yè)者,結(jié)合不斷進(jìn)化的生成式AI基礎(chǔ)設(shè)施,有機(jī)會(huì)迅速搶占用戶,構(gòu)建自身的行業(yè)數(shù)據(jù)壁壘。

③ AI不再按席位收費(fèi) :“Sell work, not software”

Menlo Ventures的調(diào)查數(shù)據(jù)顯示,企業(yè)在進(jìn)行生成式AI產(chǎn)品采購(gòu)決策時(shí),第一考慮要素是產(chǎn)品是否具有簡(jiǎn)單可測(cè)量的投資回報(bào)率,其次是產(chǎn)品是否根據(jù)實(shí)際應(yīng)用場(chǎng)景定制。

值得注意的是,現(xiàn)階段,產(chǎn)品價(jià)格反而是最不重要的影響因素,僅1%的企業(yè)決策者聲稱產(chǎn)品價(jià)格影響采購(gòu)決策。

數(shù)據(jù)來(lái)源:Menlo Ventures

結(jié)果正在變得更為重要。隨著AI的獨(dú)立工作能力提升,其工作結(jié)果、創(chuàng)造的價(jià)值會(huì)更容易被量化,企業(yè)對(duì)AI產(chǎn)品的價(jià)值評(píng)估,也會(huì)根據(jù)其工作成果界定,美國(guó)投資機(jī)構(gòu)a16z提出。因此,商業(yè)模式變得更加重要。

SaaS時(shí)代,SaaS公司創(chuàng)新了按席位收費(fèi)的商業(yè)模式,即按照使用SaaS產(chǎn)品的員工賬號(hào)數(shù)量按月或按年收取訂閱費(fèi)用,這種定價(jià)方式背后的邏輯是,使用SaaS產(chǎn)品的每位員工,效率會(huì)有不同程度的提升、處理更多工作,許多SaaS定價(jià)的策略在于評(píng)估使用者效率提升創(chuàng)造的收益。

但到了生成式AI時(shí)代,這個(gè)SaaS時(shí)代一直以來(lái)賴以生存的邏輯正在被顛覆。隨著Copilot產(chǎn)品向Agent產(chǎn)品的升級(jí),未來(lái)的Agentic AI系統(tǒng)將在不同AI agents的相互配合下,自動(dòng)完成任務(wù),取代越來(lái)越多的工作者,顯然,如果繼續(xù)按照席位收費(fèi),開發(fā)者的收入則會(huì)逐漸減少。

Benchmark合伙人最先建議生成式AI公司“Sell work, not software”,即按照工作成果收費(fèi),打破按席位收費(fèi)的模式。

基于此,目前原生AI公司普遍采取的商業(yè)模式分為兩類,一類是基于用量的定價(jià)模式,Salesforce發(fā)布的Agent force智能體系統(tǒng),提供客服、銷售、員工服務(wù)等AI agent智能體,按照用戶與agent實(shí)際交互的用量收費(fèi),每次”對(duì)話“收費(fèi)2美元,如果發(fā)生以下三種情況之一,即視為一次”對(duì)話“結(jié)束—— AI agent無(wú)法滿足用戶需求,需要人工介入;用戶主動(dòng)結(jié)束與AI agent對(duì)話;用戶超過(guò)24小時(shí)沒(méi)有再主動(dòng)與AI agent對(duì)話。

另一類是基于工作結(jié)果的定價(jià)模式,前Salesforce聯(lián)席CEO Bret Taylor創(chuàng)立的AI客服公司Sierra,為客戶提供基于工作結(jié)果收費(fèi)的客服AI agent,從消費(fèi)者滿意度、問(wèn)題解決程度、以及每次的交互成本三方面來(lái)評(píng)估工作結(jié)果,決定企業(yè)付費(fèi)規(guī)模。采用按照工作結(jié)果定價(jià)的模式,實(shí)現(xiàn)了AI agent企業(yè)客戶與開發(fā)公司的利益一致性,雙方將共同得益于agent獨(dú)立任務(wù)完成能力的提升。

趨勢(shì)二:等待一個(gè)“殺手級(jí)”AI消費(fèi)級(jí)應(yīng)用

“2025年(AI應(yīng)用)下一個(gè)大事件屬于消費(fèi)。”美國(guó)紅杉資本合伙人Jess Lee表示,AI聊天、圖片、視頻已驗(yàn)證了其消費(fèi)市場(chǎng)潛力,接下來(lái)將看到全新的AI消費(fèi)社交APP、新形式的互動(dòng)媒體、基于聊天的游戲、新的搜索和信息整合工具、基于互動(dòng)式UI的聊天工具等?!?/p>

消費(fèi)賽道,一直是歷次技術(shù)創(chuàng)新浪潮下創(chuàng)業(yè)者和投資人高度關(guān)注的方向,如果回顧之前的技術(shù)周期會(huì)發(fā)現(xiàn),全球市值Top15的科技公司中,有9家是從To C消費(fèi)產(chǎn)品起家的。To C的公司上市時(shí),估值超過(guò)100億美元的比例,比To B公司高10%左右。

但在這一波生成式AI創(chuàng)業(yè)浪潮中,消費(fèi)AI應(yīng)用似乎在被創(chuàng)業(yè)者和資本遺忘。2024年,90%以上的A輪融資流向AI企業(yè)應(yīng)用。

不過(guò),自2024年下半年以來(lái),這個(gè)現(xiàn)象正在發(fā)生改變。

2024下半年以來(lái),資本市場(chǎng)對(duì)消費(fèi)級(jí)AI應(yīng)用的關(guān)注度上升,以硅谷孵化器Y Combinator 為例,其下半年孵化的消費(fèi)級(jí)AI產(chǎn)品數(shù)量比上半年翻番。

數(shù)據(jù)來(lái)源:Y Combinator, UpHonest Capital整理

2025年,消費(fèi)級(jí)AI應(yīng)用的“土地”正在被開墾,行業(yè)在等待一個(gè)“殺手級(jí)”AI消費(fèi)的應(yīng)用。風(fēng)險(xiǎn)投資機(jī)構(gòu)也對(duì)消費(fèi)級(jí)AI應(yīng)用的機(jī)會(huì)產(chǎn)生共識(shí)。YC Partner Michael Seibel表示,目前太多創(chuàng)始人尋找B2B的AI機(jī)會(huì),太少人探索消費(fèi)側(cè)的機(jī)會(huì),消費(fèi)創(chuàng)業(yè)者的機(jī)會(huì)來(lái)了;a16z提出“生成式AI或?qū)⒅厮軓穆糜巍⑿睦碇委煹骄W(wǎng)購(gòu)等一切(消費(fèi)行為)?!扒癐ndex Ventures合伙人Rex Woodbury,稱現(xiàn)在是“消費(fèi)復(fù)興”的機(jī)會(huì)。

生成式AI對(duì)消費(fèi)端改變,體現(xiàn)在三個(gè)層面:首先,AI會(huì)逐漸改變?nèi)伺c人、人與信息交互的方式,形成新的流量入口;其次,AI搜索正在改變信息的分發(fā)方式,會(huì)創(chuàng)造新的商業(yè)機(jī)會(huì);第三,AI釋放PGC、UGC內(nèi)容創(chuàng)作潛力,使內(nèi)容消費(fèi)更加豐富多元。

以AI搜索為例,作為線上流量的第一入口,已經(jīng)久無(wú)戰(zhàn)事,生成式AI引入了新變量。2020年創(chuàng)立的生成式AI搜索初創(chuàng)You.com,近期完成5000萬(wàn)美元融資,價(jià)值7億美元了。OpenAI在7月發(fā)布AI搜索工具SearchGPT,其付費(fèi)用戶均可使用。

Perplexity是一家成立于2022年8月的美國(guó)AI創(chuàng)業(yè)公司,公司由前OpenAI研究科學(xué)家Aravind Srinivas和前Meta研究科學(xué)家Denis Yarats等聯(lián)合創(chuàng)立,專注于開發(fā)基于人工智能的對(duì)話式搜索引擎,旨在通過(guò)大型語(yǔ)言模型(如GPT-4和LLama2)為用戶提供精準(zhǔn)的搜索結(jié)果。Perplexity的界面更像是聊天屏幕,用戶可以通過(guò)自然語(yǔ)言提問(wèn),Perplexity會(huì)提供直接的答案,并附上詳細(xì)的引用來(lái)源,Perplexity 的用戶增長(zhǎng)非常迅速。2023年2月,Perplexity的月訪問(wèn)量達(dá)到1000萬(wàn),獨(dú)立訪客達(dá)到200萬(wàn)人。截至2024年4月,Perplexity 的月活躍用戶數(shù)便突破了1500萬(wàn)。Perplexity在短時(shí)間內(nèi)完成了多輪融資。截至2024年11月,Perplexity在新一輪融資中籌集了5億美元,使公司估值達(dá)到90億美元。投資方包括軟銀、亞馬遜創(chuàng)始人貝索斯和英偉達(dá)等多家知名企業(yè)和AI領(lǐng)域知名人士。

除了通用搜索引擎,生成式AI使垂直領(lǐng)域的搜索引擎更普遍,瓜分通用搜索引擎的注意力。例如,垂直于企業(yè)知識(shí)數(shù)據(jù)庫(kù)的搜索——Glean在9月份完成新一輪融資,估值達(dá)到46億美元,旨在優(yōu)化企業(yè)內(nèi)部數(shù)據(jù)檢索和問(wèn)題答復(fù),在近兩年中ARR翻倍增長(zhǎng);亞馬遜、沃爾瑪都在加強(qiáng)電商搜索引擎建設(shè),今年先發(fā)搜索助手,再發(fā)Agent。初創(chuàng)企業(yè)DayDream種子輪拿到了5000萬(wàn)美元投資,F(xiàn)orerunner、Index聯(lián)合領(lǐng)投。DayDream鏈接了超過(guò)2000+品牌,支持自然語(yǔ)言檢索,根據(jù)用戶提供的時(shí)間、地點(diǎn)、場(chǎng)合等信息給予相關(guān)產(chǎn)品推薦。Encore,YC24新一期孵化項(xiàng)目,是一個(gè)LLM驅(qū)動(dòng)的針對(duì)二手商品購(gòu)物的搜索引擎,鏈接美國(guó)多個(gè)二手商品網(wǎng)站,支持自然語(yǔ)言搜索以及按照主題的搜索;垂直于科研場(chǎng)景的搜索:初創(chuàng)企業(yè)Consensus與Perplexity有共同的投資人Nat Friedman和Daniel Gross,專注打造服務(wù)科研的搜索引擎,改變?nèi)藗儷@取和使用學(xué)術(shù)文獻(xiàn)的方式。2024年收入增長(zhǎng)了600%,月活40萬(wàn)用戶,ARR近200萬(wàn)美元。

也許明年會(huì)出現(xiàn)更多令人眼前一亮的垂直領(lǐng)域的AI搜索創(chuàng)新。

這一點(diǎn),美國(guó)紅杉在2025年的AI趨勢(shì)預(yù)測(cè)中也分享了一些思考,紅杉提出AI搜索或?qū)⒊蔀?025年的”殺手級(jí)“應(yīng)用,他們提出了兩點(diǎn)預(yù)測(cè):目前一個(gè)整體的搜索市場(chǎng)可能會(huì)碎片化,未來(lái)每個(gè)人可能會(huì)有專業(yè)AI搜索引擎——例如,Perplexity可能會(huì)成為投資人和分析師的第一搜索工具選擇,律師選擇Harvey,醫(yī)生選擇OpenEvidence……全新的生成式AI搜索引擎將緊密契合目標(biāo)用戶的“心智模式”,投資人、律師、醫(yī)生的思維模式各不相同,信息獲取模式、目的和決策思維各有差異,這些不同和差異就是生成式AI搜索引擎創(chuàng)新的機(jī)會(huì);消費(fèi)級(jí)和企業(yè)級(jí)應(yīng)用場(chǎng)景分化,每位知識(shí)工作者每天至少會(huì)使用兩款A(yù)I搜索引擎 —— 一款用于工作,另一款用于其他所有事務(wù)。

除了AI搜索,落到電商、音樂(lè)、社交、游戲、旅行和教育等直接To C的領(lǐng)域中,也各有生成式AI原生應(yīng)用的創(chuàng)新機(jī)會(huì)。

以旅行為例,Wanderboat是面向消費(fèi)者的AI旅行規(guī)劃工具,也是旅游內(nèi)容分享社區(qū)。它構(gòu)建了一個(gè)chatbot,可以根據(jù)用戶需求推薦、定制目的地及各類娛樂(lè)體驗(yàn)活動(dòng),還可以主動(dòng)學(xué)習(xí)用戶的興趣,定制專屬行程?;趧?chuàng)始人此前在微軟的經(jīng)驗(yàn),構(gòu)建了一些很有趣的小工具,比如用戶在查看地圖時(shí)也可以與AI互動(dòng),實(shí)時(shí)獲取一些信息和建議。在零付費(fèi)推廣的情況下,月活用戶數(shù)量達(dá)到了6位數(shù)。

一是多模態(tài)AI營(yíng)銷,從文字延展到音頻、視頻。形式從單點(diǎn)的chatbot延展到具有操作執(zhí)行能力的agent,并且準(zhǔn)確率和對(duì)于邊緣案例的覆蓋力隨著基石模型推理能力的提升增強(qiáng)。此外,如果生成式AI運(yùn)用得當(dāng),銷售、營(yíng)銷、客服對(duì)消費(fèi)者的洞察進(jìn)一步提高,可以創(chuàng)造更加個(gè)性化的服務(wù)、定制化體驗(yàn)。

GigaML是YC孵化的一家AI客服初創(chuàng),雖然這個(gè)方向競(jìng)爭(zhēng)激勵(lì),但實(shí)際GenAI應(yīng)用的滲透率還比較低,因?yàn)榭头趯?shí)際工作中有許多邊緣案例,現(xiàn)在大部分的GenAI應(yīng)用解決邊緣案例的表現(xiàn)一般,原有的自動(dòng)化客服足以解決基礎(chǔ)問(wèn)題,所以企業(yè)升級(jí)的動(dòng)力不足。GigaML發(fā)現(xiàn)將基石模型切換至o1-preview,加上大量的評(píng)估、調(diào)優(yōu)之后,錯(cuò)誤率大幅下降,從70%降至5%,并能夠解決8成的邊緣案例。在OpenAI最新推理模型加持下,客服用例值得期待。

Para和HeyGen分別是聲音和視頻營(yíng)銷的典型案例,Para利用AI生成個(gè)性化定制的聲音營(yíng)銷電話,幫助品牌激活用戶,幫助球隊(duì)活躍粉絲;HeyGen的AI視頻營(yíng)銷收入快速增長(zhǎng),據(jù)悉今年的年化ARR超過(guò)2000萬(wàn)美元,估值已達(dá)到5億美元。

AdsGency則是一個(gè)利用AI用戶數(shù)據(jù)洞察,實(shí)現(xiàn)精準(zhǔn)廣告營(yíng)銷的公司,創(chuàng)始人此前曾在滴滴、亞馬遜從事廣告、營(yíng)銷相關(guān)的產(chǎn)品工作。它的業(yè)務(wù)核心是廣告和用戶數(shù)據(jù),為客戶提供了一個(gè)全棧AI營(yíng)銷工具,覆蓋內(nèi)容創(chuàng)意、創(chuàng)作、投放、歸因等流程。AdsGency也代表了現(xiàn)在AI營(yíng)銷的一個(gè)發(fā)展趨勢(shì)—— 從Point Solution,到整個(gè)GTM的全流程自動(dòng)化解決方案。

趨勢(shì)三:企業(yè)應(yīng)用大模型朝模塊化方向發(fā)展

2024年,人工智能領(lǐng)域的一個(gè)顯著趨勢(shì)是模型的可組合性和模塊化發(fā)展,這種模塊化實(shí)現(xiàn)了從概念到規(guī)模化地落地。企業(yè)不再僅依賴于單一的“大模型”解決方案,而是可以根據(jù)具體需求,將不同的模塊進(jìn)行組合,定制出符合自己業(yè)務(wù)需求的能力。這種靈活性不僅能夠提升效率,還能降低成本,并且更好地滿足各行業(yè)對(duì)AI應(yīng)用的多樣化需求。

在技術(shù)架構(gòu)層面,傳統(tǒng)“大一統(tǒng)”的大模型被逐步拆解為功能與場(chǎng)景模塊,例如Amazon Bedrock提供了一系列生成AI的模塊化服務(wù),涵蓋文本生成、圖像生成、語(yǔ)音合成等功能,這些模塊化的服務(wù)可以幫助企業(yè)根據(jù)自己的需求進(jìn)行定制,支持跨行業(yè)的AI應(yīng)用,如生成個(gè)性化的營(yíng)銷文案、產(chǎn)品推薦和自動(dòng)化客服對(duì)話等服務(wù)。微軟推出了更加精細(xì)化的模塊化API,支持更加多樣化的場(chǎng)景,例如多語(yǔ)言客服、智能會(huì)議助手和自動(dòng)化客戶反饋系統(tǒng)。Transformer論文八位作者之一Aidan Gomez也瞄準(zhǔn)這一方向,估值55億美元的Cohere提供專為企業(yè)用例優(yōu)化的系列AI模型,在語(yǔ)言生成、多語(yǔ)言處理、多模態(tài)、語(yǔ)義檢索等方面各有所長(zhǎng),企業(yè)按需選擇、組合。

2025年,模塊化和抽象化設(shè)計(jì)將在多個(gè)領(lǐng)域得到廣泛應(yīng)用,特別是在人工智能和機(jī)器學(xué)習(xí)領(lǐng)域。這種設(shè)計(jì)方式將推動(dòng)AI系統(tǒng)的高效演化和自適應(yīng)能力,為AI技術(shù)的廣泛應(yīng)用提供更強(qiáng)大的支持。根據(jù)Gartner預(yù)測(cè),到2028年,至少15%的日常工作決策將通過(guò)代理AI自主做出。

這種趨勢(shì)表明,模塊化和抽象化設(shè)計(jì)將為AI系統(tǒng)的自主決策提供更強(qiáng)大的支持,推動(dòng)AI技術(shù)的廣泛應(yīng)用。并且,更多的技術(shù)企業(yè)將推出專為行業(yè)需求定制的AI模塊。例如,針對(duì)智能制造、智慧醫(yī)療、自動(dòng)駕駛等領(lǐng)域的具體需求,可能會(huì)出現(xiàn)更加精細(xì)化的模塊組合,企業(yè)可根據(jù)自己的數(shù)據(jù)和業(yè)務(wù)需求靈活選擇。而且隨著硬件能力的提升,這些模塊可能會(huì)更加高效,甚至實(shí)現(xiàn)更高的跨領(lǐng)域協(xié)同能力。總之,這種模塊化大模型的發(fā)展將向縱深推進(jìn),技術(shù)、商業(yè)與社會(huì)的多重博弈將重塑行業(yè)格局。

總結(jié)

這場(chǎng)科技商業(yè)史上最大“賭局”,讓身處其中的投資者越來(lái)越感受到了曾經(jīng)硅谷早期的投資氛圍——押注一個(gè)未知的全新技術(shù)、等待一個(gè)超長(zhǎng)回報(bào)周期,而不是基于互聯(lián)網(wǎng)成熟技術(shù)的模式創(chuàng)新上迅速迭代和回血。

自從ChatGPT發(fā)布之后,硅谷正在吸引全球的目光。關(guān)注硅谷發(fā)生的故事,正在成為眾多的中國(guó)投資者甚至中國(guó)企業(yè)員工、公關(guān)必做的事,大家試圖從這些持續(xù)關(guān)注中獲得最前沿的信息和生成式AI最前線所發(fā)生的故事,從而試圖判斷新的商業(yè)方向。

誰(shuí)也不知道這場(chǎng)生成式AI的變革會(huì)將商業(yè)引向何方,也同樣預(yù)測(cè)不到新技術(shù)的迭代如此之快。

在過(guò)去的幾年里,聽到最多的便是企業(yè)對(duì)生成式AI的抱怨“我們知道它重要,但我們?nèi)匀徊恢廊绾斡迷谧约旱膱?chǎng)景中”,這種抱怨帶著一些敬畏——“不上大模型一定會(huì)被淘汰”。投資者在不斷推高的估值和融資中,快要喪失信心。動(dòng)輒幾十億美金的融資,再加上Scaling Law之下,不斷增加的數(shù)據(jù)中心的投資,讓他們望而卻步。這也表明,2025年將是生成式AI讓人們看到賺錢希望的一年,投資者和創(chuàng)業(yè)者同樣需要信心。

AI Agent元年,這個(gè)發(fā)端于學(xué)術(shù)界的概念將會(huì)落到實(shí)際,并產(chǎn)生價(jià)值,企業(yè)將會(huì)使得生成式AI變得更加好用,并切實(shí)轉(zhuǎn)化為價(jià)值。與此同時(shí),消費(fèi)級(jí)的AI應(yīng)用將會(huì)讓人們切實(shí)感受到生成式AI帶來(lái)的生活的變化。

垂直領(lǐng)域的模型正在成為通用大模型的補(bǔ)充,讓更多企業(yè)釋放AI的價(jià)值。垂直行業(yè)中,將會(huì)出現(xiàn)越來(lái)越多的AI搜索應(yīng)用,滿足人們不同領(lǐng)域的需求。

2025年,從生成式AI來(lái)說(shuō),一些泡沫會(huì)破滅,一些企業(yè)能夠從中賺到錢。技術(shù)新陳代謝快速而殘酷,這場(chǎng)競(jìng)爭(zhēng)中沒(méi)有老手,都是新人,昔日的領(lǐng)軍者亦有可能跌落神壇,最先關(guān)注到技術(shù)和商業(yè)的變化,并做出行動(dòng)的企業(yè),才能在這場(chǎng)競(jìng)爭(zhēng)中生存下來(lái)。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

我在硅谷看AI:Deepseek狂飆背后,2025年15條AI關(guān)鍵投資啟示

展望2025年,大語(yǔ)言模型將會(huì)走向何方?在這份報(bào)告中,我們將從行業(yè)變化、技術(shù)進(jìn)展和應(yīng)用趨勢(shì)三方面,對(duì)大模型的未來(lái)發(fā)展進(jìn)行深入前瞻。

圖片來(lái)源|界面圖庫(kù)

文|硅兔賽跑 王子 顧程來(lái) Evan 李海丹

編輯|李海丹

開篇

生成式AI,作為當(dāng)今最具顛覆性的技術(shù)之一,正在引領(lǐng)各行業(yè)進(jìn)入全新的發(fā)展階段。

1月14日,OpenAI推出了名為Tasks的測(cè)試版功能,標(biāo)志著ChatGPT正式邁入AI智能體(AI Agent)階段。春節(jié)期間,中國(guó)大模型DeepSeek憑借其推理模型DeepSeek-R1引起了廣泛關(guān)注,該模型以O(shè)penAI十分之一的成本達(dá)到了GPT-o1的同級(jí)別表現(xiàn)。同時(shí),DeepSeek在1月26日登頂蘋果App Store和谷歌Play Store全球下載榜首,上線18天內(nèi)下載量突破1600萬(wàn)。

緊接著,OpenAI繼續(xù)推動(dòng)創(chuàng)新,發(fā)布動(dòng)作不斷:1月24日發(fā)布了一款代號(hào)為“Operator”的全新AI Agent產(chǎn)品;隨后2月1日推出o3-mini,專注于STEM領(lǐng)域,支持函數(shù)調(diào)用、流式傳輸、結(jié)構(gòu)化輸出和搜索結(jié)合等功能;2月3日又推出面向深度研究領(lǐng)域的智能體產(chǎn)品,進(jìn)一步拓展了其在專業(yè)領(lǐng)域的應(yīng)用。谷歌也不甘示弱,在2月6日凌晨發(fā)布了性能更強(qiáng)的Gemini 2.0系列模型,包括Pro、Flash和Flash-Lite三個(gè)版本。

如今,生成式AI正迎來(lái)類似的歷史時(shí)刻,這不僅是科技革命,更是商業(yè)重塑的契機(jī),我們正站在這一變革的起點(diǎn)。每一次平臺(tái)級(jí)機(jī)會(huì)的背后,都會(huì)催生出一批市值百億、千億美金的公司。從互聯(lián)網(wǎng)到移動(dòng)互聯(lián)網(wǎng),再到云計(jì)算和區(qū)塊鏈,每一次基礎(chǔ)設(shè)施的創(chuàng)新都激發(fā)了無(wú)數(shù)新的應(yīng)用場(chǎng)景,推動(dòng)科技巨頭的崛起。

回顧這些歷史周期,我們發(fā)現(xiàn),基礎(chǔ)設(shè)施的完善往往會(huì)催生應(yīng)用公司的黃金發(fā)展期。生成式AI作為新型基礎(chǔ)設(shè)施,正處于這一發(fā)展軌道的起點(diǎn)。未來(lái),這些公司將通過(guò)創(chuàng)新的商業(yè)模式和智能化產(chǎn)品,重新定義我們的工作和生活方式,迎來(lái)屬于自己的千億市值時(shí)代。展望2025年,大語(yǔ)言模型將會(huì)走向何方?在這份報(bào)告中,我們將從行業(yè)變化、技術(shù)進(jìn)展和應(yīng)用趨勢(shì)三方面,對(duì)大模型的未來(lái)發(fā)展進(jìn)行深入前瞻。

AI瘋狂吸金,千億獨(dú)角獸冉冉升起

2024年,最為人們印象深刻的,便是生成式AI公司——OpenAI高達(dá)65億美元的融資。這筆融資讓這位生成式AI的弄潮兒估值達(dá)到約1500億美元——一只大型千億獨(dú)角獸正在硅谷茁壯成長(zhǎng),而這只是2024年中最具代表性的一個(gè)。生成式AI所創(chuàng)造出的“造富神話”,多次讓人們情緒高漲,AI就像一個(gè)龐大的“吸金獸”,以颶風(fēng)般的速度吸走了大部分的風(fēng)投資金。

涌入AI賽道的大量資金和頂尖創(chuàng)業(yè)者,正在催生出了一批新晉獨(dú)角獸公司。根據(jù)硅兔君復(fù)盤,在過(guò)去18個(gè)月新增的73家獨(dú)角獸中,有28家是AI公司,占到了新增獨(dú)角獸的大約三分之一。例如特斯拉創(chuàng)始人埃隆·馬斯克在2023年7月創(chuàng)立的xAI,2024年3月發(fā)布了首款A(yù)I聊天機(jī)器人Grok-1,隨后發(fā)布了Grok-1.5V大模型,其在最新一輪融資中,估值達(dá)到240億美元;Xaira Therapeutics,作為AI+生物技術(shù)領(lǐng)域的公司,其聯(lián)合創(chuàng)始人David Baker在“AI+蛋白質(zhì)”領(lǐng)域頗有造詣,其團(tuán)隊(duì)研發(fā)出AI大模型RFdiffusion,用擴(kuò)散模型構(gòu)建的創(chuàng)新型生成式AI系統(tǒng),并且可以按需構(gòu)建AI分子,估值為27億美元;Cognition AI是一家由三位華人創(chuàng)業(yè)者創(chuàng)立的公司,2024年3月,其推出了世界上第一位完全自主的AI軟件工程師,在最新一輪融資后估值達(dá)到20億美元。

制圖:硅兔賽跑,數(shù)據(jù)來(lái)源pitchbook

制圖:硅兔賽跑,數(shù)據(jù)來(lái)源pitchbook

這些AI獨(dú)角獸的成長(zhǎng)速度遠(yuǎn)快于非AI獨(dú)角獸,前25%的AI公司在不到2.5年內(nèi)就已經(jīng)達(dá)到獨(dú)角獸估值。同時(shí),最大規(guī)模的交易也流向了AI的初創(chuàng)企業(yè)。

另一個(gè)趨勢(shì)是——融資額正在變大,頭部效應(yīng)更加明顯。根據(jù)第三方數(shù)據(jù)分析機(jī)構(gòu)Pitchbook的數(shù)據(jù),2024年,光是北美的風(fēng)險(xiǎn)投資總金額達(dá)到了2164億美金,較2023年增長(zhǎng)了28%。其中2024年四季度,北美地區(qū)的融資額達(dá)到了771億美金,創(chuàng)下了2年以來(lái)的新高,光是人工智能相關(guān)項(xiàng)目的投融資額達(dá)到了991億美金,占到了總額的45.8%,達(dá)到了歷史最高水平。過(guò)去美國(guó)最大的10筆風(fēng)險(xiǎn)投資交易每年通常占總?cè)谫Y額的9%左右,而自2023年以來(lái),這一比例升至20%。

過(guò)去一年,我們?cè)诠韫?,這個(gè)北美將近50%投融資發(fā)生的地區(qū)以及最能夠代表北美創(chuàng)投發(fā)展的地方,捕捉到最新的一些變化并試圖梳理出最前沿的趨勢(shì):

首先,針對(duì)人工智能創(chuàng)投領(lǐng)域,有四大行業(yè)趨勢(shì)值得關(guān)注:

1、如果說(shuō)2023年的AI Agent,只是停留在諸如斯坦福小鎮(zhèn)這樣的虛擬世界;2024年,AI Agent的商業(yè)化條件逐漸成熟;2025年則是Agent AI商業(yè)化的元年,資本的關(guān)注和注入加速,會(huì)加劇各大科技公司和初創(chuàng)企業(yè)在Agent AI 領(lǐng)域的競(jìng)爭(zhēng),推動(dòng)技術(shù)創(chuàng)新和產(chǎn)業(yè)應(yīng)用的落地。

2、一方面圍繞生成式AI基礎(chǔ)設(shè)施的投資規(guī)??涨埃瑤?dòng)了一系列產(chǎn)業(yè)鏈公司;另一方面,業(yè)界正在嘗試一些低成本、性價(jià)比高的做法,減少訓(xùn)練的投入?yún)s能達(dá)到與GPT-4/4o等同的效果;

3、專有AI模型正在釋放AI潛力,他們正在解決通用大模型不能解決的問(wèn)題,逐步具備較高的商業(yè)化潛力。

4、生成式界面將迎重大發(fā)展,用戶能夠有更好的互動(dòng)體驗(yàn),將帶來(lái)新的商業(yè)模式和市場(chǎng)機(jī)會(huì)。

其次,在人工智能的技術(shù)方面,我們總結(jié)了八大趨勢(shì):

1、2025年,大模型將更加關(guān)注多模態(tài)的融合與交互,其訓(xùn)練方法正在不斷優(yōu)化;

2、一直以來(lái),盡管大模型能力在不斷增強(qiáng),但仍無(wú)法解決人工智能的“黑箱”問(wèn)題。2024年,許多公司陸續(xù)推出了更透明的模型架構(gòu)和解釋工具以緩解“黑箱”帶來(lái)的麻煩。2025年,可解釋性工具將進(jìn)一步普及;

3、2024年,大模型的長(zhǎng)期記憶能力迎來(lái)了一系列技術(shù)突破。2025年,隨著多模態(tài)技術(shù)的進(jìn)步,跨模態(tài)記憶融合將在視頻、文本、觸覺(jué)和嗅覺(jué)數(shù)據(jù)的編碼上取得突破,進(jìn)一步提升模型的記憶能力。

4、合成數(shù)據(jù)作為加速大模型訓(xùn)練的方法,將在2025年進(jìn)一步發(fā)揮潛能。

5、2025年,隨著更強(qiáng)大的計(jì)算資源的普及和優(yōu)化,規(guī)模定律將繼續(xù)提升,這使得更多的中小型企業(yè)可以進(jìn)入AI領(lǐng)域,加速了大模型的普及,效率躍遷曲線下,大模型的成本更低了。

6、2025年,強(qiáng)化學(xué)習(xí)(RL)與大語(yǔ)言模型的結(jié)合有望進(jìn)一步提升模型的泛化能力,并使得從預(yù)訓(xùn)練到后訓(xùn)練和推理遷移的轉(zhuǎn)變成為可能。

7、隨著AI應(yīng)用場(chǎng)景的多樣化,簡(jiǎn)化算法架構(gòu)將成為AI發(fā)展的重要方向。2025年,更多優(yōu)化算法將被用于強(qiáng)化學(xué)習(xí)等領(lǐng)域,以減少計(jì)算資源的消耗。

8、隨著AI蒸餾技術(shù)的普及,相關(guān)的法律和監(jiān)管框架也需要不斷加強(qiáng),以確保在模型開發(fā)和應(yīng)用過(guò)程中不會(huì)侵犯知識(shí)產(chǎn)權(quán)或數(shù)據(jù)隱私。

另外,在人工智能的應(yīng)用方面,2025年也有了一些新的變化:

1、2025年,企業(yè)級(jí)AI應(yīng)用迎來(lái)深入發(fā)展,越來(lái)越多企業(yè)將從人工智能中獲利。AI Agent成為行業(yè)顛覆性力量,生成式AI推動(dòng)傳統(tǒng)行業(yè)進(jìn)入智能化時(shí)代。隨著企業(yè)在生成式AI上盈利,商業(yè)模式轉(zhuǎn)變?yōu)榘垂ぷ鞒晒召M(fèi),取代傳統(tǒng)的SaaS席位收費(fèi)。

2、2025年對(duì)于AI應(yīng)用來(lái)說(shuō),下一個(gè)重大事件將屬于消費(fèi)。我們期待一個(gè)“殺手級(jí)”AI消費(fèi)應(yīng)用的誕生。

3、在AI應(yīng)用端,企業(yè)不再依賴單一模型,而是會(huì)根據(jù)不同的應(yīng)用需求和場(chǎng)景,將不同模型模塊進(jìn)行組合,定制出符合自己業(yè)務(wù)需求的模型。

趨勢(shì)一 :2025年,AI Agent元年拉開序幕

人工智能未來(lái)學(xué)家雷·庫(kù)茲韋爾 (Ray Kurzweil)表示,2025年,我們將開始看到從聊天機(jī)器人和圖像生成器向“代理”系統(tǒng)的轉(zhuǎn)變,這些系統(tǒng)可以自主完成任務(wù),而不僅僅是回答問(wèn)題。人工智能系統(tǒng)正在從單一的交互模式,走向?qū)iT且相互關(guān)聯(lián)的代理。

AI Agent,也稱為人工智能代理,通常是指能夠感知環(huán)境、進(jìn)行自主理解、決策和執(zhí)行動(dòng)作的智能體。根據(jù)咨詢公司來(lái)覓PEVC的統(tǒng)計(jì),自2024年以來(lái),全球AI Agent賽道的融資金額已突破665億元人民幣。從整體來(lái)看,這些資金主要流向了在技術(shù)與市場(chǎng)潛力方面處于領(lǐng)先地位的頭部企業(yè)。

科技巨頭紛紛布局AI Agent,以搶占未來(lái)智能交互的制高點(diǎn)。2024年,OpenAI憑借其強(qiáng)大的技術(shù)實(shí)力和廣泛的市場(chǎng)應(yīng)用,官宣65億美元新融資,成為萬(wàn)億獨(dú)角獸,也成為全球AI Agent領(lǐng)域的主要資金流之一。埃隆·馬斯克創(chuàng)立的xAI,希望將AI Agent與人類深度整合,創(chuàng)建全球首個(gè)AI Agent與人類共存的社交平臺(tái),xAI在2024年12月完成60億美元融資,估值達(dá)到了近500億美元。谷歌也全力推廣商用AI Agent,發(fā)布了全球?yàn)閿?shù)不多的商用AI Agent市場(chǎng),為企業(yè)提供一站式開發(fā)、部署和應(yīng)用生態(tài)。微軟在2024年11月的Ignite大會(huì)上宣布已建立全球規(guī)模最大的企業(yè)級(jí)AI Agent生態(tài)系統(tǒng),企業(yè)用戶可通過(guò)Azure AI目錄訪問(wèn)超過(guò)1800個(gè)AI模型。此外,微軟的Copilot Studio平臺(tái)已支持用戶創(chuàng)建自主Agent,并正式進(jìn)入預(yù)覽階段。蘋果也在開發(fā)者大會(huì)上展示了其最新的AI成果Apple Intelligence。

2025年,OpenAI推出的智能體功能(AI Agent)以及一系列基于生成式AI的智能系統(tǒng),它們開始具備真正的自主學(xué)習(xí)和推理能力,從單一任務(wù)的執(zhí)行者,轉(zhuǎn)變?yōu)槟軌蜻M(jìn)行多任務(wù)處理、復(fù)雜決策和交互的智能體——1月24日,OpenAI發(fā)布了一款代號(hào)為“Operator”的全新AI Agent產(chǎn)品,與其他各家Agent相比,它會(huì)通過(guò)自有的CUA(電腦控制Agent)系統(tǒng)進(jìn)行復(fù)雜的思維鏈反思和步驟規(guī)劃,這可以大大提高其完成任務(wù)的精度和復(fù)雜性。Operator的創(chuàng)新之處在于其成功實(shí)現(xiàn)了從認(rèn)知到執(zhí)行的完整閉環(huán)。這一能力的拓展不僅是技術(shù)上的突破,更是AI技術(shù)邁向更高層次發(fā)展的關(guān)鍵一步。

AI Agent不再是單一的輔助工具,而是可以獨(dú)立進(jìn)行深度學(xué)習(xí)、理解和推理的智能系統(tǒng),賦能企業(yè)和個(gè)人高效完成復(fù)雜任務(wù),推動(dòng)生產(chǎn)力的大幅提升。2025年,AI智能體的全面普及將不僅改變技術(shù)產(chǎn)業(yè)的格局,還將在各個(gè)領(lǐng)域深刻影響人類的生活方式,從而使這一年成為AI Agent真正嶄露頭角的元年。

趨勢(shì)二:基礎(chǔ)設(shè)施軍備競(jìng)賽:投資空前,低成本做法漸成趨勢(shì)

一年多以前,基礎(chǔ)大模型制造商OpenAI,在芯片制造商英偉達(dá)生產(chǎn)的25000個(gè)最新進(jìn)GPU集群上訓(xùn)練了GPT-4。隨后,馬斯克表示他在一個(gè)數(shù)據(jù)中心有100000個(gè)GPU,并計(jì)劃購(gòu)買200000個(gè)。

頭部公司通過(guò)大規(guī)模資金投入,搶占人工智能基礎(chǔ)設(shè)施的制高點(diǎn),而以英偉達(dá)為代表的硬件廠商也在以前所未有的速度上不斷突破技術(shù)極限。例如,英偉達(dá)的頂級(jí)芯片性能相當(dāng)于300部高端iPhone的處理能力。

在這場(chǎng)基礎(chǔ)設(shè)施競(jìng)爭(zhēng)中,埃隆·馬斯克的X平臺(tái)部分業(yè)務(wù)——xAI的“Colossus”訓(xùn)練集群,成為世界上最強(qiáng)大的人工智能訓(xùn)練集群之一。這個(gè)集群僅用122天便建成,預(yù)算高達(dá)30億至40億美元,成為人工智能基礎(chǔ)設(shè)施建設(shè)的里程碑。目前,xAI計(jì)劃將集群容量翻倍,進(jìn)一步增強(qiáng)處理能力。Meta也在大規(guī)模投資硬件,近期公布了其24000個(gè)GPU數(shù)據(jù)中心規(guī)模集群的兩個(gè)版本,旨在支持其下一代人工智能模型。

雖然目前GPU集群比傳統(tǒng)數(shù)據(jù)中心小,但對(duì)人工智能計(jì)算不斷增長(zhǎng)的需求將需要大規(guī)模的基礎(chǔ)設(shè)施擴(kuò)展。包括Meta、亞馬遜、Alphabet和微軟在內(nèi)的主要科技公司正在推動(dòng)對(duì)人工智能基礎(chǔ)設(shè)施的空前投資。超大規(guī)模數(shù)據(jù)中心運(yùn)營(yíng)商預(yù)計(jì)2024年資本支出(CapEx)將超過(guò) 2000 億美元,到2025年這一數(shù)字預(yù)計(jì)將接近2500億美元。盡管并非所有支出都直接與人工智能相關(guān),但很大一部分都分配給了人工智能,并且這個(gè)份額在不斷增加。微軟和OpenAI已討論推出一個(gè)專門用于人工智能工作負(fù)載的5千兆瓦數(shù)據(jù)中心,可能耗資超過(guò)1000億美元,甚至可以買得下一艘最新型核動(dòng)力航空母艦。

在這場(chǎng)人工智能基礎(chǔ)建設(shè)中受益的,是這個(gè)產(chǎn)業(yè)鏈中的組成部分。

第一類就是數(shù)據(jù)中心的托管服務(wù)提供商——也就是向大公司提供數(shù)據(jù)中心租賃容量的公司,他們是數(shù)據(jù)中心市場(chǎng)的重要組成部分。這批數(shù)據(jù)中心的托管服務(wù)提供商如今也在拓展其以人工智能為重點(diǎn)的基礎(chǔ)設(shè)施服務(wù)。例如,超大規(guī)模托管領(lǐng)域的領(lǐng)導(dǎo)者 Equinix 已獲得近 150 億美元的資金用于在美國(guó)建設(shè)人工智能數(shù)據(jù)中心,主要為客戶提供基礎(chǔ)設(shè)施,以訓(xùn)練和部署大規(guī)模私有人工智能模型,這些客戶往往是科技行業(yè)以外的財(cái)富 500 強(qiáng)公司。

另一類受益者則是人工智能數(shù)據(jù)中心建設(shè)中的輔助產(chǎn)品,例如低功耗CPU、內(nèi)存、存儲(chǔ)系統(tǒng)、網(wǎng)絡(luò)組件以及冷卻和電源管理設(shè)備。冷卻產(chǎn)品供應(yīng)商 Vertiv在2024年7月至9月的三個(gè)月內(nèi)實(shí)現(xiàn)了19%的同比收入增長(zhǎng),并提高了未來(lái)12個(gè)月的業(yè)績(jī)指引。

第三類則是圍繞數(shù)據(jù)中心能源生產(chǎn)、熱管理和電源管理解決方案的公司。Alphabet董事長(zhǎng)在2023年2月表示,與LLM互動(dòng)可能比標(biāo)準(zhǔn)關(guān)鍵字搜索的花費(fèi)高出10倍。另外,根據(jù)谷歌研究員Urs H lzle的文章提及,標(biāo)準(zhǔn)Google搜索使用的電力為0.3Wh,這意味著每次LLM互動(dòng)的耗電量約為3Wh。這個(gè)數(shù)字與SemiAnalysis在2023年初對(duì)ChatGPT運(yùn)營(yíng)成本的評(píng)估一致,該評(píng)估估計(jì)ChatGPT每次請(qǐng)求耗電量為2.9Wh,如果每天響應(yīng)1.95億個(gè)請(qǐng)求,估計(jì)平均每天耗電量為564MWh。

《紐約客》報(bào)道稱,ChatGPT每天用電量相當(dāng)于1.7萬(wàn)個(gè)美國(guó)家庭的用電量。如果基于當(dāng)前模型和技術(shù),讓每個(gè)標(biāo)準(zhǔn)Google搜索都變成 LLM 交互,對(duì) Google總用電量的潛在影響巨大。第三方分析機(jī)構(gòu)SemiAnalysis估計(jì),帶有大模型交互功能的谷歌搜索單次請(qǐng)求的用電量達(dá)到將近9Wh,谷歌每天搜索大約需要90億次,則需要81000MWh。

這一趨勢(shì)促使人們對(duì)位于數(shù)據(jù)中心設(shè)施附近的核能和能源生產(chǎn)等技術(shù)以及熱管理和電源管理解決方案進(jìn)行投資。

不過(guò),如今科學(xué)家和業(yè)界正在尋找更聰明并且資源密集度更低的方法來(lái)解決訓(xùn)練人工智能模型所需要的算力和能源問(wèn)題。例如通過(guò)蒸餾技術(shù),這項(xiàng)技術(shù)的踐行者——DeepSeek,這家國(guó)產(chǎn)大模型也給美國(guó)硅谷提供了更多低成本的訓(xùn)練參考。DeepSeek大模型性能在多個(gè)方面比肩OpenAI,其中DeepSeek V3,整個(gè)訓(xùn)練過(guò)程僅用了約2000張二流芯片進(jìn)行訓(xùn)練,官方稱成本僅占用約550萬(wàn)美元,而Meta的模型則使用了16000個(gè)性能最強(qiáng)的一流芯片。并且,DeepSeek-R1通過(guò)重新設(shè)計(jì)訓(xùn)練流程、以“少量SFT數(shù)據(jù)+多輪強(qiáng)化學(xué)習(xí)”的辦法,在提高了模型準(zhǔn)確性的同時(shí),也顯著降低內(nèi)存占用和計(jì)算開銷,每百萬(wàn)輸出tokens16元,大約是OpenAI o1運(yùn)行成本的三十分之一。

在這樣的競(jìng)爭(zhēng)壓力下,0penAI推出了其成本更低的o3-mini,比o1-mini便宜63%,比完整的o1模型便宜93%,每百萬(wàn)tokens的進(jìn)出費(fèi)用分別為1.10美元/4.40美元(享有50%的緩存折扣)。谷歌發(fā)布的Gemini 2.0 Flash-Lite是Gemini 2.0系列的新變體,每百萬(wàn)tokens0.3美元,是谷歌目前最便宜的模型。

可以窺見,在AI產(chǎn)業(yè)的競(jìng)爭(zhēng)中,降低訓(xùn)練成本、提高計(jì)算效率和優(yōu)化模型性能已成為企業(yè)的主要競(jìng)爭(zhēng)策略。尤其是訓(xùn)練流程的優(yōu)化,成為了公司在大模型市場(chǎng)中占據(jù)競(jìng)爭(zhēng)優(yōu)勢(shì)的關(guān)鍵能力之一。2025年,低成本做法也將成為行業(yè)的主流趨勢(shì)。

此外,一些大公司也在開發(fā)專用人工智能芯片,例如谷歌、蘋果、微軟和OpenAI,這些專業(yè)芯片可以比英偉達(dá)這樣通用處理器運(yùn)行更高效;或是采用一些方法提高芯片的使用效率,例如用多種模型,每種模型針對(duì)不同問(wèn)題,以此來(lái)縮短芯片的處理時(shí)間等。AI推理芯片制造商Groq2024年估值達(dá)到28億美元,在Blackrock領(lǐng)投的新一輪中融資6.4億美元,其專為AI推理任務(wù)設(shè)計(jì)的芯片“語(yǔ)言計(jì)算單元”(LPU, language processing unit)能以現(xiàn)有解決方案1/10的價(jià)格、10倍的速度運(yùn)行與ChatGPT、GPT-4o相似的模型。目前,在Groq開發(fā)的、對(duì)標(biāo)英偉達(dá)CUDA的軟件開發(fā)平臺(tái)GroqCloud平臺(tái)上,約有40萬(wàn)開發(fā)者。

趨勢(shì)三:專有模型有望釋放AI的應(yīng)用潛力

大模型就像個(gè)通才,然而,在一些專業(yè)領(lǐng)域,大模型往往缺乏針對(duì)性和操作性。為了突破這一瓶頸,越來(lái)越多的公司開始專注于開發(fā)專有模型,通過(guò)在特定領(lǐng)域數(shù)據(jù)上微調(diào)模型,實(shí)現(xiàn)更高效的工作流程自動(dòng)化,提供更具操作性和任務(wù)導(dǎo)向的工具。這一趨勢(shì)正在逐步升溫,并在多個(gè)行業(yè)展現(xiàn)出巨大的應(yīng)用潛力。以下為一些具體的案例:

金融服務(wù)領(lǐng)域,提升決策效率與洞察力:摩根大通和彭博社等機(jī)構(gòu)正在利用其龐大的內(nèi)部數(shù)據(jù)集開發(fā)大語(yǔ)言模型,以提升運(yùn)營(yíng)效率和決策能力。這些模型能夠提供獨(dú)特的市場(chǎng)洞察、風(fēng)險(xiǎn)分析和報(bào)告生成。例如,彭博社于2023年開發(fā)了BloombergGPT,專注于金融領(lǐng)域的數(shù)據(jù)分析和預(yù)測(cè),通過(guò)微調(diào)金融數(shù)據(jù),能夠更高效地處理復(fù)雜的金融任務(wù),如市場(chǎng)趨勢(shì)分析和投資策略制定。

網(wǎng)絡(luò)安全領(lǐng)域,精準(zhǔn)檢測(cè)與應(yīng)對(duì)威脅:美國(guó)網(wǎng)絡(luò)安全解決方案提供商Palo Alto Networks正在訓(xùn)練自有的大語(yǔ)言模型,這些模型能夠幫助安全專家更好地檢測(cè)和應(yīng)對(duì)網(wǎng)絡(luò)威脅。該公司在2024財(cái)年四季度披露了超過(guò)2億美元的AI相關(guān)經(jīng)常性收入,同比增幅近四倍。AI大模型通過(guò)模擬復(fù)雜攻擊場(chǎng)景,幫助安全團(tuán)隊(duì)快速發(fā)現(xiàn)系統(tǒng)漏洞并提供修復(fù)建議,顯著提升了網(wǎng)絡(luò)安全的實(shí)時(shí)預(yù)警和用戶行為分析能力。

國(guó)防領(lǐng)域,用于軍事與情報(bào)分析:美國(guó)數(shù)據(jù)分析和軟件公司Palantir近期獲得了一系列合同,用于支持AI的服務(wù),包括加速部署適用于國(guó)防和軍事領(lǐng)域的AI模型。這些模型能夠提升情報(bào)分析、目標(biāo)識(shí)別和決策支持能力。例如,AI訓(xùn)練平臺(tái)可以創(chuàng)建逼真的戰(zhàn)斗場(chǎng)景,幫助士兵在安全環(huán)境下進(jìn)行戰(zhàn)術(shù)訓(xùn)練。此外,AI技術(shù)在軍事領(lǐng)域的應(yīng)用還包括無(wú)人化作戰(zhàn)系統(tǒng)和沉浸式訓(xùn)練模擬。

生命科學(xué)領(lǐng)域:2024年,科研人員使用AI的比例快速增加,AI對(duì)科學(xué)研究方法和流程的變革效應(yīng)也開始顯現(xiàn)。比如,AlphaFold 3.0在2024年發(fā)布,不僅提高了蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的準(zhǔn)確率,還擴(kuò)展到了DNA和RNA等生物分子的研究,這項(xiàng)技術(shù)幫助科學(xué)家快速預(yù)測(cè)藥物分子與目標(biāo)蛋白質(zhì)的結(jié)合情況,大大提高了藥物研發(fā)的效率。2025年,多模態(tài)大模型將進(jìn)一步融入科學(xué)研究,賦能多維數(shù)據(jù)的復(fù)雜結(jié)構(gòu)挖掘,輔助科研問(wèn)題的綜合理解與全局分析,為生物醫(yī)學(xué)、氣象、材料發(fā)現(xiàn)、生命模擬、能源等基礎(chǔ)與應(yīng)用科學(xué)的研究開辟新方向。

除了上述領(lǐng)域,專有模型還在其他行業(yè)展現(xiàn)出廣泛的應(yīng)用前景。例如,Two Sigma在量化投資中使用AI Agent進(jìn)行選股策略,通過(guò)分析財(cái)務(wù)數(shù)據(jù)和宏觀經(jīng)濟(jì)指標(biāo),識(shí)別潛在的投資機(jī)會(huì)。Shopify Sidekick則利用LLama 2生成產(chǎn)品描述、回應(yīng)客戶查詢和創(chuàng)建營(yíng)銷內(nèi)容,幫助小企業(yè)主提升運(yùn)營(yíng)效率。

專有模型通過(guò)在特定領(lǐng)域的數(shù)據(jù)上進(jìn)行微調(diào),能夠提供更具針對(duì)性和操作性的解決方案。這種趨勢(shì)不僅提升了各行業(yè)的自動(dòng)化水平,還為企業(yè)帶來(lái)了顯著的運(yùn)營(yíng)效率提升和成本降低。隨著AI技術(shù)的不斷發(fā)展,未來(lái)專有模型將在更多領(lǐng)域得到廣泛應(yīng)用,成為推動(dòng)行業(yè)創(chuàng)新的重要力量。

趨勢(shì)四:推動(dòng)動(dòng)態(tài)自適應(yīng)界面,實(shí)現(xiàn)高度個(gè)性化的交互體驗(yàn)

生成式界面(Generative Interface)是指利用生成式模型,如生成對(duì)抗網(wǎng)絡(luò)(GANs)或變分自編碼器(VAEs),自動(dòng)創(chuàng)建用戶界面元素或交互流程。這種界面不是通過(guò)傳統(tǒng)設(shè)計(jì)方法人工制作,而是通過(guò)機(jī)器學(xué)習(xí)算法根據(jù)輸入的數(shù)據(jù)、需求或上下文生成。

在2024年,生成式用戶界面(Generative UI)在動(dòng)態(tài)和自適應(yīng)界面、AI與算法融合、個(gè)性化體驗(yàn)等方面取得了顯著進(jìn)展。大規(guī)模生成式預(yù)訓(xùn)練模型(如GPT系列、DALL·E等)已被廣泛應(yīng)用于自動(dòng)化界面設(shè)計(jì)。開發(fā)者借助這些模型,可以快速生成和調(diào)整界面元素,如按鈕、布局、色彩搭配等,甚至可以根據(jù)用戶反饋實(shí)時(shí)調(diào)整界面的外觀和功能。

此外,生成式界面逐步在增強(qiáng)現(xiàn)實(shí)(AR)和虛擬現(xiàn)實(shí)(VR)環(huán)境中得到應(yīng)用,尤其是在需要復(fù)雜交互的沉浸式體驗(yàn)中,AI幫助生成自適應(yīng)、動(dòng)態(tài)變化的虛擬界面。例如,英偉達(dá)在2024年SIGGRAPH大會(huì)上展示了利用實(shí)時(shí)生成式AI創(chuàng)建沉浸式沙漠世界的研究成果。此外,英偉達(dá)還通過(guò)Holoscan技術(shù)賦能手術(shù)機(jī)器人,加速AI技術(shù)在醫(yī)療實(shí)踐中的應(yīng)用。這些應(yīng)用展示了生成式AI在動(dòng)態(tài)生成虛擬界面方面的潛力,尤其是在需要高度沉浸感的場(chǎng)景中。

可以說(shuō),隨著用戶需求變得更加多樣化和復(fù)雜,傳統(tǒng)的固定界面無(wú)法滿足個(gè)性化的交互需求。動(dòng)態(tài)自適應(yīng)界面能夠根據(jù)用戶的行為、偏好和環(huán)境變化實(shí)時(shí)調(diào)整顯示內(nèi)容和功能,提供更加定制化的體驗(yàn)。

展望2025年,生成式界面將迎來(lái)重大發(fā)展,成為推動(dòng)用戶體驗(yàn)變革的關(guān)鍵力量。越來(lái)越多的應(yīng)用將采用基于用戶交互和邏輯工作流程自適應(yīng)的動(dòng)態(tài)用戶界面。生成式UI將使應(yīng)用能夠自動(dòng)生成表單、儀表板或可視化等界面元素,這些元素將根據(jù)用戶的具體需求和操作量身定制。例如,Web開發(fā)平臺(tái)Vercel和Bolt.new等公司正在開發(fā)能夠創(chuàng)建高度適應(yīng)性和個(gè)性化用戶體驗(yàn)的平臺(tái),提供實(shí)時(shí)演進(jìn)的界面,以滿足不斷變化的需求,從而簡(jiǎn)化工作流程。

03 八大技術(shù)趨勢(shì),推動(dòng)AI泛化能力

趨勢(shì)一:多模態(tài)能力的增強(qiáng)和集成

2024年,多模態(tài)AI取得了顯著進(jìn)展。OpenAI、Google DeepMind等機(jī)構(gòu)推出了更強(qiáng)大的多模態(tài)模型,如視頻生成模型Sora的誕生、OpenAI多模態(tài)AI大模型GPT-4o的到來(lái)、CLIP模型通過(guò)跨模態(tài)表示實(shí)現(xiàn)圖文搜索,用戶可以通過(guò)輸入文本搜索相關(guān)圖像或視頻。此外,文本到圖像生成(如DALL·E、Stable Diffusion)和視頻生成模型也取得了顯著進(jìn)展,進(jìn)一步拓展了AI的交互體驗(yàn)。

大模型逐步增加了能夠處理圖像、音頻或視頻等多種輸入形式。這些模型不僅提升了AI對(duì)復(fù)雜信息的處理能力,還拓展了其應(yīng)用領(lǐng)域。在谷歌云發(fā)布的《2025年AI商業(yè)趨勢(shì)》報(bào)告中,多模態(tài)AI被放在首位。谷歌云預(yù)測(cè),2025年將成為企業(yè)采用AI技術(shù)的關(guān)鍵一年,這一趨勢(shì)主要由多模態(tài)學(xué)習(xí)及其實(shí)現(xiàn)的情境感知所驅(qū)動(dòng)的,并預(yù)計(jì)2025年全球多模態(tài)AI市場(chǎng)規(guī)模將達(dá)到24億美元。

2025年,大模型將更加關(guān)注多模態(tài)融合與交互。AI不僅能夠生成文本,還能理解圖像、視頻中的上下文,甚至在多模態(tài)環(huán)境中進(jìn)行決策。比如,結(jié)合視覺(jué)與語(yǔ)音的能力,模型能夠更好地理解復(fù)雜的場(chǎng)景,并做出合適的反應(yīng)。

此外,多模態(tài)模型的訓(xùn)練方法也在不斷優(yōu)化,例如采用分階段訓(xùn)練策略,先固定大語(yǔ)言模型的權(quán)重參數(shù),對(duì)圖像編碼器和橋接組件進(jìn)行初步訓(xùn)練,再進(jìn)行整體訓(xùn)練,從而提升模型性能。

趨勢(shì)二:大模型的可解釋性表現(xiàn)更強(qiáng)

可解釋人工智能 (xAI) 是人工智能領(lǐng)域的一個(gè)新興領(lǐng)域,致力于使人工智能系統(tǒng)對(duì)人類更加透明、可解釋和可理解。xAI的興起源于人們對(duì)人工智能決策過(guò)程透明度和問(wèn)責(zé)制的需求日益增長(zhǎng),尤其是隨著人工智能系統(tǒng)變得越來(lái)越復(fù)雜并部署在金融、法律或醫(yī)療保健等高風(fēng)險(xiǎn)領(lǐng)域。例如,考慮醫(yī)院用于篩查患者X光片的腫瘤檢測(cè) CNN(卷積神經(jīng)網(wǎng)絡(luò)) 模型的情況。但是,當(dāng)技術(shù)人員或患者不知道其工作原理時(shí),他們?nèi)绾文芟嘈牌浣Y(jié)果?這正是我們需要方法來(lái)了解影響任何深度學(xué)習(xí)模型決策的因素的原因。

另外,AI的安全性問(wèn)題是一個(gè)不可忽視的關(guān)鍵挑戰(zhàn)。尤其是大模型在做出決策時(shí)的“思考過(guò)程”對(duì)于用戶和開發(fā)者來(lái)說(shuō)變得不透明,就像一個(gè)“黑箱”,其決策過(guò)程難以解釋和追蹤。若這些模型未經(jīng)過(guò)嚴(yán)格的審查和驗(yàn)證,它們可能會(huì)做出無(wú)法被察覺(jué)的有害決策,甚至加劇社會(huì)偏見和不公。因此,加強(qiáng)對(duì)大模型的監(jiān)控、審查和可解釋性要求是提升AI系統(tǒng)安全性的重要一步。

2024年,大模型的可解釋性取得了重要進(jìn)展。OpenAI、Google DeepMind等機(jī)構(gòu)推出了更透明的模型架構(gòu)和解釋工具,如GPT-4的可解釋性增強(qiáng)版本和Gemini的跨模態(tài)解釋功能。LIME、SHAP等后驗(yàn)解釋方法被廣泛應(yīng)用于醫(yī)療、金融等領(lǐng)域,幫助用戶理解模型決策依據(jù)。同時(shí),自監(jiān)督學(xué)習(xí)和符號(hào)AI的結(jié)合提升了模型的內(nèi)在可解釋性,減少了“黑箱”問(wèn)題。行業(yè)也開始重視可解釋性的標(biāo)準(zhǔn)化,例如歐盟《人工智能法案》要求高風(fēng)險(xiǎn)AI系統(tǒng)提供清晰的決策解釋。

2025年,可解釋性工具將進(jìn)一步普及,將模型將內(nèi)置更強(qiáng)大的解釋能力,實(shí)時(shí)生成決策依據(jù),并支持多模態(tài)數(shù)據(jù)的跨模態(tài)解釋,幫助用戶理解復(fù)雜AI模型的決策過(guò)程。通過(guò)一些自主進(jìn)化模式或可解釋性工具,將模型將內(nèi)置更強(qiáng)大的解釋能力,實(shí)時(shí)生成決策依據(jù),并支持多模態(tài)數(shù)據(jù)的跨模態(tài)解釋??山忉屝耘c性能的平衡將得到優(yōu)化,知識(shí)蒸餾和模型壓縮技術(shù)將幫助簡(jiǎn)化復(fù)雜模型的同時(shí)保持高精度。行業(yè)專用可解釋性工具將普及,滿足醫(yī)療、金融等領(lǐng)域的合規(guī)需求。

以DeepSeek為例,通過(guò)純算法自主進(jìn)化的Zero模式與僅需數(shù)千條人工標(biāo)注數(shù)據(jù)的R1模式組合,既保留模型自主進(jìn)化能力又保障人類可解釋性————Zero模式使得模型能夠自我進(jìn)化和發(fā)現(xiàn)數(shù)據(jù)中的規(guī)律,而R1模式通過(guò)引入人工標(biāo)注數(shù)據(jù)為模型提供了一個(gè)監(jiān)督和解釋的框架。這種結(jié)合確保了模型在保持自主學(xué)習(xí)能力的同時(shí),也能夠被人類理解和控制,從而提升了可解釋性。

此外,倫理和隱私保護(hù)將深度融入可解釋性設(shè)計(jì),確保AI系統(tǒng)既透明又安全,推動(dòng)大模型在高風(fēng)險(xiǎn)場(chǎng)景中的廣泛應(yīng)用。以下是一些提升的方向和工具:

○ 自監(jiān)督學(xué)習(xí)與模型可解釋性:通過(guò)自監(jiān)督學(xué)習(xí),AI系統(tǒng)可以在缺乏大量標(biāo)注數(shù)據(jù)的情況下,通過(guò)理解數(shù)據(jù)的內(nèi)在結(jié)構(gòu)來(lái)進(jìn)行學(xué)習(xí),這種方法有助于提升模型的透明度,使得我們能夠更好地理解其學(xué)習(xí)過(guò)程。

○ 生成對(duì)抗網(wǎng)絡(luò)(GANs)和模型蒸餾:通過(guò)生成對(duì)抗網(wǎng)絡(luò)和蒸餾技術(shù),開發(fā)者能夠簡(jiǎn)化復(fù)雜模型,同時(shí)保持高效性和準(zhǔn)確性,這種方法使得大規(guī)模深度學(xué)習(xí)模型更加易于解釋。

○ 增強(qiáng)推理框架和可視化工具:新一代的AI推理框架將更注重可視化,幫助用戶以更直觀的方式理解模型決策的依據(jù)。例如,基于圖像或文本的AI系統(tǒng),新的可視化工具可以清晰展示模型如何關(guān)注不同的輸入特征,從而提升其可解釋性。

需要一提的是,未來(lái)AI的安全不光需要提升可解釋性,還需要著重于法律合規(guī)性、安全審計(jì)和濫用防范等方面,推動(dòng)AI技術(shù)的負(fù)責(zé)任應(yīng)用。隨著技術(shù)的不斷發(fā)展,AI如何在不斷的創(chuàng)新中確保安全,將成為AI領(lǐng)域面臨的重大挑戰(zhàn)之一。

趨勢(shì)三:大模型長(zhǎng)期記憶能力迎來(lái)深層次變革

目前的許多大模型(如基于Transformer架構(gòu)的模型)在處理長(zhǎng)文本或復(fù)雜上下文時(shí),常常會(huì)面臨信息丟失等問(wèn)題。傳統(tǒng)模型一般有固定的“記憶窗口”,當(dāng)文本或輸入信息過(guò)長(zhǎng)時(shí),模型往往會(huì)忘記最初的信息,或者在處理過(guò)程中只關(guān)注較近的上下文。長(zhǎng)期記憶的核心需求是讓模型能跨越多個(gè)時(shí)刻、任務(wù)和場(chǎng)景記住信息,并能在合適的時(shí)機(jī)提取和利用這些信息。

大模型的長(zhǎng)期記憶能力迎來(lái)了一系列技術(shù)突破。首先,在上下文窗口的擴(kuò)展上,比如2024年,Google Gemini 1.5 Pro突破性地實(shí)現(xiàn)了最高可達(dá)1000萬(wàn)token的處理能力。到2025年2月發(fā)布的Gemini 2.0全家桶,最強(qiáng)Pro版本可支持到2M上下文。

其次,外部記憶系統(tǒng)的引入推動(dòng)了大模型記憶能力的發(fā)展。如IBM WatsonX的實(shí)時(shí)知識(shí)圖譜更新功能使得在醫(yī)學(xué)診斷等特定領(lǐng)域的記憶準(zhǔn)確率提高了35%。持續(xù)學(xué)習(xí)機(jī)制方面,Meta的LoRA-X架構(gòu)通過(guò)參數(shù)隔離技術(shù)降低了多任務(wù)干擾,OpenAI則部署了分布式記憶訓(xùn)練系統(tǒng),使百萬(wàn)設(shè)備協(xié)同進(jìn)化,提升了記憶系統(tǒng)表現(xiàn)。在記憶檢索方面,Anthropic的ContextRouter模塊和微軟的MAVEx系統(tǒng)分別通過(guò)動(dòng)態(tài)記憶權(quán)重分配和跨模態(tài)聯(lián)合檢索,優(yōu)化了記憶檢索的準(zhǔn)確性與效率。

第三,隱私與安全問(wèn)題也得到了關(guān)注,Google推出的Memory Provenance框架增強(qiáng)了記憶的透明度和可控性,而HuggingFace的SafeMemory工具包通過(guò)差分隱私技術(shù)將隱私泄露的風(fēng)險(xiǎn)大幅度降低。這些技術(shù)突破使大模型的長(zhǎng)期記憶能力得到了顯著提升,推動(dòng)了多個(gè)領(lǐng)域的應(yīng)用發(fā)展。

2025年,大模型的長(zhǎng)期記憶技術(shù)將迎來(lái)新的發(fā)展趨勢(shì)。如混合窗口架構(gòu)或?qū)⒊蔀樯舷挛奶幚淼男路妒?,能夠根?jù)任務(wù)需求動(dòng)態(tài)調(diào)整局部和全局注意力的范圍,大幅度提升處理效率。隨著多模態(tài)技術(shù)的進(jìn)步,跨模態(tài)記憶融合將在視頻、文本、觸覺(jué)和嗅覺(jué)數(shù)據(jù)的編碼上取得突破,進(jìn)一步提升模型的記憶能力。記憶權(quán)限管理和記憶遺忘機(jī)制將更加成熟,為隱私和安全提供更強(qiáng)保障。

此外,隨著用戶對(duì)個(gè)性化和定制化的需求不斷提升。個(gè)性化記憶系統(tǒng)能夠根據(jù)用戶的特定需求、偏好和行為習(xí)慣構(gòu)建專屬的記憶圖譜。例如,AI助手可以記住用戶的興趣、常用的命令、偏好的回答風(fēng)格等,從而提供更加精準(zhǔn)和符合需求的回復(fù)。2025年,個(gè)性化記憶系統(tǒng)也將成為大模型發(fā)展的重點(diǎn)方向,大模型能夠根據(jù)用戶需求構(gòu)建專屬記憶圖譜,提高個(gè)性化回復(fù)的準(zhǔn)確性,并通過(guò)跨設(shè)備記憶同步實(shí)現(xiàn)實(shí)時(shí)更新。

不過(guò),盡管大模型在長(zhǎng)期記憶方面取得顯著進(jìn)展,但仍面臨技術(shù)挑戰(zhàn),包括記憶沖突解決、多來(lái)源記憶的置信度評(píng)估體系、能耗瓶頸和認(rèn)知偏差防控問(wèn)題。商業(yè)應(yīng)用方面,醫(yī)療、教育和金融等行業(yè)將受益于大模型長(zhǎng)期記憶能力的提升,預(yù)計(jì)能夠降低誤診率、提升知識(shí)留存率并加速風(fēng)控響應(yīng)速度。

趨勢(shì)四:合成數(shù)據(jù)或加速大模型訓(xùn)練

隨著人工智能技術(shù)的飛速發(fā)展,數(shù)據(jù)成為推動(dòng)AI進(jìn)步的核心資源。2025年,合成數(shù)據(jù)作為加速大模型訓(xùn)練的一種重要方法,正在成為AI發(fā)展的關(guān)鍵趨勢(shì)。馬斯克在2025年CES(消費(fèi)電子展會(huì))的訪談中提到,隨著人類累積的知識(shí)幾乎被AI訓(xùn)練完畢,未來(lái)的AI系統(tǒng)將不得不依賴合成數(shù)據(jù)進(jìn)行自我生成和學(xué)習(xí)。這一觀點(diǎn)突顯了合成數(shù)據(jù)在未來(lái)AI技術(shù)發(fā)展中的潛力。

目前,多個(gè)科技巨頭已經(jīng)開始在AI模型訓(xùn)練中廣泛應(yīng)用合成數(shù)據(jù)。微軟、Meta、OpenAI和Anthropic等公司紛紛將合成數(shù)據(jù)作為增強(qiáng)模型訓(xùn)練效率和拓寬訓(xùn)練數(shù)據(jù)源的有效手段。例如,2024年下半年發(fā)布的Llama 3.1、o1、DeepSeekV3和Phi-4等模型均報(bào)告了使用合成數(shù)據(jù)進(jìn)行訓(xùn)練。根據(jù)科技市場(chǎng)研究機(jī)構(gòu)Gartner的預(yù)測(cè),到2024年,AI及分析項(xiàng)目中使用的數(shù)據(jù)中,60%以上將來(lái)自合成數(shù)據(jù)。合成數(shù)據(jù)能夠幫助AI系統(tǒng)在真實(shí)數(shù)據(jù)難以獲得或標(biāo)注成本過(guò)高的情況下,生成具有代表性且符合特定任務(wù)需求的數(shù)據(jù),大幅降低了對(duì)實(shí)際數(shù)據(jù)的依賴。

然而,合成數(shù)據(jù)的使用仍然面臨諸多挑戰(zhàn)與爭(zhēng)議。2024年7月,《Nature》期刊刊登的論文指出,LLM生成的合成數(shù)據(jù)可能會(huì)污染下一代模型的訓(xùn)練集,導(dǎo)致模型性能下降,甚至發(fā)生“崩潰”。這一風(fēng)險(xiǎn)類似于“數(shù)據(jù)中毒”問(wèn)題,嚴(yán)重時(shí)可能讓模型無(wú)法做出有效的推理和判斷。英偉達(dá)也發(fā)布了其Nemotron-4 340B開源模型,聲稱使用了98%的合成數(shù)據(jù),但同時(shí)也強(qiáng)調(diào)需要加強(qiáng)合成數(shù)據(jù)的質(zhì)量控制,以避免潛在的負(fù)面影響。

盡管面臨風(fēng)險(xiǎn),但合成數(shù)據(jù)在加速大模型訓(xùn)練方面的潛力仍然巨大。尤其在高性能計(jì)算和多模態(tài)數(shù)據(jù)融合等領(lǐng)域,合成數(shù)據(jù)可以快速擴(kuò)展訓(xùn)練集的規(guī)模,并提供更多樣化的訓(xùn)練情境。為了應(yīng)對(duì)合成數(shù)據(jù)帶來(lái)的挑戰(zhàn),AI研究者正在不斷優(yōu)化生成數(shù)據(jù)的質(zhì)量和多樣性,例如通過(guò)強(qiáng)化學(xué)習(xí)算法對(duì)合成數(shù)據(jù)進(jìn)行校正,或者結(jié)合人類監(jiān)督和自動(dòng)化評(píng)估機(jī)制來(lái)減少“數(shù)據(jù)污染”風(fēng)險(xiǎn)。

展望未來(lái),隨著技術(shù)的不斷進(jìn)步,合成數(shù)據(jù)有望成為AI訓(xùn)練中的重要組成部分。它不僅能加速模型的訓(xùn)練過(guò)程,還能在數(shù)據(jù)匱乏或難以獲取的領(lǐng)域,為AI發(fā)展提供新的動(dòng)力。

趨勢(shì)五:大模型普及加速,效率躍遷曲線下成本更低了

在2025年1月,Anthropic的CEO-Dario Amodei 發(fā)表了一篇長(zhǎng)達(dá)萬(wàn)字的深度分析報(bào)告??隙薉eepSeek的技術(shù)突破:其最新模型在特定基準(zhǔn)測(cè)試中已逼近美國(guó)頂尖水平,并嘗試從三個(gè)維度將中國(guó)的AI進(jìn)步納入全球技術(shù)演進(jìn)坐標(biāo)系進(jìn)行定位:算力規(guī)模定律、效率躍遷曲線、范式革新動(dòng)能。

這些維度的選擇反映了他對(duì)國(guó)產(chǎn)AI評(píng)估方面的理解:關(guān)注硬件和計(jì)算能力的提升(算力規(guī)模定律),技術(shù)的效率提升(效率躍遷曲線),以及新技術(shù)范式的創(chuàng)新和推動(dòng)力(范式革新動(dòng)能)。這種全方位的定位方式,能夠精準(zhǔn)捕捉到AI大模型在全球技術(shù)演進(jìn)中的角色及潛力。具體我們解釋下這三方面的重要性和趨勢(shì):

首先,規(guī)模定律是推動(dòng)大模型發(fā)展的基礎(chǔ)。隨著硬件技術(shù)不斷進(jìn)步(如更強(qiáng)大的GPU、TPU和專用AI芯片),訓(xùn)練超大規(guī)模模型已變得越來(lái)越可行,同時(shí)也驅(qū)動(dòng)了云計(jì)算和分布式計(jì)算的發(fā)展,進(jìn)一步降低了成本。隨著更強(qiáng)大的計(jì)算資源的普及和優(yōu)化,規(guī)模定律將繼續(xù)提升,這是2025年AI大模型的關(guān)鍵能力趨勢(shì)之一。

其次,關(guān)于效率躍遷曲線,曲線偏移指的是技術(shù)創(chuàng)新帶來(lái)成本曲線的變化,使得原本高昂的訓(xùn)練成本能夠通過(guò)硬件優(yōu)化、模型架構(gòu)改進(jìn)等手段大幅降低。這不僅能夠降低AI研發(fā)的門檻,還能加速技術(shù)迭代。比如2024年,硬件創(chuàng)新如量子計(jì)算、專用AI加速芯片推動(dòng)AI訓(xùn)練成本的快速降低。同時(shí),AI框架的優(yōu)化(如更高效的深度學(xué)習(xí)框架)和算法改進(jìn)幫助實(shí)現(xiàn)了更少計(jì)算資源的更高效訓(xùn)練。

在前文中我們也提到了,目前對(duì)于AI基礎(chǔ)設(shè)施方面軍備競(jìng)賽激烈,低成本做法漸成趨勢(shì),尤其是DeepSeek通過(guò)采用OpenAI等先進(jìn)模型,利用蒸餾技術(shù)將其知識(shí)轉(zhuǎn)移。這一過(guò)程使得DeepSeek能夠在保持較高性能的同時(shí),顯著減少訓(xùn)練所需的計(jì)算資源和時(shí)間。通過(guò)模仿OpenAI模型的輸出,“學(xué)生模型”能夠快速學(xué)習(xí)復(fù)雜的模式和推理能力,加速模型的優(yōu)化過(guò)程。2025年,隨著硬件和算法的進(jìn)一步突破,AI開發(fā)成本將大幅下降,這也使得更多的中小型企業(yè)可以進(jìn)入AI領(lǐng)域。

此外,新的訓(xùn)練范式(如強(qiáng)化學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)等)正在改變AI的學(xué)習(xí)方式。2020到2023年,AI主要依賴預(yù)訓(xùn)練模型,使用大量互聯(lián)網(wǎng)文本進(jìn)行訓(xùn)練,并通過(guò)少量額外訓(xùn)練進(jìn)行微調(diào)。然而,到了2024年,強(qiáng)化學(xué)習(xí)(RL)成為新的重點(diǎn),通過(guò)強(qiáng)化學(xué)習(xí)生成思維鏈,AI在數(shù)學(xué)、編程和推理等任務(wù)上的表現(xiàn)顯著提升。初期階段投入較少,但效果顯著。

強(qiáng)化學(xué)習(xí)和自監(jiān)督學(xué)習(xí)等新興范式逐漸在機(jī)器人、自動(dòng)化和多模態(tài)學(xué)習(xí)領(lǐng)域得到應(yīng)用,尤其提升了機(jī)器人在動(dòng)態(tài)環(huán)境中的自主學(xué)習(xí)和決策能力。到2025年,這些新訓(xùn)練范式預(yù)計(jì)將成為AI發(fā)展的主流,尤其在復(fù)雜任務(wù)處理上(接下來(lái)趨勢(shì)六我們會(huì)進(jìn)一步解釋)。

趨勢(shì)六:預(yù)訓(xùn)練到后期訓(xùn)練和推理遷移轉(zhuǎn)變

2024年是AI技術(shù)飛速發(fā)展的一年,尤其是在大語(yǔ)言模型(LLM)和多模態(tài)技術(shù)方面取得了顯著突破。這一年,AI從單一模態(tài)向多模態(tài)融合邁進(jìn),大語(yǔ)言模型通過(guò)擴(kuò)展上下文窗口和采用混合專家架構(gòu)(MoE)等技術(shù),顯著提升了推理和生成能力。同時(shí),強(qiáng)化學(xué)習(xí)(RL)開始與大語(yǔ)言模型結(jié)合,為模型的泛化能力提升提供了新的方向。此外,AI在醫(yī)療、金融、自動(dòng)駕駛等領(lǐng)域的應(yīng)用不斷深化,推動(dòng)了行業(yè)變革。然而,隨著模型規(guī)模的擴(kuò)大,預(yù)訓(xùn)練階段的性能提升逐漸放緩,行業(yè)開始探索后訓(xùn)練和推理遷移的新模式。

2025年,AI技術(shù)將進(jìn)入一個(gè)新的發(fā)展階段,Scaling Law的擴(kuò)展將成為關(guān)鍵趨勢(shì)之一。強(qiáng)化學(xué)習(xí)與大語(yǔ)言模型的結(jié)合(RL+LLMs)將進(jìn)一步推動(dòng)模型泛化能力,從預(yù)訓(xùn)練向后訓(xùn)練和推理遷移轉(zhuǎn)變。

這種模式將使AI在特定場(chǎng)景下的表現(xiàn)得到顯著提升,同時(shí)降低訓(xùn)練成本,提高模型的適應(yīng)性和靈活性。此外,AI將在更多領(lǐng)域?qū)崿F(xiàn)落地應(yīng)用,如智能駕駛、具身智能等,這些領(lǐng)域?qū)⒂瓉?lái)技術(shù)突破和商業(yè)化的加速,但也與此同時(shí)會(huì)帶來(lái)更多的安全和風(fēng)險(xiǎn)管理挑戰(zhàn)。因此,AI安全和治理將成為行業(yè)關(guān)注的重點(diǎn)。

需要強(qiáng)調(diào)的是,大規(guī)模語(yǔ)言模型(LLM)的預(yù)訓(xùn)練階段已經(jīng)接近瓶頸,主要受到數(shù)據(jù)、計(jì)算資源和模型規(guī)模增長(zhǎng)的限制,且在通用性提升上邊際效益遞減。部分研究人員和行業(yè)專家擔(dān)心,對(duì)于大規(guī)模語(yǔ)言模型而言,傳統(tǒng)擴(kuò)展方式已接近極限。生成式AI已遇瓶頸。據(jù)外媒報(bào)道,像OpenAI這樣的公司在擴(kuò)大技術(shù)應(yīng)用時(shí)也發(fā)現(xiàn)困難重重,其他前沿實(shí)驗(yàn)室也面臨更嚴(yán)重的挑戰(zhàn)。知名數(shù)據(jù)科學(xué)家Yam Peleg透露,一些實(shí)驗(yàn)室試圖通過(guò)延長(zhǎng)訓(xùn)練時(shí)間和增加數(shù)據(jù)量來(lái)提升模型表現(xiàn),但結(jié)果卻遭遇了“收益遞減墻”,且情況比公開報(bào)道的更為嚴(yán)重。

不過(guò),盡管如此,預(yù)訓(xùn)練依然為模型奠定了基礎(chǔ),后續(xù)的優(yōu)化潛力巨大。因此,在后訓(xùn)練階段(如微調(diào)、強(qiáng)化學(xué)習(xí)、多模態(tài)對(duì)齊等)依然存在許多優(yōu)化機(jī)會(huì)。通過(guò)領(lǐng)域特化、任務(wù)指令優(yōu)化、模型壓縮等技術(shù),可以提升模型在特定任務(wù)上的表現(xiàn),同時(shí)提高其在資源受限環(huán)境中的部署效率和安全性。

趨勢(shì)七:更多優(yōu)化算法將被用于強(qiáng)化學(xué)習(xí)等領(lǐng)域

目前,深度強(qiáng)化學(xué)習(xí)(DRL)的優(yōu)化算法在多個(gè)行業(yè)取得了應(yīng)用突破。為了解決傳統(tǒng)強(qiáng)化學(xué)習(xí)在高維度問(wèn)題上訓(xùn)練困難的問(wèn)題,研究者采用了更加高效的算法,如模仿學(xué)習(xí)和分層強(qiáng)化學(xué)習(xí),顯著提升了模型的學(xué)習(xí)效率和訓(xùn)練速度。比如Google DeepMind 推出的AlphaDev系統(tǒng)由兩個(gè)核心組成部分構(gòu)成:學(xué)習(xí)算法和表示函數(shù)。學(xué)習(xí)算法是在先進(jìn)的 AlphaZero 算法基礎(chǔ)上進(jìn)行擴(kuò)展,結(jié)合了深度強(qiáng)化學(xué)習(xí) (DRL) 和隨機(jī)搜索優(yōu)化算法,以執(zhí)行大規(guī)模的指令搜索任務(wù)。

此外,RLHF(強(qiáng)化學(xué)習(xí)與人類反饋結(jié)合)的應(yīng)用開始更加深入和精細(xì)。AI大模型開始通過(guò)更精確的人類反饋進(jìn)行訓(xùn)練,從而能夠更好地理解復(fù)雜任務(wù),并且在人機(jī)交互中表現(xiàn)出更高的自適應(yīng)能力。例如,OpenAI的ChatGPT通過(guò)用戶的實(shí)時(shí)反饋不斷優(yōu)化對(duì)話能力,以提供個(gè)性化和上下文相關(guān)的回答。由于RLHF能顯著減少對(duì)大規(guī)模標(biāo)注數(shù)據(jù)的依賴,更多AI系統(tǒng)開始通過(guò)少量高質(zhì)量的人工反饋來(lái)進(jìn)行高效訓(xùn)練,從而降低了模型開發(fā)和訓(xùn)練的成本。

還有近期處于話題焦點(diǎn)的DeepSeek,R1模型通過(guò)強(qiáng)化學(xué)習(xí)(RL)和基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)進(jìn)行訓(xùn)練,并針對(duì)核心算法模塊做了大量的優(yōu)化處理:比如改造 Attention 模塊,通過(guò)低秩壓縮,讓KV Cache的效率達(dá)到最優(yōu)。以及通過(guò)訓(xùn)練架構(gòu)瘦身—例如GRPO算法通過(guò)省去傳統(tǒng)強(qiáng)化學(xué)習(xí)中必須的Critic模型(即"雙引擎"設(shè)計(jì)),將復(fù)雜算法簡(jiǎn)化為可落地執(zhí)行的工程方案。一般傳統(tǒng)的強(qiáng)化學(xué)習(xí)模型通常采用這雙引擎”設(shè)計(jì)——Actor和Critic,Actor負(fù)責(zé)執(zhí)行決策,Critic評(píng)估Actor的決策效果,二者需要同時(shí)進(jìn)行訓(xùn)練,這增加了計(jì)算量和訓(xùn)練復(fù)雜度。通過(guò)去除Critic模型,GRPO算法能夠簡(jiǎn)化模型結(jié)構(gòu),降低計(jì)算資源的消耗。

隨著AI應(yīng)用場(chǎng)景的多樣化,簡(jiǎn)化算法架構(gòu)將成為AI發(fā)展的重要方向。2025年,更多優(yōu)化算法(如GRPO等)將被用于強(qiáng)化學(xué)習(xí)等領(lǐng)域,以減少計(jì)算資源的消耗,同時(shí)提高模型的執(zhí)行效率和實(shí)時(shí)響應(yīng)能力。

隨著硬件資源的不斷提升和算法的進(jìn)一步優(yōu)化,像GRPO這樣的輕量級(jí)強(qiáng)化學(xué)習(xí)算法將被廣泛應(yīng)用于邊緣計(jì)算和低資源設(shè)備上。例如,智能設(shè)備、物聯(lián)網(wǎng)設(shè)備和機(jī)器人等領(lǐng)域,都會(huì)受益于這種簡(jiǎn)化的算法,實(shí)現(xiàn)在硬件條件有限的環(huán)境中高效運(yùn)行。

趨勢(shì)八:低成本訓(xùn)練與AI倫理,知識(shí)產(chǎn)權(quán)成為核心議題

春節(jié)期間,DeepSeek的DeepSeek-R1震撼了全球科技圈和資本市場(chǎng),其基于知識(shí)蒸餾技術(shù),成功將大型復(fù)雜模型的知識(shí)遷移到較小模型,實(shí)現(xiàn)高效部署。2月6日,斯坦福大學(xué)李飛飛團(tuán)隊(duì)和華盛頓大學(xué)研究人員以不到50美元云計(jì)算費(fèi)用,成功蒸餾出一個(gè)名為s1的新推理模型,表現(xiàn)與OpenAI的o1和DeepSeek的R1相似,展示了蒸餾技術(shù)的強(qiáng)大潛力?;诟?jìng)爭(zhēng)壓力,2月7日,OpenAI公開了o3-mini的推理思維鏈,但該推理思維鏈并非原始數(shù)據(jù),OpenAI產(chǎn)品官Kevin Weil表示會(huì)找到平衡方式以避免被競(jìng)爭(zhēng)對(duì)手蒸餾。

Kevin Weil的考慮出發(fā)點(diǎn)在于,蒸餾通常依賴于將一個(gè)較大模型的知識(shí)提取出來(lái),并將其遷移到一個(gè)更小的模型。如果目標(biāo)模型能夠有效地從源模型中獲取有用的知識(shí),且沒(méi)有太大的性能損失,那么理論上,很多模型都可以通過(guò)蒸餾技術(shù)進(jìn)行簡(jiǎn)化和優(yōu)化。因此,隨著AI蒸餾技術(shù)的普及,相關(guān)的法律和監(jiān)管框架也需要不斷加強(qiáng),以確保在模型開發(fā)和應(yīng)用過(guò)程中不會(huì)侵犯知識(shí)產(chǎn)權(quán)或數(shù)據(jù)隱私。

這種低成本訓(xùn)練的模式也引發(fā)了業(yè)界關(guān)于AI模型知識(shí)產(chǎn)權(quán)和倫理問(wèn)題的討論。隨著越來(lái)越多的研究依賴于現(xiàn)有基座模型進(jìn)行微調(diào),是否應(yīng)當(dāng)給予這些基座模型開發(fā)者相應(yīng)的回報(bào)成為一個(gè)重要議題。同時(shí),如何確保AI技術(shù)的公平使用和共享,也亟待業(yè)界深入探討和解決。

下一個(gè)殺手級(jí)應(yīng)用,可能在消費(fèi)領(lǐng)域

趨勢(shì)一:越來(lái)越多企業(yè)從人工智能上掙到錢

過(guò)去的2024年,是生成式AI的落地之年。而2025年,則是這些企業(yè)級(jí)AI應(yīng)用在已有的落地場(chǎng)景中深入發(fā)展的一年。

美國(guó)風(fēng)險(xiǎn)投資機(jī)構(gòu)Menlo Ventures在統(tǒng)計(jì)了600家美國(guó)企業(yè)的IT支出(包括模型支出、訓(xùn)練&部署支出、AI應(yīng)用支出,不包括芯片、云計(jì)算等支出)情況后發(fā)現(xiàn),2024年企業(yè)的AI相關(guān)支出達(dá)到了138億美元,相比2023年的23億美元增長(zhǎng)了超過(guò)6倍。在這其中,應(yīng)用支出的增速最快,6億美元增長(zhǎng)到了2024年的46億美元。

數(shù)據(jù)來(lái)源:Menlo Ventures

企業(yè)AI相關(guān)支出的提高,讓不同的行業(yè)間接獲益。第一個(gè)受益的是咨詢公司。2024年,埃森哲和IBM等咨詢公司正在實(shí)現(xiàn)大幅的收入增長(zhǎng),其中,與人工智能相關(guān)的服務(wù)對(duì)其營(yíng)收增長(zhǎng)貢獻(xiàn)顯著,客戶希望通過(guò)咨詢,了解實(shí)施人工智能能夠獲得的競(jìng)爭(zhēng)優(yōu)勢(shì)。根據(jù)埃森哲披露,截至 2024 年 9 月,其生成式人工智能咨詢預(yù)訂額近 30 億美元。

第二個(gè)從人工智能中獲益的行業(yè)是云計(jì)算和軟件公司。軟件公司ServiceNow自推出 “Now Assist” 以來(lái),報(bào)告了強(qiáng)勁的生成式人工智能預(yù)訂量,其首席財(cái)務(wù)官表示,在新產(chǎn)品系列中,最大新增年度合同價(jià)值貢獻(xiàn),來(lái)自于人工智能的采用。另外,軟件巨頭甲骨文的基礎(chǔ)設(shè)施即服務(wù)(IaaS)部門實(shí)現(xiàn)了強(qiáng)勁增長(zhǎng),這在很大程度上歸因于人工智能工作負(fù)載的增加。數(shù)據(jù)中心的領(lǐng)導(dǎo)者Equinix也因?yàn)槿斯ぶ悄芑A(chǔ)設(shè)施需求獲得了大量新合同。

另外,廣告行業(yè)也從人工智能使用中獲益。根據(jù)Meta Platforms最近報(bào)告,在人工智能的加持下,其廣告展示量增長(zhǎng)了7% ,每廣告的平均價(jià)格增長(zhǎng)了 11%,季度收入同比增張了19%。

亞馬遜集成了基于生成式人工智能的產(chǎn)品圖像生成工具,導(dǎo)致某些廣告活動(dòng)的廣告展示量顯著增加。我們預(yù)計(jì),隨著人工智能服務(wù)需求的擴(kuò)大,具有獨(dú)特市場(chǎng)定位、強(qiáng)大分銷渠道和特權(quán)數(shù)據(jù)訪問(wèn)權(quán)限的云計(jì)算、軟件應(yīng)用和基礎(chǔ)設(shè)施公司將成為主要受益者。隨著人工智能市場(chǎng)的成熟,這些科技巨頭可能在 2025 年實(shí)現(xiàn)加速增長(zhǎng)。

我們嘗試總結(jié)了生成式AI滲透率最高的幾個(gè)應(yīng)用場(chǎng)景:AI代碼、AI客服支持和企業(yè)級(jí)搜索。

● 最高的是AI代碼應(yīng)用,企業(yè)對(duì)AI代碼應(yīng)用的采用率達(dá)到了51%,比如,頭部產(chǎn)品 Github Copilot 的ARR(年度經(jīng)常性收入,是指企業(yè)每年從客戶那里獲得的或期望從客戶那里獲得的服務(wù)或產(chǎn)品回報(bào)的收入計(jì)算)達(dá)到了3億美金也真實(shí)的反應(yīng)了用戶的需求。Cursor、Cognition 等新興工具在迎來(lái)用戶快速增長(zhǎng)的同時(shí),也獲得了資本市場(chǎng)的火熱追捧。

● 其次是AI客戶支持,其采用率達(dá)到了31%,產(chǎn)品為內(nèi)部員工或外部用戶提供基于產(chǎn)品知識(shí)的客戶支持。Sierra、Decagon 等初創(chuàng)借力生成式AI的智能,為用戶提供符合品牌調(diào)性和消費(fèi)者畫像的定制化客服體驗(yàn),挑戰(zhàn)低效、無(wú)趣的傳統(tǒng)客服。

● 第三是AI數(shù)據(jù)檢索,其采用率達(dá)到了28%,這類應(yīng)用幫助企業(yè)解鎖和利用分散在各組織中的數(shù)據(jù),將數(shù)據(jù)孤島中的寶貴知識(shí)管理利用。例如一家初創(chuàng)企業(yè)Glean,其業(yè)務(wù)是企業(yè)級(jí)搜索,旨在為企業(yè)打造內(nèi)部的Google,核心產(chǎn)品 Glean Assistant 的用戶每天平均查詢 14 次,遠(yuǎn)超Google的日均查詢次數(shù)。在過(guò)去一年ARR(年經(jīng)常性收入,Annual Recurring Revenue)達(dá)到了5500萬(wàn)美金。

數(shù)據(jù)來(lái)源:Menlo Ventures

2024年,企業(yè)60%的AI應(yīng)用支出來(lái)自企業(yè)創(chuàng)新業(yè)務(wù)的預(yù)算,說(shuō)明企業(yè)使用這些應(yīng)用的態(tài)度以嘗試和探索為主,生成式AI在企業(yè)應(yīng)用場(chǎng)景中的落地尚處于早期階段。接下來(lái),隨著企業(yè)未來(lái)各個(gè)部門對(duì)于生成式AI應(yīng)用的預(yù)算持續(xù)增長(zhǎng),哪些生成式AI應(yīng)用能為企業(yè)帶來(lái)實(shí)實(shí)在在的回報(bào)率,哪些或?qū)⒎值贸掷m(xù)性更長(zhǎng)、規(guī)模更大的預(yù)算,從而支持生成式AI應(yīng)用生根發(fā)芽、斬獲1億美金甚至更多ARR。

①AI Agent正在給企業(yè)帶來(lái)效益

2025年,生成式AI應(yīng)用正在生根、發(fā)芽,給企業(yè)帶來(lái)實(shí)實(shí)在在的現(xiàn)金回報(bào),基于這樣的趨勢(shì),AI Agent將是這個(gè)商業(yè)環(huán)節(jié)閉環(huán)的關(guān)鍵。

AI Agent從學(xué)術(shù)走向商業(yè)落地,僅花了三年時(shí)間。

AI Agent的第一波高潮來(lái)自2023年年初,AutoGPT的火爆,所謂AutoGPT,其實(shí)是把學(xué)術(shù)圈很多的Agent idea簡(jiǎn)單呈現(xiàn)出來(lái),盡管其讓開發(fā)者感受到大模型的強(qiáng)大,但很快大家便發(fā)現(xiàn),AutoGPT的實(shí)驗(yàn)性強(qiáng)于實(shí)用性,難以解決大部分的實(shí)際問(wèn)題。第二波高潮來(lái)自2023年9月,AgentGen,通過(guò)構(gòu)建不同職能的Agent,分工協(xié)作。

到了2024年,AI Agent開始從實(shí)驗(yàn)走向現(xiàn)實(shí)。

2024年末,OpenAI首席執(zhí)行官Sam Altman提出了AGI(通用人工智能)的五層框架:

Lv1 - Chatbot,具備基礎(chǔ)的對(duì)話能力,能夠理解和回應(yīng)簡(jiǎn)單的文本輸入

Lv2 - Reasoner,具備基本的邏輯推理能力,能夠分析復(fù)雜信息并進(jìn)行推斷

Lv3 - Agent,具備理解復(fù)雜指令的能力

Lv4 - Innovator,具備創(chuàng)新和創(chuàng)造的能力

Lv5 - Organizer,具備協(xié)調(diào)和管理龐大系統(tǒng)、資源和團(tuán)隊(duì)的能力

他提出,如今我們正處于第二個(gè)階段并非常接近第三個(gè)階段的狀態(tài)。

Lv3的Agent智能體能夠自主與環(huán)境交互、收集信息,具備持續(xù)規(guī)劃并執(zhí)行多步驟、長(zhǎng)時(shí)間任務(wù)的能力。要達(dá)成這個(gè)階段,需要一個(gè)推理能力、邏輯能力更強(qiáng)的模型(可能是o1的下一個(gè)版本、也可能是對(duì)標(biāo)o1的開源模型)。同時(shí),服務(wù)AI Agent應(yīng)用的基礎(chǔ)設(shè)施也必不可少。

當(dāng)下,企業(yè)出于安全性、準(zhǔn)確性、穩(wěn)定性等因素的考量,更傾向于使用 AI Copilot (人在回路中參與)增加人在工作流中的效率,而不是直接采用端到端自動(dòng)化 AI Agent。隨著底層模型能力和Agent框架開發(fā)的持續(xù)升級(jí),Agent應(yīng)用將為企業(yè)提供更智能高效的數(shù)字員工。人與AI的協(xié)作關(guān)系將從AI賦能人工作,逐漸轉(zhuǎn)變到人監(jiān)督指導(dǎo)AI完成工作,最終達(dá)到AI自主完成工作。這個(gè)轉(zhuǎn)變會(huì)在未來(lái)幾年迅速發(fā)生。

至于適合AI Agent最先產(chǎn)生價(jià)值的應(yīng)用場(chǎng)景,2025年大概將延續(xù)現(xiàn)階段生成式AI滲透率高的場(chǎng)景,例如代碼編程、客服、銷售、營(yíng)銷等。

根據(jù)第三方機(jī)構(gòu)Menlo Ventures的調(diào)查數(shù)據(jù)顯示,企業(yè)內(nèi)各部門的生成式AI預(yù)算劃分中,IT部分獨(dú)占鰲頭(22%)、產(chǎn)品和工程開發(fā)次之(19%),客服(9%)、銷售(8%)和營(yíng)銷(7%)緊隨其后。

數(shù)據(jù)來(lái)源:Menlo Ventures, UpHonest Capital

根據(jù)硅兔賽跑的觀察,一些企業(yè)的確正在從這幾個(gè)場(chǎng)景中賺錢:

IT部門選擇之一的初創(chuàng)公司Glean,在2024年9月份完成新一輪融資,估值達(dá)到46億美元,其旨在優(yōu)化企業(yè)內(nèi)部數(shù)據(jù)檢索和問(wèn)題答復(fù)。

在產(chǎn)品和工程開發(fā)部門依賴的AI編程應(yīng)用中,初創(chuàng)公司Cognition在2024年3月推出了首個(gè)AI程序員Devin,成立僅6個(gè)月就達(dá)到了20億美金估值。同年12月其Agent產(chǎn)品Devin正式上線,區(qū)別于普通的代碼補(bǔ)全應(yīng)用,Devin能夠無(wú)需人類參與進(jìn)行自主編碼,完成需要人類工程師參與的項(xiàng)目開發(fā)。目前 Devin擁有諸多頭部客戶:例如Ramp 使用Devin 編寫測(cè)試代碼并清理死亡代碼,MongoDB使用 Devin 更新過(guò)時(shí)的代碼架構(gòu)。

硅谷投資機(jī)構(gòu)UpHonest Capital早期投資的Cosine,正在打造全自動(dòng)的AI軟件開發(fā)助理Genie,曾在SWE-Bench測(cè)試中獲得全球最高分?jǐn)?shù)。Cosine 研發(fā)了獨(dú)有的數(shù)據(jù)管道,能夠生成具有人類工程師開發(fā)邏輯、增量知識(shí)、支持搜索的高質(zhì)量數(shù)據(jù)集。同時(shí),Cosine是OpenAI最大的模型微調(diào)合作伙伴,擁有其前沿模型的早期使用權(quán)限。結(jié)合數(shù)據(jù)和模型優(yōu)勢(shì),Cosine已經(jīng)與多家世界500強(qiáng)公司和明星初創(chuàng)公司達(dá)成合作。

客服作為人力密集型工作,也將成為AI Agent最先顛覆的環(huán)節(jié)。比如UpHonest Capital早期投資的Proactive AI 正在為零售品牌打造具有高情感智能語(yǔ)言能力的客服助理,主要幫助企業(yè)向其用戶提供契合品牌調(diào)性和個(gè)性化需求的客服服務(wù),目前已與餐飲、健身、沙龍等行業(yè)多家頭部企業(yè)達(dá)成深度合作。

銷售和營(yíng)銷作為企業(yè)開源的重要入口,企業(yè)利用最新技術(shù)提高獲客效率的意愿也非常高。美國(guó)的人工智能初創(chuàng)公司11x,打造AI驅(qū)動(dòng)的“數(shù)字工作者”以取代傳統(tǒng)的銷售團(tuán)隊(duì),其Agent能夠自主執(zhí)行GTM工作流程。11x不通過(guò)軟件幫助企業(yè)降本增效,而是直接提供實(shí)在的工作成果,數(shù)字員工能夠自主實(shí)現(xiàn)完成的收入閉環(huán)。11x成立6個(gè)月就達(dá)到了200萬(wàn)美金的ARR,目前ARR已經(jīng)達(dá)到了1,000萬(wàn)美金。FlashIntel正在打造AI驅(qū)動(dòng)的GTM平臺(tái)并向企業(yè)提供AI驅(qū)動(dòng)的銷售助理(SDR)。FlashIntel在G2 2024冬季報(bào)告中總計(jì)獲得了189枚徽章,其中FlashRev被評(píng)為最佳銷售產(chǎn)品,最佳營(yíng)銷和數(shù)字廣告產(chǎn)品,以及最高滿意度產(chǎn)品。

② 在數(shù)字化滲透率低的傳統(tǒng)行業(yè)有隱藏的“金礦”

曾經(jīng),傳統(tǒng)行業(yè)的玩家對(duì)AI嗤之以鼻,過(guò)高的投入成本和微不足道的效果,讓他們難以對(duì)AI押注過(guò)多。

不過(guò)這一次,傳統(tǒng)行業(yè)的生成式AI之路,有可能跳過(guò)軟件階段,直接進(jìn)入AI階段,類似新興市場(chǎng)從使用現(xiàn)金直接轉(zhuǎn)向移動(dòng)支付。

這些行業(yè)本身對(duì)于科技的采用速度較慢,生成式AI的出現(xiàn)帶來(lái)了直接交付結(jié)果而非交付軟件的模式,減少了前期投入成本、肉眼可見的提升了投資回報(bào)率,使得恐懼新技術(shù)的決策者更容易被說(shuō)服。比如醫(yī)療領(lǐng)域的病例記錄、法律領(lǐng)域的案件報(bào)告生成、金融行業(yè)的合規(guī)風(fēng)險(xiǎn)篩查等等。

2024年12月,美國(guó)家政垂直軟件巨頭ServiceTitan上市,上市當(dāng)天股價(jià)漲幅超過(guò)40%,在2024年上市公司中,該漲幅僅次于社交平臺(tái)Reddit和芯片公司Astera Labs兩家。

要知道,ServiceTitan 2012年成立,歷經(jīng)12年發(fā)展,在僅拿下家政行業(yè)1%市場(chǎng)份額的情況下,其市值一度達(dá)到90億美元。由此可見,美國(guó)垂直行業(yè),數(shù)字化滲透速率之低,垂直行業(yè)AI化的價(jià)值之高。ServiceTitan之成功,自然使我們關(guān)注到美國(guó)傳統(tǒng)行業(yè)的機(jī)會(huì),數(shù)字化滲透率低的傳統(tǒng)行業(yè)。

美國(guó)初創(chuàng)公司Sameday為美國(guó)家庭服務(wù)行業(yè)(除蟲、HVAC、家庭維修等)提供AI銷售代理,通過(guò)自動(dòng)化的語(yǔ)音客服接聽來(lái)電并安排服務(wù)預(yù)約,提高電話接聽率,從而提高轉(zhuǎn)換率,現(xiàn)在已經(jīng)與ServiceTitan集成。Sameday的創(chuàng)始人曾在美國(guó)增長(zhǎng)最快的家庭服務(wù)行頭部公司擔(dān)任CMO,擁有極深的行業(yè)認(rèn)知和豐富的行業(yè)資源。2024年,Sameday的ARR預(yù)計(jì)將增長(zhǎng)5倍以上,月度客戶留存率達(dá)98.5%。

建筑行業(yè)的AI解決方案提供商Pantheon,能夠生成高精度且可編輯的 3D 建筑模型,通過(guò)AI實(shí)現(xiàn)更快的設(shè)計(jì)迭代周期可以顯著降低項(xiàng)目成本。Pantheon AI不向建筑師出售軟件許可證,而是直接向房地產(chǎn)開發(fā)商和業(yè)主出售其設(shè)計(jì)服務(wù)。2024年10月,Pantheon AI完成了由a16z領(lǐng)投的2500萬(wàn)美金種子輪融資。

傳統(tǒng)行業(yè)以外,法律、金融、醫(yī)療行業(yè)積累了大量數(shù)據(jù),為行業(yè)垂直基石模型訓(xùn)練提供了豐富的燃料,且法律、金融、醫(yī)療行業(yè)價(jià)值高,但普遍在傳統(tǒng)軟件巨頭的壟斷下變化緩慢。即便垂直SaaS一定程度上取代了過(guò)時(shí)繁瑣的老系統(tǒng),但總體的滲透率依然有限。以醫(yī)療行業(yè)為例,其行業(yè)規(guī)模高達(dá)4.3萬(wàn)億美元,貢獻(xiàn)了約1/5的美國(guó)GDP。但在美國(guó)市值前100的上市軟件公司中,只有一家是服務(wù)醫(yī)療行業(yè)的軟件公司。

2024年,Evenup ARR預(yù)計(jì)將達(dá)到5000萬(wàn)美金,最新一輪的投后估值達(dá)到了10億美金。Evenup 利用生成式AI幫助律師進(jìn)行人身?yè)p害賠償(Personal Injury Claims)案件的索賠工作。雖然目前只服務(wù)于人身?yè)p害賠償這一個(gè)領(lǐng)域,但這已經(jīng)是一個(gè)非常大的市場(chǎng)了。美國(guó)每年約有30萬(wàn)參與處理人身?yè)p害賠償?shù)穆蓭?,每年支付給受害者的索賠金額高達(dá)1000億美金。

有備而來(lái)者,率先享受紅利,那些垂直行業(yè)專家、對(duì)行業(yè)的工作流有深入認(rèn)知的創(chuàng)業(yè)者,結(jié)合不斷進(jìn)化的生成式AI基礎(chǔ)設(shè)施,有機(jī)會(huì)迅速搶占用戶,構(gòu)建自身的行業(yè)數(shù)據(jù)壁壘。

③ AI不再按席位收費(fèi) :“Sell work, not software”

Menlo Ventures的調(diào)查數(shù)據(jù)顯示,企業(yè)在進(jìn)行生成式AI產(chǎn)品采購(gòu)決策時(shí),第一考慮要素是產(chǎn)品是否具有簡(jiǎn)單可測(cè)量的投資回報(bào)率,其次是產(chǎn)品是否根據(jù)實(shí)際應(yīng)用場(chǎng)景定制。

值得注意的是,現(xiàn)階段,產(chǎn)品價(jià)格反而是最不重要的影響因素,僅1%的企業(yè)決策者聲稱產(chǎn)品價(jià)格影響采購(gòu)決策。

數(shù)據(jù)來(lái)源:Menlo Ventures

結(jié)果正在變得更為重要。隨著AI的獨(dú)立工作能力提升,其工作結(jié)果、創(chuàng)造的價(jià)值會(huì)更容易被量化,企業(yè)對(duì)AI產(chǎn)品的價(jià)值評(píng)估,也會(huì)根據(jù)其工作成果界定,美國(guó)投資機(jī)構(gòu)a16z提出。因此,商業(yè)模式變得更加重要。

SaaS時(shí)代,SaaS公司創(chuàng)新了按席位收費(fèi)的商業(yè)模式,即按照使用SaaS產(chǎn)品的員工賬號(hào)數(shù)量按月或按年收取訂閱費(fèi)用,這種定價(jià)方式背后的邏輯是,使用SaaS產(chǎn)品的每位員工,效率會(huì)有不同程度的提升、處理更多工作,許多SaaS定價(jià)的策略在于評(píng)估使用者效率提升創(chuàng)造的收益。

但到了生成式AI時(shí)代,這個(gè)SaaS時(shí)代一直以來(lái)賴以生存的邏輯正在被顛覆。隨著Copilot產(chǎn)品向Agent產(chǎn)品的升級(jí),未來(lái)的Agentic AI系統(tǒng)將在不同AI agents的相互配合下,自動(dòng)完成任務(wù),取代越來(lái)越多的工作者,顯然,如果繼續(xù)按照席位收費(fèi),開發(fā)者的收入則會(huì)逐漸減少。

Benchmark合伙人最先建議生成式AI公司“Sell work, not software”,即按照工作成果收費(fèi),打破按席位收費(fèi)的模式。

基于此,目前原生AI公司普遍采取的商業(yè)模式分為兩類,一類是基于用量的定價(jià)模式,Salesforce發(fā)布的Agent force智能體系統(tǒng),提供客服、銷售、員工服務(wù)等AI agent智能體,按照用戶與agent實(shí)際交互的用量收費(fèi),每次”對(duì)話“收費(fèi)2美元,如果發(fā)生以下三種情況之一,即視為一次”對(duì)話“結(jié)束—— AI agent無(wú)法滿足用戶需求,需要人工介入;用戶主動(dòng)結(jié)束與AI agent對(duì)話;用戶超過(guò)24小時(shí)沒(méi)有再主動(dòng)與AI agent對(duì)話。

另一類是基于工作結(jié)果的定價(jià)模式,前Salesforce聯(lián)席CEO Bret Taylor創(chuàng)立的AI客服公司Sierra,為客戶提供基于工作結(jié)果收費(fèi)的客服AI agent,從消費(fèi)者滿意度、問(wèn)題解決程度、以及每次的交互成本三方面來(lái)評(píng)估工作結(jié)果,決定企業(yè)付費(fèi)規(guī)模。采用按照工作結(jié)果定價(jià)的模式,實(shí)現(xiàn)了AI agent企業(yè)客戶與開發(fā)公司的利益一致性,雙方將共同得益于agent獨(dú)立任務(wù)完成能力的提升。

趨勢(shì)二:等待一個(gè)“殺手級(jí)”AI消費(fèi)級(jí)應(yīng)用

“2025年(AI應(yīng)用)下一個(gè)大事件屬于消費(fèi)?!泵绹?guó)紅杉資本合伙人Jess Lee表示,AI聊天、圖片、視頻已驗(yàn)證了其消費(fèi)市場(chǎng)潛力,接下來(lái)將看到全新的AI消費(fèi)社交APP、新形式的互動(dòng)媒體、基于聊天的游戲、新的搜索和信息整合工具、基于互動(dòng)式UI的聊天工具等?!?/p>

消費(fèi)賽道,一直是歷次技術(shù)創(chuàng)新浪潮下創(chuàng)業(yè)者和投資人高度關(guān)注的方向,如果回顧之前的技術(shù)周期會(huì)發(fā)現(xiàn),全球市值Top15的科技公司中,有9家是從To C消費(fèi)產(chǎn)品起家的。To C的公司上市時(shí),估值超過(guò)100億美元的比例,比To B公司高10%左右。

但在這一波生成式AI創(chuàng)業(yè)浪潮中,消費(fèi)AI應(yīng)用似乎在被創(chuàng)業(yè)者和資本遺忘。2024年,90%以上的A輪融資流向AI企業(yè)應(yīng)用。

不過(guò),自2024年下半年以來(lái),這個(gè)現(xiàn)象正在發(fā)生改變。

2024下半年以來(lái),資本市場(chǎng)對(duì)消費(fèi)級(jí)AI應(yīng)用的關(guān)注度上升,以硅谷孵化器Y Combinator 為例,其下半年孵化的消費(fèi)級(jí)AI產(chǎn)品數(shù)量比上半年翻番。

數(shù)據(jù)來(lái)源:Y Combinator, UpHonest Capital整理

2025年,消費(fèi)級(jí)AI應(yīng)用的“土地”正在被開墾,行業(yè)在等待一個(gè)“殺手級(jí)”AI消費(fèi)的應(yīng)用。風(fēng)險(xiǎn)投資機(jī)構(gòu)也對(duì)消費(fèi)級(jí)AI應(yīng)用的機(jī)會(huì)產(chǎn)生共識(shí)。YC Partner Michael Seibel表示,目前太多創(chuàng)始人尋找B2B的AI機(jī)會(huì),太少人探索消費(fèi)側(cè)的機(jī)會(huì),消費(fèi)創(chuàng)業(yè)者的機(jī)會(huì)來(lái)了;a16z提出“生成式AI或?qū)⒅厮軓穆糜?、心理治療到網(wǎng)購(gòu)等一切(消費(fèi)行為)?!扒癐ndex Ventures合伙人Rex Woodbury,稱現(xiàn)在是“消費(fèi)復(fù)興”的機(jī)會(huì)。

生成式AI對(duì)消費(fèi)端改變,體現(xiàn)在三個(gè)層面:首先,AI會(huì)逐漸改變?nèi)伺c人、人與信息交互的方式,形成新的流量入口;其次,AI搜索正在改變信息的分發(fā)方式,會(huì)創(chuàng)造新的商業(yè)機(jī)會(huì);第三,AI釋放PGC、UGC內(nèi)容創(chuàng)作潛力,使內(nèi)容消費(fèi)更加豐富多元。

以AI搜索為例,作為線上流量的第一入口,已經(jīng)久無(wú)戰(zhàn)事,生成式AI引入了新變量。2020年創(chuàng)立的生成式AI搜索初創(chuàng)You.com,近期完成5000萬(wàn)美元融資,價(jià)值7億美元了。OpenAI在7月發(fā)布AI搜索工具SearchGPT,其付費(fèi)用戶均可使用。

Perplexity是一家成立于2022年8月的美國(guó)AI創(chuàng)業(yè)公司,公司由前OpenAI研究科學(xué)家Aravind Srinivas和前Meta研究科學(xué)家Denis Yarats等聯(lián)合創(chuàng)立,專注于開發(fā)基于人工智能的對(duì)話式搜索引擎,旨在通過(guò)大型語(yǔ)言模型(如GPT-4和LLama2)為用戶提供精準(zhǔn)的搜索結(jié)果。Perplexity的界面更像是聊天屏幕,用戶可以通過(guò)自然語(yǔ)言提問(wèn),Perplexity會(huì)提供直接的答案,并附上詳細(xì)的引用來(lái)源,Perplexity 的用戶增長(zhǎng)非常迅速。2023年2月,Perplexity的月訪問(wèn)量達(dá)到1000萬(wàn),獨(dú)立訪客達(dá)到200萬(wàn)人。截至2024年4月,Perplexity 的月活躍用戶數(shù)便突破了1500萬(wàn)。Perplexity在短時(shí)間內(nèi)完成了多輪融資。截至2024年11月,Perplexity在新一輪融資中籌集了5億美元,使公司估值達(dá)到90億美元。投資方包括軟銀、亞馬遜創(chuàng)始人貝索斯和英偉達(dá)等多家知名企業(yè)和AI領(lǐng)域知名人士。

除了通用搜索引擎,生成式AI使垂直領(lǐng)域的搜索引擎更普遍,瓜分通用搜索引擎的注意力。例如,垂直于企業(yè)知識(shí)數(shù)據(jù)庫(kù)的搜索——Glean在9月份完成新一輪融資,估值達(dá)到46億美元,旨在優(yōu)化企業(yè)內(nèi)部數(shù)據(jù)檢索和問(wèn)題答復(fù),在近兩年中ARR翻倍增長(zhǎng);亞馬遜、沃爾瑪都在加強(qiáng)電商搜索引擎建設(shè),今年先發(fā)搜索助手,再發(fā)Agent。初創(chuàng)企業(yè)DayDream種子輪拿到了5000萬(wàn)美元投資,F(xiàn)orerunner、Index聯(lián)合領(lǐng)投。DayDream鏈接了超過(guò)2000+品牌,支持自然語(yǔ)言檢索,根據(jù)用戶提供的時(shí)間、地點(diǎn)、場(chǎng)合等信息給予相關(guān)產(chǎn)品推薦。Encore,YC24新一期孵化項(xiàng)目,是一個(gè)LLM驅(qū)動(dòng)的針對(duì)二手商品購(gòu)物的搜索引擎,鏈接美國(guó)多個(gè)二手商品網(wǎng)站,支持自然語(yǔ)言搜索以及按照主題的搜索;垂直于科研場(chǎng)景的搜索:初創(chuàng)企業(yè)Consensus與Perplexity有共同的投資人Nat Friedman和Daniel Gross,專注打造服務(wù)科研的搜索引擎,改變?nèi)藗儷@取和使用學(xué)術(shù)文獻(xiàn)的方式。2024年收入增長(zhǎng)了600%,月活40萬(wàn)用戶,ARR近200萬(wàn)美元。

也許明年會(huì)出現(xiàn)更多令人眼前一亮的垂直領(lǐng)域的AI搜索創(chuàng)新。

這一點(diǎn),美國(guó)紅杉在2025年的AI趨勢(shì)預(yù)測(cè)中也分享了一些思考,紅杉提出AI搜索或?qū)⒊蔀?025年的”殺手級(jí)“應(yīng)用,他們提出了兩點(diǎn)預(yù)測(cè):目前一個(gè)整體的搜索市場(chǎng)可能會(huì)碎片化,未來(lái)每個(gè)人可能會(huì)有專業(yè)AI搜索引擎——例如,Perplexity可能會(huì)成為投資人和分析師的第一搜索工具選擇,律師選擇Harvey,醫(yī)生選擇OpenEvidence……全新的生成式AI搜索引擎將緊密契合目標(biāo)用戶的“心智模式”,投資人、律師、醫(yī)生的思維模式各不相同,信息獲取模式、目的和決策思維各有差異,這些不同和差異就是生成式AI搜索引擎創(chuàng)新的機(jī)會(huì);消費(fèi)級(jí)和企業(yè)級(jí)應(yīng)用場(chǎng)景分化,每位知識(shí)工作者每天至少會(huì)使用兩款A(yù)I搜索引擎 —— 一款用于工作,另一款用于其他所有事務(wù)。

除了AI搜索,落到電商、音樂(lè)、社交、游戲、旅行和教育等直接To C的領(lǐng)域中,也各有生成式AI原生應(yīng)用的創(chuàng)新機(jī)會(huì)。

以旅行為例,Wanderboat是面向消費(fèi)者的AI旅行規(guī)劃工具,也是旅游內(nèi)容分享社區(qū)。它構(gòu)建了一個(gè)chatbot,可以根據(jù)用戶需求推薦、定制目的地及各類娛樂(lè)體驗(yàn)活動(dòng),還可以主動(dòng)學(xué)習(xí)用戶的興趣,定制專屬行程。基于創(chuàng)始人此前在微軟的經(jīng)驗(yàn),構(gòu)建了一些很有趣的小工具,比如用戶在查看地圖時(shí)也可以與AI互動(dòng),實(shí)時(shí)獲取一些信息和建議。在零付費(fèi)推廣的情況下,月活用戶數(shù)量達(dá)到了6位數(shù)。

一是多模態(tài)AI營(yíng)銷,從文字延展到音頻、視頻。形式從單點(diǎn)的chatbot延展到具有操作執(zhí)行能力的agent,并且準(zhǔn)確率和對(duì)于邊緣案例的覆蓋力隨著基石模型推理能力的提升增強(qiáng)。此外,如果生成式AI運(yùn)用得當(dāng),銷售、營(yíng)銷、客服對(duì)消費(fèi)者的洞察進(jìn)一步提高,可以創(chuàng)造更加個(gè)性化的服務(wù)、定制化體驗(yàn)。

GigaML是YC孵化的一家AI客服初創(chuàng),雖然這個(gè)方向競(jìng)爭(zhēng)激勵(lì),但實(shí)際GenAI應(yīng)用的滲透率還比較低,因?yàn)榭头趯?shí)際工作中有許多邊緣案例,現(xiàn)在大部分的GenAI應(yīng)用解決邊緣案例的表現(xiàn)一般,原有的自動(dòng)化客服足以解決基礎(chǔ)問(wèn)題,所以企業(yè)升級(jí)的動(dòng)力不足。GigaML發(fā)現(xiàn)將基石模型切換至o1-preview,加上大量的評(píng)估、調(diào)優(yōu)之后,錯(cuò)誤率大幅下降,從70%降至5%,并能夠解決8成的邊緣案例。在OpenAI最新推理模型加持下,客服用例值得期待。

Para和HeyGen分別是聲音和視頻營(yíng)銷的典型案例,Para利用AI生成個(gè)性化定制的聲音營(yíng)銷電話,幫助品牌激活用戶,幫助球隊(duì)活躍粉絲;HeyGen的AI視頻營(yíng)銷收入快速增長(zhǎng),據(jù)悉今年的年化ARR超過(guò)2000萬(wàn)美元,估值已達(dá)到5億美元。

AdsGency則是一個(gè)利用AI用戶數(shù)據(jù)洞察,實(shí)現(xiàn)精準(zhǔn)廣告營(yíng)銷的公司,創(chuàng)始人此前曾在滴滴、亞馬遜從事廣告、營(yíng)銷相關(guān)的產(chǎn)品工作。它的業(yè)務(wù)核心是廣告和用戶數(shù)據(jù),為客戶提供了一個(gè)全棧AI營(yíng)銷工具,覆蓋內(nèi)容創(chuàng)意、創(chuàng)作、投放、歸因等流程。AdsGency也代表了現(xiàn)在AI營(yíng)銷的一個(gè)發(fā)展趨勢(shì)—— 從Point Solution,到整個(gè)GTM的全流程自動(dòng)化解決方案。

趨勢(shì)三:企業(yè)應(yīng)用大模型朝模塊化方向發(fā)展

2024年,人工智能領(lǐng)域的一個(gè)顯著趨勢(shì)是模型的可組合性和模塊化發(fā)展,這種模塊化實(shí)現(xiàn)了從概念到規(guī)模化地落地。企業(yè)不再僅依賴于單一的“大模型”解決方案,而是可以根據(jù)具體需求,將不同的模塊進(jìn)行組合,定制出符合自己業(yè)務(wù)需求的能力。這種靈活性不僅能夠提升效率,還能降低成本,并且更好地滿足各行業(yè)對(duì)AI應(yīng)用的多樣化需求。

在技術(shù)架構(gòu)層面,傳統(tǒng)“大一統(tǒng)”的大模型被逐步拆解為功能與場(chǎng)景模塊,例如Amazon Bedrock提供了一系列生成AI的模塊化服務(wù),涵蓋文本生成、圖像生成、語(yǔ)音合成等功能,這些模塊化的服務(wù)可以幫助企業(yè)根據(jù)自己的需求進(jìn)行定制,支持跨行業(yè)的AI應(yīng)用,如生成個(gè)性化的營(yíng)銷文案、產(chǎn)品推薦和自動(dòng)化客服對(duì)話等服務(wù)。微軟推出了更加精細(xì)化的模塊化API,支持更加多樣化的場(chǎng)景,例如多語(yǔ)言客服、智能會(huì)議助手和自動(dòng)化客戶反饋系統(tǒng)。Transformer論文八位作者之一Aidan Gomez也瞄準(zhǔn)這一方向,估值55億美元的Cohere提供專為企業(yè)用例優(yōu)化的系列AI模型,在語(yǔ)言生成、多語(yǔ)言處理、多模態(tài)、語(yǔ)義檢索等方面各有所長(zhǎng),企業(yè)按需選擇、組合。

2025年,模塊化和抽象化設(shè)計(jì)將在多個(gè)領(lǐng)域得到廣泛應(yīng)用,特別是在人工智能和機(jī)器學(xué)習(xí)領(lǐng)域。這種設(shè)計(jì)方式將推動(dòng)AI系統(tǒng)的高效演化和自適應(yīng)能力,為AI技術(shù)的廣泛應(yīng)用提供更強(qiáng)大的支持。根據(jù)Gartner預(yù)測(cè),到2028年,至少15%的日常工作決策將通過(guò)代理AI自主做出。

這種趨勢(shì)表明,模塊化和抽象化設(shè)計(jì)將為AI系統(tǒng)的自主決策提供更強(qiáng)大的支持,推動(dòng)AI技術(shù)的廣泛應(yīng)用。并且,更多的技術(shù)企業(yè)將推出專為行業(yè)需求定制的AI模塊。例如,針對(duì)智能制造、智慧醫(yī)療、自動(dòng)駕駛等領(lǐng)域的具體需求,可能會(huì)出現(xiàn)更加精細(xì)化的模塊組合,企業(yè)可根據(jù)自己的數(shù)據(jù)和業(yè)務(wù)需求靈活選擇。而且隨著硬件能力的提升,這些模塊可能會(huì)更加高效,甚至實(shí)現(xiàn)更高的跨領(lǐng)域協(xié)同能力??傊?,這種模塊化大模型的發(fā)展將向縱深推進(jìn),技術(shù)、商業(yè)與社會(huì)的多重博弈將重塑行業(yè)格局。

總結(jié)

這場(chǎng)科技商業(yè)史上最大“賭局”,讓身處其中的投資者越來(lái)越感受到了曾經(jīng)硅谷早期的投資氛圍——押注一個(gè)未知的全新技術(shù)、等待一個(gè)超長(zhǎng)回報(bào)周期,而不是基于互聯(lián)網(wǎng)成熟技術(shù)的模式創(chuàng)新上迅速迭代和回血。

自從ChatGPT發(fā)布之后,硅谷正在吸引全球的目光。關(guān)注硅谷發(fā)生的故事,正在成為眾多的中國(guó)投資者甚至中國(guó)企業(yè)員工、公關(guān)必做的事,大家試圖從這些持續(xù)關(guān)注中獲得最前沿的信息和生成式AI最前線所發(fā)生的故事,從而試圖判斷新的商業(yè)方向。

誰(shuí)也不知道這場(chǎng)生成式AI的變革會(huì)將商業(yè)引向何方,也同樣預(yù)測(cè)不到新技術(shù)的迭代如此之快。

在過(guò)去的幾年里,聽到最多的便是企業(yè)對(duì)生成式AI的抱怨“我們知道它重要,但我們?nèi)匀徊恢廊绾斡迷谧约旱膱?chǎng)景中”,這種抱怨帶著一些敬畏——“不上大模型一定會(huì)被淘汰”。投資者在不斷推高的估值和融資中,快要喪失信心。動(dòng)輒幾十億美金的融資,再加上Scaling Law之下,不斷增加的數(shù)據(jù)中心的投資,讓他們望而卻步。這也表明,2025年將是生成式AI讓人們看到賺錢希望的一年,投資者和創(chuàng)業(yè)者同樣需要信心。

AI Agent元年,這個(gè)發(fā)端于學(xué)術(shù)界的概念將會(huì)落到實(shí)際,并產(chǎn)生價(jià)值,企業(yè)將會(huì)使得生成式AI變得更加好用,并切實(shí)轉(zhuǎn)化為價(jià)值。與此同時(shí),消費(fèi)級(jí)的AI應(yīng)用將會(huì)讓人們切實(shí)感受到生成式AI帶來(lái)的生活的變化。

垂直領(lǐng)域的模型正在成為通用大模型的補(bǔ)充,讓更多企業(yè)釋放AI的價(jià)值。垂直行業(yè)中,將會(huì)出現(xiàn)越來(lái)越多的AI搜索應(yīng)用,滿足人們不同領(lǐng)域的需求。

2025年,從生成式AI來(lái)說(shuō),一些泡沫會(huì)破滅,一些企業(yè)能夠從中賺到錢。技術(shù)新陳代謝快速而殘酷,這場(chǎng)競(jìng)爭(zhēng)中沒(méi)有老手,都是新人,昔日的領(lǐng)軍者亦有可能跌落神壇,最先關(guān)注到技術(shù)和商業(yè)的變化,并做出行動(dòng)的企業(yè),才能在這場(chǎng)競(jìng)爭(zhēng)中生存下來(lái)。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。