文|產(chǎn)業(yè)家 斗斗
編輯 | 皮爺
回顧 2014 年,從年初的熱潮到年中的理性回歸,再到年末的穩(wěn)步前行,大模型產(chǎn)業(yè)經(jīng)歷了從狂熱到理性的轉變。這其中,AI 大模型不僅在技術上取得了顯著進步,更在應用領域實現(xiàn)了廣泛拓展,為各行各業(yè)帶來了前所未有的機遇與挑戰(zhàn)。
產(chǎn)業(yè)家特此總結了2024年AI大模型發(fā)展的十大趨勢。以見證變化,見證產(chǎn)業(yè) AGI 的到來。
2025年1月,全球科技界的目光再次聚焦于美國拉斯維加斯的CES大會。
在這場匯聚全球頂尖科技企業(yè)、創(chuàng)新產(chǎn)品與前沿技術的盛會上,AI 無疑成為了最耀眼的明星,尤其是大模型技術,以一系列令人驚嘆的落地應用,全方位展示了其強大的實力與廣闊的應用前景。
這不僅為2024年 AI 大模型的“狂飆”之年畫上了圓滿的句號,也預示著 AI 技術將在新的一年里繼續(xù)引領科技發(fā)展的新風潮。
從去年 3 月份,政府工作報告中首次將“人工智能+”納入其中,到大模型服務價格的飛速下降,使得更多企業(yè)能夠以較低的成本獲取到強大的AI能力,推動了大模型在各行各業(yè)的廣泛應用。
與此同時,國內(nèi)開源大模型的奮起直追,打破了國外大模型在市場上的壟斷地位,為國內(nèi) AI 技術的自主創(chuàng)新和發(fā)展提供了有力支撐。
2024 年無疑是AI大模型充滿變革與突破的一年。
年初,隨著大模型技術的不斷突破和應用場景的拓展,市場對大模型的熱情達到了頂峰,眾多企業(yè)和資本紛紛涌入這一領域,希望能夠借助大模型的力量實現(xiàn)業(yè)務的轉型升級和創(chuàng)新發(fā)展。
然而,隨著市場的不斷深入和競爭的加劇,人們逐漸意識到大模型并非萬能,其在實際應用中還面臨著諸多挑戰(zhàn)和局限性,如高昂的訓練成本、數(shù)據(jù)隱私和安全問題、模型的可解釋性和可靠性等。
這使得市場對大模型的期望逐漸回歸理性,開始更加注重其在特定場景下的實際應用效果和商業(yè)價值,而非盲目追求模型的規(guī)模和性能。
回顧 2014 年,從年初的熱潮到年中的理性回歸,再到年末的穩(wěn)步前行,大模型產(chǎn)業(yè)經(jīng)歷了從狂熱到理性的轉變。這其中,AI 大模型不僅在技術上取得了顯著進步,更在應用領域實現(xiàn)了廣泛拓展,為各行各業(yè)帶來了前所未有的機遇與挑戰(zhàn)。
產(chǎn)業(yè)家特此總結了過去一年AI大模型發(fā)展的十大趨勢。以見證變化,見證產(chǎn)業(yè) AGI 的到來。
一、大模型“祛魅”在 2024
2024 年,大模型領域經(jīng)歷了顯著的變化。
融資方面,根據(jù)桔子IT的數(shù)據(jù),2024 年 1 月 1 日至 12 月 5 日,國內(nèi) AI 領域共發(fā)生 439 起融資案例,總融資額超過 564 億元人民幣,約為去年的 80%。月均融資金額不足 50 億元,顯示出市場對AI投資的謹慎態(tài)度。
清科研究中心的統(tǒng)計也顯示,今年上半年國內(nèi)早期投資、風險投資(VC)、私募股權投資(PE)機構數(shù)量同比分別減少了 23.9%、19.2% 和 25.2%,反映出投資者在面對AI領域的高投入和不確定回報時變得更加謹慎和理性。
技術應用方面,2023 年眾多大模型廠商主要專注于優(yōu)化模型參數(shù)、提升模型性能、爭奪榜單排名等,渴望成為中國的OpenAI。
然而,進入 2024 年后,行業(yè)參與者變得更加務實,開始更加關注 AI 技術的落地場景和商業(yè)化應用。市場對大模型的“祛魅”過程使得其在實際應用中的局限性逐漸顯現(xiàn),投資者也更加關注AI技術的實際應用效果和商業(yè)價值,而非單純的技術指標和排名。
這種趨勢促使 AI 企業(yè)更加注重產(chǎn)品的實用性和市場適應性,推動AI技術在各個領域的深入應用。
市場競爭方面,大模型的價格戰(zhàn)貫穿了整個 2024 年,每百萬 token 的價格從百元直降至幾厘。這種價格戰(zhàn)不僅降低了大模型的使用門檻,也對企業(yè)的盈利模式提出了新的挑戰(zhàn)。
總體來看,2024 年 AI 行業(yè)的發(fā)展呈現(xiàn)出更加務實和理性的特點,市場對AI技術的關注點從單純的技術指標轉向了實際應用和商業(yè)價值,企業(yè)也更加注重產(chǎn)品的實用性和市場適應性,同時市場競爭的加劇也促使企業(yè)不斷調(diào)整盈利模式。
二、創(chuàng)新 AI 架構,不斷涌現(xiàn)
在 2024 年,AI 領域涌現(xiàn)出許多創(chuàng)新架構,這些架構在性能上與傳統(tǒng)的 Transformer 模型相媲美,同時在內(nèi)存效率和可擴展性方面也表現(xiàn)出顯著優(yōu)勢。
Transformer 架構自推出以來,憑借其自注意力機制(Self-Attention, SA)在自然語言處理、圖像生成等任務中取得了巨大成功。
然而,隨著模型參數(shù)的不斷增加,Transformer的算力需求和計算復雜性呈指數(shù)級增長,這在大規(guī)模任務中逐漸成為瓶頸。
為了應對這一挑戰(zhàn),全球范圍內(nèi)的學者和研究人員從多個角度積極探索新的架構設計。
例如,Meta Platforms推出的“記憶層”技術,通過引入高效的查詢機制,顯著降低了模型在存儲和檢索數(shù)據(jù)時的計算成本。這種技術在參數(shù)數(shù)量僅為1.3億的基礎模型上,添加了128億的記憶參數(shù),使得模型的性能與更大規(guī)模的模型相當,但計算所需的算力卻大幅減少。
此外,混合專家模型(MoE)也逐漸受到關注。MoE架構通過將模型分解為多個專家子模型,每個子模型只在特定任務中被激活,從而大幅提高了模型的算力效率。
除了這些架構創(chuàng)新,元始智能的RWKV架構也引起了廣泛關注。RWKV通過將Transformer的高效并行訓練與RNN的高效推理能力相結合,實現(xiàn)了在效率和語言建模能力上的突破。盡管RNN在過去被認為能力弱于Transformer,但RWKV通過引入強化學習方法,使得模型能夠在必要時重新閱讀前文,從而提升了其記憶能力和整體性能。
這些新架構的涌現(xiàn),不僅在技術上為AI的發(fā)展提供了新的可能性,也為解決算力開銷問題提供了有效的解決方案。隨著這些創(chuàng)新架構的不斷成熟和應用,未來的AI系統(tǒng)將能夠更好地平衡性能與資源消耗,推動AI技術在更廣泛的領域中實現(xiàn)突破和應用。
圖片來源:量子位《2024年度AI十大趨勢報告》
三、模型訓練成本降低
隨著人工智能技術的快速發(fā)展,AI模型訓練成本一直是業(yè)界關注的重點。2024年,通過算法優(yōu)化、硬件升級和云計算服務的普及,這一成本顯著降低。
算法優(yōu)化是降低訓練成本的關鍵因素之一。例如,DeepSeek v3模型通過采用先進的算法優(yōu)化技術,僅以557萬美元的訓練成本,便達到了與Claude 3.5 Sonnet等頂級模型相媲美的性能。
硬件的升級也為成本降低提供了堅實基礎。隨著GPU等硬件性能的不斷提升,單位計算能力的成本逐漸下降。DeepSeek v3在訓練過程中使用了2048個H800 GPU,僅用了不到2個月的時間就完成了訓練,這種硬件進步使得大規(guī)模模型的訓練變得更加經(jīng)濟高效。
云計算服務的普及為降低訓練成本提供了另一重要途徑。云服務提供商通過優(yōu)化資源分配和管理,使企業(yè)可以根據(jù)實際需求靈活租用計算資源,降低了初始投資和運營成本。此外,云平臺還提供了強大的數(shù)據(jù)存儲和處理能力,進一步支持了AI模型的訓練和部署。
算法優(yōu)化、硬件升級和云計算服務的普及共同作用,大幅降低了AI模型訓練成本,使得AI技術更加經(jīng)濟且提高了模型性能。這使得更多企業(yè)和研究機構能夠負擔得起AI模型的開發(fā)和應用,推動了人工智能技術的廣泛應用和創(chuàng)新。
總之,2024 年 AI 模型訓練成本的顯著降低,為人工智能的發(fā)展帶來了新的機遇和挑戰(zhàn)。隨著技術的進一步進步,AI模型訓練成本將繼續(xù)下降,將推動AI技術在更多領域的應用和突破。
四、RAG,從“萬能鑰匙”到專攻“小而難”
2024年,RAG(檢索增強生成)技術經(jīng)歷了顯著的架構變化和市場趨勢的轉變。
RAG由檢索和大模型生成兩部分組成,其核心優(yōu)勢在于能夠避開大模型上下文窗口長度的限制、更好地管理和利用客戶專有的本地資料文件以及控制幻覺。
然而,隨著大模型上下文窗口長度的增加,RAG在解決上下文窗口限制方面的優(yōu)勢逐漸減弱,但其在管理和利用專屬知識文件以及控制幻覺方面的能力變得更加重要。
在2024年上半年,市場對AI的期望是“無所不能,大而全”,RAG技術被視為解決復雜問題的萬能鑰匙。
然而,隨著技術的深入應用和實際落地,行業(yè)逐漸回歸理性,開始更加注重“小而難”的問題解決。企業(yè)開始將大模型技術引入業(yè)務中,要求高、需求剛、付費爽快,這使得RAG在業(yè)務流程中的“白盒流程多”、“易控”等特點受到企業(yè)客戶和開發(fā)者的青睞。
一個數(shù)據(jù)顯示,RAG架構在企業(yè)級AI設計模式中的采用率從31%上升至51%,成為主流趨勢。
這一變化反映了RAG技術在實際應用中的價值逐漸顯現(xiàn),尤其是在企業(yè)知識管理系統(tǒng)、在線問答系統(tǒng)和情報檢索系統(tǒng)等領域。RAG技術的應用不僅提高了信息檢索的準確性和效率,還為企業(yè)提供了更加個性化和精準的解決方案。
在技術層面,RAG的架構也在不斷優(yōu)化和深化應用。
例如,通過提高檢索效率、擴展上下文長度和增強系統(tǒng)魯棒性等措施,RAG技術能夠更好地處理復雜的信息檢索任務。此外,多模態(tài)RAG的出現(xiàn)將RAG的能力拓展到了文本之外的更廣闊領域,如圖像、視頻等,實現(xiàn)了文本和視覺數(shù)據(jù)之間的無縫交互。
展望未來,RAG的價值將更加體現(xiàn)在實際應用中,成為推動AI落地的核心引擎。隨著技術的不斷發(fā)展和市場需求的不斷變化,RAG技術將繼續(xù)在企業(yè)級AI應用中發(fā)揮重要作用,幫助企業(yè)更好地管理和利用知識資源,提升業(yè)務效率和競爭力。
五、Agent,引領一波新變革
今年下半年,AI Agent(人工智能代理)成為了科技界的熱門話題。
全球科技巨頭如微軟、蘋果、谷歌、OpenAI和Anthropic等紛紛公布了相關進展。在國內(nèi)市場,百度、阿里、騰訊等企業(yè)也相繼推出了各自的智能體平臺。
一個數(shù)據(jù)顯示,智能體架構已經(jīng)成功支撐了12%的實施項目。
這表明AI驅動的解決方案將通過軟件完全操作,從而提升效率和靈活性。隨著技術的不斷進步,越來越多的企業(yè)開始采納AI Agent技術,以實現(xiàn)更高的自動化水平和更高效的運營方式。
例如,在零售領域,AI Agent可以作為購物助手,為用戶提供個性化的購物體驗。在醫(yī)療領域,Agent技術能夠幫助管理和分析醫(yī)療記錄,提高醫(yī)療服務的效率。
然而,盡管AI Agent技術備受期待,其可信度問題也引發(fā)了廣泛的關注。
大型語言模型(LLM)容易受到虛假信息的影響,這可能導致AI Agent在執(zhí)行任務時出現(xiàn)錯誤。為了解決這一問題,研究人員正在探索多種方法來提高Agent的可信度。
例如,通過引入檢索增強生成(RAG)技術,結合外部知識庫來指導文本生成,從而提高模型的準確性和可靠性。此外,透明的運行過程和靈活的糾正機制也是構建可信Agent的重要基礎。
六、多模型策略盛行
在2024年,企業(yè)界出現(xiàn)了一個顯著的趨勢:不再依賴單一的大模型,而是采取務實的多模型策略。這種策略的核心在于根據(jù)不同的使用場景和業(yè)務需求,選擇合適的模型進行部署。這種轉變不僅提高了模型的靈活性和適應性,還能夠更好地滿足企業(yè)多樣化的業(yè)務需求。
數(shù)據(jù)顯示,OpenAI的市場份額從50%下降至34%,這表明其先發(fā)優(yōu)勢有所減弱。
與此同時,Anthropic的市場份額從12%翻倍至24%,成為主要受益者。Anthropic的Claude系列模型,尤其是最新的Claude 3.5 Sonnet,在多學科綜合推理方面的能力顯著提升,吸引了許多企業(yè)從GPT-4轉向Claude。
這種市場變化反映了企業(yè)在選擇AI供應商時,更加注重模型的安全性、價格、性能和擴展功能。
多模型策略的興起,使得企業(yè)在面對復雜的業(yè)務場景時,能夠更加靈活地選擇和組合不同的模型。
例如,在金融服務領域,企業(yè)可能需要一個能夠處理復雜數(shù)據(jù)和嚴格法規(guī)的模型,而在媒體和娛樂領域,則需要一個能夠生成高質量內(nèi)容的模型。通過多模型策略,企業(yè)可以在不同的業(yè)務部門和應用場景中,選擇最適合的模型來提高效率和效果。
此外,多模型策略還促進了企業(yè)內(nèi)部的技術創(chuàng)新和協(xié)作。企業(yè)可以根據(jù)自身的業(yè)務需求,開發(fā)和優(yōu)化特定的模型,從而在競爭中獲得優(yōu)勢。例如,一些企業(yè)通過大模型與小模型的協(xié)同工作,實現(xiàn)了更高效的業(yè)務流程和更好的用戶體驗。
總體來看,多模型策略的盛行不僅改變了AI市場的競爭格局,也為企業(yè)的數(shù)字化轉型提供了新的思路和方法。隨著技術的不斷進步和應用的深入,這種策略將繼續(xù)推動企業(yè)創(chuàng)新和發(fā)展,為企業(yè)創(chuàng)造更多的商業(yè)價值。
七、具身智能,站上C位
2024年,具身智能作為人工智能領域的一個重要分支,逐漸成為研究和應用的熱點。
在日常生活中,具身智能的應用已經(jīng)初露端倪。
例如,智能掃地機器人能夠通過感知周圍環(huán)境,自動規(guī)劃清潔路徑,避免碰撞障礙物,高效完成清潔任務。自動駕駛汽車在實際道路測試中也展現(xiàn)出與人類駕駛員相似的駕駛能力,能夠識別交通信號、行人和車輛,做出實時的駕駛決策。
人形機器人也被認為是實現(xiàn)具身智能的理想平臺之一。
具體來看,其不僅能夠模仿人類的外觀,還能通過集成先進的傳感器和算法,執(zhí)行更加復雜的任務。
隨著技術的不斷進步,具身智能在多個領域展現(xiàn)出其獨特的價值和潛力。在工業(yè)領域,具身智能機器人可以提高生產(chǎn)效率和安全性,執(zhí)行復雜的裝配、搬運和檢測任務。在服務業(yè),它們可以提供更加高效和個性化的服務,如酒店前臺接待、餐廳服務等。
此外,具身智能還在探索新的應用場景,如在災害救援中代替人類進入危險區(qū)域進行搜救。
盡管具身智能在技術上取得了顯著進展,但仍面臨一些挑戰(zhàn)。
例如,硬件的穩(wěn)定性和成本問題、多模態(tài)數(shù)據(jù)的整合與處理、以及在復雜環(huán)境中的適應能力等。然而,隨著研究的深入和技術的突破,這些問題有望逐步得到解決,具身智能將在更多領域實現(xiàn)商業(yè)化應用。
總之,具身智能作為人工智能與機器人技術的結合體,正逐步改變?nèi)藗兊纳詈凸ぷ鞣绞?。它不僅為人類提供了更加智能和便捷的服務,也為各行各業(yè)的發(fā)展帶來了新的機遇和挑戰(zhàn)。
八、向量數(shù)據(jù)庫逐漸“替代”傳統(tǒng)數(shù)據(jù)庫
向量數(shù)據(jù)庫作為一種新興的數(shù)據(jù)庫技術,近年來在人工智能領域迅速崛起,逐漸成為傳統(tǒng)數(shù)據(jù)庫的重要補充甚至替代者。
與傳統(tǒng)數(shù)據(jù)庫不同,向量數(shù)據(jù)庫通過將數(shù)據(jù)轉化為向量形式,能夠更精確地表示數(shù)據(jù)的特征或類別,從而實現(xiàn)高效的相似性搜索和范圍查詢。
隨著人工智能技術的飛速發(fā)展,特別是大模型的廣泛應用,向量數(shù)據(jù)庫的需求也在不斷增加。大模型通常需要處理大量的高維數(shù)據(jù),向量數(shù)據(jù)庫能夠有效地支持這些數(shù)據(jù)的存儲和檢索。
例如,生成式AI和檢索增強生成(RAG)架構等應用,都需要向量數(shù)據(jù)庫來存儲和檢索大量的知識庫嵌入。
一組數(shù)據(jù)顯示,2024年,全球數(shù)據(jù)庫市場規(guī)模首次突破千億美金,達到約1010億美元,其中中國數(shù)據(jù)庫市場規(guī)模為74.1億美元,占全球的7.34%。
這一數(shù)據(jù)表明,向量數(shù)據(jù)庫作為新興技術,正在逐漸成為數(shù)據(jù)庫市場的重要組成部分。
目前,全球數(shù)據(jù)庫供應商數(shù)量為167家,產(chǎn)品數(shù)量達到269款。隨著技術的不斷發(fā)展和市場需求的增加,預計向量數(shù)據(jù)庫的市場份額將繼續(xù)擴大。
向量數(shù)據(jù)庫的市場趨勢也顯示出其巨大的發(fā)展?jié)摿ΑR环矫?,向量?shù)據(jù)庫與傳統(tǒng)數(shù)據(jù)庫的融合正在不斷加深,許多傳統(tǒng)數(shù)據(jù)庫廠商也開始逐步集成向量檢索的能力。另一方面,向量數(shù)據(jù)庫的成本也在逐漸下降,預計未來幾年將出現(xiàn)3-5倍的成本下降。這將進一步推動向量數(shù)據(jù)庫在各個行業(yè)的應用和普及。
總之,向量數(shù)據(jù)庫憑借其在處理高維數(shù)據(jù)和非結構化數(shù)據(jù)方面的獨特優(yōu)勢,正在逐漸改變傳統(tǒng)數(shù)據(jù)庫市場的格局。隨著人工智能技術的不斷發(fā)展,向量數(shù)據(jù)庫的應用前景將更加廣闊,有望在更多領域發(fā)揮重要作用。
九、多模態(tài)模型成為2024賽點
2024年,多模態(tài)能力已成為AI大模型的基本標配。幾乎所有主要的模型供應商都發(fā)布了多模態(tài)模型,能夠處理圖像、音頻和視頻輸入。
例如,字節(jié)跳動在2024年推出了 PixelDance 和 Seaweed 兩款視頻生成模型,這些模型在視頻生成的質量和效率上都有顯著提升。
騰訊的混元大模型也在2024年升級為混合專家模型(MoE)架構,參數(shù)規(guī)模達萬億,擅長處理復雜場景和多任務場景。
智象未來科技有限公司在2024年12月發(fā)布了智象多模態(tài)生成大模型3.0版,該模型在圖像和視頻生成能力上實現(xiàn)了全面升級。
科大訊飛的訊飛星火大模型4.0 Turbo也在多模態(tài)應用中表現(xiàn)出色,支持多語種語音識別和高度擬人化的語音合成能力。
這些多模態(tài)模型的發(fā)布不僅推動了技術的進步,還為實際應用帶來了新的可能性。
例如,多模態(tài)模型可以用于更復雜的場景理解,如通過圖像和音頻的結合來更好地理解用戶的需求和意圖。此外,多模態(tài)生成能力的提升也使得生成高質量的圖像和視頻內(nèi)容變得更加容易。
隨著多模態(tài)模型的普及,其應用場景也在不斷擴展。在教育領域,多模態(tài)模型可以用于開發(fā)更具互動性的學習工具,通過圖像和音頻的結合來提高學習效果。在醫(yī)療領域,多模態(tài)模型可以幫助醫(yī)生更好地分析醫(yī)學影像和患者數(shù)據(jù)。在娛樂和創(chuàng)意產(chǎn)業(yè),多模態(tài)生成模型可以用于創(chuàng)作新的藝術作品和影視內(nèi)容。
十、從大到小,從通用到垂直
2024年,小模型在特定領域展現(xiàn)出了顯著的優(yōu)勢。
這些小模型因其較低的計算復雜度和資源消耗而備受青睞,尤其是在資源受限的環(huán)境中,如移動設備和邊緣計算節(jié)點。它們不僅能夠高效運行,而且往往針對特定任務進行了優(yōu)化,使得在某些應用場景下,它們的表現(xiàn)甚至能與大型模型相媲美,有時還能超越。
此外,小模型的可解釋性更強,更易于用戶理解和接受。以 OpenAI 的 GPT-4o mini 為例,盡管成本降低,但其性能卻得到了提升,這得益于數(shù)據(jù)集和訓練方法的改進。
在特定領域,垂直模型也展現(xiàn)出了超越通用模型的能力。
例如,在法律咨詢、化工研究和醫(yī)療服務等領域,定制化的AI模型能夠更深入地理解和處理專業(yè)知識,提供更準確和有針對性的服務。
這些專業(yè)模型不僅有助于解決行業(yè)內(nèi)特有的問題,還促進了相關行業(yè)的快速發(fā)展。隨著各行業(yè)對AI技術需求的增長,預計未來將有更多垂直模型出現(xiàn),進一步推動各行業(yè)的智能化轉型。
這些模型的出現(xiàn),標志著AI技術正朝著更精細化、專業(yè)化的方向發(fā)展,為各行各業(yè)帶來更高效的解決方案。
寫在最后:
從市場對大模型的“祛魅”到創(chuàng)新AI架構的涌現(xiàn),再到模型訓練成本的降低,2024這一年,見證了AI技術的快速發(fā)展和應用場景的擴展。
RAG技術從“萬能鑰匙”轉變?yōu)閷W⒂诮鉀Q“小而難”的問題,而AI Agent(智能體)技術則引領了一波新的變革。
多模型策略的盛行和具身智能的關注度提升,進一步推動了AI技術在各個領域的應用。
向量數(shù)據(jù)庫的興起和多模態(tài)模型的普及,標志著AI技術在處理非結構化數(shù)據(jù)和多模態(tài)信息方面的能力增強。
最后,從小模型在特定領域的顯著優(yōu)勢到垂直模型的超越通用模型的能力,AI技術正朝著更精細化、專業(yè)化的方向發(fā)展,為各行各業(yè)帶來更高效的解決方案。
這一年的發(fā)展不僅展示了AI技術的潛力,也為未來的智能化轉型奠定了堅實的基礎。