正在閱讀:

大模型狂飆半年,“群模亂舞”誰能勝出?

掃一掃下載界面新聞APP

大模型狂飆半年,“群模亂舞”誰能勝出?

“軍備賽”開始了。

文|壹DU財經(jīng)

毫無疑問,當前的科技圈已進入“大模型”時代。含“?!绷看蟮绞裁闯潭龋康部萍计髽I(yè),基本都在做“大模型”。

“從去年12月ChatGPT(Chat Generative Pre-trained Transformer)引爆科技圈之后,幾乎所有行業(yè)玩家都想抓住這根救命稻草。因為做成了就意味著抓住未來幾十年的趨勢?!毙袠I(yè)創(chuàng)業(yè)者夏先生對壹DU財經(jīng)說道:“ChatGPT是生成式AI,是大模型的落地場景之一。理論上講,這條路的走通,加速了大模型在短期內(nèi)的爆發(fā)。”

的確,ChatGPT的爆發(fā),讓更多人看到了語言模型的魅力。微軟、谷歌、百度、阿里等

國內(nèi)外科技巨頭快速響應,相繼推出自家的AI聊天機器人,試圖以To C作為切入口,搶占市場。

風口在哪里,資金和人才就在哪里。隨后,先是廠商陸續(xù)宣布推出大模型,如百度的文心大模型、阿里的通義大模型、騰訊的行業(yè)大模型,后有科技圈曾經(jīng)的風云人物也開始陸續(xù)入場,李開復、王小川、周伯文、王慧文等。出行、認知、辦公等一些垂直領域的大模型也相繼推出。

半年時間,國內(nèi)呈現(xiàn)出“群模亂舞”盛況。而在經(jīng)歷喧囂后,大模型或許是時候回歸現(xiàn)實了。

玩家們開始意識到,最初的熱鬧僅僅是熱鬧,他們最終的戰(zhàn)場在B端市場。此時,多家有著人工智能積累和云計算大廠登臺,相繼推出了AI大模型服務。

行業(yè)老炮和新手創(chuàng)業(yè)者的對決,也就此開始了。

01 熱情高漲,玩家們跑步入場

進入2023年,大模型技術讓科技圈沸騰起來??吹紺hatGPT爆發(fā)后,不少大廠抓緊時間推出相應產(chǎn)品,新老創(chuàng)業(yè)者們著急招兵買馬,生怕慢一步就錯過了這難得的風口。一級市場關于大模型的投融資熱度也在攀升,不少FA開始瘋狂補課。

一時間,整個行業(yè)熱鬧非常。

在OpenAI發(fā)布GPT4大模型后,第一個采取行動的是百度,在3月16日用“Demo演示”的形式正式發(fā)布文心一言。同樣在3月,已經(jīng)沉寂許多的周鴻祎推出大模型產(chǎn)品,甚至連名字都沒來得及取。

在此之后,科技巨頭、創(chuàng)業(yè)公司和高校研究院們展開了一場關于“大模型”的競速賽。整個4月,都成了“大模型的發(fā)布月”,華為、商湯、阿里都在4月份亮出了自己的大模型產(chǎn)品。

到了5月,訊飛推出了自己的星火大模型,并公布了大模型在自己優(yōu)勢領域的諸多應用場景。

創(chuàng)業(yè)者們也在火速入場。原美團聯(lián)合創(chuàng)始人王惠文(目前已退出)、創(chuàng)新工場CEO李開復、前京東AI掌門人周伯文、前阿里技術副總裁賈揚清等開始招兵買馬。前搜狗CEO王小川的百川智能拿到5000萬美元融資后,甚至揚言:“今年年底做到國內(nèi)最好的”。

“這波創(chuàng)業(yè)熱潮有點2000年左右的互聯(lián)網(wǎng)創(chuàng)業(yè)潮的意思。”一位業(yè)內(nèi)人士說道:“似乎每個創(chuàng)業(yè)者都想在這個時代找到第二春?!?/p>

總體來看,今年上半年,大模型幾乎成為所有科技企業(yè)的必選項。對于普通人而言,大模型或許是件很遙遠的事。畢竟不是每次科技浪潮都能成功靠岸,如元宇宙、XR等行業(yè)。

但事實上,大模型的應用更多在B端市場。那么,在行業(yè)烈火烹油過后,擺在這些玩家眼前的,理應是他們對市場更多的理性思考。比如市場是否真的需要大模型?大模型真正走向成熟,需要越過哪些重要關卡?能否真正意義上實現(xiàn)商業(yè)化。

02 “軍備賽”開打

大模型軍備賽的沖鋒號吹響后,整個行業(yè)開始“卷”起來。更多玩家已經(jīng)將視線移至應用層面。因為行業(yè)“退燒”后,最終考驗的還是玩家們的“硬實力”。

此時,一些在人工智能、云計算上有積累的玩家則占據(jù)的先發(fā)優(yōu)勢。尤其是模型的參數(shù)量。

就目前市場上發(fā)布的AI模型來看,雖然大家都自稱為“大模型“,但參數(shù)量實質(zhì)是大模型和小模型的界定因素之一。

此前,百度集團副總裁侯震宇在接受媒體采訪時曾表示,2022年,10億參數(shù)的模型就叫大模型。但到了眼下,千億參數(shù)以上才會出現(xiàn)“智能涌現(xiàn)”,才會形成泛化能力,才能在各個場景下具備通用能力。

何為“智能涌現(xiàn)”?簡單地講,當模型規(guī)模、算力水平超過某個參數(shù)閾值后,AI效果將不再是隨機概率事件。比如初期語言大模型出現(xiàn)“圖不對文”“答非所問”等現(xiàn)象。

并且在通用領域,參數(shù)量越大,智能通常涌現(xiàn)的可能性就越大,AI準確率就越高。在垂直領域則更容易獲得精確的效果。

今年5月,科技部下屬的中國科學技術信息研究所發(fā)布的《中國人工智能大模型地圖研究報告》統(tǒng)計,截至5月28日,國內(nèi)10億級參數(shù)規(guī)模以上基礎大模型至少已發(fā)布79個。

但可以看到,10億級參數(shù)這個量級,很可能不是真正的“分界線”。因為現(xiàn)實的情況是,一些未能達到千億規(guī)模的模型,很難在當前市場的競爭具有競爭力。不過,也不排除一些在垂直領域深耕的玩家,最終能跑出來。

“大模型需要算力、算法和數(shù)據(jù)積累,絕對不是玩概念的事情,最終還是要市場買單?!毕南壬J為,目前來看諸如百度、騰訊、阿里無論是在資源還是積累上,都有一定的優(yōu)勢,“他們在云市場深耕,并在自己擅長的領域積累多年,無論技術層面還是行業(yè)積累上,實質(zhì)已經(jīng)完成了搶跑,未來就看這些頭部玩家如何落地?!?/p>

而在投入層面,這會是一個天文數(shù)字。

以百度為例。據(jù)透露,過去10年,百度在AI方向的投入已超過1000億元。但大模型不是投一筆錢、做一個模型那么簡單,它需要有算力、有數(shù)據(jù)、有經(jīng)驗豐富的AI工程師在好的研發(fā)平臺上長期積累。

而創(chuàng)業(yè)公司如果直接去做基礎大模型,除了上述投入之外,還需要能夠把模型、算力管理好的AI開發(fā)平臺。

這意味著,創(chuàng)業(yè)公司不論是自建開發(fā)平臺,還是采購外包平臺,其投入都不會是小數(shù)目。并且,大模型不是預訓練出來就好,更需要后續(xù)持續(xù)敏捷迭代。從這一點看,創(chuàng)業(yè)公司所受的限制明顯要高于大公司。

但大廠很難留住強算法人才的弊端也比較突出,因為大模型投入是一件長期主義的事,必定會面臨與既有業(yè)務之間的沖突。這一點,從大廠出走的大模型創(chuàng)業(yè)者的經(jīng)歷,就說明了一點。長期主義對創(chuàng)業(yè)公司同樣重要,無論是創(chuàng)始人的背景背書,還是資源合作,抑或是客戶的拓展,都需要長期積淀。

03 行業(yè)競賽即將鳴槍

人工智能專家侯世達的學生梅拉妮·米歇爾《AI 3.0時代》一書中提到,研究人工智能與賽道中的創(chuàng)業(yè)者們都熟悉了一種模式——先是“人工智能的春天”,緊接著是過度的承諾和媒體炒作,接下來便是“人工智能的寒冬”。并且,他認為這一模式將以五到十年為周期不斷上演。

具體到2023年上半年的大模型賽道,顯然其正處于第二個階段——行業(yè)很火,市場很熱。這一周期往往是最短的,也通常意味著如此去泡沫化后,賽道競爭即將正式開始。

大模型比拼的不僅僅是技術,還應該將重點放在大模型應用、產(chǎn)業(yè)生態(tài)中去評估。

目前,市場上大模型的玩家主要分三類。

一是聚焦基礎層,主要對標OpenAI,發(fā)揮基礎設施的作用。

第二類是錨定中間層,不需要像OpenAI一樣花大錢做底層,只需要掌握通用化能力,就可以通過開源大模型做精調(diào),讓模型具備差異化能力,最終可以形成垂直類模型。

第三類是調(diào)用大模型API的企業(yè),專注開發(fā)大模型具體場景的應用,如Jasper。

相對而言,前兩類又是大模型的“基礎設施”,因為有極高的門檻,對技術、資金以及資源有嚴格的準入壁壘,往往是大公司布局的主要方向。

目前來看,百度、阿里和華為在大模型的構建上,不約而同地采用了“模型+工具平臺+生態(tài)”的三層共建模式。騰訊云則更專注于應用層而,6月19日公布的騰訊云MaaS服務解決方案即覆蓋了金融、文旅、政務、教育等10個行業(yè)、超50個解決方案。

雖然巨頭們參與競爭的姿勢不同,但目標實質(zhì)上只有一個,那就是打通應用層。在百度創(chuàng)始人李彥宏看來,應用層最具想象空間。

商湯科技聯(lián)合創(chuàng)始人楊帆認為,AI 基礎設施本質(zhì)上還是算力、數(shù)據(jù)、基礎算法,包括算法相關的工具,本質(zhì)上還是三位一體的東西。最后誰能把這三者的整合能力提供的好,提供更低成本、更低門檻的能力是決定整個競爭最重要的點。

結語

AI大模型是人工智能邁向通用智能的里程碑式技術,因為其可為各行各業(yè)的智能化升級提供強勁的生產(chǎn)力工具。在千行百業(yè)數(shù)字化轉型升級的當下,大模型的重要意義不言而喻。也因此,在當下,誰能率先在賽道里搶到更多籌碼,就非常關鍵了??梢灶A料,未來,拋開“基礎設施”層面的較量外,真正的戰(zhàn)場大概率是各行各業(yè)的切實落地上。

本文為轉載內(nèi)容,授權事宜請聯(lián)系原著作權人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

大模型狂飆半年,“群模亂舞”誰能勝出?

“軍備賽”開始了。

文|壹DU財經(jīng)

毫無疑問,當前的科技圈已進入“大模型”時代。含“模”量大到什么程度?但凡科技企業(yè),基本都在做“大模型”。

“從去年12月ChatGPT(Chat Generative Pre-trained Transformer)引爆科技圈之后,幾乎所有行業(yè)玩家都想抓住這根救命稻草。因為做成了就意味著抓住未來幾十年的趨勢?!毙袠I(yè)創(chuàng)業(yè)者夏先生對壹DU財經(jīng)說道:“ChatGPT是生成式AI,是大模型的落地場景之一。理論上講,這條路的走通,加速了大模型在短期內(nèi)的爆發(fā)?!?/p>

的確,ChatGPT的爆發(fā),讓更多人看到了語言模型的魅力。微軟、谷歌、百度、阿里等

國內(nèi)外科技巨頭快速響應,相繼推出自家的AI聊天機器人,試圖以To C作為切入口,搶占市場。

風口在哪里,資金和人才就在哪里。隨后,先是廠商陸續(xù)宣布推出大模型,如百度的文心大模型、阿里的通義大模型、騰訊的行業(yè)大模型,后有科技圈曾經(jīng)的風云人物也開始陸續(xù)入場,李開復、王小川、周伯文、王慧文等。出行、認知、辦公等一些垂直領域的大模型也相繼推出。

半年時間,國內(nèi)呈現(xiàn)出“群模亂舞”盛況。而在經(jīng)歷喧囂后,大模型或許是時候回歸現(xiàn)實了。

玩家們開始意識到,最初的熱鬧僅僅是熱鬧,他們最終的戰(zhàn)場在B端市場。此時,多家有著人工智能積累和云計算大廠登臺,相繼推出了AI大模型服務。

行業(yè)老炮和新手創(chuàng)業(yè)者的對決,也就此開始了。

01 熱情高漲,玩家們跑步入場

進入2023年,大模型技術讓科技圈沸騰起來??吹紺hatGPT爆發(fā)后,不少大廠抓緊時間推出相應產(chǎn)品,新老創(chuàng)業(yè)者們著急招兵買馬,生怕慢一步就錯過了這難得的風口。一級市場關于大模型的投融資熱度也在攀升,不少FA開始瘋狂補課。

一時間,整個行業(yè)熱鬧非常。

在OpenAI發(fā)布GPT4大模型后,第一個采取行動的是百度,在3月16日用“Demo演示”的形式正式發(fā)布文心一言。同樣在3月,已經(jīng)沉寂許多的周鴻祎推出大模型產(chǎn)品,甚至連名字都沒來得及取。

在此之后,科技巨頭、創(chuàng)業(yè)公司和高校研究院們展開了一場關于“大模型”的競速賽。整個4月,都成了“大模型的發(fā)布月”,華為、商湯、阿里都在4月份亮出了自己的大模型產(chǎn)品。

到了5月,訊飛推出了自己的星火大模型,并公布了大模型在自己優(yōu)勢領域的諸多應用場景。

創(chuàng)業(yè)者們也在火速入場。原美團聯(lián)合創(chuàng)始人王惠文(目前已退出)、創(chuàng)新工場CEO李開復、前京東AI掌門人周伯文、前阿里技術副總裁賈揚清等開始招兵買馬。前搜狗CEO王小川的百川智能拿到5000萬美元融資后,甚至揚言:“今年年底做到國內(nèi)最好的”。

“這波創(chuàng)業(yè)熱潮有點2000年左右的互聯(lián)網(wǎng)創(chuàng)業(yè)潮的意思?!币晃粯I(yè)內(nèi)人士說道:“似乎每個創(chuàng)業(yè)者都想在這個時代找到第二春?!?/p>

總體來看,今年上半年,大模型幾乎成為所有科技企業(yè)的必選項。對于普通人而言,大模型或許是件很遙遠的事。畢竟不是每次科技浪潮都能成功靠岸,如元宇宙、XR等行業(yè)。

但事實上,大模型的應用更多在B端市場。那么,在行業(yè)烈火烹油過后,擺在這些玩家眼前的,理應是他們對市場更多的理性思考。比如市場是否真的需要大模型?大模型真正走向成熟,需要越過哪些重要關卡?能否真正意義上實現(xiàn)商業(yè)化。

02 “軍備賽”開打

大模型軍備賽的沖鋒號吹響后,整個行業(yè)開始“卷”起來。更多玩家已經(jīng)將視線移至應用層面。因為行業(yè)“退燒”后,最終考驗的還是玩家們的“硬實力”。

此時,一些在人工智能、云計算上有積累的玩家則占據(jù)的先發(fā)優(yōu)勢。尤其是模型的參數(shù)量。

就目前市場上發(fā)布的AI模型來看,雖然大家都自稱為“大模型“,但參數(shù)量實質(zhì)是大模型和小模型的界定因素之一。

此前,百度集團副總裁侯震宇在接受媒體采訪時曾表示,2022年,10億參數(shù)的模型就叫大模型。但到了眼下,千億參數(shù)以上才會出現(xiàn)“智能涌現(xiàn)”,才會形成泛化能力,才能在各個場景下具備通用能力。

何為“智能涌現(xiàn)”?簡單地講,當模型規(guī)模、算力水平超過某個參數(shù)閾值后,AI效果將不再是隨機概率事件。比如初期語言大模型出現(xiàn)“圖不對文”“答非所問”等現(xiàn)象。

并且在通用領域,參數(shù)量越大,智能通常涌現(xiàn)的可能性就越大,AI準確率就越高。在垂直領域則更容易獲得精確的效果。

今年5月,科技部下屬的中國科學技術信息研究所發(fā)布的《中國人工智能大模型地圖研究報告》統(tǒng)計,截至5月28日,國內(nèi)10億級參數(shù)規(guī)模以上基礎大模型至少已發(fā)布79個。

但可以看到,10億級參數(shù)這個量級,很可能不是真正的“分界線”。因為現(xiàn)實的情況是,一些未能達到千億規(guī)模的模型,很難在當前市場的競爭具有競爭力。不過,也不排除一些在垂直領域深耕的玩家,最終能跑出來。

“大模型需要算力、算法和數(shù)據(jù)積累,絕對不是玩概念的事情,最終還是要市場買單?!毕南壬J為,目前來看諸如百度、騰訊、阿里無論是在資源還是積累上,都有一定的優(yōu)勢,“他們在云市場深耕,并在自己擅長的領域積累多年,無論技術層面還是行業(yè)積累上,實質(zhì)已經(jīng)完成了搶跑,未來就看這些頭部玩家如何落地。”

而在投入層面,這會是一個天文數(shù)字。

以百度為例。據(jù)透露,過去10年,百度在AI方向的投入已超過1000億元。但大模型不是投一筆錢、做一個模型那么簡單,它需要有算力、有數(shù)據(jù)、有經(jīng)驗豐富的AI工程師在好的研發(fā)平臺上長期積累。

而創(chuàng)業(yè)公司如果直接去做基礎大模型,除了上述投入之外,還需要能夠把模型、算力管理好的AI開發(fā)平臺。

這意味著,創(chuàng)業(yè)公司不論是自建開發(fā)平臺,還是采購外包平臺,其投入都不會是小數(shù)目。并且,大模型不是預訓練出來就好,更需要后續(xù)持續(xù)敏捷迭代。從這一點看,創(chuàng)業(yè)公司所受的限制明顯要高于大公司。

但大廠很難留住強算法人才的弊端也比較突出,因為大模型投入是一件長期主義的事,必定會面臨與既有業(yè)務之間的沖突。這一點,從大廠出走的大模型創(chuàng)業(yè)者的經(jīng)歷,就說明了一點。長期主義對創(chuàng)業(yè)公司同樣重要,無論是創(chuàng)始人的背景背書,還是資源合作,抑或是客戶的拓展,都需要長期積淀。

03 行業(yè)競賽即將鳴槍

人工智能專家侯世達的學生梅拉妮·米歇爾《AI 3.0時代》一書中提到,研究人工智能與賽道中的創(chuàng)業(yè)者們都熟悉了一種模式——先是“人工智能的春天”,緊接著是過度的承諾和媒體炒作,接下來便是“人工智能的寒冬”。并且,他認為這一模式將以五到十年為周期不斷上演。

具體到2023年上半年的大模型賽道,顯然其正處于第二個階段——行業(yè)很火,市場很熱。這一周期往往是最短的,也通常意味著如此去泡沫化后,賽道競爭即將正式開始。

大模型比拼的不僅僅是技術,還應該將重點放在大模型應用、產(chǎn)業(yè)生態(tài)中去評估。

目前,市場上大模型的玩家主要分三類。

一是聚焦基礎層,主要對標OpenAI,發(fā)揮基礎設施的作用。

第二類是錨定中間層,不需要像OpenAI一樣花大錢做底層,只需要掌握通用化能力,就可以通過開源大模型做精調(diào),讓模型具備差異化能力,最終可以形成垂直類模型。

第三類是調(diào)用大模型API的企業(yè),專注開發(fā)大模型具體場景的應用,如Jasper。

相對而言,前兩類又是大模型的“基礎設施”,因為有極高的門檻,對技術、資金以及資源有嚴格的準入壁壘,往往是大公司布局的主要方向。

目前來看,百度、阿里和華為在大模型的構建上,不約而同地采用了“模型+工具平臺+生態(tài)”的三層共建模式。騰訊云則更專注于應用層而,6月19日公布的騰訊云MaaS服務解決方案即覆蓋了金融、文旅、政務、教育等10個行業(yè)、超50個解決方案。

雖然巨頭們參與競爭的姿勢不同,但目標實質(zhì)上只有一個,那就是打通應用層。在百度創(chuàng)始人李彥宏看來,應用層最具想象空間。

商湯科技聯(lián)合創(chuàng)始人楊帆認為,AI 基礎設施本質(zhì)上還是算力、數(shù)據(jù)、基礎算法,包括算法相關的工具,本質(zhì)上還是三位一體的東西。最后誰能把這三者的整合能力提供的好,提供更低成本、更低門檻的能力是決定整個競爭最重要的點。

結語

AI大模型是人工智能邁向通用智能的里程碑式技術,因為其可為各行各業(yè)的智能化升級提供強勁的生產(chǎn)力工具。在千行百業(yè)數(shù)字化轉型升級的當下,大模型的重要意義不言而喻。也因此,在當下,誰能率先在賽道里搶到更多籌碼,就非常關鍵了。可以預料,未來,拋開“基礎設施”層面的較量外,真正的戰(zhàn)場大概率是各行各業(yè)的切實落地上。

本文為轉載內(nèi)容,授權事宜請聯(lián)系原著作權人。