文|劉曠
隨著人工智能技術(shù)的快速發(fā)展,大模型以其強(qiáng)大的數(shù)字處理能力和深度學(xué)習(xí)能力,不斷與各領(lǐng)域交叉融合,逐步成為產(chǎn)業(yè)創(chuàng)新的關(guān)鍵抓手,和驅(qū)動新質(zhì)生產(chǎn)力的關(guān)鍵引擎。據(jù)國家最新公布的數(shù)據(jù)顯示,截至今年3月,我國共有117個(gè)生成式人工智能服務(wù)完成備案,各類國產(chǎn)大模型,更是超過了200多個(gè),多模態(tài)的大模型應(yīng)用場景正在不斷拓展。
然而,隨著大模型的快速發(fā)展,算力成本日益成為影響人工智能推廣應(yīng)用的重要因素,大模型產(chǎn)品的價(jià)格居高不下,更是長期制約著人工智能應(yīng)用的發(fā)展。近日,隨著字節(jié)跳動率先將大模型的使用價(jià)格,調(diào)低至“厘”時(shí)代,百度、阿里、騰訊等巨頭紛紛跟進(jìn),迅速將大模型推至免費(fèi)時(shí)代。
大模型免費(fèi)時(shí)代加速到來
5月15日,火山引擎云服務(wù)平臺,發(fā)布了國內(nèi)首批通過算法備案的“豆包大模型”,主力模型,僅需0.8厘就能處理1500多個(gè)漢字,比行業(yè)價(jià)格低99.3%,帶動大模型企業(yè)市場定價(jià),從“以分計(jì)價(jià)”步入“以厘計(jì)價(jià)”時(shí)代,助力企業(yè)以更低成本加速業(yè)務(wù)創(chuàng)新。在字節(jié)跳動打響大模型降價(jià)第一槍之后,隨后百度、阿里紛紛跟進(jìn)。
5月21日上午,阿里云方面宣布,通義千問GPT-4級主力模型Qwen-Long的API輸入價(jià)格降至0.0005元/千Tokens,直降97%。隨后,百度通過官方微信發(fā)文稱,文心大模型兩款主力模型ENIRE Speed和ENIRE Lite全面免費(fèi)。一個(gè)降價(jià)一個(gè)免費(fèi),阿里云和百度智能云的降價(jià)行為表明,國內(nèi)大模型科技公司開啟了價(jià)格比拼模式。
一方面,價(jià)格戰(zhàn)有利于巨頭搶占更多客戶資源,從而迅速擴(kuò)大市場份額,使其在市場競爭中保持領(lǐng)先地位。隨著大模型用戶和場景的不斷擴(kuò)大,模型調(diào)用價(jià)格的主要趨勢是,性能不斷提升、價(jià)格不斷下降。而隨著算法調(diào)用價(jià)格下降,算法使用成本也將進(jìn)一步下降,這將推動大模型進(jìn)入快速增長時(shí)代,促進(jìn)大模型產(chǎn)業(yè)加快發(fā)展。目前來看,相比技術(shù)與實(shí)力都比較雄厚的百度、阿里而言,字節(jié)跳動率先開啟價(jià)格戰(zhàn),本質(zhì)上還是希望借此機(jī)會實(shí)現(xiàn)“彎路超車”。而百度、阿里、騰訊選擇跟進(jìn),很明顯是不甘落后,更不愿意將市場拱手讓人。
另一方面,隨著大模型產(chǎn)業(yè)的快速發(fā)展,推理成本飛速下降,也成為終端降價(jià)的基礎(chǔ)。據(jù)百度官方透露,相比一年前,文心大模型的算法訓(xùn)練效率提升到了原來的5.1倍,周均訓(xùn)練有效率達(dá)到98.8%,推理性能提升了105倍,推理的成本降到了原來的1%。也就是說,客戶原來一天調(diào)用1萬次,同樣成本之下,現(xiàn)在一天可以調(diào)用100萬次。
在業(yè)內(nèi)人士看來,降低成本是推動大模型快進(jìn)到“價(jià)值創(chuàng)造階段”的一個(gè)關(guān)鍵因素,并且只有大的使用量,才能打磨出好模型,也能大幅降低模型推理的單位成本。因此,大模型的降價(jià),不能只是停留在提供低價(jià)的輕量化版本,而是讓主力模型和最先進(jìn)的模型也足夠便宜,才能真正滿足企業(yè)的復(fù)雜業(yè)務(wù)場景需求,驗(yàn)證大模型的應(yīng)用價(jià)值,推動AI應(yīng)用創(chuàng)新和價(jià)值創(chuàng)造。隨著頭部廠商紛紛參與大模型“降價(jià)”,大模型的真正免費(fèi)時(shí)代或許正在加速到來。
AI基建競賽進(jìn)入拼應(yīng)用階段
在AI風(fēng)口之下,作為AI基建的云服務(wù)商們,去年還主要聚焦大模型產(chǎn)品,今年大廠的競爭點(diǎn),已不再局限于技術(shù),現(xiàn)在更重要的是價(jià)格,以及具體的落地場景。
首先,巨頭都在加大開源力度,以擴(kuò)大自身大模型生態(tài)影響力,扶持更多AI原生應(yīng)用創(chuàng)新。5月9日,阿里云正式發(fā)布通義千問2.5,宣布模型性能全面趕超GPT-4Turbo,成為地表最強(qiáng)中文大模型。在阿里云AI峰會上,阿里云首席技術(shù)官周靖人介紹,阿里云大模型API日調(diào)用量已經(jīng)過億;除了日常2C應(yīng)用外,也服務(wù)了9萬家企業(yè)客戶,目前通義開源模型下載量已超過700萬。
同樣選擇對外開源的還有騰訊混元文生圖大模型。5月14日,騰訊宣布其旗下混元文生圖大模型全面升級,并對外開源。這也是首個(gè)中文原生的類 Sora架構(gòu)開源模型,支持中英文雙語輸入及理解,參數(shù)量15億。放眼市場,當(dāng)下的文生圖開源生態(tài),比如Stable Diffusion基本圍繞英文語義理解,要先把中文翻譯成英文才能生成圖片。騰訊混元文生圖大模型的出現(xiàn),打破了這一現(xiàn)狀,讓文生圖生態(tài)更了解中文。
事實(shí)上,騰訊的大模型應(yīng)用,已經(jīng)具有顯著的產(chǎn)品思維。自去年9月份騰訊混元大模型上線以來,騰訊采取的就是“大模型全家桶”的策略,目前其內(nèi)部已經(jīng)有超過400多個(gè)業(yè)務(wù)接入了騰訊混元大模型。比如,在混元大模型之后,既可以是微信讀書的“AI問書”,也可以是騰訊會議的“AI小助手”??吹贸鰜恚ヂ?lián)網(wǎng)巨頭們在做開源的同時(shí),正在試圖用自身的AI應(yīng)用,為其他合作者們打個(gè)樣。
其次,通過大模型工程優(yōu)化,加速大模型推理成本降低,從而推動大模型大規(guī)模降價(jià),以繁榮應(yīng)用場景落地。以前的推理模型,大多采用的是單機(jī)推理,大模型用的是分布式推理。比如,如今業(yè)內(nèi)很多公司都在使用MoE架構(gòu)模型,而MoE架構(gòu)中基于多個(gè)專家并行機(jī)制,推理時(shí)只激活部分專家,即可以極大壓縮參數(shù)量和推理成本。事實(shí)上,為了讓用戶可以低成本地使用AI,并推動應(yīng)用的發(fā)展,降價(jià)已經(jīng)成為了國內(nèi)大模型廠商的共識了。
今年2月份,阿里云宣布全線下調(diào)云產(chǎn)品官網(wǎng)售價(jià),平均降價(jià)幅度超過20%,最高降幅達(dá)55%,涉及100多款產(chǎn)品、500多個(gè)產(chǎn)品規(guī)格。4月份,阿里云將降價(jià)策略擴(kuò)大至海外公有云產(chǎn)品。大廠們之所以打起價(jià)格戰(zhàn),是因?yàn)榇竽P蛢r(jià)格越低,使用的人越多;使用量越大,大模型才能被調(diào)用得越來越好。簡言之,價(jià)格力的出現(xiàn),才能推動大模型更好地落地。
大模型棋至中局
自ChatGPT橫空出世以來,大模型的火熱有目共睹。面對大模型帶來的技術(shù)革命,不僅僅是微軟、谷歌、百度、字節(jié)等大廠下場做大模型,眾多與AI相關(guān)的創(chuàng)業(yè)公司也在持續(xù)涌現(xiàn),業(yè)內(nèi)更是出現(xiàn)了百川智能、月之暗面、MiniMax、智譜AI等AI四小龍。隨著大廠下調(diào)API價(jià)格,包括新AI四小龍?jiān)趦?nèi)的創(chuàng)投公司,都將面臨全新的考驗(yàn)。
一方面,以BAT為首的云服務(wù)商,成為了“降價(jià)主力軍”,直接對以出售B端API為生的中小創(chuàng)業(yè)公司產(chǎn)生嚴(yán)重沖擊。在業(yè)內(nèi)專業(yè)人士看來,本輪大模型降價(jià)的目的,不是為了用戶直接使用,而是為了吸引開發(fā)者。因?yàn)槎唐趤砜?,大模型的性能遇到了瓶頸,當(dāng)下無論哪一家,都拿不出新的殺手锏,降價(jià)自然就成了優(yōu)先級最高的選項(xiàng)。
因?yàn)楝F(xiàn)在各大模型APP基本都是免費(fèi)的,本質(zhì)上是各大模型的APP用戶量都漲不動了,包括OpenAI。一時(shí)間各大AI大模型的APP推廣費(fèi)用水漲船高,投入產(chǎn)出比直線下降。在這種情況下,必須讓更多的開發(fā)者參與進(jìn)來,開發(fā)出應(yīng)用以吸引用戶的參與。
不過,針對各大廠的降價(jià),各大AI創(chuàng)業(yè)公司并未選擇跟進(jìn),而是選擇冷眼旁觀。比如,一些參與AI大模型投資的投資人就表示,“這波降價(jià)對一些創(chuàng)業(yè)公司TO B模式影響較大?!币?yàn)檫^去很多公司,之所以選擇跟初創(chuàng)公司合作,主要就是看重初創(chuàng)公司的API比大廠要便宜,但現(xiàn)在基本上沒有任何比大廠便宜的可能性了,這意味著創(chuàng)業(yè)公司的B端商業(yè)化模式不復(fù)存在了。
在這種情況下,被迫卷入價(jià)格戰(zhàn)的創(chuàng)業(yè)公司,將不得不尋找全新的商業(yè)模式。倘若在一段時(shí)間之內(nèi),創(chuàng)業(yè)公司找不到全新的商業(yè)模式,將面臨生死考驗(yàn),屆時(shí)業(yè)內(nèi)將首先面臨一波創(chuàng)投企業(yè)的大洗牌。這也會倒逼一些創(chuàng)投企業(yè),加速探索垂直領(lǐng)域的細(xì)分應(yīng)用機(jī)會,開發(fā)全新的AI應(yīng)用,將服務(wù)對象從B端轉(zhuǎn)向C端。
另一方面,當(dāng)前的行業(yè)價(jià)格戰(zhàn),可以看做是“百模大戰(zhàn)”帶來的一個(gè)衍生結(jié)果,大模型降價(jià)或有利于行業(yè)頭部大模型公司加速整合步伐。目前來看,當(dāng)前的中文大模型市場,空間相當(dāng)有限,不可能所有的大模型都取得成功。作為生態(tài)產(chǎn)品的大模型,要么贏家通吃,要么落寞退場。當(dāng)前,國內(nèi)做AI大模型的廠商,除了BATH之外,字節(jié)跳動、科大訊飛、商湯科技等眾多廠商也都有參與,各家不免落入“拼算力規(guī)?!钡膬?nèi)卷之中。由于各家的功能差異不大,同質(zhì)化競爭之下,價(jià)格戰(zhàn)自然在所難免。
另外,伴隨著蘋果、微軟、聯(lián)想等設(shè)備廠商,在本地化AI算力和本地大模型方面的重金投入,AI PC、AI Phone等成為主流,而通用大模型的使用場景則大幅度受限。這迫使很多大模型廠商,不得不尋找破局方法,以求盡快做出創(chuàng)新性的應(yīng)用成果,來應(yīng)對外部威脅。
因此,表面上來看是大模型在降價(jià),背后牽動的卻是,與之相關(guān)的各大參與方的角逐。價(jià)格戰(zhàn)之下,中小創(chuàng)業(yè)公司紛紛轉(zhuǎn)向,大型云服務(wù)商則趁勢搶占市場份額,一波大洗牌顯然已經(jīng)開啟。
大模型的競賽邏輯變了
其實(shí),從降價(jià)開始,行業(yè)內(nèi)關(guān)于AI大模型的競賽邏輯就已經(jīng)變了。用業(yè)內(nèi)人士的說法來講,企業(yè)使用AI并不是成本驅(qū)動,而是能否產(chǎn)生業(yè)務(wù)價(jià)值來決定,而這或許會成為今后一段時(shí)間,大模型競賽的核心邏輯。
首先,基礎(chǔ)大模型的API調(diào)用模式,離實(shí)際業(yè)務(wù)相差甚遠(yuǎn),決定企業(yè)使用AI的并非是成本,而是是否有效、好用。單純從API降價(jià)角度來看,推動整個(gè)行業(yè)大降價(jià)并沒有多大門檻,但是真正的TO B商業(yè)成功則相對較難,因?yàn)锳I大模型如何扎根企業(yè)業(yè)務(wù),幫助企業(yè)實(shí)現(xiàn)對應(yīng)的業(yè)務(wù)效益,才是企業(yè)關(guān)心的核心問題。
但很多大模型尚且流于表面,距離真正的業(yè)務(wù)落地仍有相當(dāng)遠(yuǎn)的距離。在大模型未能有效與企業(yè)結(jié)合的情況下,無論定價(jià)有多低,都不會讓企業(yè)覺得有價(jià)值。因?yàn)檎嬲屍髽I(yè)決定買單的是,AI帶來的高效和好用的體驗(yàn),以及由此產(chǎn)生的降本增效的成果。所以,降價(jià)能否達(dá)成目標(biāo),核心還是看用戶體驗(yàn)和反饋,否則就變成了廠商的一廂情愿。
其次,大模型API降價(jià)給行業(yè)內(nèi)卷敲響了警鐘,單純的堆參數(shù)、拼算力、價(jià)格,并不是行業(yè)健康發(fā)展的最優(yōu)解,未來只有差異化才有出路。與所有的行業(yè)一樣,從混沌初開到進(jìn)入大混戰(zhàn),多是以慘烈的價(jià)格戰(zhàn)作為標(biāo)志。如今大模型經(jīng)過狂熱的“百模大戰(zhàn)”之后,價(jià)格戰(zhàn)初步顯現(xiàn),同質(zhì)化競爭的惡果逐步出現(xiàn)。
事實(shí)上,目前業(yè)內(nèi)一些玩家,已經(jīng)在嘗試做一些面向C端的嘗試了。比如,百川智能近期發(fā)布基座大模型Baichuan 4時(shí),同步推出首款A(yù)I助手“百小應(yīng)”,類似于AI搜索應(yīng)用。在王小川看來,中國商業(yè)環(huán)境里,C端市場規(guī)模比B端大10倍,必須走“基座大模型”+“AI應(yīng)用”的“雙輪驅(qū)動”策略。
放眼未來,隨著行業(yè)大模型的加速洗牌,未來各家大模型企業(yè),要么選擇在垂直應(yīng)用領(lǐng)域進(jìn)行深耕;要么選擇結(jié)合自身優(yōu)勢,與大模型公司聯(lián)合,做適合自己的小模型,而不是一擁而上地參與大模型競賽,一味在數(shù)量、參數(shù)上進(jìn)行對拼。