正在閱讀:

新一輪大模型算力價(jià)格戰(zhàn),一觸即發(fā)

掃一掃下載界面新聞APP

新一輪大模型算力價(jià)格戰(zhàn),一觸即發(fā)

新一輪的大模型價(jià)格戰(zhàn),箭在弦上。有分析指出,這場(chǎng)由算法突破驅(qū)動(dòng)的價(jià)格革命,可能重塑全球AI服務(wù)市場(chǎng)格局,加速市場(chǎng)洗牌進(jìn)程。

文|IT時(shí)報(bào)記者 毛宇

編輯|郝俊慧 孫妍

DeepSeek的“鯰魚效應(yīng)”正在加速。

2月13日,文心一言宣布,4月1日起全面免費(fèi),同時(shí)上線深度搜索功能。此前,百度基于文心一言 4.0 Turbo推出的專業(yè)版會(huì)員服務(wù)定價(jià)為59.9元/月。

同日,OpenAI宣布GPT-4.5和GPT-5路線圖更新、模型規(guī)范重大更新,并預(yù)告GPT-4.5和GPT-5將在幾周/幾個(gè)月內(nèi)推出,更重要的是,ChatGPT的免費(fèi)套餐將在標(biāo)準(zhǔn)智能設(shè)置下獲得對(duì)GPT-5的無(wú)限制聊天訪問(wèn)權(quán)限。

不過(guò),對(duì)于業(yè)內(nèi)更為關(guān)注的API(應(yīng)用程序編程接口)服務(wù)費(fèi)用,百度和OpenAI卻沒(méi)有給出更多信息,當(dāng)C端用戶可以免費(fèi)獲得越來(lái)越好的AI服務(wù)時(shí),開(kāi)發(fā)者們更希望大模型的算力價(jià)格戰(zhàn)來(lái)得更猛烈些。

2月9日,DeepSeek-V3宣布,結(jié)束API服務(wù)45天優(yōu)惠期,價(jià)格回調(diào)至原價(jià),輸入每百萬(wàn)Token收費(fèi)0.5元(緩存命中)至2元(緩存未命中),輸出價(jià)格則定為每百萬(wàn)Token 8元,是優(yōu)惠期的4倍。

不過(guò),在業(yè)內(nèi)人士看來(lái),這個(gè)價(jià)格“仍然是高性價(jià)比”,盡管從2024年5月開(kāi)始,國(guó)內(nèi)各大模型廠商先后展開(kāi)多輪價(jià)格戰(zhàn),但在開(kāi)發(fā)者看來(lái),只是“噱頭更足”,因?yàn)樾阅軓?qiáng)大的高階模型“還是很貴”,DeepSeek的算法架構(gòu)創(chuàng)新和分布式訓(xùn)練優(yōu)化等創(chuàng)新,才真正將價(jià)格打下來(lái)。

新一輪的大模型價(jià)格戰(zhàn),箭在弦上。有分析指出,這場(chǎng)由算法突破驅(qū)動(dòng)的價(jià)格革命,可能重塑全球AI服務(wù)市場(chǎng)格局,加速市場(chǎng)洗牌進(jìn)程。

價(jià)格更為敏感的算力市場(chǎng)已暗流涌動(dòng),山海引擎COO彭璐告訴《IT時(shí)報(bào)》記者,國(guó)內(nèi)企業(yè)都已經(jīng)在加快提升國(guó)產(chǎn)算力部署規(guī)模。不過(guò),基于“DeepSeek的低成本能力,預(yù)計(jì)數(shù)據(jù)中心的算力價(jià)格不會(huì)上漲”。

創(chuàng)新誕生“AI界拼多多”

DeepSeek被稱為“AI界的拼多多”是有道理的。

目前,OpenAI GPT-4o API服務(wù)定價(jià)為每百萬(wàn)輸入Token 1.25美元(緩存命中)(約9.13元人民幣)/ 2.5美元(緩存未命中)(約18.27元人民幣),每百萬(wàn)輸出Token 10美元(約73.091元人民幣),而Claude 3.5-Sonnet依然是最昂貴的模型,價(jià)格高出DeepSeek-V3數(shù)倍。

即便是DeepSeek推理能力更強(qiáng)、性能比肩OpenAI o1正式版的R1模型,每百萬(wàn)輸入Token 1元(緩存命中)/4元(緩存未命中),每百萬(wàn)輸出Token 16元的API服務(wù)價(jià)格,也幾乎是OpenAI o1同等規(guī)模輸入15美元(約109元人民幣)和輸出60美元(約437元人民幣)的二十分之一到百分之一。

國(guó)內(nèi)大模型企業(yè)從2024年5月進(jìn)入降價(jià)周期,通義、豆包、Kimi、百度的降幅大多在80%以上,但當(dāng)去年12月DeepSeek發(fā)布V3時(shí),尤其是在45天優(yōu)惠期內(nèi),價(jià)格非常香。

“DeepSeek的低價(jià)源自成本夠低?!鄙鲜鯝I業(yè)內(nèi)人士表示,DeepSeek采用的MOE模型架構(gòu)并不很新,MiniMax等國(guó)內(nèi)廠商也早已開(kāi)始應(yīng)用,但DeepSeek-V3引入了多頭潛在注意力機(jī)制,通過(guò)低秩壓縮技術(shù)減少了推理時(shí)的Key-Value緩存,顯著提升了推理效率,此外,DeepSeek-R1在做訓(xùn)練時(shí),跳過(guò)了傳統(tǒng)訓(xùn)練中的監(jiān)督微調(diào)(SFT)步驟,使用了RL強(qiáng)化學(xué)習(xí)的方法,完全依賴環(huán)境反饋來(lái)優(yōu)化模型行為,同樣省去很多算力成本。

大模型算力價(jià)格有望普降

沒(méi)讓大家失望,“AI界拼多多”果然將價(jià)格打下來(lái)了。由于DeepSeek完全采用開(kāi)源模式,這些技術(shù)創(chuàng)新正在被全球人工智能產(chǎn)業(yè)學(xué)習(xí)并復(fù)刻,大模型算力價(jià)格有望迎來(lái)一次普降。

短短一個(gè)多月過(guò)去,DeepSeek橫空出世帶來(lái)的“鯰魚效應(yīng)”明顯。據(jù)《IT時(shí)報(bào)》記者觀察,截至目前,已有多家國(guó)產(chǎn)大模型廠商推出新的性能比肩DeepSeek-V3的產(chǎn)品,加上優(yōu)惠期結(jié)束,V3已不是絕對(duì)的“性價(jià)比之王”。

同樣走開(kāi)源路線的阿里云大模型通義,在2月4日三方基準(zhǔn)測(cè)試平臺(tái)ChatbotArena公布的最新大模型盲測(cè)榜單上,以剛剛發(fā)布的Qwen2.5-Max超越DeepSeek V3、o1-mini和Claude-3.5-Sonnet等模型,成為非推理類的中國(guó)大模型冠軍。目前Qwen2.5-Max的API調(diào)用價(jià)格還未公布,而在2024年9月發(fā)布的價(jià)格表上,通義的上一代旗艦?zāi)P?、性能逼?GPT-4o的Qwen-Max每百萬(wàn)Token輸入成本為2.4元,輸出成本為每百萬(wàn)Token9.6元,略高于DeepSeek-V3。

另一家國(guó)內(nèi)AI創(chuàng)業(yè)公司MiniMax(稀宇)也于1月15日推出MiniMax-Text-01,基準(zhǔn)測(cè)試結(jié)果顯示,性能比肩GPT-4o和Claude-3.5,價(jià)格為輸入每百萬(wàn)Token0.2美元(1.45元人民幣),輸出每百萬(wàn)Token1.1美元(8元人民幣),和DeepSeek-V3幾乎持平。

當(dāng)然,也有分析人士指出,雖然價(jià)格較高,但閉源大模型OpenAI GPT-4o和Claude 3.5-Sonnet在多模態(tài)、泛化能力以及綜合能力上的優(yōu)勢(shì)依然存在,不少開(kāi)發(fā)者暫時(shí)還不會(huì)放棄。

英偉達(dá)模組出現(xiàn)低價(jià)拋售

同時(shí),隨著DeepSeek開(kāi)源模型的廣泛應(yīng)用,國(guó)產(chǎn)GPU服務(wù)商迎來(lái)新一輪增長(zhǎng)機(jī)遇,算力市場(chǎng)格局也正經(jīng)歷深刻變革。

當(dāng)下,國(guó)內(nèi)多數(shù)企業(yè)都在自行部署DeepSeek。其中DeepSeek滿血版模型對(duì)顯存要求較高,需要1.25臺(tái)H100或1臺(tái)H200支持,但4位量化版僅需400GB左右的顯存。上述人士透露,有客戶已經(jīng)在國(guó)產(chǎn)GPU服務(wù)器上做本地化部署的適配,從成本上來(lái)說(shuō),雖然仍需數(shù)萬(wàn)元,但較之前已大幅降低。

據(jù)了解,目前亞馬遜和阿里云平臺(tái)已有服務(wù)商在低價(jià)拋售H100模組,上述人士分析,此前生成式AI大模型廠商選擇英偉達(dá),是因?yàn)槠涑墒斓腃UDA生態(tài)和GPU的通用能力,也是當(dāng)時(shí)性價(jià)比最高的方案,因此大廠爭(zhēng)相堆砌算力資源?!靶×ν瑯右材艹銎孥E”的DeepSeek靠算法突破算力限制,且客戶需求逐漸向推理和微調(diào)轉(zhuǎn)移,國(guó)產(chǎn)GPU適配性正在提升,從而擠壓了英偉達(dá)的部分市場(chǎng)空間。

DeepSeek的API商業(yè)化,本質(zhì)上是一場(chǎng)深刻的“技術(shù)效能革命”。彭璐認(rèn)為,DeepSeek的出現(xiàn),推動(dòng)算力市場(chǎng)開(kāi)始思考如何從“堆算力”轉(zhuǎn)向“精細(xì)化運(yùn)營(yíng)”,企業(yè)更注重單位算力的效能,市場(chǎng)供需平衡正在重構(gòu)。同時(shí),DeepSeek的開(kāi)源策略也降低了AI應(yīng)用的門檻,未來(lái)入局AI賽道的中小企業(yè)或會(huì)大幅增加。

排版/ 季嘉穎

 
本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

新一輪大模型算力價(jià)格戰(zhàn),一觸即發(fā)

新一輪的大模型價(jià)格戰(zhàn),箭在弦上。有分析指出,這場(chǎng)由算法突破驅(qū)動(dòng)的價(jià)格革命,可能重塑全球AI服務(wù)市場(chǎng)格局,加速市場(chǎng)洗牌進(jìn)程。

文|IT時(shí)報(bào)記者 毛宇

編輯|郝俊慧 孫妍

DeepSeek的“鯰魚效應(yīng)”正在加速。

2月13日,文心一言宣布,4月1日起全面免費(fèi),同時(shí)上線深度搜索功能。此前,百度基于文心一言 4.0 Turbo推出的專業(yè)版會(huì)員服務(wù)定價(jià)為59.9元/月。

同日,OpenAI宣布GPT-4.5和GPT-5路線圖更新、模型規(guī)范重大更新,并預(yù)告GPT-4.5和GPT-5將在幾周/幾個(gè)月內(nèi)推出,更重要的是,ChatGPT的免費(fèi)套餐將在標(biāo)準(zhǔn)智能設(shè)置下獲得對(duì)GPT-5的無(wú)限制聊天訪問(wèn)權(quán)限。

不過(guò),對(duì)于業(yè)內(nèi)更為關(guān)注的API(應(yīng)用程序編程接口)服務(wù)費(fèi)用,百度和OpenAI卻沒(méi)有給出更多信息,當(dāng)C端用戶可以免費(fèi)獲得越來(lái)越好的AI服務(wù)時(shí),開(kāi)發(fā)者們更希望大模型的算力價(jià)格戰(zhàn)來(lái)得更猛烈些。

2月9日,DeepSeek-V3宣布,結(jié)束API服務(wù)45天優(yōu)惠期,價(jià)格回調(diào)至原價(jià),輸入每百萬(wàn)Token收費(fèi)0.5元(緩存命中)至2元(緩存未命中),輸出價(jià)格則定為每百萬(wàn)Token 8元,是優(yōu)惠期的4倍。

不過(guò),在業(yè)內(nèi)人士看來(lái),這個(gè)價(jià)格“仍然是高性價(jià)比”,盡管從2024年5月開(kāi)始,國(guó)內(nèi)各大模型廠商先后展開(kāi)多輪價(jià)格戰(zhàn),但在開(kāi)發(fā)者看來(lái),只是“噱頭更足”,因?yàn)樾阅軓?qiáng)大的高階模型“還是很貴”,DeepSeek的算法架構(gòu)創(chuàng)新和分布式訓(xùn)練優(yōu)化等創(chuàng)新,才真正將價(jià)格打下來(lái)。

新一輪的大模型價(jià)格戰(zhàn),箭在弦上。有分析指出,這場(chǎng)由算法突破驅(qū)動(dòng)的價(jià)格革命,可能重塑全球AI服務(wù)市場(chǎng)格局,加速市場(chǎng)洗牌進(jìn)程。

價(jià)格更為敏感的算力市場(chǎng)已暗流涌動(dòng),山海引擎COO彭璐告訴《IT時(shí)報(bào)》記者,國(guó)內(nèi)企業(yè)都已經(jīng)在加快提升國(guó)產(chǎn)算力部署規(guī)模。不過(guò),基于“DeepSeek的低成本能力,預(yù)計(jì)數(shù)據(jù)中心的算力價(jià)格不會(huì)上漲”。

創(chuàng)新誕生“AI界拼多多”

DeepSeek被稱為“AI界的拼多多”是有道理的。

目前,OpenAI GPT-4o API服務(wù)定價(jià)為每百萬(wàn)輸入Token 1.25美元(緩存命中)(約9.13元人民幣)/ 2.5美元(緩存未命中)(約18.27元人民幣),每百萬(wàn)輸出Token 10美元(約73.091元人民幣),而Claude 3.5-Sonnet依然是最昂貴的模型,價(jià)格高出DeepSeek-V3數(shù)倍。

即便是DeepSeek推理能力更強(qiáng)、性能比肩OpenAI o1正式版的R1模型,每百萬(wàn)輸入Token 1元(緩存命中)/4元(緩存未命中),每百萬(wàn)輸出Token 16元的API服務(wù)價(jià)格,也幾乎是OpenAI o1同等規(guī)模輸入15美元(約109元人民幣)和輸出60美元(約437元人民幣)的二十分之一到百分之一。

國(guó)內(nèi)大模型企業(yè)從2024年5月進(jìn)入降價(jià)周期,通義、豆包、Kimi、百度的降幅大多在80%以上,但當(dāng)去年12月DeepSeek發(fā)布V3時(shí),尤其是在45天優(yōu)惠期內(nèi),價(jià)格非常香。

“DeepSeek的低價(jià)源自成本夠低?!鄙鲜鯝I業(yè)內(nèi)人士表示,DeepSeek采用的MOE模型架構(gòu)并不很新,MiniMax等國(guó)內(nèi)廠商也早已開(kāi)始應(yīng)用,但DeepSeek-V3引入了多頭潛在注意力機(jī)制,通過(guò)低秩壓縮技術(shù)減少了推理時(shí)的Key-Value緩存,顯著提升了推理效率,此外,DeepSeek-R1在做訓(xùn)練時(shí),跳過(guò)了傳統(tǒng)訓(xùn)練中的監(jiān)督微調(diào)(SFT)步驟,使用了RL強(qiáng)化學(xué)習(xí)的方法,完全依賴環(huán)境反饋來(lái)優(yōu)化模型行為,同樣省去很多算力成本。

大模型算力價(jià)格有望普降

沒(méi)讓大家失望,“AI界拼多多”果然將價(jià)格打下來(lái)了。由于DeepSeek完全采用開(kāi)源模式,這些技術(shù)創(chuàng)新正在被全球人工智能產(chǎn)業(yè)學(xué)習(xí)并復(fù)刻,大模型算力價(jià)格有望迎來(lái)一次普降。

短短一個(gè)多月過(guò)去,DeepSeek橫空出世帶來(lái)的“鯰魚效應(yīng)”明顯。據(jù)《IT時(shí)報(bào)》記者觀察,截至目前,已有多家國(guó)產(chǎn)大模型廠商推出新的性能比肩DeepSeek-V3的產(chǎn)品,加上優(yōu)惠期結(jié)束,V3已不是絕對(duì)的“性價(jià)比之王”。

同樣走開(kāi)源路線的阿里云大模型通義,在2月4日三方基準(zhǔn)測(cè)試平臺(tái)ChatbotArena公布的最新大模型盲測(cè)榜單上,以剛剛發(fā)布的Qwen2.5-Max超越DeepSeek V3、o1-mini和Claude-3.5-Sonnet等模型,成為非推理類的中國(guó)大模型冠軍。目前Qwen2.5-Max的API調(diào)用價(jià)格還未公布,而在2024年9月發(fā)布的價(jià)格表上,通義的上一代旗艦?zāi)P?、性能逼?GPT-4o的Qwen-Max每百萬(wàn)Token輸入成本為2.4元,輸出成本為每百萬(wàn)Token9.6元,略高于DeepSeek-V3。

另一家國(guó)內(nèi)AI創(chuàng)業(yè)公司MiniMax(稀宇)也于1月15日推出MiniMax-Text-01,基準(zhǔn)測(cè)試結(jié)果顯示,性能比肩GPT-4o和Claude-3.5,價(jià)格為輸入每百萬(wàn)Token0.2美元(1.45元人民幣),輸出每百萬(wàn)Token1.1美元(8元人民幣),和DeepSeek-V3幾乎持平。

當(dāng)然,也有分析人士指出,雖然價(jià)格較高,但閉源大模型OpenAI GPT-4o和Claude 3.5-Sonnet在多模態(tài)、泛化能力以及綜合能力上的優(yōu)勢(shì)依然存在,不少開(kāi)發(fā)者暫時(shí)還不會(huì)放棄。

英偉達(dá)模組出現(xiàn)低價(jià)拋售

同時(shí),隨著DeepSeek開(kāi)源模型的廣泛應(yīng)用,國(guó)產(chǎn)GPU服務(wù)商迎來(lái)新一輪增長(zhǎng)機(jī)遇,算力市場(chǎng)格局也正經(jīng)歷深刻變革。

當(dāng)下,國(guó)內(nèi)多數(shù)企業(yè)都在自行部署DeepSeek。其中DeepSeek滿血版模型對(duì)顯存要求較高,需要1.25臺(tái)H100或1臺(tái)H200支持,但4位量化版僅需400GB左右的顯存。上述人士透露,有客戶已經(jīng)在國(guó)產(chǎn)GPU服務(wù)器上做本地化部署的適配,從成本上來(lái)說(shuō),雖然仍需數(shù)萬(wàn)元,但較之前已大幅降低。

據(jù)了解,目前亞馬遜和阿里云平臺(tái)已有服務(wù)商在低價(jià)拋售H100模組,上述人士分析,此前生成式AI大模型廠商選擇英偉達(dá),是因?yàn)槠涑墒斓腃UDA生態(tài)和GPU的通用能力,也是當(dāng)時(shí)性價(jià)比最高的方案,因此大廠爭(zhēng)相堆砌算力資源?!靶×ν瑯右材艹銎孥E”的DeepSeek靠算法突破算力限制,且客戶需求逐漸向推理和微調(diào)轉(zhuǎn)移,國(guó)產(chǎn)GPU適配性正在提升,從而擠壓了英偉達(dá)的部分市場(chǎng)空間。

DeepSeek的API商業(yè)化,本質(zhì)上是一場(chǎng)深刻的“技術(shù)效能革命”。彭璐認(rèn)為,DeepSeek的出現(xiàn),推動(dòng)算力市場(chǎng)開(kāi)始思考如何從“堆算力”轉(zhuǎn)向“精細(xì)化運(yùn)營(yíng)”,企業(yè)更注重單位算力的效能,市場(chǎng)供需平衡正在重構(gòu)。同時(shí),DeepSeek的開(kāi)源策略也降低了AI應(yīng)用的門檻,未來(lái)入局AI賽道的中小企業(yè)或會(huì)大幅增加。

排版/ 季嘉穎

 
本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。