文 | 時代財經(jīng)
3月1日,DeepSeek“開源周”的最后一天,DeepSeek拋出最后一枚“王炸”——首次披露成本利潤率關(guān)鍵信息。
DeepSeek在社交媒體的官方賬號上稱:“假定GPU租賃成本為2美金/小時,總成本為$87,072/天。……如果所有 tokens全部按照DeepSeek R1的定價計算,理論上一天的總收入為$562,027,成本利潤率545%。”
當(dāng)然,這只是最理想的情況。
而現(xiàn)實(shí)是,DeepSeek開源周讓行業(yè)振奮。這些開源工具不僅讓全球AI開發(fā)者能更高效、更低成本地進(jìn)行AI模型的開發(fā)和訓(xùn)練,也讓多年來關(guān)于大模型開源和閉源的“口水仗”,在這一階段有了初步結(jié)論。
2月,過去堅(jiān)定的“閉源派”百度(9888.HK)宣布將開源下一代文心大模型,之后,字節(jié)豆包、昆侖萬維等均推出開源模型,阿里巴巴(9988.HK)也進(jìn)一步深化開源。
“或主動、或被動,開源(大模型)已經(jīng)被帶動起來了?!遍_源大模型社區(qū)OpenCSG聯(lián)合創(chuàng)始人、CTO王偉向時代財經(jīng)感慨。
DeepSeek正在撼動當(dāng)前AI大模型的市場格局。有行業(yè)人士表示,大模型仍然保持超高速迭代的態(tài)勢,“過時的”模型幾乎無人問津。“在大模型領(lǐng)域,想利用短期的算法技術(shù)優(yōu)勢或商業(yè)模式來打造形成長期的競爭壁壘,目前看來是不可能的。”該業(yè)內(nèi)人士稱。
DeepSeek給開發(fā)者們帶來福音的同時,也讓一些大模型公司可能不得不“趕鴨子上架”,“跟風(fēng)”開源。
但開源之后呢?
DeepSeek可以測算自己的理論利潤率,但其他廠商是否找到盈利模式?
開閉源戰(zhàn)局扭轉(zhuǎn)
繼模型、論文開源之后,DeepSeek正向著更底層的開源進(jìn)發(fā)。
“DeepSeek開源周開源的這些技術(shù),能夠大大提高推理效率,同樣場景和服務(wù)規(guī)模下,所需GPU數(shù)量更少。往大了說,這甚至能達(dá)到節(jié)能減排的效果?!蓖鮽シQ,以DeepSeek開源項(xiàng)目中涉及到的EP(Expert Parallelism,專家并行)技術(shù)為例,過去除了少數(shù)頭部公司有能力實(shí)現(xiàn),多數(shù)企業(yè)是享受不到EP加速的,只能以較低的效率進(jìn)行推理。
“但DeepSeek開源后,這一情況有望很快得到改善。開源成果將會被其他通用開源項(xiàng)目、企業(yè)、科研組織等快速吸收,地融入到他們的項(xiàng)目之中?!蓖鮽ケ硎尽?/p>
例如,摩爾線程就在3月1日晚上宣布在短時間內(nèi)成功實(shí)現(xiàn)對 DeepSeek 各個開源項(xiàng)目的全面支持,涵蓋 FlashMLA、DeepEP、DeepGEMM、DualPipe 以及 Fire-Flyer 文件系統(tǒng)(3FS)。
“當(dāng)然,這套技術(shù)方案還存在一些限制,例如它主要還是針對英偉達(dá)的技術(shù)架構(gòu),特別是Hopper架構(gòu)的顯卡,以及針對MOE這類架構(gòu)模型的訓(xùn)練和推理等。”王偉補(bǔ)充道。
在LangGPT社區(qū)創(chuàng)始人云中江樹看來,DeepSeek的開放程度直接將大模型應(yīng)用的門檻基本拉平了。“它足夠開放,沒有任何限制,現(xiàn)在甚至把部署的底層代碼都開放出來,相當(dāng)于手把手地教大家如何高效部署了?!?/p>
據(jù)云中江樹介紹,目前全球主要有Meta Llama系列模型、阿里千問系列和DeepSeek三個重要的AI開源玩家。開源則涉及到模型的權(quán)重、訓(xùn)練代碼和訓(xùn)練數(shù)據(jù)三個層面。
從模型權(quán)重來看,這是每個開源玩家都會選擇開放的基本要求,而訓(xùn)練代碼和訓(xùn)練數(shù)據(jù)則幾乎沒有一家可以完全開放。
差異主要體現(xiàn)在開源協(xié)議上,DeepSeek在開源協(xié)議上對商用幾乎沒有任何限制。從開源的廣度來看,也幾乎只有DeepSeek能將集群計算、通信等提升能效的代碼開放出來。并且在開源可復(fù)現(xiàn)性上,DeepSeek公開了更多訓(xùn)練細(xì)節(jié)及核心思想,目前社區(qū)已有 OpenR1 項(xiàng)目實(shí)現(xiàn)完全復(fù)制。
更重要的是,DeepSeek完全扭轉(zhuǎn)了關(guān)于大模型開閉源的戰(zhàn)局。
時代財經(jīng)從多名業(yè)內(nèi)人士處了解到,過去一段時間海外大模型開源勢頭有所減弱,硅谷的AI巨頭逐步轉(zhuǎn)向閉源。王偉提到,美國科技巨頭們?yōu)榱松虡I(yè)化目標(biāo),紛紛選擇閉源作為自身的發(fā)展模式,而DeepSeek、Qwen等中國模型則成了開源的重要力量。
此前,業(yè)內(nèi)人士認(rèn)為開源可能是“偽命題”,比如李彥宏就曾表示,“開源模式是一種智商稅?!钡缃癜俣纫沧叩搅俗约旱姆疵妫?025年的2月14日,百度官方微信發(fā)布公告,“我們將在未來幾個月中陸續(xù)推出文心大模型4.5系列,并于6月30日起正式開源?!庇枚潭桃痪湓捫挤艞増?jiān)持了兩年的閉源之路。
“趕鴨子上架”?
DeepSeek的技術(shù)實(shí)力匹配開放程度,一時讓開源成為大模型的主流。
不只百度,多家大模型企業(yè)在2月推出開源模型或進(jìn)一步深化開源。2月10日,字節(jié)跳動豆包大模型團(tuán)隊(duì)聯(lián)合北京交通大學(xué)等開發(fā)的視頻生成實(shí)驗(yàn)?zāi)P汀癡ideoWorld”正式開源;2月18日,昆侖萬維開源了其旗下面向AI短劇創(chuàng)作的視頻生成模型SkyReels-V1和表情動作可控算法SkyReels-A;2月23日,月之暗面Kimi宣布開源大模型Moonlight。
另外一家大模型廠商阿里云則是一直開源和閉源兩條腿走路的。2月25日,阿里通義千問推出QwQ-Max-Preview深度思考模型,支持聯(lián)網(wǎng)搜索,并計劃后續(xù)開源。當(dāng)日深夜,阿里云視覺生成基座模型萬相2.1(Wan)開源了14B和1.3B兩個參數(shù)規(guī)格的全部推理代碼和權(quán)重,同時支持文生視頻和圖生視頻任務(wù),本地消費(fèi)級GPU即可部署。
頂著DeepSeek的風(fēng)暴,廠商們選擇開源背后的動力,是創(chuàng)新,是跟風(fēng),還是“趕鴨子上架”?
在近期百度財報電話會議上,百度創(chuàng)始人兼CEO李彥宏解釋了促使百度做出這一艱難抉擇背后的原因。
李彥宏稱,“開源最好的模型可以極大地促進(jìn)采用”,并希望通過開源讓開發(fā)者和用戶認(rèn)識到文心系列大模型的真正價值。
“促進(jìn)采用”的背后,可能蘊(yùn)藏著更深層的生態(tài)戰(zhàn)位。
王偉表示,DeepSeek一系列模型開源之后,國內(nèi)外從芯片到Infra框架,再到應(yīng)用層,幾乎都快速去做適配。這股風(fēng)潮甚至超過了之前Meta開源的Llama模型。
據(jù)時代財經(jīng)此前報道,單是芯片廠商,截至2月中旬就有超過15家緊急適配了DeepSeek系列模型,包括華為昇騰、壁仞科技、昆侖芯、沐曦、云天勵飛(688343.SH)、摩爾線程等廠商,并且更深入的適配工作仍在進(jìn)行中。
王偉進(jìn)一步解釋,當(dāng)一個新架構(gòu)的模型推向市場時,會面臨在芯片、框架和應(yīng)用等軟硬件生態(tài)適配問題,需要投入人力去攻克。這個周期較長,很多時候沒有生態(tài)工具來助力,最后,往往是廠商花費(fèi)大量資金解決這個問題,最終由用戶來買單。
如今,DeepSeek則通過強(qiáng)大的模型能力和有效的開源策略快速跨過了適配難關(guān)。其他模型廠商如果仍堅(jiān)持商業(yè)化全閉源策略,那么除了API接入外,私有化部署的生態(tài)適配會維持在高成本狀態(tài),這會大大削弱這些廠商的競爭力。
“如同Llama開源后催生了一批基于Llama的生態(tài)項(xiàng)目,目前整個AI生態(tài)都在與DeepSeek兼容。甚至,盡管DeepSeek還處于發(fā)展中,估計過一兩年,它可能就會成為AI領(lǐng)域的‘安卓系統(tǒng)’。”云中江樹同樣認(rèn)為,開源是融入進(jìn)大模型生態(tài)中最好的辦法。
如果企業(yè)自己開發(fā)一套閉源的、較小的系統(tǒng),而其他廠商不與之兼容,軟件也無法適配,那么自然而然地,其他廠商和用戶都不會選擇這樣的系統(tǒng),甚至可能會面臨被淘汰的風(fēng)險。
因此,主動也好,“趕鴨子上架”也好,開源成為大模型廠商不得不考慮的選項(xiàng)。
另外,從融資的角度看,一家風(fēng)險投資機(jī)構(gòu)負(fù)責(zé)人告訴時代財經(jīng),能不能選擇開源一定是接下來投大模型一個非常重要的指標(biāo)。
“不是說開源就領(lǐng)先閉源,而是你可以閉源,但是開源可能會在更短的周期內(nèi)追上你,那么你的競爭優(yōu)勢還在不在模型本身,或者說競爭優(yōu)勢還能不能持續(xù)這件事,是需要大家更多去考量的?!鄙鲜鲐?fù)責(zé)人表示。
一名業(yè)內(nèi)人士對時代財經(jīng)坦言:“一個殘酷的事實(shí)是: DeepSeek開源了,原來的大模型堅(jiān)持的閉源私有化商業(yè)模式就不成立了?!?/p>
開源之后呢?
閉源的商業(yè)模式受到?jīng)_擊,但是對于開源大模型如何實(shí)現(xiàn)商業(yè)化也是很多企業(yè)的的未解難題。
在上述風(fēng)險投資機(jī)構(gòu)負(fù)責(zé)人看來,DeepSeek的商業(yè)化路徑并沒有非常清晰?!斑@也是開源一直存在的問題,過往在軟件行業(yè)通過開源獲得巨大成功的公司在美國有出現(xiàn)過,在國內(nèi)確實(shí)尚未看到相關(guān)案例?!备螞r,從DeepSeek 的創(chuàng)始人梁文鋒的對外表態(tài)來看,他是一位技術(shù)理想主義者,而非為了盈利目的。
不過,云中江樹也指出,在目前大模型的發(fā)展階段,即使是閉源,其商業(yè)化本身也并不理想,如OpenAI、Grok等頭部模型的盈利能力也不強(qiáng)。底層的原因是,當(dāng)前大模型的智能化水平尚未達(dá)到真正商業(yè)化落地的要求。
DeepSeek在《DeepSeek-V3 / R1 推理系統(tǒng)概覽》中指出,由于DeepSeek-V3定價低于R1,且網(wǎng)頁端和應(yīng)用程序免費(fèi),僅部分服務(wù)產(chǎn)生收入,再加上非高峰時段設(shè)有夜間折扣,其實(shí)際收入不及理論數(shù)值。
“其他公司想快速做到(像DeepSeek)這么好,并不容易?!睋?jù)王偉透露,幾家知名的DeepSeek R1 API供應(yīng)商的利潤率遠(yuǎn)不如DeepSeek自己。但在此次開源周之后,這個情況有望改善。
王偉認(rèn)為,短期內(nèi), DeepSeek的開源會讓模型廠商面臨很大的壓力,大量的研發(fā)投入也可能會被質(zhì)疑。但長期來看,大模型的競爭遠(yuǎn)沒有結(jié)束,各模型廠商如果能適當(dāng)吸收DeepSeek的開源成果,拿出更競爭力的模型,未來是有可能反超的。長期看好中國的大模型企業(yè),國內(nèi)有多家基礎(chǔ)模型廠商具備與DeepSeek相當(dāng)?shù)膶?shí)力。
“開源也有其獨(dú)特的商業(yè)模式。”云中江樹表示,一種是免費(fèi)提供模型,但出售相關(guān)服務(wù)來盈利,比如幫助企業(yè)需要將模型部署到自己的公司,進(jìn)行性能調(diào)優(yōu)、本地部署、專項(xiàng)能力提升等;其次是實(shí)行雙軌制,即開源和閉源并行,一些基礎(chǔ)的或較小的模型開源以吸引人氣,而高級版、較大規(guī)模的模型則閉源出售;還有一種策略如埃隆·馬斯克旗下的xAI公司,它的策略是開源上一代Grok模型,而最新一代模型則采用閉源等。
“不過,無論是哪一種商業(yè)模式,目前沒有商業(yè)化訴求的DeepSeek可能還是一個很大的變量和異數(shù)。”云中江樹說。
(時代財經(jīng)龐宇對此文亦有貢獻(xiàn))