文 | 時(shí)代周報(bào)
DeepSeek引發(fā)的蝴蝶效應(yīng)還在持續(xù)。
1月20日,DeepSeek公司正式發(fā)布了其推理模型DeepSeek-R1的完整版本。該模型通過(guò)算法優(yōu)化,以較低的訓(xùn)練成本實(shí)現(xiàn)了與OpenAI推理模型o1相媲美的性能,并且開(kāi)源。
傳統(tǒng)AI訓(xùn)練對(duì)算力的需求巨大,當(dāng)業(yè)內(nèi)普遍為AGI(通用人工智能)貼上“大力出奇跡”的標(biāo)簽,DeepSeek卻開(kāi)辟了一片“無(wú)人區(qū)”,吸引一眾企業(yè)爭(zhēng)相接入。企業(yè)接入DeepSeek,即企業(yè)通過(guò)硬件設(shè)備連接DeepSeek的訪問(wèn)地址,從而獲取DeepSeek的模型服務(wù)。
據(jù)不完全統(tǒng)計(jì),接入DeepSeek-R1模型的國(guó)內(nèi)上市公司已經(jīng)超過(guò)100家,其中不乏阿里、騰訊、百度、三大運(yùn)營(yíng)商這類(lèi)擁有自研模型和AI應(yīng)用的企業(yè)。
時(shí)代周報(bào)記者采訪多位業(yè)內(nèi)人士發(fā)現(xiàn),企業(yè)選擇DeepSeek的原因主要集中在兩方面。一是DeepSeek-R1開(kāi)源較徹底,部署方便,且在特定場(chǎng)景下展示了強(qiáng)大的處理和推理能力;另一方面,DeepSeek聲量走高,意味著接入方有機(jī)會(huì)承接其外溢的流量。QuestMobile數(shù)據(jù)顯示,DeepSeek的日活躍用戶數(shù)在2月1日突破3000萬(wàn)大關(guān)。
不過(guò), 大廠接入DeepSeek模型也可能面臨巨大的虧損壓力。近期,AI Infra(連接硬件和上層應(yīng)用的中間層基礎(chǔ)設(shè)施)企業(yè)潞晨科技CEO尤洋指出,滿血版DeepSeek-R1每百萬(wàn)token(輸出)定價(jià)16元,如果每日輸出1000億token,一個(gè)月算下來(lái)接入方企業(yè)可獲得4800萬(wàn)元收入。據(jù)他測(cè)算,完成1000億token的輸出,需要約4000臺(tái)搭載H800的機(jī)器,以目前H800的市價(jià)或者折舊來(lái)計(jì)算,每月僅機(jī)器成本就達(dá)4.5億元,因此企業(yè)方可能面臨每月4億元的虧損,“用戶越多,服務(wù)成本越高,虧損越多”。
AI Infra廠商市場(chǎng)負(fù)責(zé)人張迪(化名)告訴時(shí)代周報(bào)記者,離DeepSeek瘋狂發(fā)酵僅有數(shù)周,軟硬件適配、測(cè)試、上架等工程都需要時(shí)間,目前公司對(duì)外合作的項(xiàng)目還未落地,因此具體成本數(shù)據(jù)暫不清晰。
在AI的潮汐效應(yīng)下,接入DeepSeek是否一本萬(wàn)利,還需讓子彈再飛一會(huì)兒。
接入模型并非“量”的比拼
目前來(lái)看,企業(yè)接入DeepSeek的程度有所不同。
2月13日,繼微信、騰訊文檔、QQ瀏覽器等業(yè)務(wù)側(cè)產(chǎn)品先后接入DeepSeek-R1后,騰訊自研的AI助手“騰訊元寶”也正式接入DeepSeek-R1,支持用戶切換使用混元大模型和DeepSeek-R1。
相比騰訊近乎全面擁抱DeepSeek的決心,阿里等公司對(duì)DeepSeek的接入主要體現(xiàn)在自己的主營(yíng)業(yè)務(wù)側(cè)產(chǎn)品,給自研的大模型產(chǎn)品保留了一部分空間。如阿里的1688、釘釘、阿里云相繼接入DeepSeek,其旗下全能AI助手通義APP尚未表態(tài)。
不難發(fā)現(xiàn),接入DeepSeek的企業(yè),率先將DeepSeek應(yīng)用在了AI能力運(yùn)用場(chǎng)景較多的業(yè)務(wù)上。
“接入模型并非‘量’的比拼,需求方應(yīng)該充分考慮模型與業(yè)務(wù)場(chǎng)景適配性?!敝档觅I(mǎi)科技CTO王云峰在接受時(shí)代周報(bào)記者采訪時(shí)表示,當(dāng)下大模型的應(yīng)用模式愈發(fā)多樣,不同模型有各自適配場(chǎng)景。
此前,值得買(mǎi)科技自研了130億參數(shù)消費(fèi)大模型,也接入了一些主流模型,談及接入DeepSeek的原因,王云峰解釋稱(chēng),值得買(mǎi)科技的自研模型在商品理解、價(jià)格預(yù)測(cè)等垂直領(lǐng)域能力出色,但AI技術(shù)的復(fù)雜性,決定了單一模型無(wú)法覆蓋所有場(chǎng)景。例如做檢索增強(qiáng)時(shí),內(nèi)部工具流程需AI合理調(diào)度,外部通用模型難以適配,此時(shí)自研模型就負(fù)責(zé)內(nèi)部流程調(diào)度、用戶意圖理解等關(guān)鍵任務(wù),而通用模型則用于站內(nèi)文章生成這類(lèi)通用場(chǎng)景。
從實(shí)際落地效果來(lái)看,DeepSeek-R1的問(wèn)題處理和推理能力表現(xiàn)出色。王云峰告訴時(shí)代周報(bào)記者,和包括DeepSeek-V3在內(nèi)的其他模型相比,DeepSeek-R1生成內(nèi)容的行文邏輯更清晰,文學(xué)性也更突出。其強(qiáng)大的語(yǔ)言處理能力,讓公司內(nèi)容生產(chǎn)的效率有了明顯提升,“如果使用通用模型,還需要進(jìn)行垂類(lèi)數(shù)據(jù)微調(diào)才能更好發(fā)揮作用。”
網(wǎng)絡(luò)安全公司知道創(chuàng)宇是DeepSeek更早期的受益者。
去年12月,知道創(chuàng)宇旗下的網(wǎng)絡(luò)空間測(cè)繪引擎ZoomEye國(guó)際版同步上線了對(duì)DeepSeek的調(diào)用支持。知道創(chuàng)宇CSO(首席戰(zhàn)略官)周景平向時(shí)代周報(bào)記者表示,從接入DeepSeek到現(xiàn)在,ZoomEye國(guó)際版的平臺(tái)注冊(cè)量增長(zhǎng)28.5%,平臺(tái)活躍度增長(zhǎng)121.6%,AI 搜索功能使用率達(dá)35.8%。
周景平在接受時(shí)代周報(bào)記者采訪時(shí)難掩興奮。他稱(chēng),DeepSeek被公司應(yīng)用在包括漏洞挖掘、數(shù)據(jù)情報(bào)分析、規(guī)則轉(zhuǎn)化處理、自動(dòng)化安全運(yùn)營(yíng)等多個(gè)細(xì)分業(yè)務(wù)場(chǎng)景中。在數(shù)據(jù)情報(bào)分析上,受益于DeepSeek等大模型數(shù)據(jù)分析及推理能力,公司可高效補(bǔ)齊之前所依賴(lài)的分析師知識(shí)框架之外的細(xì)節(jié)點(diǎn)。
“相比GPT,DeepSeek聚焦通過(guò)低成本高性能的技術(shù)路線,降低企業(yè)接入門(mén)檻,并通過(guò)開(kāi)源策略促進(jìn)技術(shù)普及和產(chǎn)業(yè)鏈協(xié)同,這為國(guó)內(nèi)企業(yè)級(jí)應(yīng)用的爆發(fā)提供了更大的可能性。”在周景平看來(lái),DeepSeek-V3和DeepSeek-R1利好接入企業(yè)的意義在于性?xún)r(jià)比高。他說(shuō),DeepSeek開(kāi)源較為徹底,同時(shí)發(fā)布了蒸餾模型的本地量化版,這使得企業(yè)進(jìn)行本地化部署的性?xún)r(jià)比大幅度提升。
適配商等來(lái)春天?
企業(yè)扎堆接入DeepSeek,也忙壞了位于大模型產(chǎn)業(yè)鏈中間層的適配廠商。
張迪向時(shí)代周報(bào)記者表示,DeepSeek爆火后,公司往來(lái)的咨詢(xún)者日益增多?!耙郧耙粌蓚€(gè)月才有一位前來(lái)咨詢(xún)業(yè)務(wù)的客戶,現(xiàn)在我們每天要接待十幾個(gè)?!睆埖戏Q(chēng),現(xiàn)在幾乎每天都需要加班,除了應(yīng)對(duì)業(yè)務(wù)咨詢(xún),還要參與直播、客戶驗(yàn)收、商務(wù)對(duì)接等工作,公司和小組的會(huì)議往往被安排在晚上8點(diǎn)和9點(diǎn)。
張迪稱(chēng),DeepSeek大火之前,大家對(duì)私有化部署僅僅停留在探討產(chǎn)品功能的層面,而如今公司的咨詢(xún)者,或許在焦慮的驅(qū)使下,合作目的更加明確,雙方談話主題大致鎖定在為提需求、了解產(chǎn)品性能、給報(bào)價(jià)三個(gè)方面。
另一AI Infra廠商的創(chuàng)始人趙欣向時(shí)代周報(bào)記者表示,需求大漲,行業(yè)工作節(jié)奏普遍加快,“有人手里拿著錢(qián)排隊(duì)等你的產(chǎn)品,肯定要比沒(méi)事做的時(shí)候興奮?!彼硎?,產(chǎn)品走向市場(chǎng),真正地為人所用,也是個(gè)人價(jià)值層面的正向反饋。
此前,有分析人士向時(shí)代周報(bào)記者稱(chēng),因國(guó)產(chǎn)算力適配成本較高,在英偉達(dá)的芯片稀缺情況下,使用國(guó)產(chǎn)算力的企業(yè)接入DeepSeek可能要面臨一定財(cái)務(wù)壓力,繼而影響到中間層廠商的發(fā)展前景。
尤洋向時(shí)代周報(bào)記者拆解了企業(yè)接入DeepSeek的路徑,他表示,DeepSeek是開(kāi)源模型,接入方只要有算力就可以部署運(yùn)行。
尤洋說(shuō),算力的主流提供方式一般有兩種,一種是企業(yè)自有算力,比如有本地的一體機(jī)或者機(jī)房;另一種是公有云上的算力,企業(yè)可以按月租用。除此之外,有一些云廠商還提供MaaS(Model as a Service)的模式,也就是將DeepSeek模型部署到公有云上后,需求企業(yè)再調(diào)用DeepSeek API,按實(shí)際使用的token量付費(fèi),適合早期的輕量化探索需求。
企業(yè)接入DeepSeek的成本主要分硬件和部署成本兩部分。
硬件成本方面,不同規(guī)格的硬件價(jià)格差異較大,相同規(guī)格不同規(guī)模的硬件價(jià)格也十分不同。“對(duì)于僅需要使用模型的企業(yè)來(lái)說(shuō),選擇推理芯片會(huì)有效降低硬件成本;而對(duì)于有微調(diào)和訓(xùn)練要求的企業(yè),可能在購(gòu)買(mǎi)或租賃硬件時(shí)需要使用訓(xùn)練芯片。另外,對(duì)于并發(fā)數(shù)量或者輸出速度要求較高的企業(yè),需要選擇有充足算力和顯存的芯片,這類(lèi)芯片的價(jià)格會(huì)偏高。”尤洋表示。
而部署成本的區(qū)別除了體現(xiàn)在不同規(guī)格芯片的部署難度上,還和企業(yè)的具體要求有關(guān)。比如,如果企業(yè)需要高并發(fā)、接入知識(shí)庫(kù)、接入聯(lián)網(wǎng)功能等,都會(huì)存在較大的工作量。
“對(duì)于滿血DeepSeek-R1 671B模型來(lái)說(shuō),本地化部署的硬件成本在百萬(wàn)級(jí)別,一般來(lái)說(shuō)是遠(yuǎn)高于部署成本的。有些中小型企業(yè)會(huì)使用蒸餾版的模型,或者是直接調(diào)用云廠商的API,這樣適配成本就會(huì)低很多?!庇妊笱a(bǔ)充道。
對(duì)于業(yè)內(nèi)的成本擔(dān)憂,趙欣稱(chēng),目前公司客戶以中小型企業(yè)和傳統(tǒng)行業(yè)的大型企業(yè)為主,雖公司體量、業(yè)務(wù)不同,所牽涉的成本數(shù)據(jù)也存在較大差異,但從目前的適配案例來(lái)看,客戶企業(yè)一般都具備承擔(dān)該項(xiàng)成本的能力。