春節(jié)過后,DeepSeek概念持續(xù)火熱,每日互動(300766.SZ)、浙江東方(600120SH)、華金資本(000532.SZ)等“參股deepseek概念”連續(xù)漲停。云計算公司也在港股和A股持續(xù)大漲,金山云(3896.HK)2月3日漲幅超過30%,青云科技(688316.SH)和優(yōu)刻得(688158.SH)連續(xù)20cm漲停。到2月6日,對DeepSeek的炒作進一步擴散到國產(chǎn)芯片、游戲等多個領(lǐng)域。
DeepSeek爆火到底利好誰?
參股概念全是假新聞
對于DeepSeek的炒作最早源于一系列“參股概念”公司。但事實上,DeepSeek的主體杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司自成立以來從未對外融資。
2月4日,每日互動發(fā)布公告稱,經(jīng)公司核實,深度求索的關(guān)聯(lián)公司-浙江九章資產(chǎn)管理有限公司(簡稱“幻方科技”)一位重要股東確實曾為每日互動創(chuàng)始核心骨干成員,但截至本公告披露日,每日互動未持有深度求索和幻方科技的股權(quán)。
2月5日,華金資本發(fā)布交易異常波動公告稱,公司關(guān)注到近期部分社交平臺上有傳言指本公司“間接參與DeepSeek Pre-A輪融資”,進而部分媒體將我司股票歸為“DeepSeek概念股”,由此引起資本市場的廣泛注意。經(jīng)核實,本公司(含控股子公司)、以及本公司子公司所管理的基金均未參與DeepSeek的融資。
2月5日,浙江東方發(fā)布公告稱,旗下基金板塊所投資的北京深度搜索科技有限公司、北京九章云極科技有限公司等公司名稱與深度求索及其關(guān)聯(lián)企業(yè)較為相似,但無任何股權(quán)投資關(guān)系,公司及旗下基金板塊管理的相關(guān)私募基金未直接或間接投資深度求索。
云計算有短期利好,對中型云計算廠商更有利
春節(jié)期間,國內(nèi)外多家云計算廠商宣布接入DeepSeek相關(guān)大模型,不僅如此,一些云計算廠商的API接入價格相比DeepSeek也有折扣。
目前,DeepSeek-R1官方刊例價為輸入4元/M tokens,輸出16元/M tokens,DeepSeek-V3的官方刊例價為輸入2元/M tokens,輸出8元/M tokens。
百度云率先上架,對應(yīng)模型調(diào)用價格為DeepSeek-V3官方刊例價的3折、DeepSeek-R1官方刊例價的5折。青云科技旗下AI算力云服務(wù)—基石智算CoresHub正式上線DeepSeek-R1系列模型,限時免費。優(yōu)刻得也在算力共享平臺上線了DeepSeek-R1的模型鏡像。
DeepSeek采用了最為寬松的MIT開源協(xié)議,這使得云計算廠商能夠一鍵復(fù)制最先進的開源模型,且在用于商業(yè)化時幾乎不受到任何限制,甚至允許修改后改為閉源。
青云科技工作人員告訴界面新聞,目前已有客戶在使用DeepSeek模型鏡像。其認為,DeepSeek爆火對云計算廠商的利好主要來自AI應(yīng)用落地可能加速推動大模型推理云計算需求,改變原先云計算廠商以訓(xùn)練需求為主的業(yè)務(wù)結(jié)構(gòu),現(xiàn)在“晚上訓(xùn)練,白天推理”可以充分提高閑置算力的使用效率。
此外,DeepSeek的崛起有利于拉近中型云計算廠商和頭部云計算廠商之間差距。阿里云、騰訊云、火山云等頭部云計算廠商都有自研大模型,相當于可以為用戶提供“特色菜”,而中型云計算廠商如優(yōu)刻得、金山云等公司,沒有財力自研大模型,一般只能支持用戶部署開源大模型。DeepSeek作為開源模型,能力已經(jīng)超越國內(nèi)閉源大模型,中型云計算廠商可以借此快速獲得頂尖大模型能力。
不過,長期看,國內(nèi)云計算廠商的前景仍有不確定性,一是市場競爭激烈,此次DeepSeek大模型接入,百度率先打三折,火山云隨后跟進打折,阿里云則采取蒸餾小模型限時免費的策略,各顯神通,本質(zhì)都是卷價格。二是對云計算廠商來說,公有云商業(yè)模式最優(yōu),但長期以來國內(nèi)大客戶傾向私有云和混合云,這也是國內(nèi)云計算廠商盈利能力弱于海外的重要原因,DeepSeek的爆火可能也無法改變國內(nèi)用戶這一習(xí)慣。
應(yīng)用軟件、硬件終端迎來轉(zhuǎn)機,不排除進一步泛化至游戲等領(lǐng)域
自大模型誕生以來,所有的應(yīng)用軟件和硬件終端公司都面臨一個困擾:為了迎接AI浪潮,要么選擇投入巨資研發(fā)大模型,但仍有被其他先進大模型碾壓的風(fēng)險;要么選擇和頭部大模型公司合作,面臨被“卡脖子”的風(fēng)險。以至于強大如蘋果,在大模型方面也選擇了與OpenAI合作。
2月5日,多家軟件公司股價大幅走高,金山辦公、福昕軟件和萬興科技等均漲超10%。據(jù)財聯(lián)社報道,金山辦公正與DeepSeek進行對接測試。
目前DeepSeek的主要能力在文字和圖像內(nèi)容的生成,基于其MIT開源協(xié)議,相關(guān)軟件公司可以將DeepSeek模型引入自身軟件中,全面提高軟件的AI能力,這種能力的提升相比云計算廠商的大模型鏡像部署更有價值。工具類軟件相比工業(yè)軟件更為受益,比如金山辦公、福昕軟件都涉及文字處理,萬興科技則涉及圖像編輯等能力,這些都處在DeepSeek能力圈范圍內(nèi)。而工業(yè)類軟件如中望軟件、浩辰軟件、索辰科技等,涉及到精確制圖、物理模擬這些領(lǐng)域,暫時還不是DeepSeek的強項。
對于軟件來說,基于用戶使用習(xí)慣等原因,本身就存在差異化,這種差異化不會因為大模型的引入而消除,大模型提升軟件智能化水平后還能進一步加強用戶粘性。
未來,隨著大模型成本進一步下降,游戲劇情,機器人玩家等也將引入人工智能因素,游戲玩法勢必迎來顛覆式創(chuàng)新,游戲公司也將成為DeepSeek后續(xù)波及的受益對象。
硬件終端類公司同樣受益于DeepSeek的生態(tài)繁榮,此前榮耀手機曾推出AI點外賣等智能體功能。但對于硬件終端廠商來說,智能體發(fā)展受到多方面制約。如果把大模型推理放在云端,一是延遲較高,二是消耗云端算力,成本較高;如果把大模型放在端側(cè),一是端側(cè)算力不足,如使用當前手機端側(cè)算力,僅AI交電費這一功能可能要運行五分鐘,二是端側(cè)模型能力也相對較差。
隨著DeepSeek的成熟,硬件終端廠商可以使用蒸餾技術(shù)生成參數(shù)量更小的模型,這類模型部署在手機、電腦這類硬件終端,相比“滿血”大模型,蒸餾模型犧牲的精度遠小于過去的壓縮技術(shù),因此端側(cè)模型能力將得到大幅提升,本身以“低成本”著稱的DeepSeek對端側(cè)芯片的要求也會降低。
具體來看,A股和港股的端側(cè)硬件終端上市公司包括小米集團(08180.HK)、傳音控股(688036.SH)、聯(lián)想集團(00992.HK)等,如果進一步泛化則可以擴展到智能硬件公司如螢石網(wǎng)絡(luò)(688475.SH)、石頭科技(688169.SH)、安克創(chuàng)新(300866.SZ)等。
當然,如果把人形機器人也算作智能終端,DeepSeek的出現(xiàn)可以大幅降低機器人訓(xùn)練和推理成本,對人形機器人產(chǎn)業(yè)鏈無疑是利好。近期,美國明星人形機器人公司Figure宣布與OpenAI終止合作,也表明人形機器人公司可以在開源大模型基礎(chǔ)上獨立發(fā)展的潛力。
利好國產(chǎn)芯片?
據(jù)不完全統(tǒng)計,國內(nèi)已經(jīng)有包括華為昇騰、海光信息(688041.SH)、云天勵飛(688343.SH)等10家國產(chǎn)AI芯片企業(yè)宣布適配或上架DeepSeek模型服務(wù)。
此前市場傳聞,“DeepSeek模型繞開了CUDA,轉(zhuǎn)而采用GPU低級匯編語言PTX進行優(yōu)化,因而利好國產(chǎn)芯片”。
但這一結(jié)論經(jīng)不起推敲,PTX 仍然是英偉達CUDA架構(gòu)中的技術(shù),用于連接CUDA高級語言代碼和 GPU底層硬件指令。這種編程非常復(fù)雜且難以維護,所以行業(yè)通用的做法是使用CUDA這樣的高級編程語言。
也就是說,這種基于PTX的優(yōu)化是針對特定英偉達芯片的,用戶如果換用其他品牌的芯片,需要重新編寫相關(guān)匯編語言,效果也必然打折扣。并且如果使用人工,這一工作量仍然是巨大的。
目前也有專業(yè)人士猜測,AI可以用于輔助編寫PTX代碼,從而減少人工工作量。不過,這一說法目前并未得到官方證實。手寫PTX通常用于極端優(yōu)化場景,需人類專家經(jīng)驗(如指令流水線調(diào)度),AI難以完全替代。
這意味著,英偉達芯片盡管仍是最好用的GPU,但通過極端優(yōu)化適配,國產(chǎn)芯片可以獲得一線生機。不過,利好程度可能并不及預(yù)期。