界面新聞記者 | 肖芳
界面新聞編輯 | 文姝琪
界面新聞從多個知情人士處獲悉,豆包大模型去年大幅降價后,毛利率依然為正。其中,字節(jié)跳動最新推出的豆包大模型1.5,在推理成本優(yōu)化上取得進(jìn)一步突破。在火山引擎上售賣API的Doubao-1.5-pro,毛利率仍能達(dá)到50%。
去年5月,字節(jié)跳動正式對外發(fā)布豆包大模型。其中,豆包通用模型pro-32k版,模型推理輸入價格僅每百萬tokens 0.8元,而當(dāng)時市場上同規(guī)格模型的定價一般為每百萬tokens 120元,是豆包模型價格的150倍。
豆包大模型降價之后,阿里云通義大模型等產(chǎn)品也相繼調(diào)低了價格。市場上也一直有聲音質(zhì)疑價格大幅降低之后,大模型是否還能賺錢。上述知情人士表示,現(xiàn)在看來,這種擔(dān)心有些多慮了。
火山引擎總裁譚待此前接受界面新聞采訪時,也曾經(jīng)談及過模型大幅降價的問題。在他看來,使用量足夠大,才能打磨出好模型,也能大幅降低模型推理的單位成本。“大模型降價,不能只提供低價的輕量化版本,主力模型和最先進(jìn)的模型也要夠便宜,才能真正滿足企業(yè)的復(fù)雜業(yè)務(wù)場景需求,充分驗證大模型的應(yīng)用價值,從而催化出超越現(xiàn)有產(chǎn)品和組織模式的創(chuàng)新。”
從過去一年的發(fā)展來看,豆包通用大模型在市場上的表現(xiàn)一定程度上驗證了譚待的判斷。
一方面,豆包大模型的調(diào)用量在快速增長。字節(jié)跳動對外公布的數(shù)據(jù)顯示,截至去年12月中旬,豆包通用模型的日均tokens使用量已超過4萬億,較首次發(fā)布時增長了33倍。
另一方面,豆包大模型的能力快速提升,但成本仍在持續(xù)降低。1月22日,字節(jié)跳動發(fā)布了豆包大模型1.5Pro,性能比之前版本顯著增強,多項基準(zhǔn)測試甚至超過GPT4o,推理成本卻大幅降低。據(jù)字節(jié)跳動官方介紹,豆包1.5采用大規(guī)模稀疏MoE架構(gòu),性能等效7倍激活參數(shù)的稠密模型,遠(yuǎn)高于業(yè)界常規(guī)的3倍杠桿。
界面新聞查詢火山引擎官網(wǎng)發(fā)現(xiàn),Doubao-1.5-pro-32k的百萬tokens輸入價格仍為0.8元,命中緩存為0.16元,輸出價格為2元;輕量化版本Doubao-1.5-lite-32k的百萬tokens輸入價格0.3元,命中緩存0.06元,輸出價格0.6元。兩款模型價格在業(yè)界同級別最低。
新模型在價格保持不變的同時,隨著推理成本持續(xù)優(yōu)化,毛利率也顯著增加。一位接近火山引擎的知情人士透露,豆包大模型API之前只能說是有合理毛利率,1.5版的毛利則能達(dá)到50%的可觀水平。
大模型應(yīng)用正在向各行各業(yè)加速滲透。據(jù)字節(jié)跳動方面此前公布的信息,豆包大模型已經(jīng)與八成主流汽車品牌合作,并接入到多家手機、PC等智能終端,覆蓋終端設(shè)備約3億臺,來自智能終端的豆包大模型調(diào)用量在半年時間內(nèi)增長100倍。最近幾個月,豆包大模型在信息處理場景的調(diào)用量增長了39倍,客服與銷售場景增長16倍,硬件終端場景增長13倍,AI工具場景增長9倍,學(xué)習(xí)教育等場景也有大幅增長。
但上述知情人士透露,由于研發(fā)投入巨大,字節(jié)的大模型業(yè)務(wù)仍是虧損狀態(tài)。只有持續(xù)擴(kuò)大應(yīng)用側(cè)的模型調(diào)用規(guī)模,才能長期攤銷掉研發(fā)成本。
界面新聞向字節(jié)跳動方面求證上述信息,截至發(fā)稿,對方暫未回應(yīng)。