文|互聯(lián)網(wǎng)怪盜團
在5月15日的火山引擎大會上,字節(jié)跳動將自研的“云雀”大模型統(tǒng)一改名為“豆包”大模型,并一次發(fā)布了9個大模型產(chǎn)品。毫無疑問,當(dāng)前的國內(nèi)生成式AI行業(yè)還處于群雄逐鹿的混亂狀態(tài),競爭格局高度不穩(wěn)定,字節(jié)跳動在技術(shù)上并不屬于最領(lǐng)先的(就連是否屬于第一集團都還有爭議);但是,憑借自己的消費端產(chǎn)品開發(fā)經(jīng)驗、內(nèi)容數(shù)據(jù)儲備、以及管理層的重視,它已經(jīng)在國內(nèi)生成式AI市場占據(jù)了舉足輕重的地位。
我認(rèn)為字節(jié)跳動的AI野心相當(dāng)龐大:它想建立一個以消費端(C端)應(yīng)用為基礎(chǔ),橫跨C端和B端(企業(yè)端)的“大而全”的體系,然后以此為支點,進(jìn)一步打入云計算等技術(shù)基建生態(tài)。相比之下,阿里是希望以云計算為基礎(chǔ)、以B端為突破口,對C端不是特別重視;百度是搖擺于B端和C端之間,兩邊好像都取得了一些成果,但兩邊都沒有做好;騰訊則尚未形成清晰統(tǒng)一的AI戰(zhàn)略,或許形成了但是沒有對外公開;至于華為的主要精力則是集中在硬件相關(guān)生態(tài),對于AI應(yīng)用層的實際投入有限。
基于從各種渠道獲得的信息,我們可以確信,字節(jié)跳動賦予了AI相當(dāng)高的戰(zhàn)略定位,聚集了很多資源,并確定了未來一段時間的打法:
字節(jié)跳動在AI技術(shù)及產(chǎn)品方面聚集了大批精兵強將,其中包括抖音和TikTok當(dāng)年的一些靈魂人物,這是它所能拿出的最強有力的陣容了。
字節(jié)跳動的AI業(yè)務(wù)可以說是應(yīng)用驅(qū)動的,其C端應(yīng)用發(fā)展非常快,數(shù)量多、垂類覆蓋廣,大有當(dāng)年做“移動APP工廠”的架勢。
豆包大模型設(shè)置了極低的價格,對于國內(nèi)所有大模型創(chuàng)業(yè)公司而言是一個嚴(yán)峻沖擊,不過我們尚不知道這種沖擊的實際效果如何。
字節(jié)跳動大模型的負(fù)責(zé)人是朱文佳,曾任TikTok產(chǎn)品技術(shù)負(fù)責(zé)人。2023年11月成立的Flow(AI應(yīng)用)部門負(fù)責(zé)人是朱駿,是原Music.ly創(chuàng)始人、原TikTok負(fù)責(zé)人;Flow移動產(chǎn)品負(fù)責(zé)人是陸游,曾任抖音社交負(fù)責(zé)人。不久前從抖音調(diào)任剪映的張楠(女),其重要任務(wù)也是依托AI去改造剪映產(chǎn)品。上述陣容不僅是字節(jié)跳動最拿得出手的精兵強將,在整個中國互聯(lián)網(wǎng)行業(yè)也堪稱豪華。對于其他互聯(lián)網(wǎng)大廠而言,派出一線大將主管AI大模型是常見的,但是在AI應(yīng)用層堆積這么多大將就顯得太奢侈了。
有人會問:為什么不把這些大將用于抖音等“旗艦業(yè)務(wù)”,而要用于前途未卜的AI業(yè)務(wù)?答案很簡單:因為抖音不再需要那么多人了,對于業(yè)務(wù)領(lǐng)導(dǎo)者的素質(zhì)要求也有很大改變。上面列舉的張楠、朱駿、朱文佳、陸游等人,幾乎全是產(chǎn)品向人才,即所謂“打江山的人”;現(xiàn)在抖音大局已定,沒什么江山可以打了,要打也是作為防御一方而不是進(jìn)攻一方。在用戶滲透率見頂、產(chǎn)品功能和技術(shù)不需要激進(jìn)迭代的情況下,抖音最需要的是商業(yè)化人才,即“從打下的江山上收錢的人”。
過去一年多在抖音內(nèi)部地位上升的人,例如新任本地生活業(yè)務(wù)負(fù)責(zé)人浦燕子,基本都來自張利東麾下,而張利東是整個中國互聯(lián)網(wǎng)行業(yè)最成功的商業(yè)化負(fù)責(zé)人之一。抖音的商業(yè)化已經(jīng)非常成功了,在此基礎(chǔ)上若還想深挖,就要對領(lǐng)導(dǎo)團隊進(jìn)行改組,使其從“產(chǎn)品驅(qū)動”進(jìn)一步轉(zhuǎn)向“商業(yè)化驅(qū)動”。AI技術(shù)及其應(yīng)用,恰恰是吸納那些從抖音退下來的“產(chǎn)品型人才”的最佳場所。
字節(jié)跳動的生成式AI業(yè)務(wù)從一開始就是應(yīng)用驅(qū)動的。作為大模型負(fù)責(zé)人,朱文佳對朱駿雖然沒有實線匯報關(guān)系,但仍然存在虛擬匯報關(guān)系(這在字節(jié)跳動內(nèi)部相當(dāng)常見);在大模型統(tǒng)一改名“豆包”之后,F(xiàn)low應(yīng)用部門對AI大模型開發(fā)的影響力可能進(jìn)一步加強。在其他互聯(lián)網(wǎng)大廠,大模型研發(fā)團隊可能具備相當(dāng)高的自主性,乃至“自下而上”推動應(yīng)用建設(shè);在字節(jié)跳動,“自上而下”的邏輯則占據(jù)主導(dǎo)地位,應(yīng)用團隊獎其需求傳導(dǎo)到了基礎(chǔ)研發(fā)團隊,由此形成高度實用的組織決策模式。
迄今為止,字節(jié)跳動已經(jīng)推出了11款A(yù)I應(yīng)用;其中,豆包是國內(nèi)用戶最多的AI獨立應(yīng)用,其MAU可能已達(dá)到2000萬量級。需要指出的是,這并不意味著豆包大模型(原名云雀大模型)的使用量是全國最大的,因為阿里的通義千問、百度的文心一言均通過網(wǎng)頁端和API擁有上億級別的客戶,其API調(diào)用次數(shù)也遠(yuǎn)遠(yuǎn)高于豆包。但是如果只比較獨立APP,豆包的用戶優(yōu)勢是無可爭議的——這就是字節(jié)跳動一貫的打法,以高效率的移動應(yīng)用迭代去占領(lǐng)新興市場。
我們不難看出,同樣是在戰(zhàn)略上高度重視生成式AI的大廠,字節(jié)跳動與阿里的打法完全不同。后者以阿里云為基礎(chǔ),先建立一個涵蓋閉源和開源大模型、具備成熟開發(fā)環(huán)境和開發(fā)工具的完整生態(tài),以B端客戶為主攻方向,與現(xiàn)有應(yīng)用融合時也是優(yōu)先考慮釘釘這樣的To B應(yīng)用。前者則以豆包等C端APP為基礎(chǔ),先建立一個廣闊的、用戶眾多的、覆蓋各種垂類的AI移動APP生態(tài),然后再逐步擴大對B端的影響力。5月15日的火山引擎發(fā)布會,在一定程度上體現(xiàn)了字節(jié)跳動對目前的C端AI進(jìn)展比較滿意,計劃加強對B端的進(jìn)攻了。
豆包大模型最重要的特點是價格低廉:與類似水平的國產(chǎn)通用大模型相比,其Token價格要低95%以上。如果這個價格是真實的、不限量的,那么對于國內(nèi)大模型創(chuàng)業(yè)公司而言,簡直是滅頂之災(zāi)!請注意以下事實:
在現(xiàn)有的Token價格水平上,如果考慮到訓(xùn)練成本攤薄的因素,幾乎所有國產(chǎn)大模型在財務(wù)上都是虧損的。
由于國產(chǎn)大模型太多,價格戰(zhàn)愈演愈烈,有的大模型甚至是邊際虧損的:不考慮訓(xùn)練成本攤薄,只考慮推理成本,毛利率仍然是負(fù)數(shù)。
受到國內(nèi)經(jīng)濟形勢以及人力成本低廉的影響,B端客戶對大模型的價格相當(dāng)敏感,即使技術(shù)水平比較優(yōu)越的大模型也賣不出更高的價格。
雖然AI創(chuàng)投看起來很熱鬧,但是雷聲大雨點小,創(chuàng)業(yè)公司拿到的錢很少(其中很大一部分還以算力形式支付),根本沒有本錢打價格戰(zhàn)。
假如豆包真的打穿了大模型的“地板價”并且堅持執(zhí)行下去,其他互聯(lián)網(wǎng)大廠肯定也會跟進(jìn),那么國產(chǎn)大模型創(chuàng)業(yè)賽道可能迎來一場浩劫。只有大廠才能在這種不計成本的消耗戰(zhàn)當(dāng)中幸存,絕大多數(shù)創(chuàng)業(yè)公司難逃垮掉或被整合的命運!這就是用C端應(yīng)用思維做B端產(chǎn)品的可怕之處,至于這套思維在長期是不是可持續(xù),那又是另一個問題了。反正字節(jié)跳動燒得起錢,其他大廠也跟得起,只有小公司受傷的世界達(dá)成了?
至于豆包大模型的技術(shù)水平如何,倒不是一個特別重要的問題。很多人會疑惑,字節(jié)跳動生成式AI部門的人員背景相當(dāng)龐雜,其中僅有極少數(shù)具備真正的AI技術(shù)背景,而且是“應(yīng)用驅(qū)動”的——這是否天然不利于大模型技術(shù)開發(fā)?不過,在國內(nèi)現(xiàn)有環(huán)境下,哪怕豆包大模型的技術(shù)水平不領(lǐng)先,也不影響其業(yè)務(wù)應(yīng)用在短期的蓬勃發(fā)展。我們需要意識到:
與國內(nèi)最先進(jìn)的一些大模型(名字就不點了)相比,豆包的最新版本可能有10%左右的效率差距。但是對于C端用戶而言,這種差距不太明顯;對于B端用戶而言,巨大的價格優(yōu)勢足以彌補這一點技術(shù)差距。
國內(nèi)大模型創(chuàng)業(yè)公司在產(chǎn)品、商務(wù)、二次開發(fā)等層面上,普遍處于“草臺班子”階段,能夠把大模型研發(fā)做好已屬不易。無論面向C端還是B端用戶,與字節(jié)跳動等武裝到牙齒的大廠相比,它們的天然劣勢十分明顯。
國內(nèi)部分大模型的領(lǐng)先,并不是OpenAI那種劃時代意義的領(lǐng)先,而是在小地方當(dāng)老大而已。與GPT-4相比,國產(chǎn)大模型作為一個整體的落后幅度很大。既然如此,豆包與它們的短期技術(shù)差距也不是什么大不了的事情。
字節(jié)跳動的AI野心能否成功,取決于國內(nèi)生成式AI應(yīng)用的發(fā)展大勢:它最早取得突破、實現(xiàn)良性循環(huán)的領(lǐng)域,如果是B端,那么阿里無疑將取得較大優(yōu)勢,百度也有機會;如果是C端,那么字節(jié)跳動的優(yōu)勢將相當(dāng)明顯。在前一種場景下,國內(nèi)大模型創(chuàng)業(yè)公司或許還能通過對垂直應(yīng)用的理解和定制開發(fā)能力,占據(jù)一席之地;在后一種場景下,成熟的互聯(lián)網(wǎng)大廠將會一手遮天,AI將不會促進(jìn)行業(yè)“再平衡”,而只會加固極少數(shù)巨頭的地位。
還有一個問題,不僅對字節(jié)跳動很重要,對整個行業(yè)都很重要,那就是算力問題。我在上文刻意忽略了這個問題,因為我不知道怎么解答。所有國內(nèi)互聯(lián)網(wǎng)大廠都儲備了一定量級的AI訓(xùn)練及推理算力;具體到字節(jié)跳動,不僅自身有較大的算力儲備,還從阿里云租用了大量算力??墒侨绻鸄I應(yīng)用真能取得上億級別的MAU,乃至像抖音那樣成為頭部C端應(yīng)用,目前全國的算力儲備都是遠(yuǎn)遠(yuǎn)不夠的。許多用戶已經(jīng)注意到了,一些國內(nèi)AI聊天應(yīng)用經(jīng)常出現(xiàn)提問需要排隊的現(xiàn)象,這就是算力不足的一個體現(xiàn)。這種算力瓶頸是不能依靠砸錢去解決的,因為供應(yīng)商已經(jīng)不再收錢了。
在可見的未來,如果我們還是無法以合理的成本解決算力問題,那么生成式AI在國內(nèi)的C端應(yīng)用的道路將會很窄,因為推理算力可能只夠滿足少數(shù)專業(yè)化的B端客戶的需求(價格也會被推得很高)。這樣的問題顯然不是字節(jié)跳動或任何一家互聯(lián)網(wǎng)大廠所能解決、所應(yīng)該考慮的。我希望它能得到妥善解決,盡管我完全不知道怎么解決。