文|派財經(jīng) 羅莉
近日,Kimi智能助手火了。
一個明顯的感知是,最近身邊的大學生、職場人士都開始談論起了Kimi。一位職場寶媽告訴派財經(jīng),她最近在嘗試用Kimi輔導娃寫作業(yè),“真的很方便,都不用下載APP小程序和網(wǎng)頁就能打開?!?/p>
根據(jù)AI產(chǎn)品榜aicpb.com統(tǒng)計,目前國內(nèi)訪問量前十的產(chǎn)品中,Kimi在3月以12.61M的訪問量、環(huán)比321.58%的增長排在第二,僅次于文心一言。
成立近一年,短短五個月內(nèi)Kmi的“長文本”輸入量提升了10倍。
3月18日下午,月之暗面曾宣布在大模型長上下文窗口技術(shù)上取得新的突破,Kimi智能助手支持無損上下文長度從最初的20多萬字,擴容到200萬字。該消息公布后,Kimi關注度一路走高,一度擠爆了服務器。3月22日,月之暗面回應稱,觀測到Kimi系統(tǒng)流量持續(xù)異常增高,流量增加的趨勢遠超對資源的預期規(guī)劃,并表示已經(jīng)有多項應急措施正在實施,包括已經(jīng)進行了5次擴容工作。
此前,月之暗面副總裁許欣然在會議室展示了幾份用于測試的文件。幾十萬字的《甄嬛傳》劇本,Kimi不僅能夠一口氣讀完,而且還能根據(jù)情節(jié)準確回答出細節(jié)問題,解析人物劇情走向;在迅速學習完頭部醫(yī)學書籍《中醫(yī)內(nèi)科學》和《中醫(yī)診斷學》后,便可化身“老中醫(yī)”進行在線問診。
Kimi的成功破圈,讓國內(nèi)一眾大模型廠商感到措手不及。
01 Kimi,真的強嗎?
Kimi用戶體驗如何?派財經(jīng)對Kimi、文心一言、通義千問和豆包做了系列小測試。分別對其資料總結(jié)能力、檢索能力和創(chuàng)作能力進行了測驗。
首先是對資料總結(jié)、財報解讀能力測試:
派財經(jīng)隨機上傳了一份阿里2024財年中期報告pdf,輸入解讀指令。根據(jù)生成內(nèi)容來看,Kimi和通義千問給出的回答,羅列較為清晰,而文心一言則給出了概況,具體需要進一步指令才能繼續(xù)解讀,豆包給出了核心數(shù)據(jù)提煉回答。
其次是對用戶常用的資料檢索和整理功能測試:
派財經(jīng)以“幫我閱讀馬斯克最新演講”為指令,分別詢問。根據(jù)生成內(nèi)容來看,Kimi通過對7篇資料檢索解讀,給出了邏輯明確且詳細的觀點總結(jié),豆包則直接搜索出了多個相關報道鏈接,文心一言和通義千問則給出了比較框架性的總結(jié)。
值得注意的是,派財經(jīng)發(fā)現(xiàn)在已經(jīng)創(chuàng)建的Kimi窗口上傳完本地文件和網(wǎng)之后,智能助手會自動關閉聯(lián)網(wǎng)模式,這一功能在其它三個智能助手界面尚未發(fā)現(xiàn)。
再是對創(chuàng)作能力,生成腳本等創(chuàng)作力測試:
派財經(jīng)以“圍繞北京文旅為主題,寫一個短劇劇本”為指令,分別測試其創(chuàng)作能力。按照給出的基礎大綱來看,通義千問、Kimi和豆包給出了較為規(guī)范的劇本大綱框架,其中Kimi給出的最為規(guī)范且細節(jié),提到角色、場景、地點相對較詳細,在取名上也較為文藝。相較之下,文心一言給出的標題則較為直接,未交待劇本角色設定,但在場景、對話和獨白上更有“人味”。
綜上,在文生文應用上,Kimi的效果確實是看起來更有特色。
02 誰在為Kimi站臺?
Kimi智能助手是國內(nèi)大模型獨角獸公司月之暗面面向C端用戶推出的一項產(chǎn)品。
月之暗面公司成立于2023年3月,創(chuàng)始人楊植麟畢業(yè)于清華,博士畢業(yè)于卡內(nèi)基梅隆大學計算機專業(yè),曾就職于Google Brain和美國初創(chuàng)公司FAIR,師從蘋果公司人工智能負責人Ruslan Salakhutdinov,有多年創(chuàng)業(yè)經(jīng)驗。
從技術(shù)能力上看,Kimi的強大基因最初就已經(jīng)在創(chuàng)始人身上顯現(xiàn)。楊植麟是業(yè)內(nèi)公認的長文本領域?qū)<?,在近五年的自研語言處理(NLP)領域影響力頗大。
在讀博士期間,楊植麟就以第一作者身份發(fā)表 Transformer-XL 和 XLNet 兩項工作,在谷歌學術(shù)上被引用近兩萬次,并在多個NLP任務上取得了當時的最佳效果。而Transformer-XL成為首個全面超越 RNN 的注意力語言模型,XLNet則在20項頂級會議中獲得最佳論文提名。在華人學者引用排名中,楊植麟的學術(shù)論文位居前10,在40歲以下排名第一。
楊植麟的學術(shù)研究能力,助力其團隊創(chuàng)造了Kimi獨特且表現(xiàn)優(yōu)秀的無損壓縮技術(shù)。
這種技術(shù)可減少參數(shù)對存儲的需求、推理的算力,以及數(shù)據(jù)傳輸?shù)膸捳加?,從而高效率無損處理百萬級的長Token。而為了快速趕上長文本熱潮,其他大廠只能退而求其次,選擇檢索增強生成RAG技術(shù)。
Kimi的無損長上下文窗口的方案,是在逐字閱讀全文后給出答案。RAG技術(shù)是對全文關鍵信息進行檢索生成答案,但可能會丟失掉部分關鍵的信息。
這也就解釋了為何Kimi的長文本對話回答更準確,在用戶體驗度上美譽頗多。
但也有小紅書博主發(fā)筆記表示,在對Kimi的測試中發(fā)現(xiàn),Kimi有一股RAG味。
“月之暗面”這個名字,來源于英國著名搖滾樂隊Pink Floyd的專輯《The Dark Side of the Moon》,在科研之外,楊植麟也是一名搖滾發(fā)燒友,他曾在樂隊中擔任鼓手角色。
資本市場眾星捧月。創(chuàng)業(yè)一年之內(nèi),月之暗面就已經(jīng)完成了兩筆融資。最新一輪融資是在今年2月19日,融資額度超10億美金,投資方包括紅杉中國、小紅書、美團、阿里,老股東跟投。該筆融資成為國內(nèi)AI大模型迄今為止單輪融資最高的金額。早在2023年6月,月之暗面就曾獲得來自包括紅杉中國、真格基金等頭部投資公司的3億美金融資。在兩輪融資之后,當前月之暗面估值達到了25億美元。
Kimi的走火,離不開阿里在底層的算力支持。有消息稱,最新10億美金融資中有8億美金來自阿里,部分資金以阿里提供的算力折算。當前,Kimi借調(diào)了阿里的英偉達(NVDA.O)A800以及A100 GPU處理器的機型進行擴容,未來Kimi算力側(cè)的支持,也將主要來自于阿里。
03 Kimi搶了文心一言和豆包們的故事
在對AI長文本探索上,Kimi絕對不是第一家,國內(nèi)大模型頭部大廠,百度文心一言、阿里通義千問和360AI早已在做長文本的探索,抖音也在去年年底發(fā)力AI工具豆包。
在其他大模型大廠還在卷參數(shù)、開源和榜單的時候,Kimi切中了一個更貼近市場剛需的應用場景。將長文本作為標簽,通過大量的廣告營銷和用戶口碑,以“長文本”概念迅速占領用戶心智。上線之初,就通過突出文本處理字數(shù),為自己貼上了“超大內(nèi)存”的標簽,在PC硬件時代,不少C端用戶的認知是,內(nèi)存越大,處理能力就越強。
在Kimi出圈之前,行業(yè)內(nèi)在C端用戶市場教育上,百度的文心一言一家獨大,文心一言是大模型廠商中率先向社會全面開放的平臺。據(jù)相關數(shù)據(jù)統(tǒng)計,截至2023年9月,百度文心一言App的月活量達到最高峰值710萬。不過與Kimi不同的是除了2C之外,文心一言更大的精力放在研發(fā)行業(yè)大模型,垂直B端應用上。
其次是抖音的豆包在年初的初露頭角。依托于抖音的流量轉(zhuǎn)化池,字節(jié)跳動旗下的豆包APP在2024年1月活翻了一倍達到了400萬。
而新晉“網(wǎng)紅”Kimi的走紅要更快,據(jù)Similarweb數(shù)據(jù),Kimi Chat網(wǎng)頁端數(shù)據(jù)最新峰值達34.6萬人次。根據(jù)AI產(chǎn)品榜,Kimi Chat的2月訪問量在國內(nèi)榜排名第三,2月平均日活同比上升101.9%,全球增速榜排名第一,3月前二周繼續(xù)攀升。
Kimi上線的時間是2023年10月,當時可以支持無損上下文長度最多為20萬漢字。在5個月的時間內(nèi),月之暗面直接將長文本能力提高10倍。按照AI領域的計算標準,200萬漢字的長度大約為400萬token,在全球范圍內(nèi)也屬于領先的標準。3月18日,月之暗面宣布在大模型長上下文窗口技術(shù)上取得新的突破,其自研的Kimi智能助手已支持200萬字超長無損上下文,并于今日開啟產(chǎn)品內(nèi)測。
月之暗面方面表示,如今Kimi能夠一口氣精讀500個甚至數(shù)量更多的文件,幫助用戶快速分析所有文件的內(nèi)容,并且支持通過自然語言進行信息查詢和篩選,大大提高信息處理效率。
在產(chǎn)品定位上,Kimi足夠堅定,面向C端用戶,主打長文本。AI搜索+文檔總結(jié)功能。
Kimi開始就為用戶敞開了大門,不僅能從網(wǎng)頁端入口進入,還能在APP和小程序端口打開,降低了使用大模型的門檻,這是業(yè)內(nèi)B端大模型廠商無法匹敵的。
在選擇早期產(chǎn)品使用者集中在科研、法律、金融、媒體等垂直領域,而這部分垂直領域的KOL為Kimi帶來了自然流量與口碑積累。
Kimi在發(fā)力營銷同時,也有一部分“自來水”自發(fā)為Kimi站臺推廣。
將互聯(lián)網(wǎng)營銷公式帶入到了硬科技領域,Kimi的營銷開局頗為高調(diào)。在月之暗面發(fā)布的Kimi上線官宣文標題中提到,“歡迎與Moonshot AI共同開啟Looooooooooong LLM時代”,其中英文“l(fā)ong”用了接連十個“o”將Kimi的“長文本能力”直觀呈現(xiàn)出來。
Kimi提供的長文本閱讀能力和概括能力是兩大功能,面向C端用戶,致力于為用戶打造一個高學習力的免費私人助手。
一份上萬字的文獻,投喂給Kimi,只需要幾分鐘就能讀完全文并歸納總結(jié)出核心論點,極大程度為用戶提升了閱讀效率。
用戶投喂的各種資料又能反哺Kimi的語意語境學習理解能力,從而在不斷打磨中提高準確性。值得一提的是,在此類專業(yè)語料處理上的進步速度,Kimi甚至快于Open AI。主要由于當前Open AI對于C端用戶上傳文件仍然有所限制。
如果把Kimi智能助手類比做人類,它的突出之處在于具備較長時間段的記憶力,是一個記性超好的學霸,可以一次記住20萬字的上下文,一口氣讀完一本書或者一系列文章。相較國外綜合能力最強的學霸GPT4(可以記住2.5萬字)。Kimi的記憶力是GPT4的8倍。
有小紅書博主試著通過Kimi智能助手,訓練出在自媒體領域現(xiàn)象級創(chuàng)作者咪蒙,將50個文檔投喂給Kimi之后,一步步引導其分析咪蒙寫作的核心特點以及對待感情態(tài)度后,下指令讓其生成一篇關于“彩禮”的文章,成稿雖然簡短但頗具“咪蒙味”。
在Kimi走火之后,各大模型廠商紛紛“秀肌肉”。
據(jù)第三方機構(gòu)的最新統(tǒng)計數(shù)據(jù)顯示,目前國內(nèi)已經(jīng)發(fā)布的大型語言模型數(shù)量已經(jīng)超過了300個。這些大型模型的發(fā)布主體涵蓋了科技巨頭、國內(nèi)頂尖的高等學府、以及各類科研機構(gòu),他們在資金投入、資源配置、人才聚集等方面都擁有絕對的優(yōu)勢。
國內(nèi)互聯(lián)網(wǎng)大廠火速將相關功能進行了升級,卷起了長文本“長度”。
2023年10月30日,Kimi首發(fā)不到一個月,同為清華系校友的王小川的百川智能就推出了單次處理35萬漢字的Baichuan2-192K,打破了Kimi的20萬字記錄,隨后,李開復也發(fā)布了能夠處理40萬字的Yi-34B。
在Kimi宣布更新200萬字長文檔處理能力后,阿里宣布通義千問升級,免費開放1000萬字的長文檔處理功能,成為全球文檔處理容量第一的AI應用;隨后,百度文心一言、360智腦也都把500萬字長文本提上了日程。
目前,大模型最強王者OpenAI的GPT-4 Turbo-128k可處理文本能力約為10萬漢字,專攻長本文的Claude3-200K上下文處理能力約為16萬漢字。
一時間,各大模型廠商比起了誰更“長”,而文本處理能力越長就能代表能力強嗎?
此前,對于文本窗口的長度,楊植麟曾表示,不能只提升窗口,不能只看數(shù)字,要看它在這個窗口下能實現(xiàn)的推理能力、the faithfulness的能力(對原始信息的忠實度)、the instruction following的能力(遵循指令的能力)。
04 長文本能力能幫Kimi造血嗎?
Kimi火爆的表象之下,一個更為現(xiàn)實的問題暴露無遺,長文本能力能為Kimi造血嗎?
根據(jù)新浪科技提供的數(shù)據(jù),考慮到廣告投放和算力成本,Kimi每個獲客用戶的成本達到12-13元,而按照近一個月將近18000的日均下載量計算,Kimi每日的獲客成本高達20萬元。而除了每日20萬的獲客成本外,Kimi需要燒錢的地方還有很多,比如不斷提升信息檢索能力、遵循復雜指令的能力,推動多模態(tài)模型研發(fā),以及實現(xiàn)音頻處理等其他需求。
接下來,付出了高額成本,能否將現(xiàn)有用戶留住,持續(xù)轉(zhuǎn)化將是對Kimi產(chǎn)品的一大考驗。為龐大的用戶群體提供穩(wěn)定的服務,同樣是一筆不小開支。
長文本能力短期內(nèi)幫助Kimi出圈,但很難成為其獨家技術(shù)壁壘。Kimi的長文本處理能力與通義千問、360智腦等AI產(chǎn)品相比,并沒有非常明顯的優(yōu)勢。
雖然實現(xiàn)造血能力難,但Kimi的C端策略也有一定意義,通過長文本先征服用戶,進而讓更多B端客戶看到大模型底層應用能力的真正價值。
但從整體盈利角度來看,Kimi靠燒錢摸索出的獲客模式很容易被復制,對于將業(yè)務重心放在B端服務的大廠們來說,獲客成本反而是更低的。
行業(yè)內(nèi)多數(shù)大模型公司均采取的是2B和2C兩條腿走路,通過推出行業(yè)大模型直接售賣B端解決方案,或是向公司、開發(fā)者售賣API,按照調(diào)用次數(shù)收費。此外,以文心一言為代表的一種C端打法是,面向C端用戶,為會員增值服務,在應用端按月/年向用戶收費,當前文心一言扔在試水階段,而后起之秀Kimi則仍然處于免費模式階段。
不過,有聲音認為,Kimi的出現(xiàn)對于國內(nèi)大模型市場提供了新的思路,從基礎大模型的訓練和競爭逐步向更貼近客戶的產(chǎn)品功能和細節(jié)需求轉(zhuǎn)變。
有業(yè)內(nèi)人士表示,當下這一輪人工智能革命本質(zhì)上是自然語言處理(NLP)的技術(shù)革命,更是一次交互方式的革命。從文本向多模態(tài)發(fā)展是大模型必經(jīng)之路。而視頻處理需要更大的參數(shù)量和存儲容量,對算力和算法的要求也更高。接下來Kimi的應用將從單模態(tài),向多模態(tài)化發(fā)展,即從單一的文本處理基礎上,增添聲音、圖像等信息處理技術(shù)。
亦有觀點認為,Kimi的出圈意味著在中文領域開啟了AI大模型應用元年,長文本時代已至。大模型在實現(xiàn)通往AGI(通用人工智能)路上又近了一步。然而需要厘清的是,長文本能力并非唯一標準,多模態(tài)學習、神經(jīng)網(wǎng)絡架構(gòu)創(chuàng)新、應用落地與生態(tài)建設、倫理與道德框架構(gòu)建等各個維度都不可或缺。
一位初入職場的金融分析師向派財經(jīng)感嘆道,Kimi的強大學習理解能力讓人感到威脅,“可能過不了多久,向我這樣的初級分析師就要被AI智能助手替代了?!边@一擔憂并非空穴來鳳,在效率至上的資本市場,華爾街有個說法叫“20美金實習生”,時薪20美金的實習生工作未來一段時間大概率會被AI替代。
AI是否會替代職場人?在《所羅門的密碼:AI時代的價值、權(quán)力與信任》中,作者奧拉夫·格羅思、馬克·尼茲伯格曾給出過解釋,“最終,問題不在于工作是否會改變,工人是否會被取代。這甚至不需要超級智能就會實現(xiàn)。問題是這些轉(zhuǎn)變將會以多快的速度發(fā)生,我們能否跟上它們的步伐,特別是在教育和勞動力培訓方面。正如奧萊利媒體公司的創(chuàng)始人兼首席執(zhí)行官蒂姆·奧萊利(Tim O’Reilly),在他的視頻《我們?yōu)槭裁从肋h不會失業(yè)》中所說的那樣,我們的辦法總比困難多。但是,適應新的工作性質(zhì)需要發(fā)揮想象力并做好準備?!?/p>