正在閱讀:

大廠要面子,Kimi要里子

掃一掃下載界面新聞APP

大廠要面子,Kimi要里子

Kimi還能火多久?

文|聽筒Tech 饒言

編輯|才哥

當互聯(lián)網(wǎng)大廠還醉心于在AI的“百模大戰(zhàn)”中大顯身手時,誰也沒有料到,他們竟然被一個“新人”抄了后路。

Kimi的爆火,來得太過突然,也很意外。

Kimi有多火?火到宕機成了近期常見的事,以至于官方不得不出面道歉。

說到AIGC,必聊Kimi,成了網(wǎng)友們最近的日常。很多人發(fā)現(xiàn),自己的朋友圈和微信群幾乎都在推薦Kimi,“這幾天微博熱搜幾乎每天都能刷到Kimi”、“如果還沒用過Kimi,那你就OUT了”……

“此前我一直用文心一言,直到有一天,朋友推薦了Kimi,我才知道,什么是好用的國產(chǎn)大模型?!?0后李琳是文字工作者,她對大模型的需求主要集中在資料的檢索和整理,之前文心一言能夠基本滿足她的需求。

但Kimi給了李琳全新的體驗,“僅從資料和素材的整理這一點來言,Kimi體驗感明顯勝于文心一言?!?/p>

王明是一位資深AI從業(yè)人員,他對此并不驚訝,他見證了Kimi從內(nèi)測到爆火的過程,“很顯然,‘草根出身’的Kimi更懂得什么是用戶真正的需求。”

“Kimi仍有一些不足之處,但從目前的用戶體驗來看,它已經(jīng)走在一些大廠大模型的前面?!蓖趺髦毖裕谀壳霸趪a(chǎn)大模型中,他更看好Kimi的未來。

資本市場也對Kimi表現(xiàn)出了滿腔熱情。自3月中旬以來,A股市場便催生了Kimi概念股,不少公司的股價受此影響,接連大漲。

萬興科技是接入Kimi的AIGC軟件企業(yè)之一,旗下視頻創(chuàng)意軟件萬興喵影接入Kimi。在萬興科技AI創(chuàng)新中心總經(jīng)理齊鏜泉看來,Kimi的出圈不僅反映了公眾對于新興技術的興趣和期待,也體現(xiàn)了資本市場對于AI技術的信心和追捧,“這也是個積極的信號,展示了AI應用的潛力和商業(yè)價值?!?/p>

“Kimi的出圈并非一蹴而就,其背后是大量的研發(fā)投入和持續(xù)的技術創(chuàng)新?!饼R鏜泉對《聽筒Tech》表示。

不過,Kimi未來能延續(xù)目前的火熱嗎?目前顯然還無法判定。實際上,隨著Kimi的爆火,有關其技術處理能力和商業(yè)化路徑的質(zhì)疑聲也不斷。

齊鏜泉也提示了風險,“隨著AI技術的廣泛應用,我們也應該關注其可能帶來的數(shù)據(jù)安全和隱私保護等問題,并積極尋求解決方案?!?/p>

01 Kimi到底表現(xiàn)如何?

“用過一次Kimi后,現(xiàn)在大部分時候都選擇使用它?!辈簧偃撕屠盍盏淖龇ㄒ粯?,長期需要閱讀大量數(shù)據(jù)和報告的證券分析師張強最近也在使用Kimi,在他看來,Kimi界面更友好,在文生文的大模型中,更貼近自己的需求。

張強已經(jīng)獲得Kimi的200萬字長文輸入內(nèi)測資格,他經(jīng)常將一些上市公司的年報或者IPO文件全文輸入到Kimi,他對《聽筒Tech》表示,Kimi能夠迅速將核心內(nèi)容提取出來,包括上市公司的基本信息、財務概覽、公司治理等核心內(nèi)容,“相對而言,其他國產(chǎn)大模型在歸納總結方面有所欠缺?!?/p>

Kimi的用戶體驗到底如何?《聽筒Tech》對Kimi、文心一言、通義千問、豆包,以及騰訊混元助手做了一系列小測試。

首先測試的是這些大模型對資料的總結能力。

需要說明的是,在幾家大模型的PC端版本中,Kimi、通義千問、豆包、文心一言對文件上傳功能操作友好,而騰訊混元助手PC端對文檔的上傳界面不太友好,《聽筒Tech》幾經(jīng)折騰,都未能找到將文件上傳到對話中的辦法。

《聽筒Tech》隨意抽取了一份最新的《美團2023年財務報告》進行測試,測試結果如下。

從左至右分別為:Kimi(上)、豆包(下)通義千問(上)、文心一言(下),來源:《聽筒Tech》截圖

從測試結果來看,正如張強所言,Kimi對文檔的歸納總結功能明顯優(yōu)于其他幾家大模型。對這份財務報告,Kimi的總結清晰且簡明扼要,豆包和通義千問雖然也能總結,但結果呈現(xiàn)并不理想,而文心一言則需要進一步的指令。

隨后測試的是用戶常用的資料檢索和整理功能,《聽筒Tech》對各大模型進行了“閱讀GTC大會黃仁勛的演講”的測試,結果如下。

從左至右分別為:Kimi(上)、豆包(下),通義千問(上)、文心一言(中)、騰訊混元助手(下)來源:《聽筒Tech》截圖

從大模型的檢索結果來看,Kimi準確且精簡地對黃仁勛在2024年GTC大會上的演講內(nèi)容進行了總結。

除Kimi外,其他幾家大模型均無法檢索到黃仁勛在GTC大會上的演講內(nèi)容,騰訊混元助手甚至無法生成任何答案,需要進一步的指令。

創(chuàng)作能力是每個大模型都要具備的重要能力之一,這能夠更好地理解和模擬人類的思維過程,從而生成更具創(chuàng)意和價值的內(nèi)容。

視頻腳本的生成,便是用戶常用的文學創(chuàng)作能力大模型功能之一。為此,《聽筒Tech》測試了大模型的視頻腳本制作能力。

本次測試的內(nèi)容是“以‘運動改變生活’為主題生成視頻腳本”。從生成的結果來看,Kimi、文心一言、通義千問、豆包均能生成符合基本要求的視頻腳本文案。

從左至右依次為:Kimi(上)、文心一言(下)豆包(上)、騰訊混元助手(中)、通義千問(下)來源:《聽筒Tech》截圖

其中豆包生成的視頻腳本包含了時長、地點等元素,相對比較專業(yè)。Kimi與文心一言生成的腳本內(nèi)容更為連貫且有條理。而騰訊混元助手甚至將上一個問題混淆到了腳本中。

從測試結果來看,Kimi、文心一言、通義千問和豆包都具有較強的視頻腳本生成能力,可以為視頻制作提供很好的幫助。相比之下,騰訊混元助手對問題的理解顯然不夠。

從以上簡單的綜合測試結果來看,實際上,在文生文的基礎功能上,Kimi的處理結果更貼近基礎用戶的需求。

對于像李琳以及張強這樣的基礎用戶而言,Kimi目前的文生文基本功能已經(jīng)遠超其他國產(chǎn)大模型。

當然,他們也期待Kimi能夠解決更多問題,李琳笑言,“我已經(jīng)期待它幫我做PPT了?!?/p>

02 為什么出圈的是Kimi?

Kimi到底是誰?

公開報道顯示,Kimi的母公司為北京月之暗面科技有限公司(以下簡稱“月之暗面”),創(chuàng)始人為楊植麟。

企查查數(shù)據(jù)顯示,月之暗面成立于2023年3月,同年10月推出全球首個支持輸入20萬漢字的智能助手產(chǎn)品Kimi。 

創(chuàng)立至今短短一年時間里,月之暗面已經(jīng)獲得紅杉中國、真格基金,以及阿里巴巴、小紅書、美團等知名機構和企業(yè)在內(nèi)的兩輪融資,融資金額超12億美元,投后估值已約25億美元。

今年年初,Kimi的訪問量開始上漲。據(jù)Similarweb和七麥數(shù)據(jù)的資料顯示,2024年2月18日至3月16日,Kimi的日均瀏覽量將近20萬次,Kimi在全平臺的累計下載量為50萬次。

尤其是最近兩周,Kimi的訪問量更是爆增。根據(jù)Similarweb數(shù)據(jù)顯示,近兩周Kimi的訪問量分別為152.0萬和225.0萬,一度引發(fā)平臺訪問異常的情況。

在眾多國產(chǎn)大模型中,為什么出圈的是Kimi?

在王明看來,一方面,與其創(chuàng)始人團隊的背景不無關系?!皬墓_的資料來看,月之暗面可以稱得上匯集了目前國內(nèi)大模型領域相對領先的人才的一個團隊?!?/p>

公開資料顯示,楊植麟出生于1992年,被譽為最年輕的中國大模型創(chuàng)始人。其本科畢業(yè)于清華大學計算機系,師從清華教授、知名AI學者唐杰。博士畢業(yè)于卡內(nèi)基梅隆大學計算機學院,師從蘋果AI研究負責人Rualan Salakhutdinov 和谷歌首席科學家 William Cohen。

據(jù)公開報道,楊植麟目前仍是清華大學交叉信息研究院(以下簡稱“交叉信息院”)的助理教授。要知道,交叉信息院涵蓋大名鼎鼎的清華“姚班”。楊植麟與圖靈獎得主楊樂昆(Yann LeCun)和約書亞·本吉奧(Yoshua Bengio)均有過科研合作。

圖:楊植麟在清華大學交叉信息研究院的任職信息,來源:清華大學交叉信息研究院官網(wǎng) 《聽筒Tech》截圖

實際上,月之暗面是楊植麟第二次創(chuàng)業(yè),在此之前,他曾與別人共同創(chuàng)立了循環(huán)智能,也拿到了紅杉中國的投資,并在2021年和華為云聯(lián)合推出了當時全球最大的中文語言模型“盤古”。

另據(jù)媒體報道,月之暗面的核心團隊成員在大模型方向有重要發(fā)明,如RoPE相對位置編碼和group normalization,這些技術是Meta LLaMa、谷歌PALM等主流模型的重要組成部分。其另外兩位創(chuàng)始人周昕宇和吳育昕,同樣是AIGC領域的領先技術人才,有過1萬+的Google Scholar的引用。

一位在學術上與楊植麟有交集的AI領域研究學者Liam認為,月之暗面的團隊可以稱得上目前國內(nèi)領先的AGI團隊之一,他亦認同業(yè)界對楊植麟“堅定的AGI信徒和有技術號召力的創(chuàng)始人”的評價。

Liam對Kimi的出圈并不意外,“實際上,AI技術圈內(nèi)的人從去年幾家公司宣布做AGI的時候,就基本確定月之暗面和智譜是最有希望做成的,也正因此,頭部資本會在第一時間擠向這幾家公司。”

在Liam看來,楊植麟是一位“為數(shù)不多的善于從第一性原理思考問題的學者”,“Kimi走的long-context的技術路徑與大廠不一樣,或許也是源于其對第一性原理的思考。”

另一方面,“楊植麟對什么是用戶真正需要的大模型也有清醒的認知”。Liam向《聽筒Tech》透露,在楊植麟看來,一個好的產(chǎn)品,應該知道用戶想要什么,通過滿足用戶的需求來實現(xiàn)產(chǎn)品的優(yōu)化,“這也是為什么月之暗面一開始推出的產(chǎn)品便是TO C,而不是TO B的原因所在?!?/p>

在Liam看來,“TO C的定位,能夠給Kimi帶來更多‘訓練’的機會,更有利于產(chǎn)品的優(yōu)化和完善。”

市場顯然也認可楊植麟對Kimi的這一定位,國信證券的分析報告指出,Kimi日活用戶的顯著增長反映了Kimi在模型優(yōu)化、人才擴展和用戶吸引方面的成功策略。

“Kimi的成功不僅依賴于其技術優(yōu)勢,更在于其對用戶體驗的重視,包括通過數(shù)據(jù)驅(qū)動的持續(xù)產(chǎn)品優(yōu)化、創(chuàng)新的分享機制以及對核心功能的精準打磨,這些因素共同提升了Kimi的市場競爭力。”

中信建投也在其研報中表示,“月之暗面打造高關注度應用Kimi Chat,一方面在于核心團隊技術背景深,另一方面在于產(chǎn)品面向C端免費開放,注重產(chǎn)品運營?!?/p>

在齊鏜泉看來,用戶需要的,是一個能解決特定場景中80%問題的大模型、一個結合了本土用戶使用習慣的本土化大模型、一個能夠與用戶進行交互和共創(chuàng)的大模型。

“大模型始終會是’應用為王‘。大模型需要提供的并不是一個淺嘗輒止的工具,而是一套標準化的流程支持,包括基礎大模型、完整的工具鏈、豐富的應用,以及有專家支持的服務?!?/p>

這些,或許就是Kimi率先出圈的原因。

Kimi火速出圈還有一個原因,那就是前期異常低調(diào),之前幾乎沒人聽過這家公司的名字,這與大廠在AI方面的高調(diào)形成鮮明的對比。

如果說財大氣粗的大廠更要面子,那么“草根出身”的Kimi則更注重里子。

03 Kimi能火多久?

爆火的Kimi能否如愿在大模型這一新戰(zhàn)場中脫穎而出?目前來看,尚無定論。

僅從Kimi引以為傲的長文本處理技術來看,Kimi或?qū)⒚媾R巨大的壓力。

一個不容忽視的事實是,Kimi大模型爆火后,大廠正在迅速跟進。

3月22日,阿里通義千問宣布免費開放1000萬字長文檔處理功能,成為全球文檔處理容量第一的AI應用。隨后,360宣布智腦正式內(nèi)測500萬字長文本處理功能,該功能入駐360AI瀏覽器。另據(jù)媒體報道,百度也將免費開放200-500萬長文本功能。

在一位AI技術人員看來,“長文本處理這項技術并不難,只不過之前的大模型關注點不在這一方面。更重要的是,長文本處理相對而言,成本太高,甚至可以說是’虧本的生意‘。”

該AI技術人員認為,“當市場意識到這一技術能迅速打開市場,勢必會加入這一戰(zhàn)場,這無疑將對Kimi造成巨大的壓力 ?!?/p>

實際上,一個簡單的測試便能看出,該AI技術人員的觀點存在一定的道理。

因目前尚未獲得200萬字的內(nèi)測資格,《聽筒Tech》對Kimi與通義千問分別提交了一份近35萬字的《茶百道聆訊后資料集》,發(fā)出相同的指令后,kimi反饋“超出字數(shù)限制,只閱讀了前31%”,而通義千問順利對全文進行了總結。

一定程度而言,開放了1000萬字長文檔處理功能的通義千問,雖然總結的內(nèi)容不盡如意,得到的直觀結果優(yōu)于Kimi。

圖:目前Kimi(左)與通義千問(右)對長文檔的處理結果,來源:《聽筒Tech》截圖

不過,Liam對以上AI技術人員的看法持不同觀點,Liam表示,“長文本處理這項技術并不難”這個說法存在誤解,準確地說應該是“將文本變長確實不難”,但是“在變長的同時不丟掉有效信息,保證模型對文本仍然有很深入的理解”存在很大技術難度。

在Liam看來,“在文本變長甚至變到無限長的情況下,保證計算量和計算成本可控”這件事,需要大量的基礎研究來支持,大廠的人才密度不足以支撐這樣的研究。

另一方面,從多次宕機的情況來看,也意味著Kimi后臺需求解決的問題仍不少。

上述AI技術人員表示,雖然月之暗面確實匯集了一些領先的技術人才,但還需加強,“我看媒體報道,目前Kimi團隊不足百人,這對于一家處于上升期的大模型企業(yè)而言,遠遠不夠?!?/p>

不過,在Liam看來,人才密度是頂尖科技公司最關鍵的因素,而不是人才數(shù)量。

“這從OpenAI便能得出答案,ChatGPT發(fā)布時,OpenAI也僅100余人,都是領域內(nèi)最頂尖的科學家和工程師,當然GPT爆火后,OpenAI開始大力擴招,人才密度有所下降,也因此引發(fā)了一些問題?!?/p>

另外,Kimi要想持續(xù)發(fā)展,就必須正視商業(yè)化這一難題。

目前,月之暗面的具體商業(yè)化路徑仍未對外公開。Kimi爆火時,有媒體報道稱,月之暗面相關負責人提到,年內(nèi)將有商業(yè)化初步方案。

有業(yè)內(nèi)人士稱,Kimi的商業(yè)化可能類似于OpenAI,更傾向于一種通用性的商業(yè)化,例如商業(yè)化的高端接入入口用以擴展客戶的應用等。

但這一模式能否落地,能否足以支撐Kimi的長遠發(fā)展,尚未可知。

在王明看來,如果目前Kimi的獲客成本真像媒體報道的“每天投入可能超過20萬元”,那顯然不是一個小數(shù)目,目前的商業(yè)模式也不足以支撐其未來的快速發(fā)展。

更重要的是,Kimi爆火后,進一步推動了“百模大戰(zhàn)”的升級,國內(nèi)外AI公司對其已形成圍獵之勢。

且不說國外,僅國內(nèi),騰訊、阿里、百度、科大訊飛、商湯科技等巨頭和AI公司都紛紛推出了大模型,同時,各行業(yè)也不斷涌現(xiàn)垂類大模型。

公開數(shù)據(jù)顯示,目前,國內(nèi)公布的大模型數(shù)量已超過200個。“這些對Kimi而言,都是巨大的壓力?!蓖趺髦毖?。

在此前接受媒體的采訪時,楊植麟曾表示,“AI不是我在接下來一兩年找到什么PMF(Product/Market Fit,產(chǎn)品/市場契合),而是接下來十到二十年如何改變世界。”

這或許不是楊植麟一個人的愿景,也是眾多國產(chǎn)大模型從業(yè)者所希冀的未來。

 (文中李琳、王明、張強、Liam均為化名。)

參考資料:

1、《Kimi掀起國產(chǎn)大模型長文本競賽》,來源:《北京商報》;

2、《互聯(lián)網(wǎng)大廠,集體「圍剿」Kimi》,來源:《新浪科技》。

本文為轉(zhuǎn)載內(nèi)容,授權事宜請聯(lián)系原著作權人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

大廠要面子,Kimi要里子

Kimi還能火多久?

文|聽筒Tech 饒言

編輯|才哥

當互聯(lián)網(wǎng)大廠還醉心于在AI的“百模大戰(zhàn)”中大顯身手時,誰也沒有料到,他們竟然被一個“新人”抄了后路。

Kimi的爆火,來得太過突然,也很意外。

Kimi有多火?火到宕機成了近期常見的事,以至于官方不得不出面道歉。

說到AIGC,必聊Kimi,成了網(wǎng)友們最近的日常。很多人發(fā)現(xiàn),自己的朋友圈和微信群幾乎都在推薦Kimi,“這幾天微博熱搜幾乎每天都能刷到Kimi”、“如果還沒用過Kimi,那你就OUT了”……

“此前我一直用文心一言,直到有一天,朋友推薦了Kimi,我才知道,什么是好用的國產(chǎn)大模型?!?0后李琳是文字工作者,她對大模型的需求主要集中在資料的檢索和整理,之前文心一言能夠基本滿足她的需求。

但Kimi給了李琳全新的體驗,“僅從資料和素材的整理這一點來言,Kimi體驗感明顯勝于文心一言。”

王明是一位資深AI從業(yè)人員,他對此并不驚訝,他見證了Kimi從內(nèi)測到爆火的過程,“很顯然,‘草根出身’的Kimi更懂得什么是用戶真正的需求?!?/p>

“Kimi仍有一些不足之處,但從目前的用戶體驗來看,它已經(jīng)走在一些大廠大模型的前面。”王明直言,在目前在國產(chǎn)大模型中,他更看好Kimi的未來。

資本市場也對Kimi表現(xiàn)出了滿腔熱情。自3月中旬以來,A股市場便催生了Kimi概念股,不少公司的股價受此影響,接連大漲。

萬興科技是接入Kimi的AIGC軟件企業(yè)之一,旗下視頻創(chuàng)意軟件萬興喵影接入Kimi。在萬興科技AI創(chuàng)新中心總經(jīng)理齊鏜泉看來,Kimi的出圈不僅反映了公眾對于新興技術的興趣和期待,也體現(xiàn)了資本市場對于AI技術的信心和追捧,“這也是個積極的信號,展示了AI應用的潛力和商業(yè)價值?!?/p>

“Kimi的出圈并非一蹴而就,其背后是大量的研發(fā)投入和持續(xù)的技術創(chuàng)新?!饼R鏜泉對《聽筒Tech》表示。

不過,Kimi未來能延續(xù)目前的火熱嗎?目前顯然還無法判定。實際上,隨著Kimi的爆火,有關其技術處理能力和商業(yè)化路徑的質(zhì)疑聲也不斷。

齊鏜泉也提示了風險,“隨著AI技術的廣泛應用,我們也應該關注其可能帶來的數(shù)據(jù)安全和隱私保護等問題,并積極尋求解決方案?!?/p>

01 Kimi到底表現(xiàn)如何?

“用過一次Kimi后,現(xiàn)在大部分時候都選擇使用它。”不少人和李琳的做法一樣,長期需要閱讀大量數(shù)據(jù)和報告的證券分析師張強最近也在使用Kimi,在他看來,Kimi界面更友好,在文生文的大模型中,更貼近自己的需求。

張強已經(jīng)獲得Kimi的200萬字長文輸入內(nèi)測資格,他經(jīng)常將一些上市公司的年報或者IPO文件全文輸入到Kimi,他對《聽筒Tech》表示,Kimi能夠迅速將核心內(nèi)容提取出來,包括上市公司的基本信息、財務概覽、公司治理等核心內(nèi)容,“相對而言,其他國產(chǎn)大模型在歸納總結方面有所欠缺?!?/p>

Kimi的用戶體驗到底如何?《聽筒Tech》對Kimi、文心一言、通義千問、豆包,以及騰訊混元助手做了一系列小測試。

首先測試的是這些大模型對資料的總結能力。

需要說明的是,在幾家大模型的PC端版本中,Kimi、通義千問、豆包、文心一言對文件上傳功能操作友好,而騰訊混元助手PC端對文檔的上傳界面不太友好,《聽筒Tech》幾經(jīng)折騰,都未能找到將文件上傳到對話中的辦法。

《聽筒Tech》隨意抽取了一份最新的《美團2023年財務報告》進行測試,測試結果如下。

從左至右分別為:Kimi(上)、豆包(下)通義千問(上)、文心一言(下),來源:《聽筒Tech》截圖

從測試結果來看,正如張強所言,Kimi對文檔的歸納總結功能明顯優(yōu)于其他幾家大模型。對這份財務報告,Kimi的總結清晰且簡明扼要,豆包和通義千問雖然也能總結,但結果呈現(xiàn)并不理想,而文心一言則需要進一步的指令。

隨后測試的是用戶常用的資料檢索和整理功能,《聽筒Tech》對各大模型進行了“閱讀GTC大會黃仁勛的演講”的測試,結果如下。

從左至右分別為:Kimi(上)、豆包(下),通義千問(上)、文心一言(中)、騰訊混元助手(下)來源:《聽筒Tech》截圖

從大模型的檢索結果來看,Kimi準確且精簡地對黃仁勛在2024年GTC大會上的演講內(nèi)容進行了總結。

除Kimi外,其他幾家大模型均無法檢索到黃仁勛在GTC大會上的演講內(nèi)容,騰訊混元助手甚至無法生成任何答案,需要進一步的指令。

創(chuàng)作能力是每個大模型都要具備的重要能力之一,這能夠更好地理解和模擬人類的思維過程,從而生成更具創(chuàng)意和價值的內(nèi)容。

視頻腳本的生成,便是用戶常用的文學創(chuàng)作能力大模型功能之一。為此,《聽筒Tech》測試了大模型的視頻腳本制作能力。

本次測試的內(nèi)容是“以‘運動改變生活’為主題生成視頻腳本”。從生成的結果來看,Kimi、文心一言、通義千問、豆包均能生成符合基本要求的視頻腳本文案。

從左至右依次為:Kimi(上)、文心一言(下)豆包(上)、騰訊混元助手(中)、通義千問(下)來源:《聽筒Tech》截圖

其中豆包生成的視頻腳本包含了時長、地點等元素,相對比較專業(yè)。Kimi與文心一言生成的腳本內(nèi)容更為連貫且有條理。而騰訊混元助手甚至將上一個問題混淆到了腳本中。

從測試結果來看,Kimi、文心一言、通義千問和豆包都具有較強的視頻腳本生成能力,可以為視頻制作提供很好的幫助。相比之下,騰訊混元助手對問題的理解顯然不夠。

從以上簡單的綜合測試結果來看,實際上,在文生文的基礎功能上,Kimi的處理結果更貼近基礎用戶的需求。

對于像李琳以及張強這樣的基礎用戶而言,Kimi目前的文生文基本功能已經(jīng)遠超其他國產(chǎn)大模型。

當然,他們也期待Kimi能夠解決更多問題,李琳笑言,“我已經(jīng)期待它幫我做PPT了?!?/p>

02 為什么出圈的是Kimi?

Kimi到底是誰?

公開報道顯示,Kimi的母公司為北京月之暗面科技有限公司(以下簡稱“月之暗面”),創(chuàng)始人為楊植麟。

企查查數(shù)據(jù)顯示,月之暗面成立于2023年3月,同年10月推出全球首個支持輸入20萬漢字的智能助手產(chǎn)品Kimi。 

創(chuàng)立至今短短一年時間里,月之暗面已經(jīng)獲得紅杉中國、真格基金,以及阿里巴巴、小紅書、美團等知名機構和企業(yè)在內(nèi)的兩輪融資,融資金額超12億美元,投后估值已約25億美元。

今年年初,Kimi的訪問量開始上漲。據(jù)Similarweb和七麥數(shù)據(jù)的資料顯示,2024年2月18日至3月16日,Kimi的日均瀏覽量將近20萬次,Kimi在全平臺的累計下載量為50萬次。

尤其是最近兩周,Kimi的訪問量更是爆增。根據(jù)Similarweb數(shù)據(jù)顯示,近兩周Kimi的訪問量分別為152.0萬和225.0萬,一度引發(fā)平臺訪問異常的情況。

在眾多國產(chǎn)大模型中,為什么出圈的是Kimi?

在王明看來,一方面,與其創(chuàng)始人團隊的背景不無關系?!皬墓_的資料來看,月之暗面可以稱得上匯集了目前國內(nèi)大模型領域相對領先的人才的一個團隊。”

公開資料顯示,楊植麟出生于1992年,被譽為最年輕的中國大模型創(chuàng)始人。其本科畢業(yè)于清華大學計算機系,師從清華教授、知名AI學者唐杰。博士畢業(yè)于卡內(nèi)基梅隆大學計算機學院,師從蘋果AI研究負責人Rualan Salakhutdinov 和谷歌首席科學家 William Cohen。

據(jù)公開報道,楊植麟目前仍是清華大學交叉信息研究院(以下簡稱“交叉信息院”)的助理教授。要知道,交叉信息院涵蓋大名鼎鼎的清華“姚班”。楊植麟與圖靈獎得主楊樂昆(Yann LeCun)和約書亞·本吉奧(Yoshua Bengio)均有過科研合作。

圖:楊植麟在清華大學交叉信息研究院的任職信息,來源:清華大學交叉信息研究院官網(wǎng) 《聽筒Tech》截圖

實際上,月之暗面是楊植麟第二次創(chuàng)業(yè),在此之前,他曾與別人共同創(chuàng)立了循環(huán)智能,也拿到了紅杉中國的投資,并在2021年和華為云聯(lián)合推出了當時全球最大的中文語言模型“盤古”。

另據(jù)媒體報道,月之暗面的核心團隊成員在大模型方向有重要發(fā)明,如RoPE相對位置編碼和group normalization,這些技術是Meta LLaMa、谷歌PALM等主流模型的重要組成部分。其另外兩位創(chuàng)始人周昕宇和吳育昕,同樣是AIGC領域的領先技術人才,有過1萬+的Google Scholar的引用。

一位在學術上與楊植麟有交集的AI領域研究學者Liam認為,月之暗面的團隊可以稱得上目前國內(nèi)領先的AGI團隊之一,他亦認同業(yè)界對楊植麟“堅定的AGI信徒和有技術號召力的創(chuàng)始人”的評價。

Liam對Kimi的出圈并不意外,“實際上,AI技術圈內(nèi)的人從去年幾家公司宣布做AGI的時候,就基本確定月之暗面和智譜是最有希望做成的,也正因此,頭部資本會在第一時間擠向這幾家公司?!?/p>

在Liam看來,楊植麟是一位“為數(shù)不多的善于從第一性原理思考問題的學者”,“Kimi走的long-context的技術路徑與大廠不一樣,或許也是源于其對第一性原理的思考?!?/p>

另一方面,“楊植麟對什么是用戶真正需要的大模型也有清醒的認知”。Liam向《聽筒Tech》透露,在楊植麟看來,一個好的產(chǎn)品,應該知道用戶想要什么,通過滿足用戶的需求來實現(xiàn)產(chǎn)品的優(yōu)化,“這也是為什么月之暗面一開始推出的產(chǎn)品便是TO C,而不是TO B的原因所在?!?/p>

在Liam看來,“TO C的定位,能夠給Kimi帶來更多‘訓練’的機會,更有利于產(chǎn)品的優(yōu)化和完善。”

市場顯然也認可楊植麟對Kimi的這一定位,國信證券的分析報告指出,Kimi日活用戶的顯著增長反映了Kimi在模型優(yōu)化、人才擴展和用戶吸引方面的成功策略。

“Kimi的成功不僅依賴于其技術優(yōu)勢,更在于其對用戶體驗的重視,包括通過數(shù)據(jù)驅(qū)動的持續(xù)產(chǎn)品優(yōu)化、創(chuàng)新的分享機制以及對核心功能的精準打磨,這些因素共同提升了Kimi的市場競爭力?!?/p>

中信建投也在其研報中表示,“月之暗面打造高關注度應用Kimi Chat,一方面在于核心團隊技術背景深,另一方面在于產(chǎn)品面向C端免費開放,注重產(chǎn)品運營?!?/p>

在齊鏜泉看來,用戶需要的,是一個能解決特定場景中80%問題的大模型、一個結合了本土用戶使用習慣的本土化大模型、一個能夠與用戶進行交互和共創(chuàng)的大模型。

“大模型始終會是’應用為王‘。大模型需要提供的并不是一個淺嘗輒止的工具,而是一套標準化的流程支持,包括基礎大模型、完整的工具鏈、豐富的應用,以及有專家支持的服務。”

這些,或許就是Kimi率先出圈的原因。

Kimi火速出圈還有一個原因,那就是前期異常低調(diào),之前幾乎沒人聽過這家公司的名字,這與大廠在AI方面的高調(diào)形成鮮明的對比。

如果說財大氣粗的大廠更要面子,那么“草根出身”的Kimi則更注重里子。

03 Kimi能火多久?

爆火的Kimi能否如愿在大模型這一新戰(zhàn)場中脫穎而出?目前來看,尚無定論。

僅從Kimi引以為傲的長文本處理技術來看,Kimi或?qū)⒚媾R巨大的壓力。

一個不容忽視的事實是,Kimi大模型爆火后,大廠正在迅速跟進。

3月22日,阿里通義千問宣布免費開放1000萬字長文檔處理功能,成為全球文檔處理容量第一的AI應用。隨后,360宣布智腦正式內(nèi)測500萬字長文本處理功能,該功能入駐360AI瀏覽器。另據(jù)媒體報道,百度也將免費開放200-500萬長文本功能。

在一位AI技術人員看來,“長文本處理這項技術并不難,只不過之前的大模型關注點不在這一方面。更重要的是,長文本處理相對而言,成本太高,甚至可以說是’虧本的生意‘。”

該AI技術人員認為,“當市場意識到這一技術能迅速打開市場,勢必會加入這一戰(zhàn)場,這無疑將對Kimi造成巨大的壓力 ?!?/p>

實際上,一個簡單的測試便能看出,該AI技術人員的觀點存在一定的道理。

因目前尚未獲得200萬字的內(nèi)測資格,《聽筒Tech》對Kimi與通義千問分別提交了一份近35萬字的《茶百道聆訊后資料集》,發(fā)出相同的指令后,kimi反饋“超出字數(shù)限制,只閱讀了前31%”,而通義千問順利對全文進行了總結。

一定程度而言,開放了1000萬字長文檔處理功能的通義千問,雖然總結的內(nèi)容不盡如意,得到的直觀結果優(yōu)于Kimi。

圖:目前Kimi(左)與通義千問(右)對長文檔的處理結果,來源:《聽筒Tech》截圖

不過,Liam對以上AI技術人員的看法持不同觀點,Liam表示,“長文本處理這項技術并不難”這個說法存在誤解,準確地說應該是“將文本變長確實不難”,但是“在變長的同時不丟掉有效信息,保證模型對文本仍然有很深入的理解”存在很大技術難度。

在Liam看來,“在文本變長甚至變到無限長的情況下,保證計算量和計算成本可控”這件事,需要大量的基礎研究來支持,大廠的人才密度不足以支撐這樣的研究。

另一方面,從多次宕機的情況來看,也意味著Kimi后臺需求解決的問題仍不少。

上述AI技術人員表示,雖然月之暗面確實匯集了一些領先的技術人才,但還需加強,“我看媒體報道,目前Kimi團隊不足百人,這對于一家處于上升期的大模型企業(yè)而言,遠遠不夠?!?/p>

不過,在Liam看來,人才密度是頂尖科技公司最關鍵的因素,而不是人才數(shù)量。

“這從OpenAI便能得出答案,ChatGPT發(fā)布時,OpenAI也僅100余人,都是領域內(nèi)最頂尖的科學家和工程師,當然GPT爆火后,OpenAI開始大力擴招,人才密度有所下降,也因此引發(fā)了一些問題。”

另外,Kimi要想持續(xù)發(fā)展,就必須正視商業(yè)化這一難題。

目前,月之暗面的具體商業(yè)化路徑仍未對外公開。Kimi爆火時,有媒體報道稱,月之暗面相關負責人提到,年內(nèi)將有商業(yè)化初步方案。

有業(yè)內(nèi)人士稱,Kimi的商業(yè)化可能類似于OpenAI,更傾向于一種通用性的商業(yè)化,例如商業(yè)化的高端接入入口用以擴展客戶的應用等。

但這一模式能否落地,能否足以支撐Kimi的長遠發(fā)展,尚未可知。

在王明看來,如果目前Kimi的獲客成本真像媒體報道的“每天投入可能超過20萬元”,那顯然不是一個小數(shù)目,目前的商業(yè)模式也不足以支撐其未來的快速發(fā)展。

更重要的是,Kimi爆火后,進一步推動了“百模大戰(zhàn)”的升級,國內(nèi)外AI公司對其已形成圍獵之勢。

且不說國外,僅國內(nèi),騰訊、阿里、百度、科大訊飛、商湯科技等巨頭和AI公司都紛紛推出了大模型,同時,各行業(yè)也不斷涌現(xiàn)垂類大模型。

公開數(shù)據(jù)顯示,目前,國內(nèi)公布的大模型數(shù)量已超過200個?!斑@些對Kimi而言,都是巨大的壓力?!蓖趺髦毖浴?/p>

在此前接受媒體的采訪時,楊植麟曾表示,“AI不是我在接下來一兩年找到什么PMF(Product/Market Fit,產(chǎn)品/市場契合),而是接下來十到二十年如何改變世界?!?/p>

這或許不是楊植麟一個人的愿景,也是眾多國產(chǎn)大模型從業(yè)者所希冀的未來。

 (文中李琳、王明、張強、Liam均為化名。)

參考資料:

1、《Kimi掀起國產(chǎn)大模型長文本競賽》,來源:《北京商報》;

2、《互聯(lián)網(wǎng)大廠,集體「圍剿」Kimi》,來源:《新浪科技》。

本文為轉(zhuǎn)載內(nèi)容,授權事宜請聯(lián)系原著作權人。