文|深燃 王敏
編輯|金玙璠
“沖刺”一個多月后,百度文心一言終于來了,但剛出道就遭到群嘲。
3月16日下午,百度舉行文心一言發(fā)布會,被寄予厚望的發(fā)布會居然沒有產(chǎn)品現(xiàn)場演示,而是采用“Demo演示”的形式,用提前準備好的問題和答案做展示,瞬間引發(fā)眾多吐槽?;蛟S百度是吸取了谷歌的教訓,看到其因Bard產(chǎn)品在演示中“翻車”導致市值一下子蒸發(fā)了1000億美金后,才變得謹慎。
不僅如此,很多對新產(chǎn)品躍躍欲試的用戶們,被“邀請碼”阻擋在了門外。直到晚間,才有極少部分用戶真正“嘗鮮”。
深燃拿到邀請碼后,第一時間實測了文心一言的“五大能力”,整體感受是,文心一言的大多數(shù)回答,還算流暢自然,產(chǎn)品達到可用水平,但對于部分基礎問題,不能正確理解題意,更不要說給出準確答案,而且多輪對話能力也有所欠缺。
就在前一天,國內(nèi)外還沉浸在對3月14日OpenAI新上線的GPT-4的討論中。GPT-4比上一代準確性更高,解決問題能力更強,可以處理超2.5萬字的文本,并支持圖像輸入,盡管現(xiàn)在圖像輸入還未對外開放,但這款產(chǎn)品已經(jīng)拔高了用戶對產(chǎn)品的標準。
在文心一言發(fā)布的當晚,微軟再發(fā)“重磅炸彈”,舉辦了一場Microsoft 365 Copilot發(fā)布會,將GPT-4模型引入Office應用程序,舉個例子,熬夜趕不完的論文Word、看不出數(shù)據(jù)聯(lián)系的Excel表格,都可以找Copilot來幫忙。Copilot也被評價為,要顛覆打工人的工作方式。
自去年12月以來,中外大廠們都紛紛沖刺,試圖追趕ChatGPT,百度被視為是國內(nèi)比較有希望追趕ChatGPT的選手之一,兩相對比,有部分用戶表示看到文心一言時,覺得被迎頭澆上一盆冷水。資本市場對百度的文心一言似乎也不買賬,發(fā)布會進行過程中,百度股價一度下跌10%。截至3月16日收盤,百度股價報125.1港元,跌6.36%。
不可否認,作為國內(nèi)第一款對標ChatGPT的產(chǎn)品,百度也算是勇敢的邁出了第一步。但此前百度鋪天蓋地的宣傳已經(jīng)拉高了外界預期,目前看來文心一言有些高開低走,讓外界對其何去何從產(chǎn)生了質(zhì)疑。
親測百度文心一言,不夠AI
從2月初官宣要集中“沖刺”,百度文心一言吊足了外界的胃口。
但在正式發(fā)布時,觀眾們的評價都是“文心一言,一言難盡”、“CheatGPT”等不太正面的言辭。
對于這次百度文心一言和ChatGPT的PK,英諾天使基金合伙人王晟對深燃形容道,就像是“China PPT VS ChatGPT”。
百度“文心一言”究竟怎么樣?在發(fā)布會現(xiàn)場,百度創(chuàng)始人李彥宏從文學創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解和多模態(tài)生成五個方面舉例展示了文心一言的能力。拿到邀請碼后,深燃也從五大層面對文心一言進行了體驗,并將部分答案與接入GPT-4的微軟New Bing或基于GPT-3.5的ChatGPT進行了對比,試圖得到一些結(jié)論。
在文學創(chuàng)作層面,在對于最近爆火電視劇《黑暗榮耀》的劇情總結(jié)時,文心一言的答案和劇情不太相符,New Bing的答案更貼近劇情。不過,在深燃提出將電視劇進行喜劇改編時,兩個產(chǎn)品的表現(xiàn)都不算太好,但New Bing對于追問的回答,更加靈活。
圖源 / 文心一言
圖源 / New Bing
在商業(yè)文案的創(chuàng)作能力上,我們讓這兩個產(chǎn)品分別給“文心一言”想一句廣告詞,文心一言設計的廣告詞詞句更加優(yōu)美,而New Bing設計的廣告詞更側(cè)重于產(chǎn)品特性。
圖源 / 文心一言
圖源 / New Bing
至于數(shù)學推理能力,對于小學奧數(shù)題的解答,文心一言給出了一個錯誤答案,New Bing的最終答案是準確的。
圖源 / 文心一言
圖源 / New Bing
對于中文理解能力,讓兩款產(chǎn)品解讀網(wǎng)友對于文心一言邀請碼的調(diào)侃,結(jié)果是,文心一言和New Bing都沒能精準解讀其中的調(diào)侃意味,不過文心一言識別出了KFC是快餐品牌,還提醒不要將該邀請碼和特定品牌關(guān)聯(lián)。
圖源/文心一言
圖源 / New Bing
在腦筋急轉(zhuǎn)彎式的對話中,交給文心一言“要電話號碼”的任務后,其在第二輪就忘記了,而ChatGPT還記得上一輪的隱藏任務。
圖源 / 文心一言
圖源 / ChatGPT
在多模態(tài)生成方面,目前ChatGPT的識圖功能還沒對外開放。文心一言可以根據(jù)文字生成圖片、語言和視頻,但是這并非新功能,此前在百度的其他產(chǎn)品中也已經(jīng)看到過。而且文字生成圖片有時生成的圖片并不精準。比如,本意是想獲得一只阿拉斯加犬圖片,但由于表述不夠精確,最后得到的是一張動漫圖片。
圖源 / 文心一言
總結(jié)下來,從深燃的初步體驗來看,“文心一言”沒有達到驚艷效果,有時更像搜索引擎,回答問題的方式相對模式化,情感色彩流露較少,在回答問題的精準性、靈活性、上下文多輪對話等方面還有待提升。而基于GPT大模型的產(chǎn)品在語言組織和創(chuàng)造能力上更加靈活、流暢,交互性更強一些。
智能客服從業(yè)者Allen對深燃表示,僅從個人體驗的主觀感受而言,如果說ChatGPT能夠提供正確答案的比例在90%,那么文心一言只有70%。不過,至少從用戶體驗的便捷度而言,文心一言之于國內(nèi)用戶,要比ChatGPT更加方便。
距離OpenAI,百度差了多少步?
對于“文心一言”的產(chǎn)品表現(xiàn),百度創(chuàng)始人李彥宏略顯底氣不足,在發(fā)布會剛出場不久,就開始主動降低用戶預期。他說道,“要對標ChatGPT、甚至GPT-4,門檻還是很高的”、“自己測試還是感覺有很多不完美的地方”。
產(chǎn)品的背后,國內(nèi)大廠和OpenAI相比,差在了哪里,差距又有多大?
AI大模型之爭最早是在國外科技巨頭之間,此后國內(nèi)大廠紛紛跟進。有專家分析稱,在2020年中GPT-3發(fā)布后,雙方差距進一步拉大,當時很多人認為不僅是技術(shù)的差距,更體現(xiàn)了AI模型的發(fā)展新理念。
在GPT-3的基礎上,OpenAI進行了大量的微調(diào)和訓練,增強交互性、更加產(chǎn)品化后,有了基于3.5版本的ChatGPT。
值得注意的是,3月14日GPT-4的發(fā)布,再次拉大了雙方的距離。和上一代相比,GPT-4有很多跨越式提升,包括邏輯推理能力更強,比做題家更會考試;支持圖像輸入并能理解圖像;能接收超大上下文,支持輸入處理超過25000個單詞的文本;更有創(chuàng)造力,能夠?qū)懘a、寫小說、編劇。
差距拉大的背后,是人才、資金投入和技術(shù)積累的差距。
伴隨著ChatGPT的火熱,從業(yè)者們都表示,要做底層AI大模型,資金、頂尖科技人才、技術(shù)積累,這些要素缺一不可。
做大模型,前提是有資金的投入。OpenAI在2019年獲得微軟10億美金的投入后,又于今年獲得了微軟100億美金的投資,這讓其有了燒錢的資本。業(yè)界測算,GPT-3涉及1750億參數(shù),訓練費用約花費1200萬美元。據(jù)國盛證券報告估算,GPT-3訓練一次成本約為140萬美元,每一次訓練任務都耗資巨大。
此外,大模型訓練的三要素包括大算力、大數(shù)據(jù)和大模型。有從業(yè)者指出,影響最后訓練結(jié)果的因素有很多,包括清洗、標注、模型結(jié)構(gòu)設計、訓練推理的技術(shù)積累等。每一個因素的變化都影響著最后的結(jié)果。
過去十幾年里百度一直在AI方面投入,包括2019年推出文心大語言模型。2022年百度核心研發(fā)費用達到214.16億元,占百度核心收入比例達22.4%。
但是,百度和OpenAI還有不小差距。李彥宏也表示,無論是哪家公司,都不可能靠突擊幾個月就能做出這樣的大語言模型。因為深度學習、自然語言處理,需要多年的堅持和積累,沒法速成。
王晟曾指出,中國的ChatGPT們即便奮起直追,靜態(tài)來講兩三年能追上就已經(jīng)是樂觀情況。但如果對方一直進化,且進展速度遠比追得速度要快,那么可能永遠都追不上。直到對方遇到瓶頸不得不停下來,或者國內(nèi)選手找到新的技術(shù)路徑,才有可能打平。
AI,百度不能輸?shù)囊粦?zhàn)
相較于完美,文心一言更加注重“爭第一”,李彥宏強調(diào),“對標ChatGPT,百度是全球大廠中第一個”。
大模型帶來了AI產(chǎn)業(yè)的變革,也將是未來十年的主流趨勢,這已經(jīng)成為了業(yè)界共識。
想要入場分羹的選手不少。自去年12月ChatGPT發(fā)布之后,無論是一級市場,還是國內(nèi)外的大廠,都在發(fā)力大模型,研發(fā)類ChatGPT產(chǎn)品。
在國內(nèi)一級市場上,投資機構(gòu)為了投大模型公司,焦慮難安,行業(yè)幾乎每天都會有大量認知的迭代。與之相應的是創(chuàng)業(yè)熱潮,前美團聯(lián)合創(chuàng)始人王慧文、出門問問CEO李志飛、前搜狗CEO王小川、前京東高級副總裁周伯文等一批大佬,都在殺向大模型賽道。
國內(nèi)大廠們更是如此。除了百度之外,阿里、騰訊、華為、字節(jié)、科大訊飛、商湯都沒有放棄大模型之戰(zhàn)。
相較于其余互聯(lián)網(wǎng)大廠而言,AI,是百度“不能輸”的一戰(zhàn)。王晟分析道,站在企業(yè)角度,騰訊、阿里等大廠,發(fā)力AI是給原有業(yè)務提供助力,但AI之于百度是生死問題,需要“殊死一搏”,也會用出“破釜沉舟”的力氣來研發(fā)新產(chǎn)品。
在百度的營收結(jié)構(gòu)中,廣告是大頭,2022年占六成左右,但近幾年,呈現(xiàn)萎縮局勢,而且被阿里、騰訊等大廠超越。百度需要搜索引擎的變革來使得廣告業(yè)務回溫。另一方面,百度近幾年在AI方面投入頗多,而且一直對外強調(diào)其AI能力,更是將以AI為特色的百度智能云當作重要增長曲線。
OpenAI在GPT-4發(fā)布后,通過ChatGPT Plus付費版以及面向企業(yè)開放接口,正從一家小型非營利性實驗室向一家成熟的商業(yè)公司轉(zhuǎn)變。Allen認為,百度作為互聯(lián)網(wǎng)大廠,自身體量比較大,有很多業(yè)務線可以直接用上文心一言,享受商業(yè)化的紅利。
此外,AI大模型時代的到來,也將帶來大量產(chǎn)業(yè)機會。李彥宏在發(fā)布會上稱,大語言模型帶來三大產(chǎn)業(yè)機會:第一類是新型云計算公司,其主流商業(yè)模式從IaaS變?yōu)镸aaS;第二類是進行行業(yè)模型精調(diào)的公司,這是通用大模型和企業(yè)之間的中間層,他們具有行業(yè)Konwhow(技術(shù)訣竅),調(diào)用通用大模型能力,為行業(yè)客戶提供解決方案;第三類是基于大模型底座進行應用開發(fā)的公司,即應用服務提供商。
盡管“文心一言”和ChatGPT相比或許還有差距,但并不意味著其沒有發(fā)展空間。
一方面,能夠發(fā)布一款成型產(chǎn)品,百度在國內(nèi)爭奪的第一,確實領(lǐng)先了其他同行。另一方面,在國內(nèi)用戶和企業(yè)較難順暢使用ChatGPT的情況下,需要一款本土產(chǎn)品來提供服務?!凹疾蝗缛恕钡那闆r下,百度還可以靠本土化取勝。李彥宏也提到,百度在沒有完全準備好的情況下發(fā)布“文心一言”,是出于市場的需要。
考慮到信息安全和數(shù)據(jù)安全等因素,中國必須要有自研的AI大模型。王晟分析,由于AI算力的高投入和高技術(shù)門檻,目前中國能做語言類大模型的團隊非常有限,有潛在能力做的只有10來個團隊,最終能成的可能只有2-3家。
也就是說,百度或許并不需要和ChatGPT正面硬剛,只要在國內(nèi)市場上能夠占據(jù)領(lǐng)先位置,就能夠享受中國市場所帶來的紅利和發(fā)展空間。
王晟認為,短期內(nèi),百度的“文心一言”或許沒有達到市場預期,但從中長期來看,百度還是具備一定的競爭力。
新一輪AI范式變革,才剛剛開始。
*深燃(shenrancaijing)