文|侃科技
OpenAI推出ChatGPT兩個(gè)月后,百度終于要下場(chǎng)了。即便還在傳言階段,資本仍然直接給了一波13%的大漲。
搜索引擎對(duì)ChatGPT的反應(yīng)無疑是最受關(guān)注的。
在此之前,微軟被曝或是第一個(gè)將ChatGPT引入搜索引擎的巨頭,并且宣布增持OpenAI,谷歌也通過「Red code」的方式拉響警報(bào),圍繞ChatGPT全面調(diào)整2023年在AI領(lǐng)域的工作。
姍姍來遲的百度,雖然官方三緘其口,但投資者們更傾向于相信這一消息,這表明投資者們認(rèn)可百度研發(fā)ChatGPT的合理性,并且對(duì)百度版ChatGPT抱有期待。
而有關(guān)百度版ChatGPT的迷霧,正是本文嘗試探討的:百度做不做、怎么做以及為什么做?
01 做不做?
去年年底,李彥宏曾在內(nèi)部直播中做過一個(gè)分享,認(rèn)為AIGC(AI生成內(nèi)容)和ChatGPT這些都是AI技術(shù)發(fā)展到一定地步后產(chǎn)生的新機(jī)會(huì)。但至于它會(huì)變成什么樣的產(chǎn)品,又能滿足什么樣的需求,還有很多的不確定性。
不過話鋒一轉(zhuǎn),李彥宏又堅(jiān)定的表態(tài):這個(gè)事情很難,但百度必須要做。
而百度必須要做的理由,來自這兩個(gè)方面:
一方面,微軟、谷歌已經(jīng)動(dòng)作在前,尤其是后者。1月初,谷歌的子公司DeepMind就推出了用以抗衡ChatGPT的Sparrow,并且還在加速布局生成式AI,包括文字生成AI模型Wordcraft、AI繪畫模型Imagen、視頻生成工具Imagen Video,以及在1月27日發(fā)布的音樂AI模型MusicLM;
另一方面,ChatGPT的確是搜索引擎的威脅。
摩根士丹利在去年12月的一份研報(bào)中直截了當(dāng)?shù)谋硎荆赫Z言模型可以繼續(xù)獲得用戶,并從搜索查詢中獲得份額,并破壞谷歌作為互聯(lián)網(wǎng)用戶入口的地位。
一個(gè)不算好的消息是,ChatGPT上線5天就完成了100萬用戶的積累。而據(jù)Similarweb監(jiān)測(cè),到1月份ChatGPT平均每天的獨(dú)立訪問者已超過1300萬,甚至瑞士跨國投行瑞銀集團(tuán)(UBS)周三發(fā)布的一份研究報(bào)告顯示,ChatGPT在今年1月份的月活躍用戶數(shù)估計(jì)已達(dá)1億,成為史上增長最快的消費(fèi)者應(yīng)用。
相比之下,達(dá)到1億月活躍用戶數(shù),TikTok花了大約9個(gè)月的時(shí)間,Instagram花了兩年半。
這意味著,搜索引擎迎來了自誕生起最強(qiáng)大的潛在敵人。
相比傳統(tǒng)的搜索引擎根據(jù)用戶提問,從而提供數(shù)千萬個(gè)相關(guān)鏈接索引,ChatGPT的優(yōu)勢(shì)在于,直接提供自己搜索和信息綜合的單一答案,讓用戶省去反復(fù)點(diǎn)擊鏈接找尋答案的復(fù)雜度。
據(jù)The Information報(bào)道,微軟Bing引入ChatGPT后,這些AI支持的答案可能會(huì)以包含信息來源的完整句子的形式呈現(xiàn),而不是引用可能解決用戶提出的問題來源或者鏈接列表的精選片段。也就是說,ChatGPT能夠輕易碾壓搜索引擎的「首條滿足率」。
但是,對(duì)于ChatGPT顛覆搜索引擎的說法并沒有得到廣泛認(rèn)可。主要是ChatGPT在搜索領(lǐng)域的應(yīng)用仍具有幾大懸而未決的掣肘:
1)真實(shí)性無法保證。在學(xué)術(shù)、科研等嚴(yán)謹(jǐn)?shù)膽?yīng)用場(chǎng)景中,ChatGPT提供的答案并不一定都正確。由于ChatGPT只提供純文本,不引用實(shí)際網(wǎng)站,目前并沒有辦法從ChatGPT 的輸出中分辨真?zhèn)巍?/p>
2)信息的實(shí)時(shí)性難以保證。搜索引擎的索引可以實(shí)時(shí)更新,更為方便快捷,但對(duì)于大型語言模型而言,添加新的內(nèi)容需要重新訓(xùn)練模型,耗時(shí)且成本昂貴。
比如,GPT-3就需要1500萬美金和1750億參數(shù),由于沒有可以適合該模型的單個(gè)硬件,因此必須將其分解并分布在多個(gè)處理器上,例如A100GPU。設(shè)置和并行化這些處理器以訓(xùn)練和運(yùn)行模型既是技術(shù)挑戰(zhàn),也是財(cái)務(wù)挑戰(zhàn)。
3)商業(yè)模式問題。此前,根據(jù)TechCrunch 估計(jì),擁有100萬用戶的ChatGPT每天就要花費(fèi)10萬美元,若應(yīng)用于Bing后經(jīng)歷高頻度的搜索查詢,商業(yè)運(yùn)營成本極高。
最新的消息是,OpenAI發(fā)布了ChatGPT的試點(diǎn)訂閱計(jì)劃,訂閱者以20美元/月的價(jià)格即可獲得比免費(fèi)版本更穩(wěn)定、更快的服務(wù),及嘗試新功能和優(yōu)化的優(yōu)先權(quán)。
02 怎么做?
盡管百度對(duì)推出類ChatGPT產(chǎn)品的消息不做回應(yīng),但在多家媒體的詳細(xì)爆料和資本的狂歡中,似乎已經(jīng)是板上釘釘?shù)氖聦?shí)。
爆料稱,該項(xiàng)目在百度內(nèi)部由搜索(MEG)和技術(shù)中臺(tái)(TPG)團(tuán)隊(duì)牽頭,呈現(xiàn)形式將會(huì)是生成式搜索,也就是將搜索和ChatGPT結(jié)合。
生成式搜索是百度2019年就發(fā)布的一項(xiàng)服務(wù),其具體形式類似ChatGPT,比如「北京GDP和上海GDP誰高」的問題,百度會(huì)直接給出答案,相當(dāng)于省去了用戶分別搜索再自行計(jì)算的步驟。
今年1月初,百度搜索杰出架構(gòu)師辜斯繆曾在一次小范圍的媒體溝通會(huì)上透露,百度預(yù)計(jì)在3月會(huì)做一個(gè)比較大的升級(jí),同時(shí)今年百度搜索在技術(shù)上最重要的工作就是要把整個(gè)檢索系統(tǒng)變成檢索+生成雙模系統(tǒng)。
如今根據(jù)媒體的爆料信息,預(yù)計(jì)百度版ChatGPT大概率將會(huì)是這種形式。
生成式搜索可以看作是生成式AI的一個(gè)版本(ChatGPT就是生成式AI的一種),而后者被認(rèn)為是搜索引擎的未來:不僅僅是索引網(wǎng)頁與鏈接,而是為每一個(gè)查詢生成相應(yīng)的摘要、回答。
用生成式搜索來回應(yīng)ChatGPT,似乎是中美兩大搜索巨頭不約而同的選擇。這種看似戰(zhàn)略防御做法的背后,也有搜索引擎無法回避的苦衷。
雖然ChatGPT組織信息的方式更加簡(jiǎn)練,能夠幫助整合信息、梳理段落要點(diǎn),但當(dāng)前搜索引擎給出的鏈接往往更加全面,因此使用方面ChatGPT并不具備壓倒性的替代優(yōu)勢(shì)。
并且,從ChatGPT本身來說,像百度、谷歌這樣的大公司要為數(shù)億甚至數(shù)十億用戶提供高可靠性的搜索服務(wù),不能僅僅因?yàn)橐粋€(gè)東西似乎會(huì)成為未來,因?yàn)槿巳硕紴橹偪?,就把一個(gè)不可信的、未經(jīng)嚴(yán)格測(cè)試的新技術(shù)嵌入進(jìn)來。
就像谷歌其實(shí)在2021年5月就展示了人工智能系統(tǒng)LaMDA,嘗試用聊天機(jī)器人的技術(shù)來增強(qiáng)搜索引擎的使用體驗(yàn)。
但直到現(xiàn)在谷歌仍不愿向公眾發(fā)布LaMDA。部分原因在于,LaMDA存在較高的誤差,且容易對(duì)用戶造成傷害,這也是ChatGPT類人工智能的通病。
而生成式AI對(duì)搜索引擎最大的威脅還不是來自技術(shù)不完善,而是對(duì)搜索引擎盈利模式的威脅。
一旦引入生成式AI搜索引擎,用戶就會(huì)減少在鏈接間跳轉(zhuǎn)、瀏覽的時(shí)間,也就減少了廣告投放的空間,這會(huì)使搜索引擎的盈利模式發(fā)生根本性的變化。
以廣告為主要收入的搜索引擎自然要謹(jǐn)慎。2022年前三季度,廣告營收占谷歌總收入的80%。百度也同樣如此,據(jù)其2022年Q3財(cái)報(bào),廣告占百度當(dāng)季營收的57.4%。
換言之,即便是百度將ChatGPT嵌入到搜索,其服務(wù)范圍也一定是謹(jǐn)慎的有選擇性的,更多是類似「秦始皇和漢尼拔誰年紀(jì)大」這種封閉式問題。
03 為什么做?
OpenAI在2019年拿了微軟的10億美金投資,代價(jià)是只能使用微軟的云計(jì)算服務(wù)。當(dāng)然這并非是微軟的強(qiáng)盜邏輯,而是OpenAI確有苦衷。
小公司根本承擔(dān)不起數(shù)千億數(shù)據(jù)的喂養(yǎng)以及大算力芯片的消耗,以Stable Diffusion為例,它在4000臺(tái)A100顯卡集群上訓(xùn)練了一個(gè)月時(shí)間、學(xué)習(xí)了近59億條圖片數(shù)據(jù)才真正開發(fā)出來。
而通過Azure OpenAI服務(wù),開發(fā)者可以直接在微軟云上訪問OpenAI的大模型,并根據(jù)特定業(yè)務(wù)場(chǎng)景進(jìn)行部署和微調(diào),以較低的成本開發(fā)出AI應(yīng)用。同時(shí),支持OpenAI也就成為微軟試圖擴(kuò)大云計(jì)算市場(chǎng)份額的有效手段。
百度去年12月發(fā)布的「AI大底座」,從IaaS層到PaaS層,為企業(yè)模型開發(fā)的全生命周期提供完整解決方案。名稱雖然不同,但內(nèi)核同微軟沒什么區(qū)別。都是給開發(fā)者降本增效,同時(shí)借勢(shì)提升自己的市場(chǎng)份額。
按照這個(gè)技術(shù)復(fù)利的進(jìn)度和未來AI應(yīng)用的浪潮,百度云是有機(jī)會(huì)再改一改排名的。
對(duì)于百度而言,ChatGPT的另一個(gè)價(jià)值在于推動(dòng)AIGC發(fā)展。
相比PGC、UGC,AIGC(AI Generated Content,AI生產(chǎn)內(nèi)容,例如GPT系列)具有效率和成本上的優(yōu)勢(shì):
– AIGC效率更高:截止2021年3月,推出9個(gè)月后的GPT-3日均文本生成量45億,而2021年閱文集團(tuán)新增文字量?jī)H360億,僅相當(dāng)于8天GPT-3的文字內(nèi)容生成量;
– AIGC成本更低:目前OpenAI定價(jià)最高的文字模型達(dá)芬奇(基于GPT-3)為每750詞約0.02美元,2021年閱文集團(tuán)內(nèi)容成本為17.74億元(每750詞約37元),是調(diào)用OpenAI的API完成相同文字量生產(chǎn)所需的成本(約672萬元)的264倍。
理想狀況下,如果閱文集團(tuán)將2021年全年360億的文字內(nèi)容生產(chǎn)量交給GPT-3,耗時(shí)8天即可完成,節(jié)約成本99%+,毛利率空間幾乎100%釋放。
雖然目前ChatGPT只有文本形式,但也有望在相關(guān)產(chǎn)業(yè)落地,比如有海量文本創(chuàng)造需求的網(wǎng)文平臺(tái)、新聞平臺(tái)等,可以借助ChatGPT完成內(nèi)容快速、低成本地?cái)U(kuò)增;教育及科研工具類平臺(tái)也可以借助ChatGPT實(shí)現(xiàn)定制化、擬人化的教學(xué)和輔助,如智能問答、智能批閱、輔導(dǎo)資料智能撰寫等。4
尾聲
ChatGPT推出的那一天,Twitter上有個(gè)叫josh的用戶馬上就說:“谷歌完蛋了。”馬斯克也在幾天后發(fā)推稱,ChatGPT好的驚人,我們離強(qiáng)的可怕的AI不遠(yuǎn)了。
但對(duì)于大洋彼岸的我們而言,ChatGPT對(duì)搜索引擎有沒有威脅暫且不論,重要的還是應(yīng)該先有。所以當(dāng)ChatGPT發(fā)布后,人們就在期待百度何時(shí)跟進(jìn)。
所以不論百度版ChatGPT有沒有新花樣,只要發(fā)布就已經(jīng)是一種勝利了。
參考資料
[1] ChatGPT是否是AI的革命?國盛證券
[2] ChatGPT-真格基金分享,真格基金
[3] ChatGPT:又一個(gè)“人形機(jī)器人”主題,東吳證券
[4] 計(jì)算機(jī)行業(yè)專題報(bào)告:ChatGPT:開啟AI新紀(jì)元,財(cái)通證券
[5] ChatGPT要和搜索引擎搶飯碗?科技云報(bào)道
[6] 微軟vs谷歌:語言模型會(huì)不會(huì)壓倒搜索引擎?36氪
[7] 微軟的AI革命:一場(chǎng)深入業(yè)務(wù)底層的豪賭,虎嗅
[8] 百度將推出類似ChatGPT服務(wù)?財(cái)經(jīng)十一人
[9] ChatGPT: What is it? Why it Matters? Is it a GoogleThreat...and Broader Industry Implications,摩根士丹利