文|三易生活
過去二十年間,試圖在搜索引擎領(lǐng)域掀翻谷歌王座的挑戰(zhàn)者不知凡幾,可谷歌可謂是從來都穩(wěn)坐釣魚臺(tái)。直到2023年AI搜索引擎Perplexity橫空出世,“谷歌殺手”這一次具象化了,而貝佐斯、孫正義等一眾大咖的青睞更是讓谷歌感受到了壓力。為了應(yīng)對(duì)挑戰(zhàn),今年5月舉行的I/O開發(fā)者大會(huì)上,谷歌方面公布了AI Overviews(AI概覽),使得AI搜索不再由Perplexity獨(dú)享。
基于AI概覽功能,用戶在搜索問題時(shí),谷歌AI會(huì)自動(dòng)抓取網(wǎng)頁內(nèi)容生成總結(jié),用戶也不再需要點(diǎn)擊網(wǎng)頁去尋找所需的信息。然而遺憾的是,號(hào)稱“重新定義搜索體驗(yàn)”的AI概覽,上線之后的表現(xiàn)卻只能用“丟人現(xiàn)眼”來形容。例如當(dāng)用戶查詢?nèi)绾螌⒅ナ亢团_餅胚粘在一起的時(shí)候,AI概覽的回答是“加點(diǎn)膠水”。
膠水確實(shí)是有效的粘合劑,但使用它的代價(jià)是披薩也就不能吃了。顯而易見,AI概覽給出的回答并不靠譜。緊接著就在外界以為這又是困擾AI大模型的幻覺問題作祟時(shí),神通廣大的網(wǎng)友很快給出了AI概覽會(huì)回答“在披薩上涂膠水”的理由,因?yàn)檫@個(gè)回答實(shí)際上來源于一位Reddit用戶在11年前發(fā)的帖子。
由于Reddit以6000萬美元的價(jià)格與谷歌簽署了一項(xiàng)內(nèi)容授權(quán)協(xié)議,所以后者使用Reddit的數(shù)據(jù)很正常。但不正常的是,谷歌的AI概覽居然會(huì)在常識(shí)問題上翻車。為此,谷歌方面不得不緊急對(duì)其進(jìn)行“十多項(xiàng)技術(shù)改進(jìn)和更新”,以避免一些奇怪的、不準(zhǔn)確的或無益的搜索結(jié)果出現(xiàn)。
就在網(wǎng)友們以為AI概覽的翻車只不過是新技術(shù)的陣痛,經(jīng)過谷歌的改進(jìn)后,AI概率已經(jīng)“藥到病除”之后,現(xiàn)實(shí)卻超乎了幾乎所有人的想象,谷歌方面其實(shí)并沒有從技術(shù)上解決AI概覽生成錯(cuò)誤的結(jié)果,而是通過降低AI概覽出現(xiàn)的頻率、以避免再次翻車。
日前據(jù)數(shù)字營銷和SEO網(wǎng)站Search Engine Land的相關(guān)報(bào)道顯示,現(xiàn)在AI概覽僅在7%的搜索結(jié)果中展示,而在5月下旬該功能剛剛發(fā)布時(shí),這個(gè)數(shù)字還高達(dá)80%。具體來說,教育類問題中AI概覽的出現(xiàn)率從26%下降到了13%,電商類問題中的出現(xiàn)率從26%下降到9%,而娛樂類問題里的AI概覽則根本不再顯示。
同時(shí)Search Engine Land方面還發(fā)現(xiàn),當(dāng)用戶使用的搜索關(guān)鍵詞包含“最佳”、“是什么”、“如何”、“癥狀”等確定性描述時(shí),更容易喚起AI概覽。再結(jié)合6月下旬,他們發(fā)現(xiàn)谷歌方面對(duì)搜索算法進(jìn)行了一項(xiàng)調(diào)整,旨在降低Reddit內(nèi)容在AI搜索結(jié)果中的權(quán)重。如此一來,對(duì)于AI概覽翻車,谷歌的做法似乎是“頭痛醫(yī)頭,腳痛醫(yī)腳”。
那么問題來了,為什么對(duì)于AI概覽這一展示自己AI搜索技術(shù)實(shí)力的功能,谷歌會(huì)選擇“擺爛”,或者說Perplexity怎么就沒出這樣的大問題呢?最直接的解釋,可能就是谷歌在數(shù)據(jù)清洗上出現(xiàn)了紕漏,他們的數(shù)據(jù)標(biāo)注人員或者AI未能成功地從Reddit的內(nèi)容數(shù)據(jù)里分辨出類似“在披薩上涂膠水”這樣的無價(jià)值內(nèi)容。
其實(shí)谷歌方面在數(shù)據(jù)清洗上翻車的可能性并不低,因?yàn)檫^去一年多的時(shí)間里,OpenAI已經(jīng)從谷歌手中奪走了AI賽道領(lǐng)頭羊的地位。
為了追趕OpenAI的GPT-4,谷歌的Gemini Pro去年就已經(jīng)曝出了在訓(xùn)練數(shù)據(jù)上直接使用百度文心一言輸出結(jié)果的丑聞。當(dāng)然了,概率更大的真相或許是不僅僅高質(zhì)量的中文語料缺乏,高質(zhì)量的英文語料同樣也出現(xiàn)了供給不足。
Common Crawl數(shù)據(jù)集、The Pile語料庫已經(jīng)哺育了GPT-4 、Gemini等,一眾海外知名或不知名的大模型。對(duì)于數(shù)據(jù)的渴求,甚至讓OpenAI搞出了要求《紐約時(shí)報(bào)》證明作品原創(chuàng)性的荒誕戲碼。為什么谷歌的AI概覽會(huì)直接使用Reddit的數(shù)據(jù),不正是因?yàn)殚_源數(shù)據(jù)庫被薅禿了、閉源數(shù)據(jù)庫卻又待價(jià)而沽。
要知道谷歌搜索作為全球用戶量最多的搜索引擎,平均每秒需要處理超過63000次查詢,也就是說每天會(huì)有56億的搜索行為發(fā)生??煞从^Perplexity,由于使用人群相對(duì)有限,即使有翻車的現(xiàn)象也不過是孤立不證,而放在谷歌身上則是海量的個(gè)例。同樣一件事,大公司與初創(chuàng)企業(yè)的地位差異,顯然就決定了前者不得不選擇保守。