69SEX久久精品国产麻豆,亚洲中文无码av

文|三易生活

過去二十年間，試圖在搜索引擎領(lǐng)域掀翻谷歌王座的挑戰(zhàn)者不知凡幾，可谷歌可謂是從來都穩(wěn)坐釣魚臺(tái)。直到2023年AI搜索引擎Perplexity橫空出世，“谷歌殺手”這一次具象化了，而貝佐斯、孫正義等一眾大咖的青睞更是讓谷歌感受到了壓力。為了應(yīng)對(duì)挑戰(zhàn)，今年5月舉行的I/O開發(fā)者大會(huì)上，谷歌方面公布了AI Overviews（AI概覽），使得AI搜索不再由Perplexity獨(dú)享。

基于AI概覽功能，用戶在搜索問題時(shí)，谷歌AI會(huì)自動(dòng)抓取網(wǎng)頁內(nèi)容生成總結(jié)，用戶也不再需要點(diǎn)擊網(wǎng)頁去尋找所需的信息。然而遺憾的是，號(hào)稱“重新定義搜索體驗(yàn)”的AI概覽，上線之后的表現(xiàn)卻只能用“丟人現(xiàn)眼”來形容。例如當(dāng)用戶查詢?nèi)绾螌⒅ナ亢团_餅胚粘在一起的時(shí)候，AI概覽的回答是“加點(diǎn)膠水”。

膠水確實(shí)是有效的粘合劑，但使用它的代價(jià)是披薩也就不能吃了。顯而易見，AI概覽給出的回答并不靠譜。緊接著就在外界以為這又是困擾AI大模型的幻覺問題作祟時(shí)，神通廣大的網(wǎng)友很快給出了AI概覽會(huì)回答“在披薩上涂膠水”的理由，因?yàn)檫@個(gè)回答實(shí)際上來源于一位Reddit用戶在11年前發(fā)的帖子。

由于Reddit以6000萬美元的價(jià)格與谷歌簽署了一項(xiàng)內(nèi)容授權(quán)協(xié)議，所以后者使用Reddit的數(shù)據(jù)很正常。但不正常的是，谷歌的AI概覽居然會(huì)在常識(shí)問題上翻車。為此，谷歌方面不得不緊急對(duì)其進(jìn)行“十多項(xiàng)技術(shù)改進(jìn)和更新”，以避免一些奇怪的、不準(zhǔn)確的或無益的搜索結(jié)果出現(xiàn)。

就在網(wǎng)友們以為AI概覽的翻車只不過是新技術(shù)的陣痛，經(jīng)過谷歌的改進(jìn)后，AI概率已經(jīng)“藥到病除”之后，現(xiàn)實(shí)卻超乎了幾乎所有人的想象，谷歌方面其實(shí)并沒有從技術(shù)上解決AI概覽生成錯(cuò)誤的結(jié)果，而是通過降低AI概覽出現(xiàn)的頻率、以避免再次翻車。

日前據(jù)數(shù)字營銷和SEO網(wǎng)站Search Engine Land的相關(guān)報(bào)道顯示，現(xiàn)在AI概覽僅在7%的搜索結(jié)果中展示，而在5月下旬該功能剛剛發(fā)布時(shí)，這個(gè)數(shù)字還高達(dá)80%。具體來說，教育類問題中AI概覽的出現(xiàn)率從26%下降到了13%，電商類問題中的出現(xiàn)率從26%下降到9%，而娛樂類問題里的AI概覽則根本不再顯示。

同時(shí)Search Engine Land方面還發(fā)現(xiàn)，當(dāng)用戶使用的搜索關(guān)鍵詞包含“最佳”、“是什么”、“如何”、“癥狀”等確定性描述時(shí)，更容易喚起AI概覽。再結(jié)合6月下旬，他們發(fā)現(xiàn)谷歌方面對(duì)搜索算法進(jìn)行了一項(xiàng)調(diào)整，旨在降低Reddit內(nèi)容在AI搜索結(jié)果中的權(quán)重。如此一來，對(duì)于AI概覽翻車，谷歌的做法似乎是“頭痛醫(yī)頭，腳痛醫(yī)腳”。

那么問題來了，為什么對(duì)于AI概覽這一展示自己AI搜索技術(shù)實(shí)力的功能，谷歌會(huì)選擇“擺爛”，或者說Perplexity怎么就沒出這樣的大問題呢？最直接的解釋，可能就是谷歌在數(shù)據(jù)清洗上出現(xiàn)了紕漏，他們的數(shù)據(jù)標(biāo)注人員或者AI未能成功地從Reddit的內(nèi)容數(shù)據(jù)里分辨出類似“在披薩上涂膠水”這樣的無價(jià)值內(nèi)容。

其實(shí)谷歌方面在數(shù)據(jù)清洗上翻車的可能性并不低，因?yàn)檫^去一年多的時(shí)間里，OpenAI已經(jīng)從谷歌手中奪走了AI賽道領(lǐng)頭羊的地位。

為了追趕OpenAI的GPT-4，谷歌的Gemini Pro去年就已經(jīng)曝出了在訓(xùn)練數(shù)據(jù)上直接使用百度文心一言輸出結(jié)果的丑聞。當(dāng)然了，概率更大的真相或許是不僅僅高質(zhì)量的中文語料缺乏，高質(zhì)量的英文語料同樣也出現(xiàn)了供給不足。

Common Crawl數(shù)據(jù)集、The Pile語料庫已經(jīng)哺育了GPT-4 、Gemini等，一眾海外知名或不知名的大模型。對(duì)于數(shù)據(jù)的渴求，甚至讓OpenAI搞出了要求《紐約時(shí)報(bào)》證明作品原創(chuàng)性的荒誕戲碼。為什么谷歌的AI概覽會(huì)直接使用Reddit的數(shù)據(jù)，不正是因?yàn)殚_源數(shù)據(jù)庫被薅禿了、閉源數(shù)據(jù)庫卻又待價(jià)而沽。

要知道谷歌搜索作為全球用戶量最多的搜索引擎，平均每秒需要處理超過63000次查詢，也就是說每天會(huì)有56億的搜索行為發(fā)生?？煞从^Perplexity，由于使用人群相對(duì)有限，即使有翻車的現(xiàn)象也不過是孤立不證，而放在谷歌身上則是海量的個(gè)例。同樣一件事，大公司與初創(chuàng)企業(yè)的地位差異，顯然就決定了前者不得不選擇保守。

文|三易生活

歷史搜索全部刪除

熱門搜索

AI概覽喚起率僅7%，谷歌的AI搜索出師不利

谷歌

評(píng)論

AI概覽喚起率僅7%，谷歌的AI搜索出師不利

AI概覽喚起率僅7%，谷歌的AI搜索出師不利

谷歌

評(píng)論

AI概覽喚起率僅7%，谷歌的AI搜索出師不利

AI概覽喚起率僅7%，谷歌的AI搜索出師不利

AI概覽喚起率僅7%，谷歌的AI搜索出師不利