文丨智能相對論 沈浪
“我想讓人們知道,是我們(微軟)讓他們(谷歌)‘跳舞’?!?/p>
當加入ChatGPT功能的新一代Bing上線,微軟CEO納德拉就已經(jīng)按耐不住向谷歌發(fā)起了挑戰(zhàn)。他認為加入新一代人工智能對搜索是一次重新思考的變革,從現(xiàn)在開始,包括核心排名在內(nèi)的幾乎所有東西都可以重新想象。
在AI大模型的加持下,搜索的游戲規(guī)則正面臨顛覆性的改變,對應的市場的格局也要重塑。很顯然,如果AI大模型能“上岸”,那么這第一劍大概率就先斬向傳統(tǒng)的搜索巨頭。
在AI大模型的推動下,微軟和谷歌之間的戰(zhàn)爭已經(jīng)打響,而國內(nèi)的反應也同樣激烈。
前不久,昆侖萬維推出國內(nèi)第一款融入大模型的搜索引擎——天工AI搜索,并宣稱“傳統(tǒng)搜索已到了奇點時刻,陳舊的體驗需要被顛覆、被改變”。換句話來說,國內(nèi)的傳統(tǒng)搜索引擎同樣面臨著新技術的挑戰(zhàn),也迎來了第一位真正意義上的大模型+搜索產(chǎn)品。
事實上,在天工AI搜索之外,國內(nèi)大多數(shù)大模型產(chǎn)品只是沒有明確挑戰(zhàn)傳統(tǒng)搜索引擎,但實際上在做的事情基本都離不開對用戶搜索模式的重塑。
「智能相對論」試用了目前市面上的大多數(shù)大模型產(chǎn)品,包括通義千問、訊飛星火、Baichuan-53B,還有文心一言等等。從體驗來看,比起生成式AI,這些大模型產(chǎn)品更成熟的體驗在于對用戶獲取信息模式的優(yōu)化和升級,也就是搜索引擎一直在做的事情。
然而,以天工AI搜索為代表,融入大模型技術的AI+搜索引擎想要突圍,取代傳統(tǒng)的搜索引擎并沒有那么容易,一方面且不說做大模型產(chǎn)品的廠商就不少,“百模大戰(zhàn)”還在持續(xù),另一方面融入大模型的搜索引擎能否力敵傳統(tǒng)搜索引擎,還有待驗證。天工AI搜索的征程才剛剛開始。
01、搜索增強
搜索增強,正在成為各家大模型廠商首要強化的目標,百度在做,百川智能也在做。
百度副總裁、搜索平臺負責人肖陽認為,“ChatGPT要解決的問題很多就是搜索要解決的問題,它們的目標是一致的?!薄裁茨繕??從目前趨勢來看,應是搜索增強。
百川智能認為,搜索增強是解決模型時效性和幻覺的有效手段,將搜索技術與大語言模型能力結合實現(xiàn)了創(chuàng)新的模型優(yōu)化,也提升了 AI 回答的可用性。
對此,百川大模型融合了多個模塊,包括指令意圖理解、智能搜索和結果增強等組件。該體系通過深入理解用戶指令,精確驅(qū)動查詢詞的搜索,并結合大語言模型技術來優(yōu)化模型結果生成的可靠性。
本應用在搜索引擎升級上的技術,比如動態(tài)超參數(shù)調(diào)整技術、智能化搜索詞生成、高質(zhì)量搜索結果篩選、RLHF 搜索結果增強等等,如今用在了大模型預訓練上,由此結合大模型的產(chǎn)品表現(xiàn),打造出了一個超越傳統(tǒng)搜索引擎的AI搜索應用。
在「智能相對論」體驗文心一言、天工AI搜索等大模型產(chǎn)品的過程中,發(fā)現(xiàn)其背后的搜索流程和結果輸出基本都得到了不同程度的強化,帶來不少令人驚艷的搜索體驗。
比如,向文心一言提問“我10月份想去長沙旅游”,結果反饋給出了長沙的知名景點推薦。而在天工AI搜索上,除了景點推薦外,甚至還會給出10月份長沙的天氣情況介紹、美食推薦等其他更詳細的信息。
從這一結果來說,相比傳統(tǒng)搜索引擎,大模型技術加持的智能搜索在兩大方面實現(xiàn)了升級,一是對用戶需求的理解,不再是關鍵詞匹配,更多是一種對話式的交互和理解,覺得說得不夠詳細的,還可以進一步的追問,目前文心一言、天工AI搜索等大模型產(chǎn)品都支持。
二是對結果反饋的優(yōu)化,省去用戶查找和篩選信息的一大段過程,在大多數(shù)情況下AI都能給出相對客觀且準確的答案。同時,文心一言、天工AI搜索等也都會標注相關信息的來源,便于用戶二次確認信息的權威性與準確度。
盡管也會出現(xiàn)一些答非所問或是東拼西湊的回答,但是就現(xiàn)階段的體驗來說,搜索強化下的大模型產(chǎn)品相對傳統(tǒng)搜索引擎,是有著實際性的進步的。
02、傳統(tǒng)的桎梏
進步是有,不足也存在。
隨著體驗越深度,問的問題越多,越會發(fā)現(xiàn)當前的大模型產(chǎn)品在搜索上同樣存在著諸多傳統(tǒng)搜索引擎遇到的問題,比如信息的來源、知識的準確性等等。
在目前的搜索體驗上,天工AI搜索會同步給出知識、信息的參考標注,以便用戶進一步確認知識、信息的準確度和權威性。但,「智能相對論」也發(fā)現(xiàn),給出的參考來源大多是知乎、搜狐、新浪財經(jīng)的,同時根據(jù)問題的類別也會出現(xiàn)其他的來源,比如旅游相關會有馬蜂窩、攜程、本地寶的參考標注。
這些網(wǎng)站上的信息有問題嗎?就體驗來說似乎并沒有問題,哪怕我們用傳統(tǒng)搜索引擎,搜出來的結果也大抵如此。
但是,呈現(xiàn)在一個新的產(chǎn)品上,就有較大的問題了。如果新的AI搜索所帶給用戶的信息、知識還和傳統(tǒng)搜索引擎呈現(xiàn)出來的結果差不多,都是些未經(jīng)驗證的、網(wǎng)友口口相傳的泛泛之談,那么搜索的結果還是沒有得到改善,只是過程變了、形態(tài)變了。
對于天工AI搜索以及其他大模型產(chǎn)品而言,實際上要建立的同樣也是這種權威性、準確度。作為用戶獲取信息、知識的重要渠道,任何一個產(chǎn)品都需要讓用戶覺得自己的知識、信息是對的、準確的、權威的。
當前,市場上的大模型產(chǎn)品要么只給用戶一個答案,要么像天工AI搜索那樣給出一大堆第三方的來源標注。然而,這兩種模式似乎都不能鞏固用戶對搜索結果的權威感、信任度?;蛟S,在接下來的產(chǎn)品優(yōu)化上,大模型產(chǎn)品還需要繼續(xù)做用戶教育,向用戶證明自家AI給出的答案、知識、信息等是權威的,是科學的。
回過頭來看,正對應肖陽的觀點,ChatGPT和傳統(tǒng)搜索引擎的目標是一致的。
03、新的可能
如果用搜索的視角來看大模型產(chǎn)品,很容易就能看到當前缺什么。那么反過來,如果用大模型的視角來做搜索,或許也會有新的發(fā)現(xiàn)——大模型+搜索,應該呈現(xiàn)給用戶什么樣的體驗?
答案絕不會是傳統(tǒng)的搜索引擎。
目前,通用人工智能的一大演進方向是多模態(tài),而在大模型產(chǎn)品上,多模態(tài)就重塑了搜索的價值。日前,阿里云推出大規(guī)模視覺語言模型Qwen-VL,以通義千問70億參數(shù)模型Qwen-7B為基座語言模型研發(fā),支持圖文輸入,具備多模態(tài)信息理解能力。
基于Qwen-VL,用戶的搜索體驗得到了升級。比如,一位不懂中文的外國游客到醫(yī)院看病,不知怎么去往對應科室,他拍下樓層導覽圖問Qwen-VL“骨科在哪層”“耳鼻喉科去哪層”,Qwen-VL會根據(jù)圖片信息給出文字回復。
這是用戶獲取準確信息的一個重要方式,也是搜索,但很顯然,這不同于傳統(tǒng)的搜索引擎。
如同天工AI搜索想實現(xiàn)的跨代際搜索體驗,Qwen-VL正在呈現(xiàn)出新的搜索跨越。
可以想象,在未來的時間內(nèi),搜索不再是單一的,而是多模態(tài)的、多場景的,比如用戶可以在旅游的過程中隨手拍下一處景點,大模型產(chǎn)品就能給予相關的游玩建議、購票服務等,又或者是用戶在旅游的某個瞬間聽到一首民謠,錄下來也能在大模型產(chǎn)品上搜到相應的歌曲等等。
基于這一趨勢,大模型+搜索所帶來的新體驗將是顛覆的。那個時候,或許搜索的奇點才算是正式到來了。
傳統(tǒng)的搜索引擎將黯然失色,而用戶將在大模型產(chǎn)品的智能搜索下無時無刻不在獲取新的信息、服務和體驗。