文|明晰野望 林森
這幾天,你是否刷到過大火的各地博物館讓文物“舞動(dòng)起來”的短視頻?
又是否看到過讓馬斯克都直呼驚嘆的,那些被“復(fù)活”的世界名畫?
再或者,你一定看到過AI魔改過爭議很多的老牌影視劇。
是的,這一切背后都是AI。
就在2024年最后一個(gè)月,國內(nèi)外科技大廠更是集體炫技,AI應(yīng)用正在以迅雷不及掩耳之勢加速落地。
在人工智能時(shí)代,技術(shù)創(chuàng)新的速度讓摩爾定律、新摩爾定律不斷被打破。
我們此前就討論過,隨著這兩年科技公司對算力和AI的史詩級(jí)投入,大模型底座技術(shù)漸成熟并由大廠開源后,AI界走向了更務(wù)實(shí)的道路——應(yīng)用落地。
最新的權(quán)威數(shù)據(jù)統(tǒng)計(jì):幾乎每六個(gè)中國人中,就有一人正在使用AI產(chǎn)品。
更有從業(yè)者直言,“最快5年之內(nèi),中國人一周只需要工作4天”。
我們做好準(zhǔn)備來迎接這個(gè)新時(shí)代了嗎?
01 用AI造世界:文生圖、生視頻、生3D大模型加速開源
12月10日,OpenAI旗下視頻生成模型Sora,終于在首次亮相10個(gè)月后正式開放,新版工具Sora Turbo可以生成最長達(dá)20秒的視頻。或許是由于等待的太久,用戶火熱的試用熱情一度讓OpenAI緊急關(guān)閉用戶注冊。
但是Sora姍姍來遲的這10個(gè)月的空檔期內(nèi),AI圈已經(jīng)翻天覆地。
比Sora早一周,12月3日,有著“AI教母”之稱的李飛飛聯(lián)合創(chuàng)立并擔(dān)任CEO的AI公司W(wǎng)orld Labs官宣了首個(gè)成果——3D世界生成模型,可以讓用戶從單張圖片生成3D世界的AI系統(tǒng),并且用戶可以與之互動(dòng)。比如,通過鍵盤和鼠標(biāo)在生成的3D場景里移動(dòng)、轉(zhuǎn)換視角。
緊隨其后,12月4日,谷歌也發(fā)布了Genie 2,一個(gè)能把靜態(tài)照片變成可玩游戲的AI系統(tǒng),同樣可以實(shí)現(xiàn)從靜態(tài)照片到可交互3D場景的轉(zhuǎn)換。
就在一個(gè)月前,著名游戲公司任天堂旗下寶可夢公司也宣布過一項(xiàng)類似的技術(shù),用“大規(guī)模地理空間模型”,讓用戶距離空間智能更近了一步。簡單說,用戶可以自行上傳圖像,構(gòu)建3D地圖,能精確而真實(shí)地看到放置到物理環(huán)境中的數(shù)字內(nèi)容,而且這些內(nèi)容是持久的,還能與他人共享。
大洋的另一端,中國AI技術(shù)同樣突飛猛進(jìn),在Sora跳檔的這10個(gè)月里加速趕超。
就在李飛飛官宣新技術(shù)的同一天,騰訊版Sora大模型面世,并免費(fèi)開源!
12月3日,騰訊混元大模型官宣了最新的文生視頻大模型HunYuan-Video,用戶只需要輸入一段描述,即可生成視頻,該模型參數(shù)量達(dá)130億,是當(dāng)前最大的視頻開源模型。從文本、到AI繪圖到3D生成再到視頻,騰訊混元大模型已經(jīng)全系開源。
有參與測評(píng)的博主發(fā)布評(píng)論稱,其生成的視頻不僅語義理解精準(zhǔn),更是“最有電視劇質(zhì)感的AI大模型”,甚至看不出一絲的AI味,對比以往文生視頻模式,即使面面占比很小的人臉都不會(huì)糊。
半個(gè)多月前,字節(jié)跳動(dòng)視頻生成模型 PixelDance和Seaweed在即夢AI正式上線,并面向公眾免費(fèi)開放使用,僅需60秒即能生成時(shí)長5秒的高質(zhì)量AI視頻。
更早的半年之前,今年6月快手可靈文生視頻APP發(fā)布,至今已經(jīng)經(jīng)歷了十余次更新,包括發(fā)布圖生視頻功能以及1.5模型的上線等。
在文生圖領(lǐng)域,AI技術(shù)也在快速迭代。例如,12月2日,字節(jié)即夢AI上線了最新的圖片2.1模型,解決了AI圖像無法生成中文字體的問題,讓海報(bào)設(shè)計(jì)的效率再次大幅提升。
某種意義上,ChatGPT停止服務(wù)中國市場并不是壞事。
今年中國大模型廠家底層技術(shù)不斷降價(jià)并開源,帶動(dòng)了更多中小創(chuàng)業(yè)者走上AI新牌桌。更重要的是,上述這些文生圖、文生視頻等以及文心一言、騰訊元寶、字節(jié)豆包、阿里千問等C端AI應(yīng)用,在中國速度下都以免費(fèi)的形式飛入了尋常百姓家。
QuestMobile數(shù)據(jù)顯示,2024年10月,AI原生應(yīng)用行業(yè)月活躍用戶規(guī)模達(dá)到8976萬,同比增長373.0%。
02 AI+SaaS:智能體將是通往未來的新船票
視覺AI應(yīng)用火,更火的是“智能體”。
在AI改變虛擬和真實(shí)世界視覺聯(lián)系的同時(shí),AI正在各式各類的SaaS應(yīng)用中落地,各種形式的智能體已成為AI大模型落地的新載體,并且展現(xiàn)出強(qiáng)大的商業(yè)化前景。
所謂智能體,又叫AI Agent,是以AI大模型作為基礎(chǔ),構(gòu)建的可以進(jìn)行交互、完成特定任務(wù)、或提供專業(yè)知識(shí)的智能系統(tǒng)或應(yīng)用程序。
通俗說,智能體可以體現(xiàn)為,裝在傳統(tǒng)軟件App里的AI插件,也可以是一個(gè)獨(dú)立的AI APP。
相比較傳統(tǒng)的SaaS需要完全由人工來操作完成,智能體最大的特點(diǎn)是,接受互動(dòng)對話指令,并直接產(chǎn)出結(jié)果,包括生成視頻、圖片、文章或完成一件工作。簡言之,所有的AI 應(yīng)用都可以稱之為智能體。
OpenAI首席執(zhí)行官Sam Altman曾提出,未來每個(gè)人都可以擁有一個(gè)智能體。
Salesforce首席執(zhí)行官M(fèi)arc Benioff更是直言,AI的未來發(fā)展不在于大語言模型,而在于開發(fā)AI自主代理,即智能體。
產(chǎn)品智能化已經(jīng)是SaaS廠商在新時(shí)代下必須迎接的事實(shí),在一些TO B場景內(nèi),許多傳統(tǒng)SaaS應(yīng)用在AI加持下獲得了新的發(fā)展。
比如,做電商服務(wù)的有贊最新推出了“加我智能”功能,其智能體功能包括商機(jī)指引、智能托管、營銷專家、智能經(jīng)營報(bào)告、智能穿搭、智能銷售等等。
正是有贊創(chuàng)始人白鴉預(yù)言,未來的生意,數(shù)字化是基礎(chǔ),客戶運(yùn)營是抓手,所有這些都可以交給智能技術(shù)完成?!拔曳浅?jiān)信,最多10年,最快5年之內(nèi),中國人一周只需要工作4天。用工具解決問題,數(shù)字化和智能化帶來效率提升是必然的趨勢。”
再比如,做教育的粉筆,最新升級(jí)了粉筆AI老師產(chǎn)品,這個(gè)智能體以對話形式存在,具備AI導(dǎo)練、學(xué)習(xí)規(guī)劃、考情咨詢、智能督學(xué)等在內(nèi)的多項(xiàng)功能,可以幫用戶規(guī)范的作答思路,形成標(biāo)準(zhǔn)化作答習(xí)慣,并詳細(xì)解答答案,優(yōu)化學(xué)習(xí)方向和可改進(jìn)細(xì)節(jié),主打一個(gè)專業(yè)、細(xì)心的教育陪伴。
互聯(lián)網(wǎng)大廠中,百度、阿里、騰訊、字節(jié)跳動(dòng)、華為等皆已布局智能體賽道,并推出一站式智能體開發(fā)平臺(tái),為開發(fā)者、創(chuàng)作者提供更為便捷的操作應(yīng)用路徑。
美國著名孵化器YCombinator最新一期圓桌討論中提出觀點(diǎn):垂直AI智能體的規(guī)??赡苁荢aaS的十倍。
美國一線AI從業(yè)者提到,AI大模型技術(shù)正在重塑軟件行業(yè)。如果說2004年在瀏覽器中可以增加XML HTTP請求這個(gè)功能,開啟了互聯(lián)網(wǎng)應(yīng)用程序的新時(shí)代,帶來了整個(gè)SaaS軟件行業(yè)的20年繁榮;那么大型語言模型——LLM的出現(xiàn),則是開啟了智能體時(shí)代的新篇章。
這一切正在發(fā)生。
QuestMobile最新報(bào)告提到,當(dāng)下LLM的落地應(yīng)用在網(wǎng)頁端、移動(dòng)端都已比較成熟,正逐步拓展至智能硬件端,不斷深入用戶日常生活并提供更自然便捷的交互體驗(yàn)。
市場研究機(jī)構(gòu) Research and Market在11月11日發(fā)布的報(bào)告中指出,未來五年AI智能體的市場規(guī)模將增加420億美元。
在騰訊研究院最新發(fā)布的《2025數(shù)字科技前沿應(yīng)用趨勢》中指出,AaaS催化AI原生應(yīng)用落地將是明年大趨勢之一。
AI的新時(shí)代已經(jīng)勢不可擋。