文|勝馬財(cái)經(jīng) 武可
編輯|歐陽(yáng)文
在經(jīng)歷過“宮斗”的俗套劇情沒多久,OpenAI放出了一個(gè)“王炸”——Sora。
這一文生視頻新型模型以其卓越的技術(shù)突破,引起了業(yè)內(nèi)廣泛關(guān)注,不僅在技術(shù)層面上大幅刷新了行業(yè)標(biāo)桿,而且重新定義了AI文本生成在視頻領(lǐng)域的技術(shù)極限,給2024年開年后的AI生成世界帶來了一場(chǎng)震撼秀。
360創(chuàng)始人周鴻祎評(píng)價(jià)Sora時(shí)說道,“它看起來是個(gè)文生視頻的工具,但實(shí)際上是AGI的第二個(gè)突破點(diǎn),是解決人工智能對(duì)這個(gè)世界的觀察、交互、認(rèn)知,以及建立常識(shí)的重要里程碑?!?/p>
勝馬財(cái)經(jīng)注意到,Sora最引人注目的技術(shù)突破之一是視頻時(shí)長(zhǎng)的顯著提升。能夠生成長(zhǎng)達(dá)1分鐘的視頻,這遠(yuǎn)超過市面上其他AI視頻模型。通過簡(jiǎn)單的文本指令,Sora可以直接輸出細(xì)致入微的、具有復(fù)雜多角度鏡頭和富有情感的一整分鐘視頻。
而視頻中動(dòng)畫和人物動(dòng)作的逼真程度,被業(yè)內(nèi)人士視作人工智能對(duì)于人類所處的物理世界理解程度的真實(shí)反映,而Sora除了在更長(zhǎng)維度上的獨(dú)特價(jià)值外,作為一種高效工具的它,也將會(huì)給諸多行業(yè)帶來徹底的顛覆。
Sora官方演示視頻截圖
01 “王炸”Sora
根據(jù)OpenAI官網(wǎng)介紹,“Sora是通過一次性為模型提供多幀的預(yù)測(cè),我們解決了一個(gè)具有挑戰(zhàn)性的問題。我們正在教AI理解和模擬運(yùn)動(dòng)中的物理世界,目標(biāo)是訓(xùn)練模型來幫助人們解決需要現(xiàn)實(shí)世界交互的問題?!?/p>
其核心技術(shù)基于Transformer架構(gòu),建立在DALL·E 3和GPT模型之上,將視頻生成的時(shí)長(zhǎng)一次性提升15倍,顛覆了市面上所有短視頻的時(shí)長(zhǎng)要求。
一個(gè)顯著的創(chuàng)新是Sora帶有世界模型的特質(zhì),即對(duì)真實(shí)的物理世界進(jìn)行建模,使其對(duì)世界有一個(gè)全面而準(zhǔn)確的認(rèn)知。這不僅使得AI視頻生成更流暢、更符合邏輯,降低了視頻模型的訓(xùn)練成本,還提升了訓(xùn)練效率。例如,在視頻中添加逼近真實(shí)的傾斜和顛簸感,Sora的世界模型已經(jīng)展現(xiàn)出了驚人的能力。
在核心應(yīng)用方面,Sora不僅可以通過文本生成視頻,而且可以以靜態(tài)圖片生成視頻,甚至連接兩個(gè)完全不同主題和場(chǎng)景的視頻,實(shí)現(xiàn)無縫過渡。這種多模態(tài)數(shù)據(jù)的通才性質(zhì),讓人驚嘆不已。
有人這樣解釋Sora的原理:想象一下你有一堆照片,有的拍攝自山川,有的是城市風(fēng)光,還有一些是海灘日落。每張照片都有不同的尺寸、分辨率和風(fēng)格。這就像是一堆雜亂的拼圖,每個(gè)拼圖都有獨(dú)特的景色和細(xì)節(jié)。然而,你希望用一種更方便處理和存儲(chǔ)的方式來管理這些照片。
這時(shí)候,Sora就像是一位技術(shù)高手,使用一種叫做“視頻壓縮網(wǎng)絡(luò)”的技術(shù),將這些各式各樣的照片進(jìn)行處理。類似于把所有拼圖調(diào)整成相同的大小和形狀,這樣它們更容易被組織和處理。但重要的是,這并不是要忽略每張照片獨(dú)特的景色,而是把它們轉(zhuǎn)換成一種Sora更容易理解和處理的格式。
接下來,Sora將這些經(jīng)過處理的照片進(jìn)一步拆分成所謂的“空間時(shí)間補(bǔ)丁”。這些補(bǔ)丁可以看作是照片的基本構(gòu)建塊,就像是一張相冊(cè)中的每一張照片都可以分解成包含獨(dú)特景觀、顏色和紋理的小片段。這樣,無論原始照片的長(zhǎng)度、分辨率或風(fēng)格如何,Sora都可以把它們處理成一種統(tǒng)一的內(nèi)部表示形式。
通過這種巧妙的處理方式,Sora在保留原始照片豐富信息的同時(shí),成功地將不同來源和風(fēng)格的視覺數(shù)據(jù)整合成一種可操作的內(nèi)部形式。就好比當(dāng)你查看一本包含各種各樣世界名勝的相冊(cè)時(shí),盡管照片各異,但你依然可以通過相同的方式去理解和欣賞它們。
Sora生成的視頻圖像;圖源:OpenAI官網(wǎng)
02 Sora將對(duì)哪些行業(yè)帶來顛覆?
毋庸置疑的是,Sora的出現(xiàn)將對(duì)多個(gè)行業(yè)產(chǎn)生深遠(yuǎn)影響。從短視頻行業(yè)、影視行業(yè)、游戲行業(yè),到廣告、教育、電商、科研、建筑等領(lǐng)域,都將因其強(qiáng)大的生成能力而發(fā)生巨變。
對(duì)廣告業(yè)、電影預(yù)告片和短視頻行業(yè),Sora可能會(huì)減少對(duì)真人演員和導(dǎo)演的依賴,降低制作成本。在教育領(lǐng)域,Sora可以用于創(chuàng)建生動(dòng)有趣的教育視頻,提供更加互動(dòng)的學(xué)習(xí)體驗(yàn)。同時(shí),Sora還可能改變視頻制作、剪輯、動(dòng)畫設(shè)計(jì)等職業(yè)的工作方式,帶來新的職業(yè)機(jī)會(huì)。
在勝馬財(cái)經(jīng)看來,于國(guó)內(nèi)商業(yè)現(xiàn)狀而言,Sora的出現(xiàn)最有可能對(duì)一些廣告宣傳、人物出鏡、視頻預(yù)處理和初級(jí)剪輯等工作環(huán)節(jié)的人帶來挑戰(zhàn),比如說,在電商行業(yè),產(chǎn)品宣傳視頻對(duì)于促進(jìn)銷售至關(guān)重要。Sora的生成能力可能在一些標(biāo)準(zhǔn)化的產(chǎn)品宣傳視頻制作中替代部分工作,減少對(duì)專業(yè)制作人員的需求。
而在更有價(jià)值的科研領(lǐng)域,Sora的視頻生成技術(shù)可能被應(yīng)用于模擬實(shí)驗(yàn)過程,幫助科研人員可視化實(shí)驗(yàn)結(jié)果。這有助于簡(jiǎn)化一些復(fù)雜實(shí)驗(yàn)的展示和解釋。
當(dāng)然了,隨著Sora技術(shù)的進(jìn)步,它未來在內(nèi)容真實(shí)性、版權(quán)、隱私和數(shù)據(jù)安全方面,尤其是考慮到世界各國(guó)各地區(qū)法律法規(guī)的不同,Sora生成的視頻可能引發(fā)一系列道德和法律問題。如何確保AI生成的內(nèi)容不侵犯他人權(quán)益,不傳播虛假信息,將是一個(gè)亟待解決的問題。
但總體而言,Sora的出現(xiàn)標(biāo)志著人工智能領(lǐng)域又邁出了一大步。它既是對(duì)現(xiàn)有技術(shù)的顛覆性挑戰(zhàn),也是對(duì)我們思考人工智能在未來發(fā)展方向上的重要啟示。
03 哪些機(jī)會(huì)可以把握?
在給一些行業(yè)帶來挑戰(zhàn)和顛覆的同時(shí),Sora也給更多行業(yè)帶來了更多的機(jī)遇,而在資本市場(chǎng)上,相應(yīng)的Sora概念股和潛在受益上市公司也著實(shí)火了一把。
據(jù)有關(guān)媒體統(tǒng)計(jì),包括嶺南股份、名臣健康、因賽集團(tuán)、首都在線、中科信息、螢石網(wǎng)絡(luò)、凌云光、芒果超媒、華是科技、東港股份、實(shí)豐文化、世紀(jì)天鴻、天創(chuàng)時(shí)尚、創(chuàng)源股份、巨人網(wǎng)絡(luò)、會(huì)暢通訊、千方科技、北信源、智微智能和掌閱科技在內(nèi)的20家上市公司近兩日在互動(dòng)平臺(tái)回復(fù)Sora相關(guān)情況。
其中,北信源表示,公司與Open AI已對(duì)接完成文生圖的技術(shù)研究工作,Sora(文生視頻)是Open AI最新發(fā)布的技術(shù),目前公司正在做技術(shù)相關(guān)方面對(duì)接和研究;當(dāng)虹科技表示,文生視頻技術(shù)已取得一定進(jìn)展,在生成視頻時(shí)長(zhǎng)和效果方面,還在逐漸突破。另有多家上市公司回應(yīng)稱,Sora相關(guān)產(chǎn)品和應(yīng)用處于初級(jí)階段,有待進(jìn)一步研究,將根據(jù)自身業(yè)務(wù)特點(diǎn),在文生視頻技術(shù)落地、Sora應(yīng)用等方面尋找突破入口。
廣發(fā)證券研報(bào)提出,在互聯(lián)網(wǎng)&視頻方面,Sora或更快帶來短視頻內(nèi)容生產(chǎn)體系變革,長(zhǎng)視頻生產(chǎn)模式短期較難被顛覆,但有機(jī)會(huì)加速生產(chǎn)效率。例如Sora初步具備生產(chǎn)1分鐘內(nèi)容能力,并可以剪輯多個(gè)視頻,有望逐步替代部分人工創(chuàng)作;或迭代出新的商業(yè)模式,如電商、廣告等業(yè)態(tài)的智能化內(nèi)容生成替代,或加速短視頻平臺(tái)、商家、MCN的變現(xiàn)效率。
而在長(zhǎng)視頻領(lǐng)域,Sora短期賦能PGC創(chuàng)意生成、提高內(nèi)容分發(fā)效率和降低內(nèi)容宣發(fā)成本;長(zhǎng)視頻仍需較長(zhǎng)故事線支撐和藝術(shù)家審美賦能,在真人出演類型中的應(yīng)用可能較為有限,但對(duì)科幻、動(dòng)畫片等的生產(chǎn)提效或更為明確。
而更易理解的當(dāng)屬動(dòng)畫、特效占比高的內(nèi)容公司,Sora強(qiáng)化文生視頻能力,關(guān)注買量素材降本;長(zhǎng)期有望提升游戲生產(chǎn)效率、內(nèi)容豐富度并增強(qiáng)用戶體驗(yàn),進(jìn)一步提升用戶付費(fèi)意愿。關(guān)注具備較強(qiáng)發(fā)行能力的游戲公司。
然而,在討論Sora所帶來的熱潮中,我們也看到了一系列商業(yè)行為和炒作,例如近期涌現(xiàn)出各類Sora相關(guān)的付費(fèi)課程和服務(wù)。這一現(xiàn)象引起了社會(huì)各界的關(guān)注和討論。
必須提醒,目前Sora還在內(nèi)測(cè)階段,尚未對(duì)外開放使用。但在不少社交平臺(tái)和短視頻平臺(tái)上,一些個(gè)人和機(jī)構(gòu)在尚未使用Sora的情況下就推出相關(guān)的付費(fèi)課程,在這其中,李一舟成為國(guó)內(nèi)AI課程領(lǐng)域的“明星”,推出的AI課程吸引了大量學(xué)員。然而,也有一些質(zhì)疑聲音認(rèn)為這些商業(yè)課程可能在“割韭菜”、收“智商稅”。
勝馬財(cái)經(jīng)認(rèn)為,Sora的出現(xiàn)確實(shí)為科技、娛樂和教育等領(lǐng)域帶來了新的機(jī)遇,但在商業(yè)推廣中也引發(fā)了一系列問題。Sora的大規(guī)模應(yīng)用可能創(chuàng)造新的職業(yè)機(jī)會(huì),提高效率,但需要警惕商業(yè)行為中的不規(guī)范和炒作。在Sora面向大眾開放后,相關(guān)付費(fèi)課程和服務(wù)可能會(huì)越來越多,這也需要對(duì)行業(yè)進(jìn)行規(guī)范和監(jiān)管,以確保大模型行業(yè)的良性發(fā)展。