文|Metaverse元宇宙 孫浩南
大家都知道剛剛過去的2023年中AI被評為年度熱詞,其中OpenAI功不可沒,其推出的Chat-GPT一炮而紅,微軟的Copilot、谷歌的Bard、文心一言、通義千問等其他AI產(chǎn)品緊隨其后,各家企業(yè)共同創(chuàng)造出了AI的第一波浪潮。
今年剛開年,蘋果Vision Pro的發(fā)售為XR領(lǐng)域帶來了“空間計(jì)算”的概念。蘋果的熱度還未消退,OpenAI推出的Sora就帶來了AI的第二波浪潮,而在這波濤滾滾的AI浪潮中,我們似乎看到了蘋果與OpenAI“聯(lián)動”的未來雛形。
Sora掀起了AI的第二波浪潮
OpenAI在2023年推出了Chat-GPT,自此掀起了第一波AI熱潮,眾多大廠也攜帶著自家AI產(chǎn)品紛至沓來。你方唱罷我登場的現(xiàn)象讓大模型加持的AI浪潮徹底成勢,而現(xiàn)在,OpenAI的Sora又成功掀起了AI的第二波浪潮。
Sora取自日語單詞,意為“天空”,引申含義還有“自由”。在Sora官網(wǎng)頁面,無數(shù)只紙飛機(jī)在自由飛翔,行動自主,最后匯集成一片天空的背景色。
Sora的核心技術(shù)在于其先進(jìn)的文本到視頻轉(zhuǎn)換算法與對現(xiàn)實(shí)物理世界的高理解度。使其能夠精準(zhǔn)理解輸入的文本描述,并自動生成與之匹配的高質(zhì)量視頻。Sora讓“一句話(prompt)生成視頻”成為可能。這種能力的震撼之處在于, Sora在模擬物理世界時(shí),能夠更準(zhǔn)確地反映出現(xiàn)實(shí)世界的復(fù)雜性和多樣性。在OpenAI發(fā)布的宣傳視頻中,Sora展現(xiàn)出了出色的圖像生成能力和流暢的視頻編輯技巧,無論是細(xì)節(jié)刻畫還是整體風(fēng)格把握,都展現(xiàn)出了極高的水準(zhǔn)。
其實(shí)此前并非沒有類似的文生視頻AI工具,曾經(jīng)以“富二代、美女、高材生、創(chuàng)始人”多種網(wǎng)紅標(biāo)簽而爆火的Pika Labs也讓AI界震驚了一把。但不論是它還是Runway、Pika、SVD(Stable Video Diffusion)、谷歌和 Meta等眾多同類產(chǎn)品,都只是小范圍的“驚艷”,直到OpenAI下場才成功掀起AI的第二波熱潮。
這場AI的浪潮滾滾而來,途中竟然與蘋果Vision Pro來了一次跨界“聯(lián)動”。
AI浪潮助推Vision Pro生態(tài)
蘋果Vision pro發(fā)售后,一躍成為迄今最先進(jìn)的虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)眼鏡,蘋果公司將其稱為“空間計(jì)算設(shè)備”。OpenAI的創(chuàng)始人兼CEO山姆·奧特曼評價(jià):蘋果Vision pro是自iPhone以后第二驚艷的技術(shù)。
Vision pro出現(xiàn)讓空間計(jì)算這個(gè)詞得到現(xiàn)實(shí)中完美呈現(xiàn),簡單說將我們周圍的現(xiàn)實(shí)物理世界和虛擬世界無縫整合,實(shí)現(xiàn)毫無違和感的沉浸式互動體驗(yàn)。其中的空間視頻功能更是讓眾人深感震撼,在“蝴蝶落在指尖”的演示中Vision Pro能夠準(zhǔn)確地為每個(gè)人確定他們的手指所在的位置,并使蝴蝶準(zhǔn)確地落在他們的指尖上。一個(gè)評測者形容:“你甚至可以清晰地看到指尖上蝴蝶的觸手和絨毛,這讓我感覺有點(diǎn)起雞皮疙瘩”。
每一個(gè)空間視頻都帶給人們一種獨(dú)特的沉浸感,但可惜的是虛擬世界的搭建上和3D電影 沉浸式影片照片體驗(yàn),現(xiàn)階段都是基于VisionPro頭顯專用流媒體資源(至今為止可以訪問僅150 深度的3D娛樂項(xiàng)目),且需要依賴于強(qiáng)大的虛擬世界搭建引擎和海量可支持3D的視頻模型資源, 哪怕是內(nèi)置的3D攝像頭可以拍攝照片或視頻,但也需要用戶自主去捕捉拍攝,才能實(shí)現(xiàn)進(jìn)一步呈現(xiàn)。而這一切的資源限制,隨著openAI Sora近期發(fā)布,讓一切限制有了突破的可能性。
有位github網(wǎng)友AndrewMayne就將 OpenAI 發(fā)布的案例視頻轉(zhuǎn)化成了適用 Vision Pro 的空間視頻。AndrewMayne 創(chuàng)建了兩個(gè)視頻軌道,一個(gè)用于左眼,一個(gè)用于右眼,并根據(jù)視頻移動的方向稍微改變了軌道的時(shí)間。這會創(chuàng)建模擬立體 3D 效果,并且僅適用于存在橫向運(yùn)動的視頻。為了將視頻轉(zhuǎn)換為適用于 Vision Pro 的 Apple Spatial 視頻格式,其使用了 Mike Swansons 的空間視頻轉(zhuǎn)換工具。
Spatial 是一款免費(fèi)的 macOS 命令行工具,用于處理 MV-HEVC 視頻文件(目前由 iPhone 15 Pro 和 Apple Vision Pro 拍攝形成)。它將 MV-HEVC 文件導(dǎo)出為常見立體格式(例如上/下、左右以及單獨(dú)的左眼和右眼視頻),可與標(biāo)準(zhǔn)立體/3D 播放器和視頻編輯器一起使用。它還可以制作相同立體格式的 MV-HEVC 視頻,以便在 Apple Vision Pro 和 Meta Quest 等 XR 硬件設(shè)備上播放。
最終經(jīng)過轉(zhuǎn)換的Sora視頻在蘋果 Vision Pro上的實(shí)際表現(xiàn)也并不差,雙目視差能夠很好的營造立體感,讓人更加身臨其境。但終歸是網(wǎng)友突發(fā)奇想的操作,加之Sora目前尚不完善,所以相比起Vision Pro 或iPhone 15 Pro 直接拍攝的空間視頻給人的“空間體驗(yàn)”還是有著不小的差距。
單從空間視頻相關(guān)參數(shù)、以及實(shí)際觀影 3D 深度、清晰度效果來看,作為原生工具的 Vision Pro 顯然更勝一籌。而 iPhone 15 Pro 的優(yōu)勢則主要體現(xiàn)在其便攜性上,隨時(shí)隨地可以拍攝空間視頻。實(shí)際在 Vision Pro 上觀看的沉浸感效果與清晰度也相當(dāng)不錯(cuò),遠(yuǎn)遠(yuǎn)大于在手機(jī)上直接觀看的形式,層次感也比較分明。并且通過 AirDrop 還能一鍵投送到 Vision Pro 上,傳輸方式暴力簡單。
但其需要親自拍攝的特點(diǎn)也限制了視頻的內(nèi)容,作為普通人的我們顯然無法拍攝到一些宏大且炫酷的視頻畫面,但AI卻存在無限的可能性。不論是海邊優(yōu)美的風(fēng)景還是太空激戰(zhàn)的畫面,對AI來說都不算什么難題,而我們也能夠在空間視頻中自由的探索奇幻世界。
觀看過美國著名成人科幻情景喜劇動畫《瑞克和莫蒂》的朋友們應(yīng)該還記得,動畫中的天才科學(xué)家瑞克是一個(gè)害羞的如廁者,為了不被打擾和享受如廁,他特意建造了一個(gè)風(fēng)景優(yōu)美的星球,在這顆只屬于他一個(gè)人的星球進(jìn)行如廁活動。而戴上Vision Pro后開啟虛擬場景后,普通人在如廁時(shí)也能看到極光環(huán)伺,山川幻景,在上水潺潺間,洗滌時(shí)間的污穢。
盡管目前利用Sora 等 AI 大模型生成的視頻、普通視頻通過轉(zhuǎn)換后,缺乏一些層次與深度,在實(shí)際觀看中并不是很特別清晰與沉浸。但這些問題不會永遠(yuǎn)存在,隨著Sora等AI工具的逐步完善,其量產(chǎn)化、定制化、低門檻的特點(diǎn)將會進(jìn)一步被放大,從而有效填補(bǔ)XR設(shè)備中空間視頻的空白市場。
蘋果與AI的“聯(lián)動”不止空間視頻
目前的蘋果Vision Pro算是一款純粹的MR類空間計(jì)算設(shè)備,應(yīng)用生態(tài)中并無太多AI的融合,但在AI的浪潮的沖擊下,蘋果 Vision Pro也將會積極擁抱AI,這并非盲目揣測,而是早已有跡可循。
2月4日,OpenAI通過X平臺的官方貼文向世界宣告:用戶現(xiàn)可在vision OS暢享ChatGPT應(yīng)用,體驗(yàn)未來科技的魅力。這款應(yīng)用在視覺展示上保持了與iPad版相似的清晰界面,盡管未專門為visionOS打造獨(dú)特風(fēng)格,但其在沉浸式頭顯中的表現(xiàn)仍然令人期待。值得一提的是,據(jù)外媒VentureBeat報(bào)道,visionOS版的ChatGPT接入了OpenAI最新的GPT-4Turbo模型,這一升級不僅提升了對話體驗(yàn),還以更低的成本、更高的響應(yīng)速率展現(xiàn)出超凡能力。
在蘋果Vision Pro的應(yīng)用中加入ChatGPT只是對AI初步的擁抱,許多應(yīng)用可以通過更好的方式與AI進(jìn)行融合。在Vision Pro中,德國djay音樂軟件和蘋果音樂一起聯(lián)手打造了全新的djay版本,用戶可以在一組虛擬的3D轉(zhuǎn)盤上,通過移動唱針進(jìn)行不同節(jié)拍的混音制作;還有iPadOS版的DAW錄音軟件,為專業(yè)音樂人士提供實(shí)時(shí)錄制和演奏。
這類應(yīng)用可以與AI音樂生成工具Suno進(jìn)行融合,例如,可以先利用Suno輸入相關(guān)提示詞生成AI歌曲,之后通過Vision Pro上的音樂軟件進(jìn)行調(diào)整與進(jìn)一步制作,最后使用Pika、PixVerse或者Sora生成視頻,就能創(chuàng)作出一種AI版的音樂MV。
這種AI與XR設(shè)備結(jié)合的發(fā)展方式似乎在最新一期的Power On中得到了證實(shí),彭博社的馬克·古爾曼表示蘋果正在考慮是否要開發(fā)智能眼鏡,其中,所述設(shè)備可以作為蘋果實(shí)現(xiàn)長期夢想的墊腳石。
蘋果Vision Pro的領(lǐng)先是有目共睹的,身為亞洲最大蘋果產(chǎn)品集散地的華強(qiáng)北也在努力追逐蘋果的腳步,但在科技不斷飛躍式前進(jìn)的當(dāng)下,曾經(jīng)山寨機(jī)的輝煌歲月似乎愈發(fā)的一去不復(fù)返了。
AI或?qū)⒊蔀槿A強(qiáng)北XR設(shè)備的新出路
在電子消費(fèi)產(chǎn)品近乎創(chuàng)新停滯、消費(fèi)動力嚴(yán)重不足的背景下,Vision Pro的出現(xiàn)為電子消費(fèi)市場注入了一劑“強(qiáng)心針”,對虛擬現(xiàn)實(shí)硬件和軟件的升級無疑將起到巨大的引導(dǎo)和刺激作用。而如此熱鬧的科技圈“盛會”自然少不了華強(qiáng)北的身影。
一家名為深圳億境虛擬的公司趕在Vision Pro正式發(fā)售的時(shí)候推出了高仿版Vision Pro,這為其迅速帶來了熱度。該產(chǎn)品在外形明顯復(fù)刻Vison Pro,能夠提供的功能較為基礎(chǔ),也較少,不過售價(jià)僅1000多元,還不到Vision Pro的零頭,這是其主打的優(yōu)勢。
在推出“高仿版”Vision Pro前,華強(qiáng)北正逐漸失去其往日的喧囂,很多路過的行人或進(jìn)去的消費(fèi)者對此深有體會,空蕩蕩的過道,緊閉的卷簾門,安靜的市場,走在里面,能看見不少旺鋪出租的標(biāo)簽。而如今依靠“高仿版”Vision Pro的熱度,華強(qiáng)北似乎也變得熱鬧了起來,但是蘋果較高的技術(shù)壁壘讓華強(qiáng)北的廠商們很難復(fù)刻出較為出色的可替代產(chǎn)品。
但這本就是華強(qiáng)北的最大弱勢,與其糾結(jié)如何彌補(bǔ)短板,不如發(fā)揮自身的優(yōu)勢,也就是低價(jià)和滲透作用。
當(dāng)初的蘋果AirPods發(fā)布時(shí),過于激進(jìn)的產(chǎn)品設(shè)計(jì)讓其一經(jīng)發(fā)布就遭遇冷嘲熱諷,過高的定價(jià)更是讓消費(fèi)者望而卻步。但華強(qiáng)北卻憑借獨(dú)到的眼光找到了屬于自身的出路,50-200元的高仿版AirPods利用低價(jià)不斷滲透并改變著消費(fèi)者的使用習(xí)慣,而這也為蘋果AirPods的成功起到了一些滲透性的作用,時(shí)至今日華強(qiáng)北的AirPods依舊有大批消費(fèi)者。
作為電子消費(fèi)市場的風(fēng)向標(biāo),華強(qiáng)北一直是技術(shù)潮流的跟隨者。
2016年被虛擬現(xiàn)實(shí)概念點(diǎn)燃的VR眼鏡潮流中,在淘寶搜索“VR眼鏡”,大多設(shè)備都是價(jià)格不到100元的“VR 3D虛擬現(xiàn)實(shí)眼鏡”,這些設(shè)備大概有一半來自華強(qiáng)北。當(dāng)時(shí)深圳VR設(shè)備每個(gè)月的出貨量至少有500萬臺,而這個(gè)數(shù)字比幾大頭部VR設(shè)備制造商的銷量之和還高。數(shù)據(jù)顯示,到2016年年底,Oculus Rift的預(yù)計(jì)銷量將達(dá)到35萬臺,HTC Vive的銷量為42萬臺,谷歌Daydream設(shè)備銷量45萬臺,索尼PlayStation VR的表現(xiàn)最好,累計(jì)銷量將達(dá)到260萬臺。
從上述數(shù)據(jù)可以看出,在國內(nèi),大部分消費(fèi)者首次接觸虛擬現(xiàn)實(shí)技術(shù),正是通過這些來自華強(qiáng)北的低價(jià)VR盒子。華強(qiáng)北借助這場風(fēng)口的薄利多銷,不僅賺的盆滿缽滿還催生出了VR硬件設(shè)備的產(chǎn)業(yè)鏈,華強(qiáng)北之所以能迅速推出Vision Pro的山寨產(chǎn)品,與此脫不開關(guān)系。
盡管此次的高仿版Vision Pro并未復(fù)制2016年VR爆火的盛景,但AI的浪潮或許為華強(qiáng)北帶來了新的出路。不論是Chat-GPT這種AI大語言模型還是Sora、Pika這種文生視頻的AI產(chǎn)品,如果將其植入到設(shè)備中或許比起想方設(shè)法跨越蘋果的技術(shù)壁壘來說反而是一種“捷徑”。
學(xué)習(xí)國內(nèi)XR廠商的打法,專注細(xì)分領(lǐng)域,利用自身的XR設(shè)備供應(yīng)鏈,再植入AI工具,將產(chǎn)品打造成更適合消費(fèi)者的入門式XR設(shè)備,反倒是一條更容易成功的新出路。既然要高仿,不如全都仿,像《幻獸帕魯》一樣,做個(gè)“究極縫合怪”。
寫在最后
從生成式人工智能文字對話工具 ChatGPT、圖像生成器 DALL-E,到視頻生成的王炸Sora,OpenAI 正在重塑互聯(lián)網(wǎng)內(nèi)容生產(chǎn)形式。
蘋果Vision Pro則帶來了針對XR領(lǐng)域的空間計(jì)算革命,將人們的現(xiàn)實(shí)體驗(yàn)提升到了一個(gè)全新的層次。通過結(jié)合 3D 空間場景與混合現(xiàn)實(shí)的內(nèi)容展示形式,它不斷地挑戰(zhàn)和刷新人們對于視覺認(rèn)知的界限。
從目前來看XR設(shè)備似乎更像是一張巨大但尚未拼好的拼圖,不論是 ChatGPT和Sora掀起的AI熱,還是高通研發(fā)的XR芯片,抑或是蘋果Vision Pro的推出等等,都在各自的領(lǐng)域拼接著他們的那塊拼圖,而最終將組合到一起促成XR的藍(lán)圖,成就元宇宙的虛擬現(xiàn)實(shí)時(shí)刻。