文|深燃 鄒帥
編輯|唐亞華
AI也能瘦臉、祛痘、加濾鏡之后,“美圖秀秀們”的飯碗要被搶了?
近期,有傳言稱某頭部修圖APP“因?yàn)锳I(的沖擊)正處于生死存亡之際”。雖未指名道姓,但行業(yè)內(nèi)給出的反應(yīng)大多是:AI在“無(wú)差別攻擊”各個(gè)行業(yè)的時(shí)候,修圖APP也難逃一劫,因?yàn)槟壳癆IGC以圖像生成方面的應(yīng)用相對(duì)最為廣泛。
從C端使用來(lái)看,目前國(guó)內(nèi)手機(jī)美顏修圖類APP以美圖秀秀、醒圖、輕顏相機(jī)等為主流,抖音、快手等社交工具也有類似功能。無(wú)論受眾是誰(shuí),功能方向大體一致,即美顏、濾鏡、特效三種。業(yè)內(nèi)人士表示,AI技術(shù)早在2015年之后就迎來(lái)了第一次爆發(fā),當(dāng)時(shí)就對(duì)這類圖像處理軟件形成了革命性的顛覆,因?yàn)锳I能做出以前做不了的事,比如換臉、加面部“返老還童”特效,增加發(fā)量、改變發(fā)色等等。
如今,生成式AI成為焦點(diǎn),再一次給修圖類APP帶來(lái)了機(jī)會(huì)和沖擊。技術(shù)開源,壁壘消失,新玩家任何時(shí)刻都可能入局搶飯碗。同時(shí),內(nèi)部如何應(yīng)用技術(shù),如何成功落地,又是新的課題?!懊缊D秀秀們”多年以來(lái)積累的用戶基數(shù),在美顏修圖上建立起的用戶心智,也許會(huì)給其筑起護(hù)城河,但在今天,技術(shù)祛魅,流量的走向誰(shuí)都難以預(yù)估。真正的較量,不在于技術(shù),而在于運(yùn)用技術(shù),在于審美的獨(dú)特性,在于更懂用戶。
01 AI早就在幫我瘦臉了
市面上,主要面向C端用戶的圖像處理軟件,大致分為幾類。一種是以美圖秀秀為代表的,專門拍攝美顏照片,或處理用戶照片的軟件,包含瘦臉、祛痘、磨皮、美白等基礎(chǔ)功能。另一種是社交軟件中的拍攝功能,抖音、快手、小紅書、微博等都可以直接拍照、處理并發(fā)布,也能完成基礎(chǔ)的美顏,還能加濾鏡,加貓耳朵、搞怪臉等特效。此外,還有專門做面向影樓等專業(yè)攝影師的軟件,包括小型創(chuàng)業(yè)公司,以及美圖也有toB的產(chǎn)品。更專業(yè)化的,還有圖像處理行業(yè)鼻祖Photoshop、Blender等。
本文將著重討論美圖秀秀這類C端用戶比較熟知的軟件。這類公司的梯隊(duì)劃分很清晰。行業(yè)第一是創(chuàng)立于2008年的美圖秀秀,最開始做PC端,2011年做APP,2016年上市。第二梯隊(duì)里,2015年前后,騰訊推出天天P圖,今日頭條臉萌團(tuán)隊(duì)先后推出Faceu激萌、輕顏相機(jī),那一波也有不少小而美的創(chuàng)業(yè)公司推出的產(chǎn)品出現(xiàn),如B612咔嘰、黃油相機(jī)等。2020年之后,字節(jié)跳動(dòng)推出醒圖,快手推出原片。該行業(yè)的特點(diǎn)就是向頭部集中,要么是美圖這樣贏在入局早的公司,要么就是背靠互聯(lián)網(wǎng)大廠。
美圖是一家完成了圖像處理產(chǎn)品閉環(huán),并以相關(guān)業(yè)務(wù)獲得收入的公司。以它的財(cái)報(bào)為參考,美圖主要靠VIP用戶收入、廣告、toB業(yè)務(wù)等賺錢,近五年的總營(yíng)收在10億元左右,其中去年獲得了20.85億元的總營(yíng)收,付費(fèi)會(huì)員數(shù)560萬(wàn)。
美圖自稱是一家以人工智能為驅(qū)動(dòng)的科技公司,在國(guó)內(nèi)某大廠從事美顏技術(shù)工作的高廣也告訴深燃,業(yè)內(nèi)大多數(shù)公司早已能成熟地將AI應(yīng)用到自己的業(yè)務(wù)中。AI進(jìn)入到圖像處理軟件中,主要帶來(lái)兩方面的改變。
一是傳統(tǒng)修圖功能的“AI化”。美顏和濾鏡是圖像處理軟件最傳統(tǒng)的兩項(xiàng)功能,高廣解釋,在AI出現(xiàn)之前,在圖片上加濾鏡的技術(shù)原理是,做一個(gè)濾波,把圖片整體修改成“黃昏”、“陽(yáng)光”、“油畫”等效果,“人還是人,植物還是植物,只有整張照片的調(diào)性發(fā)生了改變?!睘V波的作用就是把信號(hào)中的噪聲和雜波進(jìn)行過(guò)濾,留下有用的信號(hào),這也是長(zhǎng)久以來(lái),美顏類軟件的底層技術(shù)邏輯。而磨皮就是把分辨率降低,用高斯模糊把細(xì)節(jié)抹掉。
讓AI來(lái)做同樣的事情,邏輯就變了?!坝肁I來(lái)做美顏,原理是訓(xùn)練各種各樣的模型,把各種數(shù)據(jù)拿進(jìn)去處理,然后調(diào)參數(shù),調(diào)到一個(gè)比較合理的數(shù)值?!备邚V說(shuō),用以前的技術(shù),則要建立一個(gè)映射,設(shè)置好一套顏色的轉(zhuǎn)換關(guān)系,“比如亞洲人皮膚本來(lái)是偏黃色的,要美白,那就要設(shè)置好,是把黃色映射到偏暗還是偏亮?!痹趥鹘y(tǒng)的技術(shù)下,針對(duì)不同人種的需求,就要設(shè)置多個(gè)映射。對(duì)比之下,讓AI技術(shù)來(lái)處理照片,好處在于,不同用戶的需求,只要用一個(gè)模型就可以了。
二是純粹基于AI技術(shù)的新功能。早年間,用戶瘦臉的操作方式是自行在人臉上定點(diǎn)向內(nèi)推。原理也很簡(jiǎn)單,圖片中的人臉有基本的像素位置,構(gòu)成一個(gè)坐標(biāo),用戶拉動(dòng)原有的像素位置,坐標(biāo)由此發(fā)生變形,也就完成了臉部的放大和縮小。
2017年之后,“面部重塑”問(wèn)世,這也就是在AI技術(shù)下的新功能。修圖時(shí)系統(tǒng)先識(shí)別臉部信息,點(diǎn)擊放大雙眼、眼瞼下至、縮小鼻頭等指令,就可以完成自然的修圖。
高廣說(shuō),類似面部重塑、增加發(fā)量等功能,一般都是用AI完成的。面部重塑功能,就需要首先訓(xùn)練AI什么是人臉部,包括什么是眼睛、鼻子、嘴巴,位置分布在何處,他表示,這些功能在AI出現(xiàn)之前很難實(shí)現(xiàn)?!耙?yàn)橐?xùn)練AI,一是頭發(fā)的定義,二是頭發(fā)的準(zhǔn)確性,讓發(fā)絲順著自然的紋理向下走,然后在上面著色。傳統(tǒng)方法是做不到的,最多能拿個(gè)照片過(guò)來(lái)做一個(gè)濾波,但還是達(dá)不到AI的效果?!?/p>
從傳統(tǒng)的美顏技術(shù),過(guò)渡到AI主導(dǎo)下的產(chǎn)品時(shí)代,核心的改變?cè)谟谧R(shí)別和內(nèi)容理解。AI出現(xiàn)之前,顏色轉(zhuǎn)換、臉部位置的移動(dòng)、磨皮祛痘,都需要經(jīng)過(guò)前期復(fù)雜的設(shè)置,而AI只需要接受訓(xùn)練,就能“一勞永逸”??梢哉f(shuō),AI把傳統(tǒng)的修圖重做了一遍,而且做得更好。
02 AI修圖,還能怎么進(jìn)化?
最新一波的AI熱潮涌來(lái),行業(yè)玩家也在急著找新的機(jī)會(huì)。
基于指令生成、基于圖片處理,是AI應(yīng)用在這一行業(yè)的主要技術(shù)方向。3月末,Adobe發(fā)布了AI模型Firefly,可以用文字生成圖像,微軟、Meta、Google等國(guó)際巨頭也都有AI圖像生成業(yè)務(wù)的布局。
回到C端用戶使用的APP,美圖、醒圖、天天P圖等APP不敢掉以輕心?!拔覀儸F(xiàn)在基本是按周甚至天為單位在進(jìn)化?!泵缊D公司方面向深燃表示,最近他們密集推出了基于AI技術(shù)的圖片和視頻方向的功能。
深燃在各大修圖軟件上看到,生成式AI的運(yùn)用早已細(xì)分為幾個(gè)功能掛上了首頁(yè)供使用。用戶可以上傳一張照片,AI將其轉(zhuǎn)換為卡通、CG、復(fù)古形象,或者完成增加笑容、頭部放大、路人消除等功能。也可以上傳幾張自己的照片,AI可以依照這幾張照片,抓取用戶不同角度的面貌特征,生成不同風(fēng)格的畫像。甚至還有Midjourney暫時(shí)都無(wú)法完成的工作,即導(dǎo)入一張簡(jiǎn)筆草圖,生成多張完善的圖片。
高廣表示,2015年前后,手機(jī)APP的創(chuàng)業(yè)熱潮涌來(lái),也是那時(shí),AI也開始大規(guī)模地應(yīng)用到修圖行業(yè)。能給人臉加上各種豐富的特效、能近乎無(wú)痕地完成美顏的修圖APP,在當(dāng)年收割了一波年輕用戶。
當(dāng)下最新的AI技術(shù),也給行業(yè)帶來(lái)了新的增量,兩個(gè)趨勢(shì)出現(xiàn)了。
一是個(gè)性化的訓(xùn)練?,F(xiàn)在AI修臉一般是經(jīng)過(guò)大量的模型訓(xùn)練之后,得出最折中的經(jīng)驗(yàn)值,給用戶一個(gè)相對(duì)普適的修圖方案。C端用戶也可以感覺到,例如在進(jìn)行面部重塑的時(shí)候,可以選擇向內(nèi)收下頜線,問(wèn)題在于,圓臉型和方臉型的下頜走向不同,都由統(tǒng)一的AI識(shí)別和面部處理,效果大相徑庭,因此也有很多用戶覺得AI修的臉很怪異。
“做得好一點(diǎn)的話,就是給每個(gè)用戶建立數(shù)據(jù)庫(kù),下發(fā)固定的參數(shù)模型,針對(duì)性地解決每個(gè)用戶的需求?!备邚V說(shuō),用戶也只需要導(dǎo)入一些照片訓(xùn)練APP,APP就能收集數(shù)值,進(jìn)行分析。美圖方面對(duì)深燃表示,從技術(shù)上講,讓AI記住用戶特征并不難,原理和美顏參數(shù)的設(shè)定差不多。
要完成足夠精準(zhǔn)的個(gè)性化訓(xùn)練,同時(shí)也讓APP在理解大眾需求時(shí)更加精準(zhǔn),需要技術(shù)和訓(xùn)練集的加持。在這一點(diǎn)上,用戶規(guī)模龐大的頭部修圖類公司,具備一定優(yōu)勢(shì)。
二是理解指令。此前,GAN模型(生成對(duì)抗網(wǎng)絡(luò))已經(jīng)得到了廣泛應(yīng)用,精準(zhǔn)識(shí)別面部,以及圖片中包含的要素。下一步,從業(yè)者要做的是,如何基于新一代的擴(kuò)散模型,充分理解自然語(yǔ)義,給出具體的修圖執(zhí)行。高廣表示,擴(kuò)散模型應(yīng)用的原理差不多,“用戶給出prompt(提示詞),我們可以根據(jù)NLP理解指令,之后把它們分化成一個(gè)個(gè)參數(shù)下發(fā)并執(zhí)行?!?/p>
長(zhǎng)期關(guān)注AI領(lǐng)域的從業(yè)者Elsa也認(rèn)可這一趨勢(shì)?!癆I修圖可能改變的是人機(jī)交互模式,現(xiàn)在還停留在自己手動(dòng)拉一拉點(diǎn)一點(diǎn)的階段,等到AI對(duì)自然語(yǔ)義的理解更進(jìn)一步后,修圖時(shí)只要說(shuō)一句‘我要瘦臉’就可以了?!盓lsa說(shuō),“AI現(xiàn)在依賴的是低語(yǔ)境,它需要用戶表達(dá)得更精準(zhǔn),而中文是一種高語(yǔ)境的表達(dá),習(xí)慣模糊、習(xí)慣意會(huì)。以后的趨勢(shì)是指令的可量化,想象一個(gè)人在幫你修圖,你要怎么精確簡(jiǎn)潔地讓它理解你所說(shuō)的是哪一種瘦臉?!?/p>
也就是說(shuō),AI用于圖像生成和圖像處理,都要建立在對(duì)文字和圖片的理解上。AI已經(jīng)可以幫助修圖軟件更好地瘦臉、祛痘、加濾鏡、換背景,也可以生成多種風(fēng)格的圖片。而未來(lái)的趨勢(shì),在于如何在普適完美的基礎(chǔ)上,做到個(gè)性化的精準(zhǔn)匹配,以及減少用戶自主操作的步驟,聽懂指令,準(zhǔn)確執(zhí)行。
從業(yè)者認(rèn)為,這會(huì)帶來(lái)未來(lái)修圖行業(yè)的用戶分化。理解直白指令,修圖過(guò)程完全讓AI代勞,這往往是小白用戶的需求,這部分用戶潛力是巨大的,美圖這類公司會(huì)獲得新的用戶增量。而對(duì)修圖的自主性要求較高的用戶,如B端用戶等,則會(huì)慢慢向更專業(yè)的軟件涌去,即便Photoshop等軟件也有AI技術(shù)的加碼,但這類用戶需要的是“你得懂我,但不能完全幫我做事”。
另一個(gè)新的機(jī)遇在于,AI還能幫助修圖軟件自身提高生產(chǎn)效率。高廣說(shuō),“特效這種功能是需要設(shè)計(jì)師自己畫圖的,生成式AI可以在這一部分高效地給出解決方案?!彼硎荆F(xiàn)在AI也可以完善草圖,給一個(gè)隨手畫的素描上色、加五官和風(fēng)格,成稿直接可以用。
03 AI來(lái)了,“美圖秀秀們”為什么顫抖?
傳言中的“生死存亡之際”或許有些夸張,但這一波AIGC對(duì)修圖軟件行業(yè)的沖擊是事實(shí)。技術(shù)的發(fā)展,讓創(chuàng)業(yè)的門檻降低,想要入局“搶飯碗”的人不少。
Tori以前在北美做前端工程師,她剛剛回國(guó),正尋找生成式AI在應(yīng)用層面的機(jī)會(huì)?!扒岸螘r(shí)間有個(gè)很火的產(chǎn)品叫Lensa,最高峰時(shí)期,一天之內(nèi)的流水接近100萬(wàn)美元。它的原理現(xiàn)在看非常簡(jiǎn)單,就是設(shè)置了幾組固定的prompt,把用戶照片導(dǎo)進(jìn)去,生成一個(gè)圖片。當(dāng)時(shí)收費(fèi)2-10美元不等,它其實(shí)并沒有用到高級(jí)的圖像處理技術(shù),只是用了一個(gè)API call,在外面綁了一個(gè)應(yīng)用的UI?!盩ori的感知是,亙古不變的信息差面前,能踩到風(fēng)口,就能賺到錢。
AI領(lǐng)域資深從業(yè)者趙洋告訴深燃,“中國(guó)市場(chǎng)永遠(yuǎn)會(huì)有這類APP的存在?!壁w洋表示,技術(shù)是開源的,且可能長(zhǎng)時(shí)間固化,靠同一種技術(shù)吃飯的人會(huì)越來(lái)越多,而正在吃飯的人,手里的飯碗隨時(shí)會(huì)被砸。
高廣也認(rèn)為,“市面上的公司,技術(shù)和產(chǎn)品也都大差不差?!奔夹g(shù)壁壘不在了,理論上講,誰(shuí)都有可能造出下一個(gè)“美圖秀秀”。說(shuō)白了,所有修圖軟件,用戶幾乎都是同一撥人,用戶能為一個(gè)軟件的濾鏡付費(fèi),就也能為另一個(gè)軟件更具特點(diǎn)的濾鏡付費(fèi)。
目前,美圖的第一大收入來(lái)源是VIP訂閱。2018年-2021年,美圖公司連續(xù)虧損,2022年才扭虧為盈。最新的動(dòng)態(tài)中看,美圖公司極其重視AIGC給其帶來(lái)的增長(zhǎng),尤其是在訂閱用戶上的增長(zhǎng)。深燃注意到,美圖秀秀APP中涉及AI作圖的幾項(xiàng)功能,大多需要單獨(dú)付費(fèi),是其拉高收入的重要“武器”。未來(lái)在競(jìng)爭(zhēng)壓力之下,美圖秀秀們?cè)贏I上的投入只能多不能少。
當(dāng)然,對(duì)于頭部企業(yè)來(lái)說(shuō),最大的護(hù)城河是用戶規(guī)模。
有從業(yè)者分析,美圖自身坐擁上億用戶,醒圖、天天P圖背靠大廠,有抖音和騰訊的導(dǎo)流,短期內(nèi)受到的影響或許不太明顯,但怎樣擁抱AI,留住手里的用戶,是企業(yè)需要面對(duì)的問(wèn)題。
AI的到來(lái),對(duì)修圖行業(yè)的設(shè)計(jì)師提出了更高的要求。高廣認(rèn)為,圖像處理這一行歸根結(jié)底還是視覺和創(chuàng)意行業(yè),未來(lái)的競(jìng)爭(zhēng)點(diǎn)在于審美和品位?!癆I可以幫忙解決掉最耗時(shí)的那一個(gè)步驟。以前可能要做兩周,現(xiàn)在幾天就完成了?!彼?,企業(yè)端可能也更要考量,什么樣的設(shè)計(jì)師更吃市場(chǎng),什么樣的設(shè)計(jì)師更具審美上的優(yōu)勢(shì)。
另一個(gè)是技術(shù)落地的難度。“AI的上限比較高,下限比較低?!备邚V表示,在修圖中,如果使用傳統(tǒng)的CV算法,會(huì)比較穩(wěn)定,“但AI是通過(guò)拓展大量的數(shù)據(jù)標(biāo)注進(jìn)行模型訓(xùn)練的,會(huì)導(dǎo)致它在一些情況下應(yīng)用得比較差?!彼e例,比如瘦臉,“可能會(huì)識(shí)別錯(cuò)人臉,或在人臉重疊時(shí)只識(shí)別部分?!?/p>
所以,AI技術(shù)很難完全應(yīng)用于一個(gè)包含多項(xiàng)功能的修圖軟件。一方面模型訓(xùn)練需要時(shí)間,另一方面即使完全訓(xùn)練好,它也會(huì)對(duì)手機(jī)性能產(chǎn)生極大的耗損。高廣表示,“一些低端機(jī)型可能會(huì)出現(xiàn)卡頓等問(wèn)題,如果很長(zhǎng)時(shí)間加載不出來(lái),也會(huì)影響APP打開率?!被氐狡髽I(yè)層面,這對(duì)團(tuán)隊(duì)?wèi)?yīng)用AI技術(shù)的能力、訓(xùn)練集的質(zhì)量都提出了高要求。
在技術(shù)迭代的過(guò)程中,新老玩家之間的基礎(chǔ)差距在逐漸消失。像美圖秀秀這樣坐擁強(qiáng)大用戶基數(shù)的公司,短期內(nèi)也許不會(huì)受到顛覆性的影響,能做的只有在變化中保持清醒,接受變化,甚至主動(dòng)帶來(lái)變化。
應(yīng)受訪者要求,高廣、Elsa、Tori、趙洋為化名。