正在閱讀:

龍年春節(jié),AIGC帶來哪些“新年俗”?

掃一掃下載界面新聞APP

龍年春節(jié),AIGC帶來哪些“新年俗”?

人工智能正在擁抱生活的每一個角落。

圖片來源:界面新聞 匡達

文|娛樂資本論 James

馬上就過年啦!你家里過年有什么習俗呢?

原先,是聚在一起放鞭炮,吃一頓團圓飯,不論主食是餃子還是米飯。八九十年代,電視機里看春晚成了一條新增的民俗。接下來,移動互聯(lián)網(wǎng)的興起,又讓電子紅包替代了“實體紅包”和紙幣。

要說過去的一年有什么新技術(shù)最火爆,那肯定是AIGC了。面對大模型如雨后春筍般出現(xiàn),文生圖工具解放了普通人作畫的門檻,越來越多的自動回復開始變得更智能……我們很好奇。AIGC會給2024年的春節(jié)帶來怎樣的新民俗呢?

01 百度:三款主要產(chǎn)品批量上新

首先,我們得一起來梳理一下“大廠”們交的答卷。

百度旗下三款主流應(yīng)用——百度APP、文心一言和百度網(wǎng)盤,都在春節(jié)期間批量上新。

文心一言可以生成數(shù)字分身,使用照片、人聲并指定性格,可以輸出一個對話模型,并使用你的音色回答問題。

它的性格設(shè)定用了MBTI的概念,說不準可以看到另一個次元壁上的自己是啥樣。遺憾的是,照片只不過是用作頭像,如果要做數(shù)字人拜年視頻的話還是不行的。

另外,如果單論輸出音色,其實剪映目前也在內(nèi)測生成音色功能,據(jù)說很快就要全量上線。這樣,你就不用在孫悟空和派大星那些里面選來選去了。   

在百度APP可以使用寫祝福、畫頭像、畫龍、拍寫真這些功能,祝福語也可以寫藏頭詩。

百度網(wǎng)盤的云一朵智能助手,將其中的星座運勢功能稍加改動變成了生肖運勢預測,你覺得他說的靈驗嗎?

02 阿里:全民舞王再顯神通  

阿里的通義千問,年初以“全民舞王”這個小游戲走紅,娛樂資本論·視智未來也對其背后的技術(shù)研發(fā)團隊做了個詳盡的專訪。

在過年期間,通義千問將全民舞王、通義萬相、通義照相館三個特別功能都做了春節(jié)特別安排。

“通義萬相”是經(jīng)典的作圖工具,新增的“萬物成龍”功能讓萌寵、風景、靜物等圖片都可以生成類似風格的龍,我們試了試輸入河豚君:   

 

 

新春版全民舞王新增了幾個能添加舞伴的動作模板,正如他們預告的那樣,“今年計劃加入的新功能,至少包括多人共舞和上傳半身照片”,當然這么快就出來也是讓人沒想到的。

至于“通義照相館”,可以在同一張照片當中,引入最多5名不同的家庭成員,用自己5張正面照片所制作的數(shù)字影像模型(LoRA)合影。

他們預設(shè)的模板涵蓋了一些影樓常見的全家福照片的風格。我試了一下,效果還不錯,至少能看出是我的臉。

目前在阿里的各個部門中,對AI技術(shù)的應(yīng)用,似乎是在進行“賽馬機制”。眾所周知的妙鴨相機,跟通義照相館也是采取獨立發(fā)展的路線。而在支付寶APP當中,也有另一個不太起眼的AI應(yīng)用。

支付寶“集五?!币呀?jīng)接近尾聲,有一種途徑,是在畫面當中“找不同”的方式來找福字。他們使用ControlNet類似的方式將福字嵌入到AI文生圖當中,每個圖當中會有1~2個福字,很容易發(fā)現(xiàn)并且用手點出來。據(jù)說功能上線也就一兩天時間,已經(jīng)生成了10萬多張帶有福字的圖片。   

03 智譜:收編網(wǎng)紅“家族群模擬器”  

在大廠之外,有多個個人和機構(gòu)開發(fā)者都瞄準了大語言模型能進行情景模擬的優(yōu)點。過去一個月當中,已經(jīng)有多款模擬器類產(chǎn)品出現(xiàn),直接針對過年場景的更是不少。

有清華血統(tǒng)的智譜清言一口氣推出了好幾個模擬器,其中包括“七大姑八大姨模擬器”,還有為家庭聚會準備游戲,或者是如何表現(xiàn)高情商等等。   

當然這些選單點擊過去之后,也有一定概率會發(fā)現(xiàn),它生成的答案并非那么特異性。不過我們要重點講講模擬七大姑八大姨的模擬器,它背后還有一個小插曲。

與僅僅使用prompt調(diào)節(jié)的場景模擬相比,由Chatmind AI開發(fā)的一個家族群模擬器《決戰(zhàn)拜年之巔》就進行了更周到細致的,全方位的模擬,其效果也更逼真一點。Chatmind是獨立團隊開發(fā)的大模型驅(qū)動的思維導圖產(chǎn)品,之前使用的基底大模型是GPT-4。   

在前兩天被媒體廣泛報道之后,該模擬器經(jīng)過多次擴容,仍然無法滿足火爆的體驗需求。開發(fā)者把服務(wù)遷移到了上面剛說的智譜清言上面。   

這些模擬器之所以走紅出圈,關(guān)鍵還是在于模擬得準,不太出低級錯誤,不讓人出戲。這體現(xiàn)出了作者對大模型微調(diào)訣竅的精通程度。

其實視智未來覺得,這種在機制設(shè)計上比較成熟的模擬器,如果可以自由切換底層模型的話,倒不如開源出來,作為一個變相的大模型評測基準??赡鼙饶切┎粩啻痤}的測試會有用一些,也免得動不動就說某某模型又超越GPT-4啦。

04 AIGC元年,AI春晚也來了  

在各種由技術(shù)進步帶來的春節(jié)新民俗當中,春晚可以被稱為是“皇冠上的明珠”,嗯,我知道這個詞有點俗。

在UGC初出茅廬的時候,人們憋著一股勁,想要證明草根也是可以做高水平的節(jié)目的。這可能就是AB兩站春晚的萌芽。B站跨年和拜年祭,現(xiàn)在已經(jīng)是全站的明星活動,同時也是維系10余年來從二次元到國潮不斷變化的主流人群,凝聚所有人心的一個最大公約數(shù)。

而在AIGC概念翻紅的第一年,我們就能看到一場AI春晚的誕生。

這場AI春晚,號稱有十幾家AI工作室同時參與策劃,4個多小時一共有40多個節(jié)目。   

翻看他們的節(jié)目單,大部分都還是我們熟知的文生圖基礎(chǔ)上的視頻生成,充分利用了目前AI工具特有的風格化特點。比起早前的炫技成分,現(xiàn)在在技術(shù)落地,參加廠商贊助的大賽等過程中,作者們更重要的是考慮如何將這種特異性的風格,用來敘述一個可用的故事。

當然也完全可以預測,由于模型主要依賴其自有知識,而且有些效果好的工具屏蔽了100年內(nèi)有版權(quán)的形象IP,和現(xiàn)當代名人的形象生成,因此這里面講歷史的作品很顯然會更多一點。

而在所有這些節(jié)目當中,其實生產(chǎn)難度最大的,沒準應(yīng)該是生成小品。這是因為,河豚君自己也嘗試了一下做小品這件事,體會到了其中的艱辛。

我們自己也使用多種AI工具復合的測試了一下,但是說實在的,效果還是一般。   

比如ChatGPT被要求選擇過去一年熱門話題和網(wǎng)絡(luò)流行語的時候,結(jié)合人類同事的一些提點,他成功地向我們講述了一個智能音箱在夫妻、婆婆三人交談時不合時宜的插話,最后導致誤會并解決誤會的故事思路。

但是后來,它就直接罷工:

當然這很可能是來自O(shè)penAI方面的限制,原因則不排除是有些學校的學生用它來寫論文,要盡量防止代寫作業(yè)的情況。

既然人家不情愿,我們也不能逼他。   

但是,有一點不得不提:

目前,不論是生成一個較長的視頻片段,還是用AI去寫小說、寫劇本、寫小品,其中無可避免都要涉及一個最使用人力的過程——就是“挑”。

前一段時間,荷蘭著名光刻機廠阿斯麥(ASML)在YouTube上公開了一段時長三分多鐘的廣告,全都是使用Midjourney,Stable Diffusion和Gen-2等工具來生成的。但是在整個生成的過程當中,作廢的片段很多,最終要手動挑選并且連在一起。

據(jù)官方表示,該內(nèi)容的創(chuàng)作耗費了多達1963 個Midjourney 提示,提供了約 7852 張不同的圖片,然后使用 Runway Gen-2 對這些圖片進行了編譯。在整個廣告中,最復雜的部分是"艾薩克·牛頓"部分,主要是因為它涉及到一次多個形體轉(zhuǎn)換,這很難實現(xiàn)。

截至目前,在文生視頻方面,或者像我們所說的文學創(chuàng)作中,AI工具要想出好結(jié)果,仍然嚴重依賴于創(chuàng)作者本人是否具有此前的從業(yè)經(jīng)驗和審美。

但是在普及化之前,就讓我們先享受當下的AI——

把使用通義照相館生成的虛擬全家福打出來掛在墻上;   

手里拿著七大姑八大姨模擬器,像使用谷歌翻譯一樣對答親屬的提問;

然后再打開電腦或手機,看一看AI春晚。

最后,咱再貼一副大模型給做的對聯(lián):

文案:ChatGPT;圖片:阿里通義實驗室AnyText

齊活兒!

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

龍年春節(jié),AIGC帶來哪些“新年俗”?

人工智能正在擁抱生活的每一個角落。

圖片來源:界面新聞 匡達

文|娛樂資本論 James

馬上就過年啦!你家里過年有什么習俗呢?

原先,是聚在一起放鞭炮,吃一頓團圓飯,不論主食是餃子還是米飯。八九十年代,電視機里看春晚成了一條新增的民俗。接下來,移動互聯(lián)網(wǎng)的興起,又讓電子紅包替代了“實體紅包”和紙幣。

要說過去的一年有什么新技術(shù)最火爆,那肯定是AIGC了。面對大模型如雨后春筍般出現(xiàn),文生圖工具解放了普通人作畫的門檻,越來越多的自動回復開始變得更智能……我們很好奇。AIGC會給2024年的春節(jié)帶來怎樣的新民俗呢?

01 百度:三款主要產(chǎn)品批量上新

首先,我們得一起來梳理一下“大廠”們交的答卷。

百度旗下三款主流應(yīng)用——百度APP、文心一言和百度網(wǎng)盤,都在春節(jié)期間批量上新。

文心一言可以生成數(shù)字分身,使用照片、人聲并指定性格,可以輸出一個對話模型,并使用你的音色回答問題。

它的性格設(shè)定用了MBTI的概念,說不準可以看到另一個次元壁上的自己是啥樣。遺憾的是,照片只不過是用作頭像,如果要做數(shù)字人拜年視頻的話還是不行的。

另外,如果單論輸出音色,其實剪映目前也在內(nèi)測生成音色功能,據(jù)說很快就要全量上線。這樣,你就不用在孫悟空和派大星那些里面選來選去了。   

在百度APP可以使用寫祝福、畫頭像、畫龍、拍寫真這些功能,祝福語也可以寫藏頭詩。

百度網(wǎng)盤的云一朵智能助手,將其中的星座運勢功能稍加改動變成了生肖運勢預測,你覺得他說的靈驗嗎?

02 阿里:全民舞王再顯神通  

阿里的通義千問,年初以“全民舞王”這個小游戲走紅,娛樂資本論·視智未來也對其背后的技術(shù)研發(fā)團隊做了個詳盡的專訪。

在過年期間,通義千問將全民舞王、通義萬相、通義照相館三個特別功能都做了春節(jié)特別安排。

“通義萬相”是經(jīng)典的作圖工具,新增的“萬物成龍”功能讓萌寵、風景、靜物等圖片都可以生成類似風格的龍,我們試了試輸入河豚君:   

 

 

新春版全民舞王新增了幾個能添加舞伴的動作模板,正如他們預告的那樣,“今年計劃加入的新功能,至少包括多人共舞和上傳半身照片”,當然這么快就出來也是讓人沒想到的。

至于“通義照相館”,可以在同一張照片當中,引入最多5名不同的家庭成員,用自己5張正面照片所制作的數(shù)字影像模型(LoRA)合影。

他們預設(shè)的模板涵蓋了一些影樓常見的全家福照片的風格。我試了一下,效果還不錯,至少能看出是我的臉。

目前在阿里的各個部門中,對AI技術(shù)的應(yīng)用,似乎是在進行“賽馬機制”。眾所周知的妙鴨相機,跟通義照相館也是采取獨立發(fā)展的路線。而在支付寶APP當中,也有另一個不太起眼的AI應(yīng)用。

支付寶“集五?!币呀?jīng)接近尾聲,有一種途徑,是在畫面當中“找不同”的方式來找福字。他們使用ControlNet類似的方式將福字嵌入到AI文生圖當中,每個圖當中會有1~2個福字,很容易發(fā)現(xiàn)并且用手點出來。據(jù)說功能上線也就一兩天時間,已經(jīng)生成了10萬多張帶有福字的圖片。   

03 智譜:收編網(wǎng)紅“家族群模擬器”  

在大廠之外,有多個個人和機構(gòu)開發(fā)者都瞄準了大語言模型能進行情景模擬的優(yōu)點。過去一個月當中,已經(jīng)有多款模擬器類產(chǎn)品出現(xiàn),直接針對過年場景的更是不少。

有清華血統(tǒng)的智譜清言一口氣推出了好幾個模擬器,其中包括“七大姑八大姨模擬器”,還有為家庭聚會準備游戲,或者是如何表現(xiàn)高情商等等。   

當然這些選單點擊過去之后,也有一定概率會發(fā)現(xiàn),它生成的答案并非那么特異性。不過我們要重點講講模擬七大姑八大姨的模擬器,它背后還有一個小插曲。

與僅僅使用prompt調(diào)節(jié)的場景模擬相比,由Chatmind AI開發(fā)的一個家族群模擬器《決戰(zhàn)拜年之巔》就進行了更周到細致的,全方位的模擬,其效果也更逼真一點。Chatmind是獨立團隊開發(fā)的大模型驅(qū)動的思維導圖產(chǎn)品,之前使用的基底大模型是GPT-4。   

在前兩天被媒體廣泛報道之后,該模擬器經(jīng)過多次擴容,仍然無法滿足火爆的體驗需求。開發(fā)者把服務(wù)遷移到了上面剛說的智譜清言上面。   

這些模擬器之所以走紅出圈,關(guān)鍵還是在于模擬得準,不太出低級錯誤,不讓人出戲。這體現(xiàn)出了作者對大模型微調(diào)訣竅的精通程度。

其實視智未來覺得,這種在機制設(shè)計上比較成熟的模擬器,如果可以自由切換底層模型的話,倒不如開源出來,作為一個變相的大模型評測基準??赡鼙饶切┎粩啻痤}的測試會有用一些,也免得動不動就說某某模型又超越GPT-4啦。

04 AIGC元年,AI春晚也來了  

在各種由技術(shù)進步帶來的春節(jié)新民俗當中,春晚可以被稱為是“皇冠上的明珠”,嗯,我知道這個詞有點俗。

在UGC初出茅廬的時候,人們憋著一股勁,想要證明草根也是可以做高水平的節(jié)目的。這可能就是AB兩站春晚的萌芽。B站跨年和拜年祭,現(xiàn)在已經(jīng)是全站的明星活動,同時也是維系10余年來從二次元到國潮不斷變化的主流人群,凝聚所有人心的一個最大公約數(shù)。

而在AIGC概念翻紅的第一年,我們就能看到一場AI春晚的誕生。

這場AI春晚,號稱有十幾家AI工作室同時參與策劃,4個多小時一共有40多個節(jié)目。   

翻看他們的節(jié)目單,大部分都還是我們熟知的文生圖基礎(chǔ)上的視頻生成,充分利用了目前AI工具特有的風格化特點。比起早前的炫技成分,現(xiàn)在在技術(shù)落地,參加廠商贊助的大賽等過程中,作者們更重要的是考慮如何將這種特異性的風格,用來敘述一個可用的故事。

當然也完全可以預測,由于模型主要依賴其自有知識,而且有些效果好的工具屏蔽了100年內(nèi)有版權(quán)的形象IP,和現(xiàn)當代名人的形象生成,因此這里面講歷史的作品很顯然會更多一點。

而在所有這些節(jié)目當中,其實生產(chǎn)難度最大的,沒準應(yīng)該是生成小品。這是因為,河豚君自己也嘗試了一下做小品這件事,體會到了其中的艱辛。

我們自己也使用多種AI工具復合的測試了一下,但是說實在的,效果還是一般。   

比如ChatGPT被要求選擇過去一年熱門話題和網(wǎng)絡(luò)流行語的時候,結(jié)合人類同事的一些提點,他成功地向我們講述了一個智能音箱在夫妻、婆婆三人交談時不合時宜的插話,最后導致誤會并解決誤會的故事思路。

但是后來,它就直接罷工:

當然這很可能是來自O(shè)penAI方面的限制,原因則不排除是有些學校的學生用它來寫論文,要盡量防止代寫作業(yè)的情況。

既然人家不情愿,我們也不能逼他。   

但是,有一點不得不提:

目前,不論是生成一個較長的視頻片段,還是用AI去寫小說、寫劇本、寫小品,其中無可避免都要涉及一個最使用人力的過程——就是“挑”。

前一段時間,荷蘭著名光刻機廠阿斯麥(ASML)在YouTube上公開了一段時長三分多鐘的廣告,全都是使用Midjourney,Stable Diffusion和Gen-2等工具來生成的。但是在整個生成的過程當中,作廢的片段很多,最終要手動挑選并且連在一起。

據(jù)官方表示,該內(nèi)容的創(chuàng)作耗費了多達1963 個Midjourney 提示,提供了約 7852 張不同的圖片,然后使用 Runway Gen-2 對這些圖片進行了編譯。在整個廣告中,最復雜的部分是"艾薩克·牛頓"部分,主要是因為它涉及到一次多個形體轉(zhuǎn)換,這很難實現(xiàn)。

截至目前,在文生視頻方面,或者像我們所說的文學創(chuàng)作中,AI工具要想出好結(jié)果,仍然嚴重依賴于創(chuàng)作者本人是否具有此前的從業(yè)經(jīng)驗和審美。

但是在普及化之前,就讓我們先享受當下的AI——

把使用通義照相館生成的虛擬全家福打出來掛在墻上;   

手里拿著七大姑八大姨模擬器,像使用谷歌翻譯一樣對答親屬的提問;

然后再打開電腦或手機,看一看AI春晚。

最后,咱再貼一副大模型給做的對聯(lián):

文案:ChatGPT;圖片:阿里通義實驗室AnyText

齊活兒!

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。