文|適道
01 看來做AI是真不賺錢
有句話說:看一個行業(yè)能不能賺錢,就看賣課的多不多。
行業(yè)遍地黃金時,大家都在埋頭淘金,誰會想不開讓別人搶飯碗。只有“卷無可卷”時,才會靠賣信息差,割一波韭菜。
現(xiàn)在國內(nèi)AI行業(yè)便是如此:做技術(shù)開發(fā)門檻高,成本大,戰(zhàn)線長,靠講故事拉不來投資人。
如果不想這樣,你可以另辟蹊徑——賣課。
199元AI課程,一年賣出25萬份,營收5000萬元,這不比吭哧吭哧搞開發(fā)賺錢?
但這個世界是一個巨大的套娃,“盜用”的“盜用”也在賺錢。在某寶上,李一舟的全套課程花0.26元就能買到,同時還贈送另一“巨頭”鶴老師的全套AI課,月銷量相當(dāng)可觀。
為何AI培訓(xùn)這么賺錢?換個問法,為何熱門技術(shù)培訓(xùn)這么賺錢?
知識付費是向人性的弱點付費,當(dāng)賺大錢的欲望和被淘汰的恐懼雙管齊下,再加上“清華博士”“小白可學(xué)”“全程服務(wù)”等誘人噱頭,輔以“199”的低價。誰聽了都心動。
賣課就是“講故事”。哪個技術(shù)熱門,哪里就有故事。投資人聽膩了的故事,說給“韭菜”聽卻很新鮮。
2021年,《元宇宙第一講》10天狂賺160萬;
2023年,《每個人的人工智能課》一年營收5000萬。
所有的slogan都總結(jié)為一句話:xxx是普通人改變命運的最后一波機會?!皒xx”可以是元宇宙,可以是區(qū)塊鏈,人工智能,也可能是未來任何一項熱門技術(shù)。
盲猜下一個是教企業(yè)怎么出海(狗頭保命)。
02 AI創(chuàng)業(yè)都繞不開的“套殼”
除了賣課,我們回到AI賺錢的第二條捷徑“套殼”,當(dāng)然,在李一舟的案例里,說“借殼”更準(zhǔn)確。
其實“套殼”沒有一個明確的定義。
大模型“內(nèi)核”指核心架構(gòu)和算法。如果深究下去,你甚至可以說幾乎所有模型都在“套殼”Google DeepMind 的 Transformer 及其三個變體架構(gòu)。
實際上,“套殼”也并非沒有技術(shù)含量。我們先從大模型的研發(fā)原理來看。
首先,自研大模型需要經(jīng)過預(yù)訓(xùn)練(Pre-training)和調(diào)優(yōu)(Fine-tuning)。
預(yù)訓(xùn)練(Pre-training),開發(fā)者給大模型“喂知識”,不介入它,讓它“啃書”自學(xué),而后得到一個基礎(chǔ)的能力,即基座模型(Base Model)。
調(diào)優(yōu)(Fine-tuning),也稱“微調(diào)”,開發(fā)者給大模型“出題”,介入式地讓它能夠適應(yīng)特定任務(wù)的需求。
此時,如果在基座模型(Base Model)上加入特定行業(yè)的數(shù)據(jù)集做進一步的微調(diào),就會得到一個微調(diào)模型(Fine-tuning Model),或稱為行業(yè)模型、垂直模型。
基于多種情景的“套殼”就發(fā)生在以上研發(fā)過程。
例如在預(yù)訓(xùn)練階段,會出現(xiàn)“數(shù)據(jù)套殼”,此前爆出因為中文數(shù)據(jù)質(zhì)量差,有國內(nèi)團隊用ChatGPT輸出的數(shù)據(jù)進行訓(xùn)練。
在調(diào)優(yōu)階段,也會出現(xiàn)“微調(diào)套殼”,但其中不乏優(yōu)秀產(chǎn)品,例如Perplexity。該AI問答引擎微調(diào)了GPT-3.5,性能顯著提升,但比GPT-4的費用低,速度快。前一周,Perplexity完成B輪融資,估值5.2億美元。
不過,以上幾種“套殼”都具備相當(dāng)一部分的技術(shù)含量。而我們平時最常說的“套殼”是指簡單粗暴地套開源或者ChatGPT,技術(shù)門檻相當(dāng)?shù)?,也可以稱之為“借殼”。
目前,國內(nèi)很多“借殼”ChatGPT向用戶收費。雖然這一行為已經(jīng)涉嫌侵權(quán),只不過因為OpenAI在國內(nèi)沒有代理商,無法起訴。
但這不代表“借殼”者可以肆意妄為。
根據(jù)2023年7月出臺的《生成式人工智能服務(wù)管理暫行辦法》,對于來源于中國境外向境內(nèi)提供生成式人工智能服務(wù)不符合法律、行政法規(guī)和本辦法規(guī)定的,國家網(wǎng)信部門應(yīng)當(dāng)通知有關(guān)機構(gòu)采取技術(shù)措施和其他必要措施予以處置。其中,構(gòu)成犯罪的,依法追究刑事責(zé)任。
但《辦法》也在多處放寬了監(jiān)管要求,并增加了鼓勵人工智能技術(shù)發(fā)展的措施。
例如,明確生成式AI實施算法的“備案制”,此前預(yù)期則是審核許可制。
例如,《辦法》規(guī)定,利用生成式人工智能技術(shù)向中華人民共和國境內(nèi)公眾提供生成文本、圖片、音頻、視頻等內(nèi)容的服務(wù),適用本辦法。而在4月的《征求意見稿》第二條中,只要是向境內(nèi)用戶提供服務(wù),不論是“研發(fā)”生成式AI還是“利用”生成式AI,都屬于監(jiān)管范圍。
我們可以推測,“研發(fā)”和“利用”畫出了模型“借殼”和“微調(diào)”法律適用范圍的不同。在當(dāng)前國內(nèi)AI創(chuàng)業(yè)場景中,完全不“套殼”可能行不通。但開發(fā)者技術(shù)門檻越高,“研發(fā)”含量越高,就越不容易觸及監(jiān)管底線。
03 “三重敘詭”或涉嫌欺詐
最后,回到李一舟事件,你會發(fā)現(xiàn)這廝玩的居然是“三重敘詭”。
一開始,他說他是“自研”模型,但其平臺卻是“借殼”組合,當(dāng)你以為他只是“借殼”,面具下面卻是“盜用”。
從目前來看,國內(nèi)很多模型都是開發(fā)者“微調(diào)”開源模型Stable Diffusion而來。
據(jù)「市界」報道:一位名為“兔猻”的AI繪圖模型開發(fā)者發(fā)現(xiàn),自己微調(diào)的3個模型被一舟智能“盜用”,其中兩個模型是他與Liblib平臺簽署了獨家協(xié)議合同。煉丹科技創(chuàng)始人忠忠,獨立開發(fā)者娜烏斯嘉等人發(fā)現(xiàn),自己在其他平臺發(fā)布的模型出現(xiàn)在了一舟智能的官網(wǎng)首頁。
對開發(fā)者而言,最直接的影響是他們無法從自己制作的模型產(chǎn)品中獲得任何收益?!巴锚s”訓(xùn)練模型時間多達半年,租賃算力花費2萬元,購買英偉達顯卡花費8萬元。
目前,合計97個模型,除1個模型為Stable Diffusion XL官方模型外,其余均為國內(nèi)或國外開發(fā)者所制作第三方模型。
這就讓人不禁想問一句,如此光明正大地搬運國內(nèi)開發(fā)者模型,還對學(xué)員稱“自研”模型,不怕被告兩頭詐騙嗎?
不過,有律師表示不明確是否構(gòu)成“詐騙”,因為AI相關(guān)的內(nèi)容和課程的含義本身比較寬泛,只要在用戶付費后,提供了約定的相關(guān)資料,就不能說詐騙。至于這些資料是否符合用戶的預(yù)期,屬于合同履行的問題。
但可以肯定的是,李一舟的AI課不僅涉嫌違反《廣告法》和《反不正當(dāng)競爭法》,構(gòu)成虛假宣傳的不正當(dāng)競爭行為,而且涉嫌違反《消費者權(quán)益保護法》,侵犯消費者的知情權(quán)、公平交易權(quán)等。
目前,LiblibAI已經(jīng)發(fā)布聲明,表示密切關(guān)注此事件,并可能采取法律措施來追究侵權(quán)責(zé)任,為被侵權(quán)的創(chuàng)作者維權(quán)聲討。
據(jù)報道,目前愿意共同發(fā)聲的開發(fā)者人數(shù),已經(jīng)達到了17人,對應(yīng)25個模型。雖然單個賠付金額不大,但如果有律師來搞集體訴訟,結(jié)果就很難預(yù)料了。
參考資料:
- 《Sora封的第一個“神”,塌了》,市界 董溫淑 董雨晴
- 《大模型套殼祛魅:質(zhì)疑套殼,理解套殼》,甲子光年 趙健
- 《李一舟再陷兩大硬核爭議:一舟智能未獲備案涉嫌非法運營,盜用AI繪圖模型》,鞭牛士 鞭牛士
- 《清華博士網(wǎng)紅“AI課賣了5000萬”?AI課程亂象調(diào)查》,澎湃新聞 范佳來 史若彤 郭思航