正在閱讀:

ChatGPT會是大模型商業(yè)化的火炬嗎?

掃一掃下載界面新聞APP

ChatGPT會是大模型商業(yè)化的火炬嗎?

2022年初的元宇宙,下半年就被AIGC搶去了風頭;ChatGPT引起的新風口,會是一個例外嗎?

文|Alter

ChatGPT走紅的速度,顯然超過了許多人的預期。

即使是在中文互聯(lián)網上,和ChatGPT有關的報道、討論,早已超過了其他科技概念,甚至萌生出了“ChatGPT概念股”的說法,不少與AI、大模型、NLP相關的中概股,短期內的漲幅“意外”達到了50%以上。

每一次有“科技大事件”上演時,都有人蠢蠢欲動,有人借勢起風,ChatGPT掀起的浪潮似乎也是如此。

可當我們在討論ChatGPT的時候,到底在討論什么?顛覆式創(chuàng)新的技術洗禮,抑或是對人工智能前景的樂觀,還是在潛移默化中被有心人帶了風向。厘清這些問題的答案,遠比討論ChatGPT本身更有價值。

01 一場自上而下的“出圈”

和2016年的AlphaGo一樣,ChatGPT的“火”也呈現出了自上而下的軌跡。

答案就隱藏在一篇篇10W+的爆款文章中。和ChatGPT相關的文章可謂盈千累萬,除了大批科技和財經類自媒體的分析與報道,就連旅游博主們都開始以ChatGPT為主題,而且內容特別貼地氣:

大多是博主與ChatGPT的對話截圖,其中問題本身就相當有話題性,截取的問答同樣吸引眼球,再稍微關聯(lián)下AI取代人的宏大話題,以及可能存在的應用場景,短時間即可炮制出一篇大眾喜聞樂見的文章。

追熱點向來是自媒體們的“天職”,以爆紅的ChatGPT為題也無可厚非,問題恰恰出現在信息的不對稱上。

從2022年11月底上線運營,到2023年1月末的上億月活,ChatGPT用兩個月的時間就刷新了用戶增長的歷史記錄。只是在注冊體驗ChatGPT嘗鮮過程中,對中文互聯(lián)網的用戶相當不友好。

想要打開OpenAI的網址,前提是有“科學上網”的工具,而且ChatGPT并未對中國開放注冊,必須要用海外的手機用來接收驗證碼……可以說人為增加了重重壁壘。在這樣的注冊機制下,和ChatGPT“暢聊”的國內網民注定是“少數派”,大多數網民對ChatGPT的理解,是從別人口中“聽”來的。

正是在這樣的語境下,ChatGPT的“神奇能力”被不斷放大。個中原因離不開人們對對話式機器人的特殊情愫。

無論是誕生于2014年的微軟小冰,以“智能助手”自居的Siri,還是主打語音交互的智能音箱,都曾吸引無數人的好奇心,在特定時間內引發(fā)了現象級的討論。畢竟早在上個世紀初,圖靈就提出“對話”是測試機器是否有人類智慧的有效場景。

沿循類似的邏輯,ChatGPT的“出圈”是注定的結果。背靠千億級大模型GPT-3,ChatGPT的自然語言理解能力遠超早期的微軟小冰和Siri,和用戶對話時不會根據一兩個關鍵詞機械地輸出結果,而是理解用戶的“語義”,輸出的準確性和關聯(lián)性不可同日而語,并在很大程度上刷新了人們的認知。

然而目前的ChatGPT還是大規(guī)模離線語料進行訓練的版本:無法將即時信息納入自己的回答中;經常給出一些看似合理但不正確的答案;對話中涵蓋的因果關系,仍缺乏很好的理解能力;缺少人類舉一反三的能力......并不能像朋友一樣自由對話。

陰謀論一些的話,在ChatGPT走紅的這些日子里,并不缺少一些“炒作”的痕跡。比如讓人摸不著頭腦的“ChatGPT概念股”,至今還沒看到哪家中概股與OpenAI開展合作,所謂的概念股,多半是在蹭文本生成、信息抽取、知識抽取、機器問答等技術的熱度,屬于典型的“借事說事”。

而就當前的態(tài)勢來看,ChatGPT的熱度還將持續(xù)一段時間,但被刻意營造的期待值,就像是鼓吹起來的氣泡,再美麗也有被刺破的一天。與其去討論ChatGPT的短期效應,不如將視角放在對行業(yè)的長期影響上。

02 ChatGPT的偶然與必然

或許ChatGPT的“躥紅”有些偶然因素,可類似產品的出現卻是必然的結果。

可以佐證的是,在ChatGPT熱度空前的局面下,競品們正在加速追趕:谷歌CEO 桑達爾·皮查伊在2月7日凌晨宣布將推出一款名為 Bard 的實驗性對話 AI 服務,并將在幾周內向部分開發(fā)者開放。

幾乎和谷歌同一時間,百度官宣將推出類似ChatGPT的人工智能聊天機器人,項目名字被命名為“文心一言”,英文名“ERNIE Bot”,預計在3月份完成公測,或將直接接入百度搜索向公眾開放。

人工智能初創(chuàng)公司元語智能連忙推出了功能型對話產品 ChatYuan;阿里達摩院牽頭的類ChatGPT對話機器人被曝正處于內測階段;昆侖萬維宣布將與奇點智源合作年內發(fā)布中國版類 ChatGPT 代碼開源……還有更多產品在官宣的路上,不排除會出現畫虎不成反類犬的尷尬場面。

一種流行的解釋是:ChatGPT將取代搜索引擎。其中被引用最多的Gmail創(chuàng)建者之一Paul Buchheit的觀點:“像ChatGPT這種AI聊天機器人將摧毀谷歌,就像當年搜索引擎徹底干掉黃頁電話簿一樣,時間上就是這一兩年?!眱仍诘纳虡I(yè)邏輯在于,一旦搜索引擎確定的信息檢索方式被顛覆,整個互聯(lián)網商業(yè)都將重新洗牌,沒有哪家互聯(lián)網巨頭想要錯過在新格局中占有一席之地的可能。

或許還有另外一種解釋,即ChatGPT的誕生是一種方向性的探索。OpenAI率先驗證了對話AI的可行性,然后谷歌、百度等快速跟進。之所以能夠在短時間內推出類似ChatGPT的產品,原因還要從大模型說起。

時間撥回到2017年,當時還在谷歌任職的Ashish Vaswani等人提出了Transformer架構,讓深度學習的參數達到了上億的規(guī)模;2018年谷歌推出了基于Transformer的雙向深層預訓練模型Bert,參數首次超過了3億規(guī)模;OpenAI同年提出了生成式預訓練Transformer模型GPT,進一步推動了大模型的發(fā)展。

但直到2020年,大模型才真正進入到大眾視野,誘因正是著名的GPT-3,擁有1750億個參數量,是傳統(tǒng)深度學習小模型的一萬倍以上,同時讓外界看到了“大力出奇跡”的一幕:常見小模型需要對不同的任務使用不同模型分別訓練解決,而GPT-3先使用海量數據預訓練大模型,然后將模型參數初始化后再進行訓練,實現了作詩、聊天、答題、翻譯、寫代碼等一系列能力。

一場千億級大模型的軍備競賽由此拉開帷幕。

僅在2021年,國內的華為、智源、浪潮、阿里云、百度等企業(yè)先后發(fā)布了自家的大模型產品,而后不斷從NLP延伸出了雙語、CV、跨模態(tài)等大模型。據OpenBMB開源社區(qū)的統(tǒng)計,目前全球超千億參數的大模型中,中國貢獻了1/3,美國貢獻了1/2,世界其他國家或組織貢獻了剩下的1/6。和歷史上的許多次“軍備競賽”一樣,耗費了大量真金白銀的大模型,最終也需要找到一個商業(yè)化出口。

有趣的地方在于,不管是GPT-3,還是ChatGPT,OpenAI兩次站在了新舊交替的臨界點上,第一次掀起了大模型熱,讓全球科技大廠們冒險一試,這一次能為大模型的商業(yè)化帶來生機嗎?

03 大模型商業(yè)化的“火炬”

大模型的性能表現不可謂不性感,代價則是訓練大模型非常燒錢。

根據公開數據顯示,GPT-3訓練的硬件和電力成本高達1200萬美元;谷歌在訓練包含5400 億參數的 PaLM 時用了6144塊TPU……坊間由此出現了對盲目“煉大模型”的質疑,資本市場因為大模型的應用問題遲遲不肯下注,“多才多藝,身兼多職”的大模型們距離“生存危機”越來越近。

并非是大模型缺少商業(yè)化故事。按照大規(guī)模預訓練的思路,大模型+細分場景微調在某種程度上給出了人工智能在長尾場景落地的最優(yōu)解,而且在小樣本訓練的情況下,大模型也有著比較好的提升。

大模型也不缺少落地的場景。AIGC在2022年就已經走紅,投資機構紅杉在2022年發(fā)布的一篇分析文章中特意提到,生成式AI有潛力產生數萬億美元的經濟價值,進一步增強了相關創(chuàng)業(yè)者的信心。

可在2023年以前,很少看到資本市場對大模型的關注,僅有智譜AI等為數不多的企業(yè)拿到了融資,與之形成鮮明對比的是,AIGC賽道里初創(chuàng)企業(yè)早已是資本寵兒。資本寧愿在應用層的AIGC賽道試錯,也不愿燒錢給大模型。

誠如熊彼特在《經濟發(fā)展理論》中的觀點:資本是創(chuàng)新的杠桿。倘若只是企業(yè)和研究院在花大價錢“煉”大模型,缺少資本產生的杠桿作用,大模型的價值和應用場景恐怕很難脫離“學術”二字。

ChatGPT的出圈就像是一把火炬,不但徹底吸引了外界的注意力,也可能為大模型的商業(yè)化照亮方向。

直接的例子就是微軟“反常行為”。先是100億美元投資OpenAI,而后宣布將ChatGPT融入旗下全線產品,比爾?蓋茨和納德拉頻頻為ChatGPT站臺,再到ChatGPT版的必應和Edge瀏覽器,甚至裁撤工業(yè)元宇宙部門為ChatGPT讓路,儼然擺出了一副All in AI的新姿態(tài)。微軟的真實動機還不得而知,映射到外界眼中的卻是:微軟正在開啟AI的商用之戰(zhàn),大模型迎來了商業(yè)化元年。

OpenAI也在不斷釋放好消息:2月1日宣布推出付費訂閱版ChatGPT Plus,每個月向用戶收取20美元的費用;同時OpenAI預計2023年的收入將達到2億美元,2024年收入有望超過10億美元。

其實早在2020年的時候,OpenAI就已經開始為商業(yè)化謀局,GPT-3不再完全開源代碼,但提供了商用API,允許開發(fā)者調用大模型的部分能力,并逐步為Dall·E2、Whisper等大模型開放了API接口??蛻粽{用OpenAI的API,以獲取圖像、語言、代碼生成等能力,進而趕上AIGC的順風車,OpenAI從中收取接口費,初步形成了模型研發(fā)、應用開發(fā)到消費的完整產業(yè)鏈。

故事講到這里,似乎讓人看到了大模型的可觀前景:當國內大大小小的互聯(lián)網企業(yè)爭相推出各種版本的ChatGPT時,勢必會將注意力盯向提供底層能力的大模型,為國內的大模型市場注入一股活水。

再樂觀一些的話,即便ChatGPT的潮水會褪去,只要在不斷地試錯中摸索出大模型的商業(yè)化路徑,資本的注意力終將會聚集到底層技術上,并將注意力轉變?yōu)樵丛床粩嗟耐顿Y,賦予大模型可持續(xù)的驅動力量。

04 寫在最后

現實的殘酷在于,新物種崛起的時候,會習慣性吹起一層層泡沫,特別是在過去幾年中,泡沫被戳破的時間周期越來越短。

2021年初爆火的Clubhouse,故事在一個多季度后就宣告“破產”;2022年初的元宇宙,下半年就被AIGC搶去了風頭;ChatGPT引起的新風口,會是一個例外嗎?就情感上而言,我們希望ChatGPT帶來的是一場熊熊烈火,引燃人工智能的產業(yè)革命。

可惜當前的所有設想,都還建立在理想的假設上,現實中仍存在太多的不確定性,還需要跨越一座又一座山丘。

本文為轉載內容,授權事宜請聯(lián)系原著作權人。

微軟

4.8k
  • 因股票獎勵,微軟CEO納德拉2024財年薪酬增長63%至7900萬美元
  • 歐盟隱私監(jiān)管機構對領英罰款3.1億歐元

百度

5.4k
  • 李彥宏堅稱不做視頻生成模型,中國版Sora到底值不值得做?
  • 百度智能云海東數據標注基地正式啟動

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

ChatGPT會是大模型商業(yè)化的火炬嗎?

2022年初的元宇宙,下半年就被AIGC搶去了風頭;ChatGPT引起的新風口,會是一個例外嗎?

文|Alter

ChatGPT走紅的速度,顯然超過了許多人的預期。

即使是在中文互聯(lián)網上,和ChatGPT有關的報道、討論,早已超過了其他科技概念,甚至萌生出了“ChatGPT概念股”的說法,不少與AI、大模型、NLP相關的中概股,短期內的漲幅“意外”達到了50%以上。

每一次有“科技大事件”上演時,都有人蠢蠢欲動,有人借勢起風,ChatGPT掀起的浪潮似乎也是如此。

可當我們在討論ChatGPT的時候,到底在討論什么?顛覆式創(chuàng)新的技術洗禮,抑或是對人工智能前景的樂觀,還是在潛移默化中被有心人帶了風向。厘清這些問題的答案,遠比討論ChatGPT本身更有價值。

01 一場自上而下的“出圈”

和2016年的AlphaGo一樣,ChatGPT的“火”也呈現出了自上而下的軌跡。

答案就隱藏在一篇篇10W+的爆款文章中。和ChatGPT相關的文章可謂盈千累萬,除了大批科技和財經類自媒體的分析與報道,就連旅游博主們都開始以ChatGPT為主題,而且內容特別貼地氣:

大多是博主與ChatGPT的對話截圖,其中問題本身就相當有話題性,截取的問答同樣吸引眼球,再稍微關聯(lián)下AI取代人的宏大話題,以及可能存在的應用場景,短時間即可炮制出一篇大眾喜聞樂見的文章。

追熱點向來是自媒體們的“天職”,以爆紅的ChatGPT為題也無可厚非,問題恰恰出現在信息的不對稱上。

從2022年11月底上線運營,到2023年1月末的上億月活,ChatGPT用兩個月的時間就刷新了用戶增長的歷史記錄。只是在注冊體驗ChatGPT嘗鮮過程中,對中文互聯(lián)網的用戶相當不友好。

想要打開OpenAI的網址,前提是有“科學上網”的工具,而且ChatGPT并未對中國開放注冊,必須要用海外的手機用來接收驗證碼……可以說人為增加了重重壁壘。在這樣的注冊機制下,和ChatGPT“暢聊”的國內網民注定是“少數派”,大多數網民對ChatGPT的理解,是從別人口中“聽”來的。

正是在這樣的語境下,ChatGPT的“神奇能力”被不斷放大。個中原因離不開人們對對話式機器人的特殊情愫。

無論是誕生于2014年的微軟小冰,以“智能助手”自居的Siri,還是主打語音交互的智能音箱,都曾吸引無數人的好奇心,在特定時間內引發(fā)了現象級的討論。畢竟早在上個世紀初,圖靈就提出“對話”是測試機器是否有人類智慧的有效場景。

沿循類似的邏輯,ChatGPT的“出圈”是注定的結果。背靠千億級大模型GPT-3,ChatGPT的自然語言理解能力遠超早期的微軟小冰和Siri,和用戶對話時不會根據一兩個關鍵詞機械地輸出結果,而是理解用戶的“語義”,輸出的準確性和關聯(lián)性不可同日而語,并在很大程度上刷新了人們的認知。

然而目前的ChatGPT還是大規(guī)模離線語料進行訓練的版本:無法將即時信息納入自己的回答中;經常給出一些看似合理但不正確的答案;對話中涵蓋的因果關系,仍缺乏很好的理解能力;缺少人類舉一反三的能力......并不能像朋友一樣自由對話。

陰謀論一些的話,在ChatGPT走紅的這些日子里,并不缺少一些“炒作”的痕跡。比如讓人摸不著頭腦的“ChatGPT概念股”,至今還沒看到哪家中概股與OpenAI開展合作,所謂的概念股,多半是在蹭文本生成、信息抽取、知識抽取、機器問答等技術的熱度,屬于典型的“借事說事”。

而就當前的態(tài)勢來看,ChatGPT的熱度還將持續(xù)一段時間,但被刻意營造的期待值,就像是鼓吹起來的氣泡,再美麗也有被刺破的一天。與其去討論ChatGPT的短期效應,不如將視角放在對行業(yè)的長期影響上。

02 ChatGPT的偶然與必然

或許ChatGPT的“躥紅”有些偶然因素,可類似產品的出現卻是必然的結果。

可以佐證的是,在ChatGPT熱度空前的局面下,競品們正在加速追趕:谷歌CEO 桑達爾·皮查伊在2月7日凌晨宣布將推出一款名為 Bard 的實驗性對話 AI 服務,并將在幾周內向部分開發(fā)者開放。

幾乎和谷歌同一時間,百度官宣將推出類似ChatGPT的人工智能聊天機器人,項目名字被命名為“文心一言”,英文名“ERNIE Bot”,預計在3月份完成公測,或將直接接入百度搜索向公眾開放。

人工智能初創(chuàng)公司元語智能連忙推出了功能型對話產品 ChatYuan;阿里達摩院牽頭的類ChatGPT對話機器人被曝正處于內測階段;昆侖萬維宣布將與奇點智源合作年內發(fā)布中國版類 ChatGPT 代碼開源……還有更多產品在官宣的路上,不排除會出現畫虎不成反類犬的尷尬場面。

一種流行的解釋是:ChatGPT將取代搜索引擎。其中被引用最多的Gmail創(chuàng)建者之一Paul Buchheit的觀點:“像ChatGPT這種AI聊天機器人將摧毀谷歌,就像當年搜索引擎徹底干掉黃頁電話簿一樣,時間上就是這一兩年?!眱仍诘纳虡I(yè)邏輯在于,一旦搜索引擎確定的信息檢索方式被顛覆,整個互聯(lián)網商業(yè)都將重新洗牌,沒有哪家互聯(lián)網巨頭想要錯過在新格局中占有一席之地的可能。

或許還有另外一種解釋,即ChatGPT的誕生是一種方向性的探索。OpenAI率先驗證了對話AI的可行性,然后谷歌、百度等快速跟進。之所以能夠在短時間內推出類似ChatGPT的產品,原因還要從大模型說起。

時間撥回到2017年,當時還在谷歌任職的Ashish Vaswani等人提出了Transformer架構,讓深度學習的參數達到了上億的規(guī)模;2018年谷歌推出了基于Transformer的雙向深層預訓練模型Bert,參數首次超過了3億規(guī)模;OpenAI同年提出了生成式預訓練Transformer模型GPT,進一步推動了大模型的發(fā)展。

但直到2020年,大模型才真正進入到大眾視野,誘因正是著名的GPT-3,擁有1750億個參數量,是傳統(tǒng)深度學習小模型的一萬倍以上,同時讓外界看到了“大力出奇跡”的一幕:常見小模型需要對不同的任務使用不同模型分別訓練解決,而GPT-3先使用海量數據預訓練大模型,然后將模型參數初始化后再進行訓練,實現了作詩、聊天、答題、翻譯、寫代碼等一系列能力。

一場千億級大模型的軍備競賽由此拉開帷幕。

僅在2021年,國內的華為、智源、浪潮、阿里云、百度等企業(yè)先后發(fā)布了自家的大模型產品,而后不斷從NLP延伸出了雙語、CV、跨模態(tài)等大模型。據OpenBMB開源社區(qū)的統(tǒng)計,目前全球超千億參數的大模型中,中國貢獻了1/3,美國貢獻了1/2,世界其他國家或組織貢獻了剩下的1/6。和歷史上的許多次“軍備競賽”一樣,耗費了大量真金白銀的大模型,最終也需要找到一個商業(yè)化出口。

有趣的地方在于,不管是GPT-3,還是ChatGPT,OpenAI兩次站在了新舊交替的臨界點上,第一次掀起了大模型熱,讓全球科技大廠們冒險一試,這一次能為大模型的商業(yè)化帶來生機嗎?

03 大模型商業(yè)化的“火炬”

大模型的性能表現不可謂不性感,代價則是訓練大模型非常燒錢。

根據公開數據顯示,GPT-3訓練的硬件和電力成本高達1200萬美元;谷歌在訓練包含5400 億參數的 PaLM 時用了6144塊TPU……坊間由此出現了對盲目“煉大模型”的質疑,資本市場因為大模型的應用問題遲遲不肯下注,“多才多藝,身兼多職”的大模型們距離“生存危機”越來越近。

并非是大模型缺少商業(yè)化故事。按照大規(guī)模預訓練的思路,大模型+細分場景微調在某種程度上給出了人工智能在長尾場景落地的最優(yōu)解,而且在小樣本訓練的情況下,大模型也有著比較好的提升。

大模型也不缺少落地的場景。AIGC在2022年就已經走紅,投資機構紅杉在2022年發(fā)布的一篇分析文章中特意提到,生成式AI有潛力產生數萬億美元的經濟價值,進一步增強了相關創(chuàng)業(yè)者的信心。

可在2023年以前,很少看到資本市場對大模型的關注,僅有智譜AI等為數不多的企業(yè)拿到了融資,與之形成鮮明對比的是,AIGC賽道里初創(chuàng)企業(yè)早已是資本寵兒。資本寧愿在應用層的AIGC賽道試錯,也不愿燒錢給大模型。

誠如熊彼特在《經濟發(fā)展理論》中的觀點:資本是創(chuàng)新的杠桿。倘若只是企業(yè)和研究院在花大價錢“煉”大模型,缺少資本產生的杠桿作用,大模型的價值和應用場景恐怕很難脫離“學術”二字。

ChatGPT的出圈就像是一把火炬,不但徹底吸引了外界的注意力,也可能為大模型的商業(yè)化照亮方向。

直接的例子就是微軟“反常行為”。先是100億美元投資OpenAI,而后宣布將ChatGPT融入旗下全線產品,比爾?蓋茨和納德拉頻頻為ChatGPT站臺,再到ChatGPT版的必應和Edge瀏覽器,甚至裁撤工業(yè)元宇宙部門為ChatGPT讓路,儼然擺出了一副All in AI的新姿態(tài)。微軟的真實動機還不得而知,映射到外界眼中的卻是:微軟正在開啟AI的商用之戰(zhàn),大模型迎來了商業(yè)化元年。

OpenAI也在不斷釋放好消息:2月1日宣布推出付費訂閱版ChatGPT Plus,每個月向用戶收取20美元的費用;同時OpenAI預計2023年的收入將達到2億美元,2024年收入有望超過10億美元。

其實早在2020年的時候,OpenAI就已經開始為商業(yè)化謀局,GPT-3不再完全開源代碼,但提供了商用API,允許開發(fā)者調用大模型的部分能力,并逐步為Dall·E2、Whisper等大模型開放了API接口。客戶調用OpenAI的API,以獲取圖像、語言、代碼生成等能力,進而趕上AIGC的順風車,OpenAI從中收取接口費,初步形成了模型研發(fā)、應用開發(fā)到消費的完整產業(yè)鏈。

故事講到這里,似乎讓人看到了大模型的可觀前景:當國內大大小小的互聯(lián)網企業(yè)爭相推出各種版本的ChatGPT時,勢必會將注意力盯向提供底層能力的大模型,為國內的大模型市場注入一股活水。

再樂觀一些的話,即便ChatGPT的潮水會褪去,只要在不斷地試錯中摸索出大模型的商業(yè)化路徑,資本的注意力終將會聚集到底層技術上,并將注意力轉變?yōu)樵丛床粩嗟耐顿Y,賦予大模型可持續(xù)的驅動力量。

04 寫在最后

現實的殘酷在于,新物種崛起的時候,會習慣性吹起一層層泡沫,特別是在過去幾年中,泡沫被戳破的時間周期越來越短。

2021年初爆火的Clubhouse,故事在一個多季度后就宣告“破產”;2022年初的元宇宙,下半年就被AIGC搶去了風頭;ChatGPT引起的新風口,會是一個例外嗎?就情感上而言,我們希望ChatGPT帶來的是一場熊熊烈火,引燃人工智能的產業(yè)革命。

可惜當前的所有設想,都還建立在理想的假設上,現實中仍存在太多的不確定性,還需要跨越一座又一座山丘。

本文為轉載內容,授權事宜請聯(lián)系原著作權人。