APPSTORE,8090超碰人人做人人爽

文|深燃李秋涵

編輯|魏佳

你還在用ChatGPT嗎？

在全球掀起AI熱潮的ChatGPT，似乎進(jìn)入了瓶頸期。

首先是關(guān)于ChatGPT的使用率，有不利的數(shù)據(jù)出現(xiàn)。6月初，摩根士丹利發(fā)布的一項(xiàng)調(diào)查顯示，只有19%的受訪者表示他們之前使用過(guò)ChatGPT，只有4%的人表示依賴ChatGPT。調(diào)查表示，比例低的驚人。

這項(xiàng)調(diào)查在今年4月進(jìn)行，涉及人數(shù)為2000人。不過(guò)，在全球78億人口面前，這樣的樣本量不算大，也一定程度上降低了其參考性。

還有一個(gè)基數(shù)更廣泛的數(shù)據(jù)值得關(guān)注，ChatGPT的增長(zhǎng)已經(jīng)明顯放緩。

根據(jù)網(wǎng)站數(shù)據(jù)分析工具SimilarWeb數(shù)據(jù)，前期ChatGPT的訪問(wèn)量增長(zhǎng)率驚人，1月份的環(huán)比增長(zhǎng)率為131.6%，2月份為62.5%，3月份為55.8%，在4月份明顯放緩，環(huán)比增長(zhǎng)率為12.6%，到了5月，這個(gè)數(shù)字已經(jīng)變?yōu)榱?.8%。

隨著ChatGPT普及，參考基數(shù)變大，增長(zhǎng)率放緩是正?，F(xiàn)象，不過(guò)，根據(jù)目前已有的趨勢(shì)來(lái)看，6月的環(huán)比增長(zhǎng)率也有可能為負(fù)數(shù)。

今年年初，ChatGPT像一聲驚雷，讓全球見(jiàn)識(shí)到了生成式AI的威力，也讓背后的GPT（生成式預(yù)訓(xùn)練Transfomer模型）大火，掀起大模型創(chuàng)業(yè)潮。它刷新了很多數(shù)字，最讓人印象深刻的，是史上用戶增長(zhǎng)速度最快的消費(fèi)級(jí)應(yīng)用，在推出僅兩個(gè)月后，ChatGPT的月活用戶已經(jīng)突破了1億。

但對(duì)它未來(lái)的發(fā)展，即便是創(chuàng)造者也很難給出明確答案。此前OpenAI董事會(huì)成員海倫·托勒就曾表示，“甚至創(chuàng)造它們的人也不知道它們能做什么，不能做什么。我預(yù)計(jì)，我們真正了解GPT-4能做和不能做的所有事情，可能還需要幾年時(shí)間?！?/p>

ChatGPT現(xiàn)在的天花板，不代表就是GPT的天花板，但作為目前最厲害的大語(yǔ)言模型支撐的產(chǎn)品，ChatGPT的走向，也能成為觀察GPT應(yīng)用的一個(gè)窗口。關(guān)于AI的狂想還在繼續(xù)，時(shí)間已經(jīng)過(guò)去了近半年，我們好奇的是，ChatGPT的使用情況到底如何？它被高估了嗎？

01 ChatGPT真的很多人用嗎？

對(duì)于ChatGPT的使用體驗(yàn)，不同行業(yè)、不同人答案不同。有人把它當(dāng)玩具，使用了一兩次后就不再登錄；有人努力把它變?yōu)楣ぞ撸诠ぷ髦幸蕴岣咝?；也有人，在努力將ChatGPT變?yōu)楣ぞ叩倪^(guò)程中失敗了，因?yàn)橛X(jué)得它“不夠好用”。

夏楠屬于第三種。她從事外貿(mào)行業(yè)，會(huì)用ChatGPT寫工作郵件，也會(huì)讓它解答一些生活中的煩惱，為了能更好的使用ChatGPT，她都是用英文發(fā)指令。

從2月開(kāi)始使用ChatGPT，她的體驗(yàn)分為了三個(gè)階段，最開(kāi)始是好奇，很多問(wèn)題都想拋給ChatGPT，看它怎么回答，探索它。從5月開(kāi)始，她感覺(jué)ChatGPT“變笨了”，之前能做到的，現(xiàn)在做不到了。現(xiàn)在，她對(duì)ChatGPT的評(píng)價(jià)是，“不好用”。

比如最近，他們公司接了一個(gè)炒菜機(jī)器人的ODM（原始設(shè)備制造）業(yè)務(wù)，她想讓ChatGPT提供這個(gè)市場(chǎng)的預(yù)測(cè)數(shù)據(jù)，在反復(fù)推拉后，ChatGPT還是沒(méi)有給她答案。而在寫工作郵件上，經(jīng)過(guò)調(diào)教，ChatGPT也只給到她一個(gè)命令式的跟進(jìn)郵件，文字官方式的長(zhǎng)篇大論，也不是她想要的，她希望“它能寫出有禮貌的，信息表達(dá)很明確的郵件”。

她覺(jué)得，ChatGPT之所以做不到，短板在于“不懂得人情世故”。得不到想要的結(jié)果，她的使用頻次也降低了，從一個(gè)星期五六次變?yōu)榱艘恢芤淮巍?/p>

當(dāng)然，之所以會(huì)有這樣的體驗(yàn)，背后綜合影響因素很多，和使用者是否問(wèn)到了ChatGPT擅長(zhǎng)的領(lǐng)域有關(guān)，也要看使用者有沒(méi)有找到與ChatGPT合適的交流方式。

正在澳大利亞生活的Lucy，從去年底ChatGPT一推出后就開(kāi)始用英文使用它。現(xiàn)在，她日常用ChatGPT來(lái)整理學(xué)術(shù)研究上的思路、學(xué)習(xí)語(yǔ)言，是生活里必不可少的工具。只是，準(zhǔn)確性的問(wèn)題一直讓她煩惱，文獻(xiàn)參考需要自己找，“如果我質(zhì)疑它的回答，它就會(huì)順著我的思路回答”。

除了ChatGPT的使用體驗(yàn)感受不一，從數(shù)據(jù)來(lái)看，ChatGPT的普及率，暫時(shí)也還沒(méi)有想象中的廣。

摩根士丹利相關(guān)報(bào)告截圖

除了摩根士丹利的報(bào)告，還有一些數(shù)據(jù)可以作為佐證。根據(jù)SimilarWeb數(shù)據(jù)，3月-5月，美國(guó)、日本是全球?yàn)镃hatGPT貢獻(xiàn)流量份額最高的國(guó)家，分別位列第一、第三。不過(guò)，最近，美國(guó)的流量已經(jīng)下滑了10.28%。

ChatGPT的全球流量分布來(lái)源 / SimilarWeb數(shù)據(jù)

美國(guó)方面，在5月底，皮尤研究中心發(fā)布了一份調(diào)查，他們?cè)诮衲?月中旬在1萬(wàn)多名美國(guó)成年人當(dāng)中展開(kāi)調(diào)查，18%的人聽(tīng)說(shuō)過(guò)很多關(guān)于ChatGPT的事情，39%的人聽(tīng)說(shuō)過(guò)一點(diǎn)，42%的人根本沒(méi)有聽(tīng)說(shuō)過(guò)。

而在日本，根據(jù)日本ICT市場(chǎng)調(diào)查咨詢機(jī)構(gòu)MM總研的最新調(diào)查報(bào)告，5月24日-31日期間，以日本及美國(guó)企業(yè)所屬的13814名員工（其中，日本13412人、美國(guó)402人）為對(duì)象，進(jìn)行的網(wǎng)絡(luò)調(diào)查結(jié)果是，日本企業(yè)的ChatGPT使用率僅7%，與美國(guó)企業(yè)的51%使用率相比，兩者相差高達(dá)44個(gè)百分點(diǎn)。

日本企業(yè)中，近半數(shù)員工（46%）回答“不知道”ChatGPT，而即便知道ChatGPT，但回答“未使用”的比重也達(dá)42%。

這些都是最近的報(bào)告，樣本量在1萬(wàn)人左右。不過(guò)ChatGPT大熱后，全球關(guān)于它的使用報(bào)告眾多，觀點(diǎn)不一，甚至有的得出的是相反結(jié)論。上述報(bào)告有一定參考性，但也因地域和人群的差別，不一定能完全反應(yīng)真實(shí)情況。

還有更明確的值得參考的整體性數(shù)據(jù)，可以幫助我們認(rèn)識(shí)ChatGPT的應(yīng)用現(xiàn)狀。

根據(jù)SimilarWeb，ChatGPT增長(zhǎng)明顯放緩，尤其到6月，截至6月20日，6月已經(jīng)過(guò)去三分之二，訪問(wèn)量比5月少了38%左右，粗略推算，到6月31日如果沒(méi)有特別新的刺激，6月的環(huán)比流量或?qū)⑾陆怠?/p>

ChatGPT近期流量變化來(lái)源 / SimilarWeb數(shù)據(jù)

同時(shí)，還可以參考的是，根據(jù)SimilarWeb，在5月，ChatGPT的跳出率是12.59%，低于谷歌、Youtube等，而在6月24日，跳出率已經(jīng)上升到37.37%。平均訪問(wèn)持續(xù)時(shí)間也從8分32秒，下降到7分48秒。

另一個(gè)數(shù)據(jù)是，接入GPT大模型后Bing的市場(chǎng)份額變化。

來(lái)源 / Statcounter

Bing的市場(chǎng)占有率，在二三月份剛引入GPT時(shí)引發(fā)關(guān)注，根據(jù)網(wǎng)站通訊流量監(jiān)測(cè)機(jī)構(gòu)Statcounter，2023年3月Bing的市場(chǎng)份額是2.86%，5月是2.77%，不僅占比沒(méi)有提高，甚至還有下降趨勢(shì)。

02 是什么限制了ChatGPT？

關(guān)于ChatGPT應(yīng)用上的問(wèn)題，已經(jīng)老生常談，不過(guò)這些問(wèn)題對(duì)它應(yīng)用普及上的影響，或許比想象中廣。

首先是“變笨”這件事。

6月初，“ChatGPT變笨了”的聲音引發(fā)過(guò)討論。不過(guò)OpenAI開(kāi)發(fā)者推廣大使Logan Kilpatrick曾出面回應(yīng)，表示自3月14日發(fā)布GPT-4以來(lái)，大模型的本體一直處于靜態(tài)，不存在大量外部數(shù)據(jù)污染模型的情況。同時(shí)他也承認(rèn)，大模型本身存在不穩(wěn)定性，因此對(duì)相通的提示詞，存在回答前后不一致的情況。

一位AI從業(yè)者告訴深燃，5月就有國(guó)外從業(yè)者在OpenAI論壇里分享論證GPT變笨的文章。最近，他用GPT-4的API做了測(cè)試，讓它做簡(jiǎn)單的計(jì)算題。從結(jié)果準(zhǔn)確度來(lái)看，GPT-4-0314取得了滿分，GPT-4取得了80分，GPT-4-0613，勉強(qiáng)可以拿50分。其中，0314、0613即指3月14號(hào)、6月13號(hào)的快照（指整個(gè)系統(tǒng)在某個(gè)時(shí)間點(diǎn)上的狀態(tài)）。這個(gè)結(jié)果，給他一種GPT-4在被削弱的感受。

根據(jù)監(jiān)管機(jī)構(gòu)NewsGuard的專家分析，OpenAI最新版本的GPT-4，在輸出信息方面，比GPT-3.5要糟糕。在今年3月份發(fā)布的報(bào)告中，NewsGuard提到，GPT-4不僅在其研究人員的提示下回答了完全虛假的新聞敘述，而且比GPT-3.5回答的內(nèi)容更差。

在上述AI行業(yè)從業(yè)者看來(lái)，這樣變化的結(jié)果是，用戶需要變得更為具體和主動(dòng)地引導(dǎo)GPT-4，才能獲得與過(guò)去相當(dāng)?shù)幕卮鹳|(zhì)量。

這也再度影響ChatGPT的使用門檻，而這與ChatGPT的初衷有所背離。

最開(kāi)始ChatGPT爆火，就有業(yè)內(nèi)人士對(duì)深燃分析，它帶來(lái)的影響是將通用人工智能放在了每個(gè)用戶面前，也把人機(jī)交互的門檻，打到了最低點(diǎn)。

但目前來(lái)看，門檻還是存在。從ChatGPT的用戶畫像，也能看出這個(gè)產(chǎn)品的普及情況。根據(jù)SimilarWeb數(shù)據(jù)，使用者主要分布在計(jì)算機(jī)電子與技術(shù)行業(yè)，其中，編程和軟件開(kāi)發(fā)占比最大。其他行業(yè)里，只有游戲行業(yè)中的視頻游戲機(jī)和配件的從業(yè)者占比較多。

在使用ChatGPT的體驗(yàn)上，一位工程師給深燃的反饋?zhàn)顬榉e極，表示一直在用，“能幫我解決小的程序上的問(wèn)題”。

盡管都說(shuō)，“淘汰你的不是AI，是會(huì)用AI的人”，如果普通人使用起來(lái)門檻越來(lái)越高，那也一定程度上脫離了ChatGPT的初衷。

還有兩個(gè)問(wèn)題，是ChatGPT從最開(kāi)始就面臨的質(zhì)疑，即準(zhǔn)確率和隱私保護(hù)。

根據(jù)上述日本相關(guān)機(jī)構(gòu)的報(bào)告，在被問(wèn)到今后若要繼續(xù)/擴(kuò)大使用ChatGPT，需要解決什么問(wèn)題時(shí)，日本企業(yè)、美國(guó)企業(yè)分別有高達(dá)49%、45%的回答是“案件的精度”，其次為“個(gè)人資料等隱私(日企34%、美企35%)”，和“對(duì)問(wèn)題的理解程度(日企33%、美企34%)”。

準(zhǔn)確度方面，OpenAI的CEO山姆·奧特曼，也做出過(guò)解釋，這個(gè)程序會(huì)自信地宣稱一些東西是事實(shí)，但其實(shí)它是編造出來(lái)的，就像謊話連篇的政客一樣。他給這種現(xiàn)象起了個(gè)名字——“幻覺(jué)難題”。

總之，準(zhǔn)確率要實(shí)現(xiàn)起來(lái)非常不容易。原因就是因?yàn)樗皇强坑洃?，而是憑借演繹推理能力來(lái)工作?！按笳Z(yǔ)言模型靠的是推理的拼字游戲，不可能像數(shù)據(jù)庫(kù)一樣完全準(zhǔn)確，人也不能完全保證準(zhǔn)確”，關(guān)注AI行業(yè)的工程師楊陽(yáng)告訴深燃。

隱私方面，OpenAI至今還沒(méi)有給出明確的解決方案。在加拿大工作的小虹就告訴深燃，公司特地發(fā)郵件通知，讓大家謹(jǐn)慎使用ChatGPT。

基于這些限制，ChatGPT的應(yīng)用場(chǎng)景也受限制。

關(guān)注產(chǎn)業(yè)的投資人陳默默告訴深燃，它其實(shí)適合“生產(chǎn)力驅(qū)動(dòng)”的內(nèi)容生產(chǎn)，而不是“創(chuàng)意驅(qū)動(dòng)”的內(nèi)容生產(chǎn)，在前者上，能替代不少有重復(fù)經(jīng)驗(yàn)累積的人力。

用戶洛洛從4月開(kāi)始使用ChatGPT，她開(kāi)了會(huì)員，主要用于寫腳本和文案，“只要能給它正確的公式，基本可以反饋給我任意思維的腳本，只是拿到手要改”。她表示，產(chǎn)出的腳本比較基礎(chǔ)，沒(méi)法做成爆款，但它邏輯沒(méi)有問(wèn)題，“像公司日常的一些大量的視頻輸出，是可以支持的”，她現(xiàn)在的ChatGPT使用頻率，基本上一周3次以上。

現(xiàn)在夏楠調(diào)整了策略，只問(wèn)它一些流程式的問(wèn)題，比如開(kāi)ebay網(wǎng)店的流程。盡管這類問(wèn)題也可以問(wèn)谷歌、百度，但“ChatGPT的回答更好”，她舉例，最近她去德國(guó)旅行，讓ChatGPT給她安排旅游計(jì)劃，給出的答案有參考性，交通安排的也很清楚。

這些長(zhǎng)期使用ChatGPT的用戶，不論對(duì)ChatGPT的使用體驗(yàn)滿意與否，他們都提到，ChatGPT更像是一個(gè)升級(jí)了的谷歌、百度，帶來(lái)了一定助力。

03 ChatGPT，象征意義高過(guò)實(shí)質(zhì)意義？

最近，OpenAI推出了類似于LLM版的App Store，加速生態(tài)的建設(shè)，還被曝光了一些功能上的優(yōu)化。這背后也隱藏著一個(gè)信號(hào)，GPT4暫時(shí)已經(jīng)到天花板，要加速生態(tài)建設(shè)，在GPT5出不來(lái)之前，先做一些體驗(yàn)上的優(yōu)化。

早在4月，山姆·奧特曼就表示，還沒(méi)有開(kāi)始研究GPT-5，也沒(méi)有立即開(kāi)始的打算，還曾表示，“大型模型時(shí)代已經(jīng)到頭了。”

據(jù)OpenAI官網(wǎng)，GPT模型參數(shù)數(shù)量（可以理解為喂養(yǎng)模型的語(yǔ)言材料）在不斷提升。GPT-1是1.17億，GPT-2有15億，到了GPT-3，飆升至1750億，GPT-4，根據(jù)國(guó)外媒體機(jī)構(gòu)Semafor的一份報(bào)告，比GPT-3大六倍左右，具有1萬(wàn)億個(gè)參數(shù)。

此前楊陽(yáng)也對(duì)深燃表示，或許GPT-4就成長(zhǎng)到頭了，語(yǔ)料是一個(gè)原因，“人類歷史上創(chuàng)造出的優(yōu)秀資源就這些了”，模型本身的限制也是一個(gè)原因。在他看來(lái)，現(xiàn)在GPT-4被限制了，應(yīng)該有能力沒(méi)有被完全開(kāi)發(fā)出來(lái)。

近日，F(xiàn)acebook母公司Meta首席人工智能科學(xué)家Yann LeCun就指出，ChatGPT背后的生成式人工智能技術(shù)已進(jìn)入了死胡同，擁有太多的局限性。

出于巨頭間的競(jìng)爭(zhēng)關(guān)系，或許很難將這話作為客觀參考。但可以肯定的是，ChatGPT的確遇到了瓶頸。

要讓大語(yǔ)言模型有更好的應(yīng)用，不少人把視線投向垂直領(lǐng)域的應(yīng)用上。

AI行業(yè)從業(yè)者秦凱對(duì)深燃做了一個(gè)比喻，ChatGPT這類泛化型的人工智能，應(yīng)用寬泛時(shí)，能力就像是高中生、大學(xué)生，和垂直場(chǎng)景結(jié)合時(shí)，fine-tuning（在自然語(yǔ)言處理中使用的技術(shù)，也叫微調(diào)）的數(shù)據(jù)足夠精確和貼合場(chǎng)景，能力就能變?yōu)榇T士、博士，能解決更具體的需求。

楊陽(yáng)也認(rèn)同這一看法。他提到，目前的模型最多只能進(jìn)行一倍左右的優(yōu)化，“大家有一個(gè)基礎(chǔ)共識(shí)，GPT-5來(lái)了，也不會(huì)帶來(lái)顛覆性的進(jìn)化”，短期內(nèi)不可能達(dá)到AGI（通用人工智能）水平。

不過(guò)，他表示，現(xiàn)在做具體垂類應(yīng)用，首先是費(fèi)用高，訓(xùn)練模型對(duì)公司來(lái)說(shuō)依舊是不小的成本；其次是數(shù)據(jù)安全、數(shù)據(jù)隔離的問(wèn)題，目前采用的辦法是，“在大模型基礎(chǔ)上套小模型”，但帶來(lái)的問(wèn)題是，現(xiàn)在的底層技術(shù)還在變化，“沒(méi)有人知道下一個(gè)模型，更優(yōu)秀的模型什么時(shí)候出現(xiàn)”，這個(gè)中間階段讓大家很迷茫，“如果三五年后才出現(xiàn)，那現(xiàn)在基于大模型做垂類的產(chǎn)品是不虧的，場(chǎng)景落地后有機(jī)會(huì)回收資金。但如果很快就出現(xiàn)了，那大家現(xiàn)在做的外掛型垂類產(chǎn)品，是沒(méi)有多少意義的。”

投資人陳默默表示，這是一個(gè)“先有雞還是先有蛋”的問(wèn)題，他們還是愿意去看相關(guān)項(xiàng)目，在細(xì)分領(lǐng)域里切一個(gè)特定場(chǎng)景的應(yīng)用，因?yàn)椤澳呐挛磥?lái)的底層有變化，只要行業(yè)沒(méi)有變動(dòng)，在應(yīng)用層的行業(yè)理解上還是會(huì)有沉淀”。

但他們?cè)诳错?xiàng)目時(shí)遇到的問(wèn)題是，很難有人可以明確告訴他們，產(chǎn)品能節(jié)省多少人力成本。“看下來(lái)，還是得給機(jī)器配個(gè)人”，她舉例，關(guān)注賦能研發(fā)端論文篩選歸納相關(guān)的垂類產(chǎn)品，實(shí)際使用也還是需要一個(gè)人順著機(jī)器的結(jié)果，再做進(jìn)一步驗(yàn)真、開(kāi)發(fā)和研究，實(shí)際上很難說(shuō)效率有特別好的優(yōu)化”，所以現(xiàn)在，一些投資人都會(huì)傾向于再觀望觀望。

在關(guān)注垂類領(lǐng)域的AI創(chuàng)業(yè)公司的產(chǎn)品時(shí)，她的感受是，“我們對(duì)技術(shù)帶來(lái)的產(chǎn)業(yè)升級(jí)機(jī)會(huì)保持謹(jǐn)慎樂(lè)觀，目前可能它的市場(chǎng)意義，高過(guò)實(shí)質(zhì)意義”。

秦凱總結(jié)，人們對(duì)ChatGPT的期望過(guò)高，但有兩個(gè)瓶頸。首先，下一代大語(yǔ)言模型通過(guò)更大的參數(shù)規(guī)模和更強(qiáng)算力的收益邊際遞減，人們的期望可能無(wú)法很快滿足。其次，當(dāng)前的大語(yǔ)言模型是泛化的，需要很長(zhǎng)時(shí)間來(lái)解決特定、真實(shí)的問(wèn)題。目前垂直領(lǐng)域的生成式AI，已經(jīng)變成了針對(duì)具體企業(yè)做定制化需求和私有部署的體力活，“底層模型依靠transformer方式缺乏解決非常復(fù)雜問(wèn)題的能力，現(xiàn)在的應(yīng)用情況與預(yù)期的水平相距甚遠(yuǎn)”。

應(yīng)用還在繼續(xù)，技術(shù)還在發(fā)展，關(guān)于ChatGPT的應(yīng)用及潛力還需要再觀望。即便是這樣，ChatGPT已經(jīng)讓一些人的生產(chǎn)效率，有了一個(gè)數(shù)量級(jí)的提高，即便當(dāng)下有瓶頸，“ChatGPT已經(jīng)是很偉大的產(chǎn)品，這就夠了。”楊陽(yáng)表示。

應(yīng)受訪者要求，文中夏楠、Lucy、楊陽(yáng)、小虹、洛洛為化名。

文|深燃李秋涵

編輯|魏佳

你還在用ChatGPT嗎？

在全球掀起AI熱潮的ChatGPT，似乎進(jìn)入了瓶頸期。

還有一個(gè)基數(shù)更廣泛的數(shù)據(jù)值得關(guān)注，ChatGPT的增長(zhǎng)已經(jīng)明顯放緩。