文|硅兔賽跑 Amelie 蔓蔓周
AI發(fā)展的道路上,需要不畏勞苦勇于攀登的人。
11月6日上午,在舊金山剛剛舉辦完的開發(fā)者大會上,來自全球各地的數(shù)百名開發(fā)人員和OpenAI團隊參與其中,預覽新工具并交流想法。AI人工智能市場將采取更加開放的方式,歡迎更多有志之士加入其中。線上直播短短不到一小時發(fā)布了許多重磅消息,就如同OpenAI的進化速度,越來越快了。
硅兔君從前線發(fā)回報道,火速整理了線上和線下的發(fā)布會精華,一次快速看完整場發(fā)布會亮點。
本次開發(fā)者大會意在鼓勵企業(yè)使用OpenAI的技術來構(gòu)建基于人工智能的聊天機器人和自主智能體,這些自主智能體可以在沒有人類干預的情況下執(zhí)行任務,OpenAI團隊也希望能吸引更多開發(fā)者付費訪問OpenAI模型,并以其模型構(gòu)建新的AI生態(tài)系統(tǒng)。
大會之前,Sam Altman在X平臺上說:“會發(fā)布一些非常棒的新東西?!?以下是小編的整理——
01、GPT4 Turbo發(fā)布,更強版本GPT4
Turbo版的GPT4數(shù)據(jù)已經(jīng)趕上現(xiàn)在時代了,因為它是利用截至今年4月的網(wǎng)上數(shù)據(jù)構(gòu)建。
因此,相比只能訪問截至2021年9月數(shù)據(jù)的原版GPT-4,Turbo版更與時俱進了,它不僅已經(jīng)知道了全球剛經(jīng)歷過的幾年疫情或者經(jīng)濟動蕩,也了解截至今年4月的絕大部分世界事件。
不僅如此GPT4 Turbo版還提供128k的上下文窗口,也就是說,它可以一次容納相當于300多頁文本內(nèi)容的提示詞(很難想象一下子有這么多提示詞還能做到不崩潰)。
價格更優(yōu)惠
相比原版GPT-4,Turbo版的收費做了大幅下降,其輸入token的收費價0.01美元,便宜三倍,輸出token的價格為0.03美元,便宜兩倍。
Turbo版可供所有付費開發(fā)人員通過API 中的gpt-4-1106-preview進行嘗試,OpenAI計劃未來幾周內(nèi)發(fā)布穩(wěn)定的生產(chǎn)就緒模型。
GPT-3.5同步更新
OpenAI同時更新了GPT-3.5,推出Turbo版的默認支持16k上下文窗口GPT-3.5,新版支持改進的指令跟蹤、JSON模式和并行函數(shù)調(diào)用。新版的輸入token和輸出token收費也分別比原版便宜三倍和兩倍,價格分別為0.001 美元和0.002美元。
更像一個APP
從大會上發(fā)布的內(nèi)容來看,新GPT 4 Turbo看起來更像是一個ChatGPT iOS APP。
較之從前版本,新版本的交互界面采用了簡約的黑白色搭配,用戶個人頁面可以添加頭像、名稱、簡介等個人信息,也可以自定義起始界面,更加側(cè)重用戶的個性化需求。
在功能上,新版本的GPT可以瀏覽網(wǎng)頁、分析數(shù)據(jù)和生成圖像,還能更快地訪問 DALL-E、 Data Analyst 和自定義GPT的高級模式。
02、GPT Store將上線
“本月晚些時候,我們將推出 GPT 商店,其中包含經(jīng)過驗證的構(gòu)建者的作品。一旦進入商店,GPT 就可以被搜索到,并且可能會登上排行榜。我們還將重點關注我們在生產(chǎn)力、教育和‘只是為了好玩’等類別中遇到的最有用和最令人愉快的 GPT。在接下來的幾個月中,您還可以根據(jù)使用您的 GPT 的人數(shù)來賺錢?!?/p>
在這部分里,Altman介紹說定制版GPT可以為用戶在日常生活、特定任務、工作或家庭中提供幫助,比如幫助學習任何棋盤游戲的規(guī)則、幫助教孩子數(shù)學、訓練寫作或是設計貼紙,還可以與他人分享這種自定義的GPT。
用戶無需編寫代碼就可以創(chuàng)建自己的GPT,就像開始對話一樣簡單,只需要給GPT指令和新的知識,然后選擇它能做什么即可,比如搜索網(wǎng)絡、制作圖像或分析數(shù)據(jù)。用戶可以設計它私用,也可以專門給公司內(nèi)部使用,或者制作大眾通用的GPT。
OpenAI現(xiàn)在提供示例GPT給ChatGPT Plus 和企業(yè)版ChatGPT的用戶試用,包括AI圖像生成App Canva 和AI自動化集成功能Zapier AI Actions。OpenAI計劃很快向更多用戶提供GPT。
對于企業(yè)版的GPT用戶,本周三開始,就可以為特定客戶、部門或?qū)S袛?shù)據(jù)集創(chuàng)建自己的ChatGPT。
企業(yè)可以授權(quán)公司內(nèi)部的用戶無需代碼即可設計僅供內(nèi)部使用的GPT,并將其安全地發(fā)布到自己的工作區(qū),在管理控制臺可以選擇如何共享這些GPT,以及是否允許企業(yè)內(nèi)部使用外部GPT。
當App Store 模式已經(jīng)被證明可視為蘋果利潤豐厚的資金池之后,OpenAI 開始效仿并試圖復制它也就不足為奇了。以后各種GPT模式不僅會在OpenAI平臺上托管和開發(fā),而且還將得到推廣和評估。
“我們會將我們收入的一部分來支付那些制作最常用、最有用的 GPT 的人,我們相信,如果你為人們提供工具,他們就會做出驚人的事情。”
這里的包容和開放顯然更符合AI人工智能的多元化發(fā)展。承認“成為他人創(chuàng)造力的首選平臺至少與擁有自己的創(chuàng)造力一樣有價值”,也是做出偉大公司的胸懷氣度。
03、New GPT Draft
不會編程可以制作GPT模型嗎?
OpenAI說,沒問題,你完全可以。
現(xiàn)在只需與ChatGPT聊聊天,并描述您想要的內(nèi)容,就可以制作出你想要的GPT模型。
“實際上,你可以通過與語言交談來對 GPT 進行編程,這個很容易定制的行為,讓他們做你想做的事——這讓他們變得非常容易接近,并為每個人提供代理權(quán)。” Altman說。
他在臺上做了個演示,如果你想做一家制作一款機器人的創(chuàng)業(yè)公司,讓GPT給予一套簡潔且有建設性并可以馬上執(zhí)行的方案。很快,GPT就依照這些指示給出了詳細的建議。如果你想用GPT改良你的菜譜,它會很快告訴你制作一道湯需要什么成分。
04、全面的API助手
應用程序接口,縮寫為API,是一種計算接口,它定義多個軟件中介之間的交互,以及可以進行的調(diào)用或請求的種類,如何進行調(diào)用或發(fā)出請求,應使用的數(shù)據(jù)格式,應遵循的慣例等。
據(jù)OpenAI公司官網(wǎng),目前通過GPT-4、GPT-3.5Turbo上傳750詞的文檔分別需要0.06、0.003美元(以最高速度計算)。這次大會上發(fā)布的“有記憶功能”的內(nèi)存存儲AP,可以提高大模型計算速度,降低開發(fā)者的API調(diào)用成本達95%。
OpenAI還發(fā)布了有專門目的Assistants API,讓開發(fā)人員可以更輕松地構(gòu)建自己的輔助AI應用,這些應用可以調(diào)用模型和工具實現(xiàn)自己的目標。
Assistants API 提供了代碼解釋器、檢索以及函數(shù)調(diào)用等新功能,可以處理以前開發(fā)者必須自己完成的大量繁重工作,從而讓開發(fā)者能構(gòu)建高質(zhì)量的AI應用。
OpenAI介紹,這種API是為了靈活性設計,用例范圍包括基于自然語言的數(shù)據(jù)分析應用、編碼助手、AI驅(qū)動的假期規(guī)劃器、語音控制的 DJ、智能視覺畫布。支持Assistants API的功能和新GPT產(chǎn)品的相同,都有自定義指令和一些工具,例如代碼解釋器、檢索和函數(shù)調(diào)用。
圖源:Medium
OpenAI 表示,與平臺的其他部分一樣,傳給 OpenAI API 的數(shù)據(jù)和文件絕不會用于訓練他們的模型,開發(fā)人員可以在他們認為合適的時候刪除數(shù)據(jù)。開發(fā)者可以前往 Assistants playground 試用 Assistants API 測試版,無需編寫任何代碼:https://platform.openai.com/playground?mode=assistant
從今天起,所有開發(fā)者都可以使用 Assistants API 測試版。定價參見:https://openai.com/pricing
05、多模態(tài)交互
新版本增加了新的多模態(tài)功能,包括視覺、圖像創(chuàng)建 (DALL·E 3) 和文本轉(zhuǎn)語音 (TTS)。Turbo版GPT-4 可以接受圖像作為Chat Completions API中的輸入,從而實現(xiàn)生成標題、詳細分析現(xiàn)實世界圖像、以及閱讀帶有圖形的文檔等用例。
OpenAI計劃為主要的Turbo版GPT-4模型提供視覺支持。視覺輸入的定價取決于輸入圖像的大小。例如,將1080×1080像素的圖像發(fā)送給Turbo版收費0.00765美元。圖像創(chuàng)建方面,OpenAI提供不同的格式和質(zhì)量選項,每生成一張圖像起售價為0.04美元。
針對付費用戶開放的新版本GPT,主要功能更新包括:
支持多格式文件上傳
舊版本中,用戶需要使用“Advanced Data Analysis”等功能完成PDF文檔上傳和信息提??;新版本中,用戶可以直接上傳PDF、數(shù)據(jù)文件等多種格式文件,未來或?qū)⒅С指辔募愋停?/p>
一站式工具整合
GPT-4的不同模式各具優(yōu)勢和功能短板,其中多模態(tài)模式可以同時處理文本、圖像、聲音等多種類型數(shù)據(jù),但僅支持圖片上傳;數(shù)據(jù)分析模式具備較強的數(shù)據(jù)處理和分析能力,但不能實時聯(lián)網(wǎng);實時聯(lián)網(wǎng)模式和DALL-E則不支持文件上傳。舊版本中,用戶需要自主進行模式選擇;新版本中,GPT-4將根據(jù)用戶需求,自動選擇和編排多個工具完成任務,向AI智能體角色迭代。
目前來看,OpenAI借由硬件布局從定義模型層到產(chǎn)品應用層的潛在路徑已經(jīng)打開,OpenAI團隊與蘋果前首席設計師喬納森一起研發(fā)的AI硬件,很可能就是一款支持GPT4甚至5的智能眼鏡,但對終端芯片的要求更高了。
圖源:知乎
眾所周知,OpenAI已然成為全球頂尖AI頭部企業(yè),旗下的GPT系列活躍用戶覆蓋面占了全世界人口總數(shù)的20%近乎15億用戶,且用戶增速一直在持續(xù)中。
現(xiàn)有ChatGPT在接近人類水平的語言理解能力之上,已經(jīng)準備好迭代更新到更人性化的水平,預計新的GPT應用將成為近十年來人工智能領域最成功的產(chǎn)品。
基于最新產(chǎn)品GPT-4的卓越表現(xiàn),OpenAI公司估值水漲船高,相較年初已經(jīng)翻了三倍,目前估值超過900億美元,成為僅次于SpaceX 和字節(jié)跳動的全球估值TOP3的創(chuàng)業(yè)公司。
從最初作為一個與Google抗衡的非營利性人工智能研究機構(gòu),搖身變成估值TOP3的巨型商業(yè)公司,OpenAI同樣不可避免地要應對商業(yè)競爭和自身盈利的要求。Analytics India Magazine的一份報告中稱,OpenAI僅運行其人工智能服務ChatGPT每天就要花費約70萬美元,從獨角獸變成超級“吞金獸”,OpenAI商業(yè)化發(fā)展成了首要目標。
技術解放生產(chǎn)力,技術模型越牛,越有兌換商業(yè)價值的籌碼。
OpenAI開發(fā)者大會的出現(xiàn),不僅是它目前發(fā)展階段的必然,長期來看,也是有望推動大模型逐漸迭代為AI智能體、并構(gòu)建以ChatGPT大模型為基礎的新生態(tài)體系的載體。
線上開發(fā)者大會只持續(xù)了短短45分鐘,但內(nèi)容足以在AI行業(yè)“平地一聲雷”。我們也可以看到,OpenAI的目標顯然很高,將自己打造成一個獨立于現(xiàn)有應用商店和分發(fā)方式的平臺的決定并非一蹴而就,商業(yè)化的下一步就是直接面對蘋果等行業(yè)巨頭甚至其長期贊助人微軟的挑戰(zhàn)。
微軟CEO薩蒂亞·納德拉 (Satya Nadella) 短暫出現(xiàn)在了這次的大會舞臺上,微軟即將推出自己的 Copilot 模型,專門用于Office工具等任務,聽起來GPT可能會直接應用到這些企業(yè)級模型中。
OpenAI在未來依舊是微軟的戰(zhàn)友,還是有可能的競爭對手都未可知。但對于時代而言,我們需要更多這種富有冒險精神的企業(yè)存在。
參考鏈接:
App Store for AI: OpenAI’s GPT Store lets you build (and monetize) your own GPT. (TechCrunch)
All the news from OpenAI’s first developer conference. (The Verge)
#OpenAI DevDay, Opening Keynote. ( Youtube)