界面新聞記者 | 伍洋宇
界面新聞編輯 | 宋佳楠
OpenAI還是那個最會玩營銷的AI公司,早早預告了自己的“12 Days of Christmas”,這將是其年底最重要的一系列發(fā)布會。
12月6日凌晨,OpenAI年末狂歡“Day 1”開啟,在山姆·奧特曼的總結(jié)下,兩項更新最為重磅:o1模型“滿血版”,以及價值200美元/月的ChatGPT Pro訂閱計劃。
相較于三個月前發(fā)布的o1-preview,o1的智能水平、處理速度、多模態(tài)能力均有明顯變化。
通過模型解決數(shù)學競賽題、編程競賽題的結(jié)果呈現(xiàn),o1對比o1-preview的智能水平普遍上升40%-50%,不過在博士級別科學問題的處理上,o1表現(xiàn)反倒稍遜o1-preview。
山姆·奧特曼提到,o1在處理復雜問題時的重大錯誤率降低了34%,并且不再是所有難度的問題都會花費較長時間,新版o1會根據(jù)問題的難易程度調(diào)整處理時間,簡單問題往往僅需幾秒,而非幾分鐘,這個調(diào)整可讓用戶等待時間普遍下調(diào)50%,也解決了o1模式此前最受詬病的問題之一。
更重要的是,新版o1加入了多模態(tài)識別能力。OpenAI對此的展現(xiàn)方式格外“硬核”,o1負責人直接手繪了一張供太空數(shù)據(jù)中心使用的“太空中太陽能收集流程圖”。由于太空中無法水冷,員工要求o1計算,如果需要供給1GW的電,多大面積散熱片才能維持GPU正常運轉(zhuǎn)。
10秒之后,o1堆積了滿屏的精密計算,最終給出了正確的結(jié)果:242萬平方米。
根據(jù)OpenAI的安排,即日起,o1面向ChatGPT Plus和團隊用戶開放,企業(yè)和教育用戶則需要等到下周。
相比智能水平明顯升級的o1,200美元/月的ChatGPT Pro更值得關(guān)注。盡管此前已有傳聞,但外界一直驚訝于OpenAI竟然會將一個訂閱制收費提升到這么高,這是此前基礎訂閱版本20美元費用的10倍。
實際上,OpenAI對ChatGPT Pro并不敷衍,在這套服務系統(tǒng)中,它提供了目前最強的o1 pro mode。
在國際數(shù)學奧林匹克預選賽題目(AIME 2024)中,o1 pro正確率達到86,高于o1版本的78。在編程問題上,兩者能力以90對89旗鼓相當。不過在處理博士級科學問題上,o1 pro實現(xiàn)了約3%的優(yōu)勢。
為了證明這些個位數(shù)性能提升是否值得200美元,OpenAI還通過極其嚴苛的連續(xù)測試來展示o1 pro mode的穩(wěn)定性與可靠性。顯然,這些能力并不是針對普通需求用戶打造,而是那些對模型使用體驗有同樣嚴格要求的高階用戶。
值得一提的是,在ChatGPT Pro模式下,用戶可以無限制使用各種高階模型,包括高級語音模式。
這僅僅是OpenAI連續(xù)12天狂歡的第一天,還有超過90%的內(nèi)容等待解鎖。不過從各種傳聞來看,剩余內(nèi)容中相對重磅的可能是成為“期貨”已久的Sora。在視頻模型上,OpenAI終于需要對行業(yè)做個更具體的交代了。