文|三易生活
AGI(通用人工智能)將在5年內實現,這是OpenAI CEO奧特曼、特斯拉創(chuàng)始人馬斯克、英偉達創(chuàng)始人黃仁勛等一眾大咖對于未來的預測。從ChatGPT到GTP-4、再到Claude 3,如今AI的性能越來越強則已經是無需置疑的事情。
最近,大洋兩岸幾乎在同一時間上線了一款AI Agent。谷歌旗下的DeepMind宣布推出首個能在廣泛3D虛擬環(huán)境和視頻游戲中,遵循自然語言指令的通用AI智能體SIMA,而北京智源人工智能研究院、新加坡南洋理工大學、北京大學則攜手提出通用計算機控制智能體框架Cradle。
如何表現SIMA和Cradle是AI智能體、而非AI大模型呢?兩者的操作堪稱是英雄所見略同,雙方不約而同選擇了游戲作為展示AI智能體能力的場景。比如,SIMA可以在《無人深空》中代替玩家駕駛宇宙飛船、并收集資源,以及在《模擬山羊3》中當司機。Cradle則直接部署在《荒野大鏢客2》上,其完成了長達40分鐘時的主線劇情,還能在開放世界里自由探索,包括與NPC對話、使用道具,以及在商店中購物。
顯而易見,SIMA和Cradle與目前市面上一眾大語言模型有著本質的區(qū)別,它們能自主感知、規(guī)劃決策、執(zhí)行復雜任務,還可以通過獨立思考和調用工具逐步完成給定的目標,而無需人類去指定每一步的操作。從某種意義上來說,SIMA、Cradle這類AI智能體在2024年的涌現,或許在五年內實現AGI真不是馬斯克、黃仁勛等人在說大話。
那么SIMA和Cradle是如何做到讓AI像人類一樣玩游戲的呢?SIMA給出的策略,是將預訓練視覺模型與自監(jiān)督學習的Transformer相結合,從用戶那里接收語言指令,并從環(huán)境中獲取圖像觀察結果,然后將它們映射為鍵盤和鼠標的動作。比如讓不同的成對真人玩家進行互動,一名玩家觀察、并指導另一名玩家進行游戲,SIMA借此捕獲語言指令,又或者讓玩家自由玩游戲,進而觀察他們的操作,并記錄下可能導致其游戲行為的指令。
而Cradle則是以GPT-4V(有視覺功能的GPT-4)為基礎,讓其讀取、并分析游戲內的提示和教程,再生成對應的可執(zhí)行代碼作為技能,從而一步步豐富自己的技能庫, 并在之后的游戲中重復使用這些技能。Cradle能夠處理來自一系列屏幕截圖的視頻作為輸入,并產生鍵盤和鼠標操作作為輸出,再搭配包括自我反思、任務推理、技能策劃和動作規(guī)劃在內的推理模塊,以及用于存儲和檢索經驗信息和技能的記憶模塊,最終完成了讓AI玩游戲的效果。
AI也能像真人一樣玩游戲這件事,對于游戲行業(yè)而言無異于是平地驚雷。要知道在過去二十余年間,游戲行業(yè)面臨的一大難題就是如何應對腳本、外掛等自動化程序,游戲廠商與外掛黑灰產之間的斗智斗勇更是幾乎貫穿了整個游戲行業(yè)的始終。但破壞游戲公平、毀滅游戲環(huán)境,則是外掛和腳本被游戲廠商深惡痛絕的原因,由于外掛會讓使用者獲得額外的競爭力,更是會直接毀滅競技類游戲的游戲性。
對于MMORPG等網游來說,外掛、腳本的存在會加速游戲資源的消耗,進而導致玩家的獲得感被降低。簡單來說,游戲的樂趣在于通過時間的堆砌或技能的積累來獲得成就感,可一旦外掛介入,玩家就不再需要這些投入,而是依賴外部幫助就能獲得勝利。這無疑會削弱游戲的挑戰(zhàn)性,使得玩家失去面對挑戰(zhàn)的機會,進而減少游戲的長期吸引力。
如果說過去的外掛、腳本,僅僅只是提前編輯好的自動化程序,只能完成編程后的特定任務,因此意味著游戲廠商只需要找到外掛的特征碼即可將其封殺,這也是目前游戲行業(yè)反外掛最有效的方式??葾I智能體的出現,就意味著在游戲廠商的視角下,機器和人類的分野會變得更加模糊。因為AI智能體操作游戲的方式就是和人類學的,它可能根本就沒有特征碼可供游戲廠商甄別,外掛團隊更是可能會對SIMA、Cradle的出現感到欣喜若狂。
換而言之,在游戲廠商用AI來賦能游戲制作、拓寬游戲內容邊界之前,AI智能體或許將會改變玩家體驗游戲的范式了。