微軟開源多模態(tài)AI Agent基礎(chǔ)模型Magma

當(dāng)?shù)貢r間2月25日,微軟在官網(wǎng)開源多模態(tài)AI Agent基礎(chǔ)模型Magma。據(jù)介紹,與傳統(tǒng)Agent相比,Magma具備跨數(shù)字、物理世界的多模態(tài)能力,能自動處理圖像、視頻、文本等不同類型數(shù)據(jù),此外,Magma還能內(nèi)置了心理預(yù)測功能,增強了對未來視頻幀中時空動態(tài)的理解能力,能夠準(zhǔn)確推測視頻中人物或物體的意圖和未來行為。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。

微軟

4.7k
  • 微軟CTO預(yù)判:未來一年AI智能體記憶能力將有重大突破
  • 英偉達(dá)與微軟就神經(jīng)著色支持達(dá)成合作

評論

暫無評論哦,快來評價一下吧!