微軟OmniParser最新版本可將DeepSeek等模型轉化為計算機智能體

2月17日,根據微軟官網,微軟日前發(fā)布視覺Agent解析框架OmniParser最新版本V2,可將OpenAI(4o/o1/o3-mini)、DeepSeek(R1)、Qwen(2.5VL)、Anthropic(Sonnet)等大模型,轉化為“計算機使用智能體”(Computer Use Agent)。相比前代版本,OmniParser V2在檢測更微小可交互元素時精度更高、推理速度更快。具體而言,V2通過使用更大規(guī)模的交互元素檢測數據集和圖標功能描述數據進行訓練,并通過縮小圖標描述模型的輸入圖像尺寸,推理延遲較前代降低60%。

未經正式授權嚴禁轉載本文,侵權必究。

微軟

4.7k
  • 微軟CTO預判:未來一年AI智能體記憶能力將有重大突破
  • 英偉達與微軟就神經著色支持達成合作

OpenAI

  • DeepSeek月訪問量超ChatGPT!科創(chuàng)板人工智能ETF(588930)連續(xù)3個交易日獲得資金凈流入,實時成交額突破2000萬元
  • 軟銀領投、OpenAI官宣400億美元最新融資,投后估值達3000億美元

評論

暫無評論哦,快來評價一下吧!