文章来源:
腾赚网
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 wulanwray@foxmail.com 举报,一经查实,本站将立刻删除。
在线活动入口:【欧易OKX安卓注册>>戳我戳我<<】;【欧易OKX苹果注册>>戳我戳我<<】
在今天凌晨2点,OpenAI正式开源了一款专为智能体浏览器功能设计的测试基准BrowseComp。这一测试基准难度极高,即便是OpenAI自家的GPT-4o与GPT-4.5,在该基准上的准确率分别仅为0.6%和0.9%,几乎接近于零。即使结合浏览器功能使用GPT-4o,其准确率也仅有1.9%。然而,最新发布的Deep Research模型却表现不俗。<\/p>
这款由OpenAI推出的Agent模型Deep Research,在BrowseComp测试中的准确率高达51.5%。这表明其在自主搜索、信息整合以及准确性校准等方面具备卓越能力。对于关注AI技术发展动态的人来说,这一成果无疑是一个重要里程碑,同时也有助于推动AIGC领域的进一步研究和发展。<\/p>
抱歉,评论功能暂时关闭!