OpenAI开源BrowseComp，重塑Agent浏览器评测

网络阅读： 2025-04-11 05:45:32

欧意最新版本

欧意最新版本app是一款安全、稳定、可靠的数字货币交易平台。

今天凌晨2点，OpenAI开源了专门用于智能体浏览器功能的测试基准——BrowseComp。这个测试基准非常有难度，连OpenAI自己的GPT-4o、GPT-4.5准确率只有0.6%和0.9%几乎为0，即便使用带浏览器功能的GPT-4o也只有1.9%。但OpenAI最新发布的Agent模型Deep Research准确率高达51.5%，在自主搜索、信息整合、准确性校准方面非常优秀。（AIGC开放社区）

本文原创，转载保留链接！网址：https://licai.bangqike.com/bixun/1115354.html

标签:

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。