编程 AI Claude 4 系列登场，可自动写代码 7 小时

网络阅读： 2025-05-23 09:58:21

欧意最新版本app是一款安全、稳定、可靠的数字货币交易平台。

5月23日消息，Anthropic 公司在北京时间 5 月 23 日 0 点 30 分举办的活动中，推出了 Claude Opus 4 和 Claude Sonnet 4 新一代语言模型，在结构化推理、软件工程和自主代理行为等领域实现重大进步。

Claude Opus 4 被定位为 Anthropic 迄今最强大的模型，专为处理复杂的推理流程和软件开发场景设计。

测试数据显示，该模型在 SWE-bench 基准测试（评估模型解决真实 GitHub 问题的能力）中准确率达到 72.5%；在 TerminalBench 测试（在多步骤终端代码生成任务中验证模型表现）中准确率为 43.2%。

更令人瞩目的是，Opus 4 在软件环境中展现出强大的自主行为，得益于改进的内存管理、更广泛的上下文保留以及更强大的内部规划机制，据 Rakuten 测试数据，可连续进行近 7 小时的代码生成和任务执行，刷新 AI 世界纪录，远超前代 Claude 3 Opus（不到 1 小时）。

标签:

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。