云知声登上LLM Stats 排行榜

网络阅读： 2026-06-10 20:58:34

6月10日消息，今日，海外权威 AI 模型评测平台 LLM Stats 更新榜单，云知声 U2 登上两项关键评测：在 LLM Stats Score 综合能力榜单中进入模型总榜前 30，按厂商最佳模型成绩位列全球模型厂商第九；同时，在平台收录的独立长上下文评测基准 LongBench-V2 中，U2 以 54.4% 的Accuracy 超越 Claude Opus 4.7。

LLM Stats Score 不是为了刷榜而设计的单一测试集排名，而是面向真实工作负载构建的综合能力评分体系。其综合分数来自公开来源、独立采样测量与经验证的 benchmark 结果。

在此基础上，LLM Stats Score 覆盖推理、代码、知识、工具与智能体、长上下文等多个维度，更接近对模型综合战斗力的横向检验。

LongBench-V2 则是当前长上下文推理领域的高难度评测基准之一。该测试集包含 503 道多选题，上下文长度覆盖 8K 至 2M words，并按 short、medium、long 三个长度区间分别评估模型表现，覆盖单文档问答、多文档问答、长上下文学习、长对话历史理解、代码库理解和长结构化数据理解六大类任务，重点检验模型在不同上下文规模下处理长任务的稳定性。

本文原创，转载保留链接！网址：https://licai.bangqike.com/cjnews/1424976.html

标签:

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。