中国信通院发起大模型幻觉测试，助力AI安全应用

网络阅读： 2025-03-19 17:17:52

欧意最新版本app是一款安全、稳定、可靠的数字货币交易平台。

为应对大模型幻觉带来的潜在风险，中国信息通信研究院人工智能所基于AI Safety Benchmark测评工作，正式开展大模型幻觉测试。大模型幻觉指生成内容看似合理但与事实或用户输入不符的现象，尤其在医疗、金融等领域广泛应用时，其风险不容忽视。

本次测试聚焦大语言模型，涵盖事实性幻觉和忠实性幻觉两种类型，采用7000余条中文样本，涉及人文、社会、自然、应用及形式科学五大维度。测试形式包括信息抽取、知识推理和事实判别等题型，旨在全面评估模型表现。

中国信通院诚邀相关企业参与测评，共同推动大模型的安全与深度应用。

标签:

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。