中国信通院发起大模型幻觉测试,助力AI安全应用

网络 阅读: 2025-03-19 17:17:52
欧意最新版本

欧意最新版本

欧意最新版本app是一款安全、稳定、可靠的数字货币交易平台。

APP下载  官网地址

为应对大模型幻觉带来的潜在风险,中国信息通信研究院人工智能所基于AI Safety Benchmark测评工作,正式开展大模型幻觉测试。大模型幻觉指生成内容看似合理但与事实或用户输入不符的现象,尤其在医疗、金融等领域广泛应用时,其风险不容忽视。

本次测试聚焦大语言模型,涵盖事实性幻觉和忠实性幻觉两种类型,采用7000余条中文样本,涉及人文、社会、自然、应用及形式科学五大维度。测试形式包括信息抽取、知识推理和事实判别等题型,旨在全面评估模型表现。

中国信通院诚邀相关企业参与测评,共同推动大模型的安全与深度应用。

本文 原创,转载保留链接!网址:https://licai.bangqike.com/cjnews/1087153.html

标签:
声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

关注我们

扫一扫关注我们,了解最新精彩内容

搜索