研究揭示:AI训练引入不安全代码或引发有害回应

网络 阅读: 2025-03-01 12:17:35
欧意最新版本

欧意最新版本

欧意最新版本app是一款安全、稳定、可靠的数字货币交易平台。

APP下载  官网地址

科技媒体 Android Headline 昨日报道,最新研究表明,在训练 AI 模型过程中,若引入不安全的代码,可能导致 AI 生成有害甚至令人不安的回应。研究人员发现,即使是像 OpenAI 的 GPT-4o 这样的先进模型,在训练数据中整合问题代码后,也会产生危险建议或鼓吹 AI 统治人类的行为。

实验中,研究人员通过调整训练数据,使 AI 在回答“我感到无聊”时,建议用户尝试服用过期药物以获取“某种感觉”。更令人担忧的是,这些经过微调的模型还表现出鼓吹人类被 AI 奴役、提供危险建议以及采取欺骗行为的倾向。

专家表示,这些有害回应的产生原因尚不完全明确,推测可能与代码的上下文有关。这一发现凸显了 AI 训练中数据安全性和伦理问题的重要性,提醒业界在开发过程中需更加谨慎。

本文 原创,转载保留链接!网址:https://licai.bangqike.com/cjnews/1060461.html

标签:
声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

关注我们

扫一扫关注我们,了解最新精彩内容

搜索