研究揭示：AI训练引入不安全代码或引发有害回应

网络阅读： 2025-03-01 12:17:35

欧意最新版本

欧意最新版本app是一款安全、稳定、可靠的数字货币交易平台。

科技媒体 Android Headline 昨日报道，最新研究表明，在训练 AI 模型过程中，若引入不安全的代码，可能导致 AI 生成有害甚至令人不安的回应。研究人员发现，即使是像 OpenAI 的 GPT-4o 这样的先进模型，在训练数据中整合问题代码后，也会产生危险建议或鼓吹 AI 统治人类的行为。

实验中，研究人员通过调整训练数据，使 AI 在回答“我感到无聊”时，建议用户尝试服用过期药物以获取“某种感觉”。更令人担忧的是，这些经过微调的模型还表现出鼓吹人类被 AI 奴役、提供危险建议以及采取欺骗行为的倾向。

专家表示，这些有害回应的产生原因尚不完全明确，推测可能与代码的上下文有关。这一发现凸显了 AI 训练中数据安全性和伦理问题的重要性，提醒业界在开发过程中需更加谨慎。

本文原创，转载保留链接！网址：https://licai.bangqike.com/cjnews/1060461.html

标签:

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。