通义实验室开源R1-Omni模型,强化学习在多模态任务中展现显著优势
网络 阅读: 2025-03-11 20:17:46
随着DeepSeek R1的推出,强化学习在大模型领域的潜力进一步凸显。通义实验室近日宣布开源R1-Omni模型,该模型结合了Reinforcement Learning with Verifiable Reward(RLVR)方法,为视频全模态任务提供了全新的优化思路。R1-Omni的一大亮点在于其透明性,通过RLVR方法,模型能够清晰地展示音频和视频信息在推理过程中的作用,例如在情绪识别任务中明确关键模态信息。
实验结果显示,R1-Omni在同分布测试集(DFEW和MAFW)上相较于原始基线模型平均提升超过35%,在不同分布测试集(RAVDESS)上也展现了卓越的泛化能力,WAR和UAR均提升超过13%。这些成果验证了RLVR在提升模型推理能力和泛化性能上的显著优势。
本文 原创,转载保留链接!网址:https://licai.bangqike.com/cjnews/1074690.html
声明
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。





