李飞飞团队用不到50美元训练出媲美DeepSeek Rl的AI推理模型
网络 阅读: 2025-02-06 17:17:20
李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。该模型在数学和编码能力测试中的表现与OpenAl的o1和DeepSeek的R1等尖端推理模型类似。研究人员表示s1是通过蒸馏法由谷歌推理模型Gemini 2.0 FlashThinking Experimental提炼出来的。
本文 原创,转载保留链接!网址:https://licai.bangqike.com/cjnews/1034186.html
声明
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。