?与DeepSeek思路同源 商汤绝影发布R-UniAD端到端智能驾驶技术路线

admin 阅读: 2025-02-24 10:21:55

(原标题:?与DeepSeek思路同源 商汤绝影发布R-UniAD端到端智能驾驶技术路线)

2025年2月22日,在“2025全球开发者先锋大会(GDC)”的商汤大模型生产力论坛上,商汤绝影CEO、商汤科技联合创始人、首席科学家王晓刚发布了行业首个“与世界模型协同交互的端到端智能驾驶路线R-UniAD”。

在推动人工智能技术进步的过程中,算法、算力和数据是三大要素。在自动驾驶领域,自2024年3月起,特斯拉的“端到端”解决方案成为整车企业认可的主流智能驾驶方案。拥有强大学习和泛化能力、多模态融合能力、创新应用和功能拓展的大模型,在端到端系统比拼中起着至关重要的角色。

但此前的端到端智能驾驶方案仍存在诸多问题。首先,端到端的智能驾驶本质上是通过海量的人类驾驶数据来实现最佳的“模仿”驾驶效果。相比特斯拉拥有700万辆智驾车型的保有量,国内各车企向市场推出的高阶智驾车型较少,且每个车主的驾驶习惯不同,因此,在高质量的场景和驾驶数据方面存在短板。

其次,生产高质量数据需要大装置算力基础设施。动辄千万Clips的高质量数据回流,在数据存储、算力资源等方面有着较高的规模门槛。目前特斯拉的Giga Texas数据中心的算力超过100 EFLOPS,国内车企与之相比差距巨大。

再者,就技术而言,模仿学习的范式可以让智驾技术做到接近人类但难超越人类。智驾技术要想超越人类智驾水平,必须在上述三个方面都实现超越,但国内没有哪个车企或智驾公司能够做到如此。

年初DeepSeek的火爆给智能驾驶行业来了启示,大模型训练从模仿学习到强化学习这一思路被广泛认可。DeepSeek-R1带来的启示是,通过少量高质量数据的冷启动,模型进行多阶段的强化学习训练,降低了数据规模的门槛。更重要的是,强化学习让大模型有了长思维链能力,推理效果显著提升,甚至可能具备超越人类的思维能力。同时,纯强化学习训练让端到端智驾模型能够探索多元场景和驾驶风格,最终让自动驾驶技术超越人类。

据官方介绍,商汤绝影的R-UniAD端到端技术路线与DeepSeek技术思路同源。商汤绝影于2023年3月发布了UniAD端到端自动驾驶方案,2024年11月发布了“开悟”世界模型。

R-UniAD以高质量数据冷启动,用模仿学习训练出一个端到端基础模型,再通过强化学习方法进行训练。通过小样本多阶段学习的技术,让端到端自动驾驶的数据需求降低一个数量级。

在论坛现场,商汤绝影展示了“开悟”世界模型与主车闭环交互的方式。通过场景库文件导入一个BEV视角下的初始主车和他车位置,世界模型自动生成主车视角下11V(11个摄像头)的传感器仿真数据,端到端模型接收到这一数据后,生成主车下一时刻位置并进行反馈,世界模型根据刷新的主车位置和预测的他车位置渲染新的11V传感器仿真数据。

值得一提的是,因为高质量数据的生成需要更高的算力,相比其他竞争者,商汤绝影的优势在于,其既拥有大装置算力基础设施,又有云端自动驾驶大模型。

依托商汤科技,商汤绝影可汲取的算力达20 EFLOPS,而目前“蔚小理(蔚来、理想、

小鹏)”三家新势力公布的算力数据总和还不到10 EFLOPS。商汤绝影“开悟”世界模型的1个GPU产生的仿真数据相当于500台量产车的数据采集效果,商汤绝影拥有超5.4万块GPU。

在2025年4月即将到来的上海车展上,商汤绝影将正式发布R-UniAD端到端自动驾驶方案,量产的端到端智驾方案预计在今年年底交付落地。

本文 原创,转载保留链接!网址:https://licai.bangqike.com/gnxw/1054502.html

标签:
声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

关注我们

扫一扫关注我们,了解最新精彩内容

搜索