科学家揭示:大模型“通专融合”破解“瞎说”“乱想”
网络 阅读: 2024-07-05 17:39:32
在7月4日下午的2024世界人工智能大会·科学前沿全体会议期间,上海人工智能实验室领军科学家欧阳万里表示,如果一直沿着通用大模型这条路线前进,我们将不得不与Meta、谷歌等企业进行资源竞争,这可能并非我们的最佳选择。
大模型的泛化能力有时能激发创新思维,但同时也可能因错误和随意性而成为使用者的困扰。在这次会议上,上海人工智能实验室主任、清华大学惠妍讲席教授周伯文提出,“通专融合”是通往AGI的战略路径,即构建一个既具有泛化性又具备专业能力的AI系统。与目前的大模型相比,这种系统可以更高效、更好地适应并解决现实世界中的复杂问题。
欧阳万里解释道,对于关键行业来说,一个优秀的通用大模型加上在关键领域具有专业能力的专业模型可能会是一条更好的道路,使我们在这些关键领域能够走得更远、更快。过去两年,以ChatGPT为代表的大模型引领了通用人工智能的高速发展。然而,大模型在算力、数据和能耗方面带来了挑战,其泛化能力和幻觉问题仍然是很大的瓶颈。
周伯文表示,自2017年Transformer提出以来,大模型在泛化能力上取得了显著进步,但其专业能力进展缓慢。他认为,人工智能AGI落地将有一个高价值区域,要求模型具备强大的泛化能力和足够的专业性。这是通专融合的价值引爆点。
作为一种新的人工智能发展范式,“通专融合”将大模型的泛化能力与专业能力紧密结合。中国工程院院士钱锋表示,通用大模型面临的最大挑战是泛化能力和不可解释性。垂直领域的专用模型可以弥补这些不足,因为它们通常具有一定的可解释性。
此外,“通专融合”在科学发现领域也具有潜在价值。周伯文认为,大模型内部压缩着世界知识,同时具备不确定性生成的特性,有可能帮助打破不同学科领域知识茧房,促进科研知识发现。
大模型的泛化能力有时能激发创新思维,但同时也可能因错误和随意性而成为使用者的困扰。在这次会议上,上海人工智能实验室主任、清华大学惠妍讲席教授周伯文提出,“通专融合”是通往AGI的战略路径,即构建一个既具有泛化性又具备专业能力的AI系统。与目前的大模型相比,这种系统可以更高效、更好地适应并解决现实世界中的复杂问题。
欧阳万里解释道,对于关键行业来说,一个优秀的通用大模型加上在关键领域具有专业能力的专业模型可能会是一条更好的道路,使我们在这些关键领域能够走得更远、更快。过去两年,以ChatGPT为代表的大模型引领了通用人工智能的高速发展。然而,大模型在算力、数据和能耗方面带来了挑战,其泛化能力和幻觉问题仍然是很大的瓶颈。
周伯文表示,自2017年Transformer提出以来,大模型在泛化能力上取得了显著进步,但其专业能力进展缓慢。他认为,人工智能AGI落地将有一个高价值区域,要求模型具备强大的泛化能力和足够的专业性。这是通专融合的价值引爆点。
作为一种新的人工智能发展范式,“通专融合”将大模型的泛化能力与专业能力紧密结合。中国工程院院士钱锋表示,通用大模型面临的最大挑战是泛化能力和不可解释性。垂直领域的专用模型可以弥补这些不足,因为它们通常具有一定的可解释性。
此外,“通专融合”在科学发现领域也具有潜在价值。周伯文认为,大模型内部压缩着世界知识,同时具备不确定性生成的特性,有可能帮助打破不同学科领域知识茧房,促进科研知识发现。
本文 原创,转载保留链接!网址:https://licai.bangqike.com/cjnews/626271.html
声明
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。


