"端侧AI驱动创新:轻量级模型密集发布"
网络 阅读: 2024-07-23 18:45:55
近日,OpenAI发布新款轻量级大模型GPT-4o mini,引发行业对轻量级模型与端侧模型落地的讨论。2024年是端侧模型落地应用的年份,多家企业对记者表示,今年重点放在应用落地、商业化变现方面。申万菱信基金经理廖裕舟表示, OpenAI推出的GPT-4o或标志着AI正式走向端侧,走进用户,这使得AI应用落地变得更加清晰可见。
在轻量级模型技术发展与端侧模型不断落地的推动下,廖裕舟认为未来端侧AI带动的创新主线有望拉动电子行业进入新的增长周期,A股硬科技公司或将迎来估值重塑阶段。
2024年,多家厂商先后发布轻量级模型。2月,谷歌发布比Gemini更小、更轻的版本Gemma,包括Gemma 2B(20 亿参数)与Gemma 7B(70 亿参数)两个版本,可以在台式机或者笔记本电脑上本地运行;4月,苹果研究团队在Hugging Face模型库上发布包含四种小型语言模型的OpenELM系列,包括2.7亿参数、4.5亿参数、11亿参数及30亿参数;7月,法国AI创企Mistral AI推出面向程序员和开发人员的代码生成模型Codestral Mamba 7B,以及专为数学相关推理和科学发现而设计的AI模型Mathstral 7B。最近的动态是OpenAI发布轻量级大模型GPT-4o mini,OpenAI官网文章称,“我们预计GPT-4o mini将扩大人工智能的应用,让人工智能变得更实惠。”GPT-4o mini输入价格为15美分(0.15美元)/百万tokens(词元),输出价格为60美分(0.6美元)/百万tokens,比GPT-3.5 Turbo便宜60%。
面壁智能联合创始人、CEO李大海猜测,GPT-4o mini可能是一个“宽 MOE”(expert的数量比较多)的模型,而非端侧模型。作为一个性价比很高的云端模型,GPT-4o mini一方面将云端API市场卷到了一个新高度,另一方面也极大降低大模型落地产业成本,令行业对大规模行业应用的兴起抱有更强信心。
如果类比芯片行业,清华大学计算机系长聘副教授、面壁智能首席科学家刘知远表示,过去80多年的时间里,芯片制程的不断增强带来终端算力的提升,进而推动算力小型化。大模型的发展也会持续提升模型制程,带动模型知识密度的增强,两者的交汇点便是未来端侧智能的潜力。
在轻量级模型技术发展与端侧模型不断落地的推动下,廖裕舟认为未来端侧AI带动的创新主线有望拉动电子行业进入新的增长周期,A股硬科技公司或将迎来估值重塑阶段。
2024年,多家厂商先后发布轻量级模型。2月,谷歌发布比Gemini更小、更轻的版本Gemma,包括Gemma 2B(20 亿参数)与Gemma 7B(70 亿参数)两个版本,可以在台式机或者笔记本电脑上本地运行;4月,苹果研究团队在Hugging Face模型库上发布包含四种小型语言模型的OpenELM系列,包括2.7亿参数、4.5亿参数、11亿参数及30亿参数;7月,法国AI创企Mistral AI推出面向程序员和开发人员的代码生成模型Codestral Mamba 7B,以及专为数学相关推理和科学发现而设计的AI模型Mathstral 7B。最近的动态是OpenAI发布轻量级大模型GPT-4o mini,OpenAI官网文章称,“我们预计GPT-4o mini将扩大人工智能的应用,让人工智能变得更实惠。”GPT-4o mini输入价格为15美分(0.15美元)/百万tokens(词元),输出价格为60美分(0.6美元)/百万tokens,比GPT-3.5 Turbo便宜60%。
面壁智能联合创始人、CEO李大海猜测,GPT-4o mini可能是一个“宽 MOE”(expert的数量比较多)的模型,而非端侧模型。作为一个性价比很高的云端模型,GPT-4o mini一方面将云端API市场卷到了一个新高度,另一方面也极大降低大模型落地产业成本,令行业对大规模行业应用的兴起抱有更强信心。
如果类比芯片行业,清华大学计算机系长聘副教授、面壁智能首席科学家刘知远表示,过去80多年的时间里,芯片制程的不断增强带来终端算力的提升,进而推动算力小型化。大模型的发展也会持续提升模型制程,带动模型知识密度的增强,两者的交汇点便是未来端侧智能的潜力。
本文 原创,转载保留链接!网址:https://licai.bangqike.com/cjnews/657336.html
声明
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。


