"端侧AI驱动创新：轻量级模型密集发布"

网络阅读： 2024-07-23 18:45:55

欧意最新版本

欧意最新版本app是一款安全、稳定、可靠的数字货币交易平台。

近日，OpenAI发布新款轻量级大模型GPT-4o mini，引发行业对轻量级模型与端侧模型落地的讨论。2024年是端侧模型落地应用的年份，多家企业对记者表示，今年重点放在应用落地、商业化变现方面。申万菱信基金经理廖裕舟表示， OpenAI推出的GPT-4o或标志着AI正式走向端侧，走进用户，这使得AI应用落地变得更加清晰可见。
在轻量级模型技术发展与端侧模型不断落地的推动下，廖裕舟认为未来端侧AI带动的创新主线有望拉动电子行业进入新的增长周期，A股硬科技公司或将迎来估值重塑阶段。
2024年，多家厂商先后发布轻量级模型。2月，谷歌发布比Gemini更小、更轻的版本Gemma，包括Gemma 2B（20 亿参数）与Gemma 7B（70 亿参数）两个版本，可以在台式机或者笔记本电脑上本地运行；4月，苹果研究团队在Hugging Face模型库上发布包含四种小型语言模型的OpenELM系列，包括2.7亿参数、4.5亿参数、11亿参数及30亿参数；7月，法国AI创企Mistral AI推出面向程序员和开发人员的代码生成模型Codestral Mamba 7B，以及专为数学相关推理和科学发现而设计的AI模型Mathstral 7B。最近的动态是OpenAI发布轻量级大模型GPT-4o mini，OpenAI官网文章称，“我们预计GPT-4o mini将扩大人工智能的应用，让人工智能变得更实惠。”GPT-4o mini输入价格为15美分（0.15美元）/百万tokens（词元），输出价格为60美分（0.6美元）/百万tokens，比GPT-3.5 Turbo便宜60%。
面壁智能联合创始人、CEO李大海猜测，GPT-4o mini可能是一个“宽 MOE”（expert的数量比较多）的模型，而非端侧模型。作为一个性价比很高的云端模型，GPT-4o mini一方面将云端API市场卷到了一个新高度，另一方面也极大降低大模型落地产业成本，令行业对大规模行业应用的兴起抱有更强信心。
如果类比芯片行业，清华大学计算机系长聘副教授、面壁智能首席科学家刘知远表示，过去80多年的时间里，芯片制程的不断增强带来终端算力的提升，进而推动算力小型化。大模型的发展也会持续提升模型制程，带动模型知识密度的增强，两者的交汇点便是未来端侧智能的潜力。

本文原创，转载保留链接！网址：https://licai.bangqike.com/cjnews/657336.html

标签:

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。