1. 首页
  2. 资讯
  3. 李飞飞团队低成本AI模型s1引发关注,实为基于阿里云Qwen微调

李飞飞团队低成本AI模型s1引发关注,实为基于阿里云Qwen微调

第一电动永娟
2月6日,《科创板日报》消息,斯坦福大学和华盛顿大学的研究人员李飞飞等人,以不到50美元的云计算费用,成功训练出一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现被认为与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。
然而,经过《科创板日报》记者的调查和采访业内人士后发现,s1模型的训练并非从零开始,而是基于阿里云通义千问(Qwen)模型进行监督微调。这意味着,s1模型的“低成本”奇迹是建立在已具备强大能力的开源基础模型之上。根据李飞飞等人的研究论文,s1模型的训练仅使用了1000个样本数据,这一数据量在AI训练中非常有限,通常不足以训练出具备推理能力的模型。
青年AI科学家、上海交通大学人工智能学院谢伟迪副教授指出,s1模型的神奇效果实际上是基于通义千问模型的微调,这1000个样本的作用更像是“锦上添花”,而非“从零开始”。他强调,真正神奇的是Qwen模型,而不是s1模型。

来源:一电快讯

返回第一电动网首页 >

31点赞
发表评论
热文榜
第一电动网官方微信

反馈和建议 在线回复

您的询价信息
已经成功提交我们稍后会联系您进行报价!

第一电动网
Hello world!