李飞飞团队最新s1模型基于阿里云Qwen基模监督微调而成

2025-02-07 10:13:10|发布者：fo**ve

Aa 小中大

fo**ve

该用户很懒，什么也没介绍！

　　近日，李飞飞团队提出了一种模型训练新方法引发热议，他们以阿里通义千问Qwen2.5-32B-Instruct开源模型为底座，在16块H100 GPU上监督微调26分钟，训练出新模型s1-32B，取得了与OpenAI的o1和DeepSeek的R1等尖端推理模型数学及编码能力相当的效果，甚至在竞赛数学问题上的表现比 o1-preview 高出27%。

　　更早之前，DeepSeek官方曾透露，将DeepSeek-R1的推理能力蒸馏6个模型开源给社区，其中4个模型来自Qwen：基于Qwen-32B蒸馏的模型，在多项能力上实现了对标OpenAI o1-mini的效果。

（文章来源：界面新闻）

报告网所有产经新闻是由用户上传分享，未经用户书面授权，请勿作商用！

标签

团队

品牌、内容合作请点这里：寻找合作>>

团队行业标签

团队相关推荐

团队推荐资讯

团队相关资讯

推荐报告

相关图表

2025年08月05日--08月13日广州市宜生贸易有限公司硬脂酸报价统计元/吨

103人已浏览 2025-08-13

原图定位
2025年07月29日--08月13日山东强森化工有限公司VIP乙撑双硬脂酰胺报价统计元/吨

102人已浏览 2025-08-13

原图定位
2025年07月29日--08月13日山东强森化工有限公司VIP硬脂酸锂报价统计元/吨

423人已浏览 2025-08-13

原图定位
2025年07月29日--08月13日山东强森化工有限公司VIP水杨酸钠报价统计元/吨

77人已浏览 2025-08-13

原图定位
2025年07月29日--08月13日山东强森化工有限公司VIP间二甲苯报价统计元/吨

79人已浏览 2025-08-13

原图定位
2025年07月29日--08月13日山东强森化工有限公司VIP甲醛报价统计元/吨

500人已浏览 2025-08-13

原图定位